Johannes Köster
University of Duisburg-Essen
dataset
results
Steps:
Via:
dataset
results
dataset
dataset
dataset
dataset
dataset
dataset
results
dataset
dataset
dataset
dataset
dataset
From raw data to final figures:
automation
dataset
results
dataset
dataset
dataset
dataset
dataset
scalability
Handle parallelization:
execute for tens to thousands of datasets
Avoid redundancy:
automation
dataset
results
dataset
dataset
dataset
dataset
dataset
Handle deployment:
be able to easily execute analyses on a different system/platform/infrastructure
portability
scalability
automation
www.copdri.com 2016
www.austincc.edu 2016
www.medicalxpress.com 2016
biosocialmethods.isr.umich.edu 2016
Transcript activity/expression:
the more RNA, the more protein
transcript
DNA:
Illumina Inc. 2018
en.wikipedia.org 2018
en.wikipedia.org 2018
en.wikipedia.org 2018
Result:
short, (paired-end) Reads
en.wikipedia.org 2018
...ACGCTAGCAGCGTAGCGGAGCTATTGCGGAGCTGAGCGTATCGGAGAGATCGGATCTGGATCGAGATCTGAGCTGAGCTAGCTGGCTAGCGATCGGAGGAGCTAGCGATATTCGAGGAGGCGTATCGTAGC...
Gene and transcript sequence
CGGAGCTATTGCGG
GGAGCTATTGCGGA
GGATCGAGATCT
GGATCGAGATCT
CGGAGGAGCTAG
CGGAGGAGCTAG
TCGGAGGAGCTA
Phase 1
Phase 2
Phase 3
| 11.10.2018 | Einführung, Snakemake-Tutorial |
| 18.10.2018 | Snakemake-Tutorial |
| 25.10.2018 | Snakemake-Tutorial |
| 01.11.2018 | Vorbereitung der Vorträge |
| 08.11.2018 | Vorbereitung der Vorträge |
| 15.11.2018 | Vorträge (je 30min) |
| 22.11.2018 | Implementierung des Workflows |
| 29.11.2018 | Implementierung des Workflows |
| 06.12.2018 | Implementierung des Workflows |
| 13.12.2018 | Implementierung des Workflows |
| 20.12.2018 | Implementierung des Workflows |
| 10.01.2019 | Implementierung des Workflows |
| 17.01.2019 | Implementierung des Workflows |
| 24.01.2019 | Vorbereitung der Abschlusspräsentationen |
| 31.01.2019 | Abschlusspräsentationen |
Phase 4