Johannes Köster
University of Duisburg-Essen
dataset
results
Steps:
Via:
dataset
results
dataset
dataset
dataset
dataset
dataset
dataset
results
dataset
dataset
dataset
dataset
dataset
From raw data to final figures:
automation
dataset
results
dataset
dataset
dataset
dataset
dataset
scalability
Handle parallelization:
execute for tens to thousands of datasets
Avoid redundancy:
automation
dataset
results
dataset
dataset
dataset
dataset
dataset
Handle deployment:
be able to easily execute analyses on a different system/platform/infrastructure
portability
scalability
automation
www.copdri.com 2016
www.austincc.edu 2016
www.medicalxpress.com 2016
biosocialmethods.isr.umich.edu 2016
Transcript activity/expression:
the more RNA, the more protein
transcript
DNA:
Illumina Inc. 2018
en.wikipedia.org 2018
en.wikipedia.org 2018
en.wikipedia.org 2018
Result:
short, (paired-end) Reads
en.wikipedia.org 2018
...ACGCTAGCAGCGTAGCGGAGCTATTGCGGAGCTGAGCGTATCGGAGAGATCGGATCTGGATCGAGATCTGAGCTGAGCTAGCTGGCTAGCGATCGGAGGAGCTAGCGATATTCGAGGAGGCGTATCGTAGC...
Gene and transcript sequence
CGGAGCTATTGCGG
GGAGCTATTGCGGA
GGATCGAGATCT
GGATCGAGATCT
CGGAGGAGCTAG
CGGAGGAGCTAG
TCGGAGGAGCTA
Phase 1
Phase 2
Phase 3
11.10.2018 | Einführung, Snakemake-Tutorial |
18.10.2018 | Snakemake-Tutorial |
25.10.2018 | Snakemake-Tutorial |
01.11.2018 | Vorbereitung der Vorträge |
08.11.2018 | Vorbereitung der Vorträge |
15.11.2018 | Vorträge (je 30min) |
22.11.2018 | Implementierung des Workflows |
29.11.2018 | Implementierung des Workflows |
06.12.2018 | Implementierung des Workflows |
13.12.2018 | Implementierung des Workflows |
20.12.2018 | Implementierung des Workflows |
10.01.2019 | Implementierung des Workflows |
17.01.2019 | Implementierung des Workflows |
24.01.2019 | Vorbereitung der Abschlusspräsentationen |
31.01.2019 | Abschlusspräsentationen |
Phase 4