Методы секвенирования

Зачем нужно секвенирование?

  • Анализ предрасположенностей организмов
  • Аннотация функций генов
  • Поиск SNP
  • Поиск структурных вариаций

Процесс секвенирования

Воздушный поток

Ультразвук

Рестрикция

No real difference*

*Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011) Systematic Comparison of Three Methods for Fragmentation of Long-Range PCR Products for Next Generation Sequencing. PLOS ONE 6(11): e28240.

  1. Фрагментация ДНК

Процесс секвенирования

  1. Фрагментация ДНК
  2. Крепление на поверхности

Процесс секвенирования

  1. Фрагментация ДНК
  2. Крепление на поверхности
  3. ПЦР амплификация

Процесс секвенирования

  1. Фрагментация ДНК
  2. Крепление на поверхности
  3. ПЦР амплификация
  4. Считывание

Процесс секвенирования

  1. Фрагментация ДНК
  2. Крепление на поверхности
  3. ПЦР амплификация
  4. Считывание
  5. Анализ

Процесс секвенирования

Секвенирование по Сэнгеру

Dideoxynucleotides

*Image credit: "Whole-genome sequencing: Figure 1" by OpenStax College, Biology (CC BY 4.0).

Классический подход

*Image credit: "Sanger Dideoxynucleotide Sequencing" by Binf Snipcademy.

*Image credit: "How does Sanger Sequencing Work? – Seq It Out #1" by Thermo Fisher Scientific.

Светящиеся нуклеотиды

Результат

*Image credit: "DNA Sequencing by Capillary Electrophoresis Chemistry Guide, Figure 7" by Thermo Fisher Scientific.

Достоинства

  • Относительно длинные прочтения
    (500-1000b)
     
  • Самый точный метод на данный момент
     
  • Сейчас используется для подтверждения чего-то особенно интересного

Недостатки

  • Очень дорогой
     
  • Низкая производительность

Выводы

Доп. материалы

Секвенаторы Illumina (NGS)

Парные прочтения

Alignment to the Reference Sequence

Read 2

Read 1

Repeats

Reference

Paired-End Reads

Нет ничего лучше официального видео

Баркодирование

DNA fragment

Primer 1

i5 index

Flow cell binding sequence 1

DNA fragment

Flow cell binding sequence 2

i7 index

Primer 2

Bridge amplification

Светящиеся нуклеотиды

Порядок секвенирования

Sequence read 1

50-300b

500-2500b

Index read 1

Sequence read 2

Index read 2

4 files with reads

Выводы

Достоинства

  • Дешёвый (особенно оптом)
     
  • Очень высокая производительность
     
  • Парные прочтения

Недостатки

  • Короткие прочтения

Доп. материалы

Секвенаторы PacBio (TGS)

Принцип работы

* Anthony Rhoads, Kin Fai Au, PacBio Sequencing and Its Applications, Genomics, Proteomics & Bioinformatics, Volume 13, Issue 5, October 2015, Pages 278-289, ISSN 1672-0229. Figures 1,3.

Повышение качества

*Image credit: "Glossary of Terms: Figure 1" by Pacific Biosciences.

Выводы

Достоинства

  • Очень длинные прочтения (1-100kb)
     
  • Нет амплификации
     
  • Можно понизить долю ошибок до 2-5%, но это также понижает производительность и уменьшает длину прочтений до 1-60kb.

Недостатки

  • Высокая доля ошибок (13-15%)
     
  • Низкая производительность
     
  • Стоимость секвенатора (~700k$)

Доп. материалы

Секвенаторы Oxford Nanopore (TGS)

  • Размер: 10 × 3 × 2 см
  • Вес: 90г
  • Цена: 1000$
  • Подключаетс по USB прямо к ноутбуку
  • Никаких больше светящихся нуклеотидов
  • Прочтения до 900kb (но это не точно)*

Забудьте всё, что вы знали о секвенаторах!

Принцип работы

Принцип работы

K-mers sequencing

2D reads increase quality

Выводы

Достоинства

  • Прочтения даже длиннее, чем у PacBio
     
  • Дешёвый секвенатор (1000$)
     
  • Единственный карманный секвенатор
     
  • Нет амплификации
     
  • В перспективе может секвенировать белки

Недостатки

  • Очень низкая производительность
     
  • Высокий уровень ошибок (19-30%)
     
  • Проблемы с гомополимерами

PacBio vs Nanopore

*Image credit: "Hybrid Read Sequencing: Applications and Tools" by Genohub Blog.

512 потоков

144000 потоков

PacBio vs Nanopore

Доп. материалы

Оптические карты

Нет нуклеотидов - есть фрагменты

Выводы

Достоинства

  • Средняя длина прочтения 225kb
     
  • Дешёвое секвенирование

Недостатки

  • Большое число ошибок
     
  • Сложный процесс сборки генома
     
  • Не может использоваться самостоятельно
     
  • Технология потеряет смысл, если ультра-длинные прочтения войдут в широкое употребление

Сравнение секвенаторов

Секвенатор Доля ошибок Объём данных за запуск Длина прочтений
Sanger 0.001% 100 Kb 400-900 b
Illumina 2% 1 Tb 50-300 b
PacBio 3-15% 5-10 Gb 1-60 Kb
Oxford Nanopore 10-20% 5 Gb 1-900 Kb

Спасибо за внимание

Доп. материалы

Sequencing

By Viktor Petukhov

Sequencing

  • 950