Избранные методики анализа данных
Александра Галицына
Цикл лекций о структуре хроматина
9 декабря 2021
Квиз №2 по структурной организации хроматина
Ссылка на форму:
время проведения:
11:10 до 11:30
(строгий дедлайн)
Задача 1.
Поиск детермининтов ТАДов
Секвенирование для системной биологии

Проблема: большое количество разнородных данных, как их ассоциировать?
Поиск обогащенных факторов на границах ТАДов
Ulyanov, Khrameeva et al. Genome Research 2016

Пример ассоциации данных Hi-C и ChIP-Seq
Подходы для обработки данных о взаимодействии ДНК
- Выбрать только заведомо важные контакты
2. Анализировать особенности (фичи, features) данных

- точечные контакты промоторов и энхансеров
- на уровне экспериментальной техники: Capture C




}
ТАДы имеют сложную и неоднозначную структуру...
Filippova et al. Algorithms for Molecular Biology 2014


- Поиск с помощью динамического программирования, например,
Armatus
Поиск обогащенных факторов на границах ТАДов
Ulyanov, Khrameeva et al. Genome Research 2016
Профили обогащения вокрг границ ТАДов


Много способов искать ТАДы...
Forcato et al. Nature Methods 2017

Может, ТАДы и не стоит искать?
- Использование меры Gamma transitional (близкая к IS)

1. для каждого бина генома получаем
некоторую меру инсуляции
2. берем набор эпигенетических данных

Может, ТАДы и не стоит искать?
- Использование меры Gamma transitional (близкая к IS)
3. подбираем и обучаем модель машинного обучения
(в данном случае biLSTM):
4. получаем ранжирование эпигенетических факторов по важности для формирования структуры хроматина:


Может, ТАДы и не стоит искать?
Wang et al. 2018
5. Находим "визуальное" подтверждение

Задача 2. Анализ Hi-C одиночных клеток
Single-cell Hi-C

Flyamer et al. Nature 2017

Single-cell Hi-C - протокол, похожий на Hi-C, но для единичных клеток:
Single-cell Hi-C (scHi-C)
Ulyanov, Galitsyna et al. 2021

- Эксперимент:
- Ошибочные прыжки полимеразы:
- Строгий протокол фильтрации
One Read-Based Interactions Annotation (ORBITA):

Single-cell Hi-C: данные
-
Пример результатов для Drosophila melanogaster


Ulyanov, Galitsyna et al. 2021
ТАДы в single-cell Hi-C данных
-
Пример разметок ТАДов в Drosophila:


Ulyanov, Galitsyna et al. 2021
Обогащение границ факторами:


Ulyanov, Galitsyna et al. 2021
Обогащение границ факторами:


Ulyanov, Galitsyna et al. 2021
Подходы к исследованию scHi-C
Galitsyna & Gelfand 2021

Усреднение - мощный инструмент
Ulyanov, Galitsyna et al. 2020, Nature Communications, in press
На примере single-cell Hi-C данных мухи, очень мало данных:


Single-cell Hi-C, моделирование ДНК
Stevens et al. Nature 2017

Сила моделирования:
- хромосомные территории,
- активный хроматин (компартмент A) расположен
на периферии:
Всегда ли активный хроматин на периферии?
Falk et al. Nature 2019

Результаты для типичных клеток:

нейроны
тимоциты
Флуоресцентная микроскопия
Карта Hi-C
Компартменты
Falk et al. Nature 2019



обычное ядро
На карте Hi-C видим одинаковые компартменты, но принципиально разные результаты микроскопии!
Всегда ли активный хроматин на периферии?
мутантные тимоциты
тимоциты
Флуоресцентная микроскопия
Карта Hi-C
Компартменты
инвертированные ядра
колбочки глаза
Solovei, 2009
Рассмотрим колбочки глаза:
Когда активный хроматин не на периферии ядра?

Solovei, 2009
Ядра колбочек мышей - инвертированы!

Когда активный хроматин не на периферии ядра?

колбочки
(тела клеток)
биполярные клетки
ганглиолярные клетки
срез сетчатки
колбочки
(ядра клеток)
колбочки
ганглиолярные клетки
фибробласты
Solovei, 2009
Ядра колбочек у ночных
животных - инвертированы!


Когда активный хроматин не на периферии ядра?
Single-cell Hi-C, накопленные данные:
Galitsyna and Gelfand, 2021

Трехмерная организация генома: Избранные методики анализа данных.
By agalicina
Трехмерная организация генома: Избранные методики анализа данных.
Трехмерная организация генома: Избранные методики анализа данных.
- 149