вычислительные ресурсы Щукинской 5с6
Мы планируем использовать под дисковое пространство (50/50 Ceph и полки) освобождающиеся 8 стоек (ПАК МАСУ + пустые стойки).
Мы храним не менее 2 копий данных в 3 хранилищах: горячем (Ceph), холодном (дисковые полки UDH) и архивном (магнитные ленты).
С горячего хранилища ведем расчеты, в холодном – храним копию в оперативном доступе на случай неполадок горячего, архивным подстраховываемся от потери части данных в холодном.
Чтобы хранить 100 тысяч геномов, нужно иметь пространство для 200 тысяч полезного хранения .
формат | горячее | холодное | архивное |
---|---|---|---|
BCL | + | - | + |
FASTQ | + | + | - |
BAM+gVCF | + | + | - |
В ближайшие 3 месяца мы надеемся добавить в архивное хранилище также форматы BAM+gVCF и FASTQ.
Достоинства:
Недостатки:
Достоинства:
Недостатки:
Достоинства:
Недостатки:
CephFS представляет единую распределенную файловую систему гигантского размера.
Она позволяет гибко разграничивать доступы пользователей к различным поддиректориям. В частности, можно выдать права конкретному пользователю на доступ только к конкретной поддиректории только на чтение.
В данный момент доступы к данным в CephFS имеют группы Митрофанова, Зотовой, Траспова и дата-инженеры нашей команды.
локальная сеть, будущий выход в интернет
вычислительный комплекс и хранение данных в серверных 026, 027, 034, 042, 0014 и кроссовые помещения
конвейеры обработки данных NGS
ЛИС
техподдержка пользователей в домене pak-cspmz.ru на -2, 1, 2, 3 и 4 этажах, диск О и другие общие диски
телефонные номера на Щукинской