Официальное извещение о начале нового проекта

18 февраля решил заново начать свой проект по изучению аутосом народонаселения восточной Европы.
Формально это означает окончание моего предыдущего проекта MDLP.
Я решил начать с нуля — на этот раз в основу будет положен контрольный сет из 400 000 снипов лаборатории Райха (Affymetrix HumanOriginsv3), точнее подмножество снипов этого сета, прошедшее контрольные QC-тесты.
Первая задача — самая трудная. Нужно импутировать на основании имеющихся 300-400 Kb те 990 000 снипов референсной панели 1000G (эти общие снипы референсной панели фазированных гаплотипов 1000G и чипсета 23andme v3.
Основная трудность в компьютерной ресурсозатратности задачи (на ее выполнение в кластерной системе из 8 узлов с 16 виртуальными процессорами и 136 гигабайтами оперативной памяти RAM требуется несколько недель распределенных вычислений).
Я попытаюсь выполнить эту задачу с помощью наименее эргоемкой комбианции — предварительного фазирования гаплотипов в SHAPEIT и импутации в IMPUTE2.
Если удастся — можно будет создать успешный пайплайн (на основании уже существующих образцов, которые я установил  на EC2-виртуальной машине амазоновского облака)  для прямого и максимально точного непосредственного сравнения сотен древних геномов с даннами клиентов компаний FTDNA и 23andme.

Будет тяжело, но без этого sine qua non этапа будущность моих исследований под большим вопросом

Официальное извещение о начале нового проекта: Один комментарий

Оставьте комментарий