Географическое распространение компонентов нового калькулятора проекта MDL K27

Не успела бета-версия моего нового этно-популяционного калькулятора и сопутствующего ему геномного оракула (Dodecad oracle) пойти в массы, как один талантливый россиянин Сергей Козлов из Новосибирска (о котором я уже много раз упоминал в блоге) написал программу, позволяющую довольно точно проецировать/предсказывать ареал происхождения анализируемого человека по мере степени увеличения или убывания  процентов предковых компонентов (или аллельных частот)  в отношении к априори заданым точкам на контурным картам (эти точки на контурной карте соответствуют контрольным группам референсных популяций).

Отклоняясь в сторону от темы, хочу отметить что два года назад, когда я начал работу над проектом MDL, я не надеялся найти активных последователей среди русскоговорящего населения, хотя задекларированный в анонсе ареал проекта частично охватывал часть современной западной европейской части России.  Причина моего пессимизма была очевидна — современные русские (впрочем как и 90% прочего человеческого населения) ленивы, глупы и любят бесплатно паразитировать на результатах труда других людей.  К началу 2011 года можно было по пальцам пересчитать тех русскоязычных людей, которые занимались  практическим изучением аутосомного родства и изучения происхождения, или создавали соответствующее программное обеспечение. По прошествии 2 лет,  я должно признать, что в своих мрачных прогнозах немного ошибался.   К счастью, не перевелись еще в известных российских IT-селениях вроде Новосибирска энтузиасты-кулибины.  А это означает, что надежда на пробуждение массового  интереса к ДНК-генеалогии в РФ, так же как это произошло уже в США, где уже сейчас можно наблюдать геномную революцию  во всей ее динамике.

Но вернемся к теме.

Итак,  уважаемый Сергей Козлов разработал интересное программное решение для визуализации пространственного расположения индивида, исходя исключительно из аллельных чистот снипов в геноме:

Я написал программу для совмещения данных этно-калькулятора с географической картой. Чем краснее область, тем более похож протестированный на ее жителей. И наоборот, чем зеленее, тем дальше от них. Черным цветом надписаны популяции, основанные на данных реальных людей, серым — частично или полностью основанные на предположениях.

В связи  с этим, нужно отметить два важных нюанса.
Во-первых,  число реперных точек (т.е «реперных» популяций) по европейской части РФ у Сергея  гораздо выше, чем в оригинальной бета-версии моего калькулятора K27 . Число точек в модификации Сергея было увеличено за счет включения фиксирующих дополнительных групп народонаселения РФ.
Во-вторых, cама идея визуализации  геномных данных на географической карте далеко не нова.  Весной этого года, в своей большой обзорной статье о принципах созданиях этно-популяционных калькуляторов на примере MDL World K22,  я указал на возможность визуализации коэффициентов адмикса в географическом пространстве:

… я решил визуализировать компоненты на поверхности земного шара путем отображения коэффициентов адмикса. Избегая излишних премудростей, я воспользовался готовым рецептом Франсуа Оливье, который предложал  использовать графическую библиотеку статистического программного обеспечения R для отображения пространственной интерполяции  коэффициентов адмикса (Q матрица) в двух измерениях (где пространственные координаты записываются как географические долгота и широта).

При вдумчивом прочтении подобных методов, встает неизбежный вопрос — почему градиенты аллельных частот в геноме людей являются крайне информативными при определении места их происхождения?   Частичный ответ на этот вопрос можно найти в другой моей заметке «О новых перспективах геномной геногеографии: SPA анализ участников проекта MDL«. В этой заметке я обсуждал перспективу расширения традиционных геногеографических методов, так как эксплицитное пространственное моделирования частот аллелей позволяет достаточно точно локализовать положение отдельно взятого человеческого индивида  на географической карте только на основании генетической информации. Если географическое происхождение лиц известно априори, то можно использовать эту информацию для определения функции частот аллелей в каждом SNP. Однако, если таковая информация отсутствует, то наша модель позволяет определить географическое происхождение физических лиц, используя только их генетические данные аналогично более известному методу  многомерного скалирования , основанному на определении пространственных координат статистических параметров.
Это заключение подтверждается в независимом исследовании компании 23andme, согласно которому анализ главных компонентов генетического разнообразия в геноме человека позволяет точно определить его место происхождения в Европе.

К сожалению, в отличии от авторов программы SPA, Cергей Козлов пока не счел нужным опубликовать формальное описание своего метода. Вместо этого, он обкатал программу на данных живых людей и привел их результаты. Вот результаты самого Сергея

Легенда

Результаты «типичного русского»

Результаты карпатского русина

Кроме этого, программа  Сергея умеет визуализировать частоты компоненты калькулятора в мировом масштабе. Ниже приведены все 27 компонентов калькулятора в алфавитном порядке:

Ancestral-South-Indian Ancestral-Yayoi Arabic Australo-Melanesian Austronesian Baltic-Finnic Bantu Bushmen Caucasian-Near-Eastern Central-African-Hunter-Gatherers Central-African-Pygmean Congo-Pygmean Cushitic East-Siberean Gedrosia-Caucasian Kalash Nilo-Saharian Nilotic-Omotic North-African North-Amerindian North-Circumpolar North-European-Baltic Papuan-Australian South-Meso-Amerindian South-West-European Tibeto-Burman Uralic

Географическое распространение компонентов нового калькулятора проекта MDL K27: Один комментарий

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s