Бета-версия нового этно-популяционного калькулятора MDLP K27

По многочисленным просьбам, я все же решил сделать релиз бета-версии нового MDL DIYкалькулятора. Калькулятор носит кодовое название K27 по числу принятых в качестве априорных предковых компонентов.
Нужно отметить, что перед принятием решения о релизе я долго думал о том, имеет ли смысл выкладывать калькулятор и сопутствующую ему версию Genomic Oracle в открытый доступ. После долгих колебаний я все же решил все же выложить

Хочу сразу отметить три важных нюанса:

1) Эта версия коренным образом отличается от тех бета-версий, которые я отправлял на тестирование ув. А.Бурнашеву и С.Козлову

2) Я не собираюсь (пока) встраивать его в калькуляторы Gedmatch

3) Самое важное: в силу гораздо большего охвата референсных популяций (а всего их 429) в мировом масштабе, этот калькулятор будет гораздо менее информативен для европейцев (восточных и западных), в сравнении с другими калькуляторами проекта, уже находящимися на gedmatch. Это связана прежде всего с тем, что между главными кластерами генетического разнообразия европейцев наблюдается крайне низкая степень дивергенции.  Низкая степень дивергенции заметна на графике MDS центроидов генетического разнообразия каждой из использованных популяций (европейцы находятся в очень узком кластере в центре большого скопления в правой части графика)

Скорее всего в  случае с чистыми европейцами, калькулятор будет показывать только ключевые исторические эпизоды смешения популяций. В калькуляторе из 27 кластеров только 3-4 имеют значение для типичных европейцев. Зато (скорее всего) он будет идеальным инструментов для людей с би- и трирасовым происхождением, а также америндов, азиатов, и африканцев. Остальным рекомендую принимать результаты, как говорят англичане, with a grain of salt.

С другой стороны,  судя по дендрограммам кластеров калькулятора, объединение и соединения компонентов имеют четкую и логичную структуру:

Кластеризация компонентов в эвклидовой метрике
Кластеризация по методу Complate Linkage/Chi-square
Chi-Square/Ward’s method

Инструкции по пользованию калькулятором такие же как и в базовой версии калькулятора от Dienekes Pontikos (эти инструкции можно найти в его блоге). Файл параметров называется test.par.

Что касается Oracle, команды аналогичные Dodecad Oracle, c той лишь разницей что рабочая функция называется cответственно MDLOracle и MOracle2.

Ccылки на скачивание

MDLOracle

Oracle

DIYCalculator

Примечание — в этом дистрибутив калькулятора по ошибке не был включен файл с названиями компонентов (test.txt) .
Этот файл содержит названия компонентов в следующем порядке

Nilotic-Omotic
Ancestral-South-Indian
North-European-Baltic
Uralic
Australo-Melanesian
East-Siberean
Ancestral-Yayoi
Caucasian-Near-Eastern
Tibeto-Burman
Austronesian
Central-African-Pygmean
Central-African-Hunter-Gatherers
Nilo-Saharian
North-African
Gedrosia-Caucasian
Cushitic
Congo-Pygmean
Bushmen
South-Meso-Amerindian
South-West-European
North-Amerindian
Arabic
North-Circumpolar
Kalash
Papuan-Australian
Baltic-Finnic
Bantu

Практические результаты использования калькулятора на примере исходных популяций выборки

Расклад предковых компонентов у Этци Тирольского человека

[1,] «S1» «0»
[2,] «28.1% Cypriot + 71.9% Sardinian» «10.4539»
[3,] «28.8% Cretan + 71.2% Sardinian» «10.5494»
[4,] «23.1% Druze + 76.9% Sardinian» «10.5847»
[5,] «19.9% Bulgarian-Roma + 80.1% Sardinian» «10.6089»
[6,] «19.8% Macedonian-Roma + 80.2% Sardinian» «10.6152»
[7,] «20% Roma + 80% Sardinian» «10.6193»
[8,] «29.9% Island-Greek + 70.1% Sardinian» «10.7168»
[9,] «30.3% Ashkenazi + 69.7% Sardinian» «10.8659»
[10,] «19.4% Georgian_Laz + 80.6% Sardinian» «10.928»

Структура компонентов в образцах древней ДНК из пещеры La_Brana

 BRA
[1,] «BRA» «0»
[2,] «75.5% North_Finn + 24.5% Spanish_Basque» «17.0606»
[3,] «24.2% French_Basque + 75.8% North_Finn» «17.3356»
[4,] «77.1% North_Finn + 22.9% Sardinian» «19.5163»
[5,] «24.1% Iberian + 75.9% North_Finn» «21.1495»
[6,] «76.2% North_Finn + 23.8% Spanish» «21.3459»
[7,] «78.5% North_Finn + 21.5% S1» «22.1884»
[8,] «76.7% North_Finn + 23.3% Portuguese» «22.5586»
[9,] «76.3% North_Finn + 23.7% Puerto-Rican» «22.7617»
[10,] «22.1% Corsican + 77.9% North_Finn» «23.2394»

Древнее ДНК пост-мезолитических жителей Швеции (Готланда)

[1,] «Swedish-Mesolithic» «0»
[2,] «8.9% AriblacksmithIbd + 91.1% Latvian» «13.1043»
[3,] «9% Ariblacksmith + 91% Latvian» «13.1644»
[4,] «9.3% Aricultivator + 90.7% Latvian» «13.9085»
[5,] «9.3% AricultivatorIbd + 90.7% Latvian» «13.9138»
[6,] «7.4% AriblacksmithIbd + 92.6% Lithuanian» «15.5735»
[7,] «7.4% Ariblacksmith + 92.6% Lithuanian» «15.6297»
[8,] «92.7% Latvian + 7.3% Wolayta» «15.8622»
[9,] «4.8% Kalash + 95.2% Latvian» «16.2399»
[10,] «7.4% Aricultivator + 92.6% Lithuanian» «16.2569»

Древнее ДНК неолитических жителей Щвеции

1,] «Swedish-Neolithic» «0»
[2,] «61.9% Georgian_Jew + 38.1% Selkup» «22.6282»
[3,] «38.7% Selkup + 61.3% SephardicBul» «22.7533»
[4,] «37.6% Selkup + 62.4% Sephardic_Bulgaria» «23.0667»
[5,] «62.6% Morocco_Jew + 37.4% Selkup» «23.2594»
[6,] «38.2% Selkup + 61.8% SephardicTurk» «23.6872»
[7,] «38.6% Selkup + 61.4% South-Sicilian» «23.7453»
[8,] «38.1% Selkup + 61.9% West-Sicilian» «23.8583»
[9,] «56.3% Georgian_Jew + 43.7% Udmurd» «23.9074»
[10,] «37.2% Ket + 62.8% SephardicBul» «24.21»

Древнее ДНК жителя палеолитической стоянки Мальта (Сибирь)

[2,] «33.7% Brahui + 66.3% Udmurd» «21.9804»
[3,] «34.5% Makrani + 65.5% Udmurd» «22.357»
[4,] «34.3% Balochi + 65.7% Udmurd» «22.413»
[5,] «33.3% Sindhi + 66.7% Udmurd» «24.1198»
[6,] «36.5% Burusho + 63.5% Udmurd» «24.211»
[7,] «39.7% Pashtun + 60.3% Udmurd» «24.3389»
[8,] «34.3% Pathan + 65.7% Udmurd» «24.716»
[9,] «32.2% Pakistani + 67.8% Udmurd» «24.753»
[10,] «41.4% Tadjik + 58.6% Udmurd» «24.852

Довольно-таки интересны результаты литовских татар. Они показывают что основу их популяции составляли группы близкие к современным каракалпакам. Доказан факт смешивание со славянскими популяциями.

[1,] «Tatar_Lithuania» «0»
[2,] «45.7% Belarusian + 54.3% Karakalpak» «4.114»
[3,] «48.2% East-Ukrainian + 51.8% Karakalpak» «4.362»
[4,] «53.2% Karakalpak + 46.8% South-Russian» «4.373»
[5,] «45.7% Center-Russian + 54.3% Karakalpak» «4.4215»
[6,] «51.8% Karakalpak + 48.2% Russian_cossack» «4.7105»
[7,] «53.7% Karakalpak + 46.3% Pole» «4.7189»
[8,] «51.1% Karakalpak + 48.9% Ukrainian» «4.7654»
[9,] «56.2% Karakalpak + 43.8% Russian» «4.9077»
[10,] «49.9% Karakalpak + 50.1% West-Ukrainian» «5.5127»

Результаты дагестанцев. У кумыков из Стальского замтене сдвиг в сторону европейского неолитического фона, у даргинцев из Уркараха — в сторону таджиков, бурушей и пакистанцев

[,1] [,2]
[1,] «Stalskoe» «0»
[2,] «89.3% Lak + 10.7% Sardinian» «5.9513»
[3,] «87.7% Lak + 12.3% S1» «5.9727»
[4,] «90% Lezgin + 10% Sardinian» «6.2035»
[5,] «91.1% Lezgin + 8.9% Spanish_Basque» «6.2534»
[6,] «88.6% Lezgin + 11.4% S1» «6.339»
[7,] «8.8% French_Basque + 91.2% Lezgin» «6.3573»
[8,] «14.8% S1 + 85.2% Urkarah» «6.613»
[9,] «87.4% Lezgin + 12.6% Puerto-Rican» «6.6176»
[10,] «11.3% Iberian + 88.7% Lezgin» «6.6416»

[1,] «Urkarah» «0»
[2,] «87.2% Lak + 12.8% Tadjik» «3.9718»
[3,] «7.4% Brahui + 92.6% Lak» «4.027»
[4,] «7.1% Balochi + 92.9% Lak» «4.1902»
[5,] «90.7% Lak + 9.3% Pashtun» «4.2146»
[6,] «92.9% Lak + 7.1% Makrani» «4.2644»
[7,] «96.3% Lak + 3.7% Orcadian» «4.4254»
[8,] «5.3% Burusho + 94.7% Lak» «4.4391»
[9,] «95.4% Lak + 4.6% Pakistani» «4.4458»
[10,] «95.3% Lak + 4.7% Sindhi» «4.4459»

Чеченцы, как и должно быть находятся как бы посередине между восточно-северокавказскими популяциями и популяциями западной части северного Кавказа (дагестанцами):

[1,] «Chechen» «0»
[2,] «41.7% Balkarian + 58.3% Lezgin» «1.2933»
[3,] «47% Balkarian + 53% Lak» «1.461»
[4,] «48.6% Adygei + 51.4% Lak» «1.5575»
[5,] «43% Adygei + 57% Lezgin» «1.7072»
[6,] «54.3% Lak + 45.7% North-Ossetian» «2.2724»
[7,] «62% Adygei + 38% Urkarah» «2.3513»
[8,] «60.2% Lezgin + 39.8% North-Ossetian» «2.3592»
[9,] «60.3% Balkarian + 39.7% Urkarah» «2.3594»
[10,] «32.1% Cirkassian + 67.9% Lezgin» «2.647»
Доказана примесь тюркских генов у русских казаков

[,1] [,2]
[1,] «Russian_cossack» «0»
[2,] «4% Karakalpak + 96% Pole» «1.6702»
[3,] «92.7% Pole + 7.3% Tatar_Lithuania» «1.673»
[4,] «3.5% Kyrgyz + 96.5% Pole» «1.6749»
[5,] «96.1% Pole + 3.9% Uyghur» «1.6836»
[6,] «96.3% Pole + 3.7% Uygur» «1.6839»
[7,] «3.6% Kazakh + 96.4% Pole» «1.7032»
[8,] «96% Pole + 4% Uzbek» «1.7071»
[9,] «96.1% Pole + 3.9% Turkmen» «1.7144»
[10,] «3.6% Hazara + 96.4% Pole» «1.7184»

Результаты  крымских татар также обнадеживают. Они представлены как смесь ногайцев, башкиров, литовских татар, — и румын, греков из разных областей, что логично.

[1,] «Tatar_Crim» «0»
[2,] «54.3% Nogay + 45.7% South-Greek» «2.26»
[3,] «46.4% Center-Greek + 53.6% Nogay» «2.9529»
[4,] «46.2% Greek + 53.8% Nogay» «3.1448»
[5,] «55.8% Nogay + 44.2% North-Greek» «3.2151»
[6,] «50% Nogay + 50% Romanian_Jew» «3.3766»
[7,] «41.4% Kosovar + 58.6% Nogay» «3.9495»
[8,] «73.3% Greek_Azov + 26.7% Tatar_Lithuania» «4.6688»
[9,] «22.5% Bashkir + 77.5% Greek_Azov» «4.8702»
[10,] «57.6% Nogay + 42.4% Romanian» «5.0906»

Cеверные финны из Куусамо. Они выходят наиболее истинными наследниками палеолитического населения Европы

[,1] [,2]
[1,] «North_Finn» «0»
[2,] «39.8% BRA + 60.2% Finland» «22.1224»
[3,] «49.2% BRA + 50.8% South_Finn» «24.2635»
[4,] «54.8% BRA + 45.2% Finn» «25.2111»
[5,] «64.1% BRA + 35.9% Inkeri» «25.9453»

Отвлеченные заметки на около- и метагенетические темы

Это сообщение знаменует собой начало новой серии постов, посвященных созданию концептуального аппарата и языка описания в новой парадигме исследований, которую мы можем обозначить как НМА (ницшеанскую молекулярную антропологию).

Заметка 1.A представляет репост одной  старой известной статьи на одном из российских порталов.

Зато как приятно, когда, казалось бы, абсолютно социальные феномены наподобие заработка и интеллектуального развития обретают четкие генетические причины: Рой Фрай из университета Питтсбурга, опираясь на обширные экспериментальные данные, собранные им в Калифорнии и его коллегами по всему миру, не просто связал между собой IQ, статус, здоровье, продолжительность жизни, расу и активность парасимпатической нервной системы. Он утверждает, что истоки всех различий – в мутациях всего лишь одного гена. «Врагом народов» оказалась регуляторная часть гена, кодирующего мускариновый рецептор М2, чувствительный к медиатору нервной системы ацетилхолину. Эти рецепторы широко представлены как в центральной нервной системе, так и в парасимпатической, контролирующей функции внутренних органов. Так что даже небольшие изменения количества рецепторов (о качестве речь не идет, ведь мутации – в регулирующей части гена, а не в кодирующей) сказываются и на умственных способностях, и на активности главного «проводника» парасимпатической нервной системы – блуждающего нерва (vagus). Эти мутации, а точнее, точечные замены нуклеотидов и стали тем недостающим звеном, что сходу объяснило сразу все вышеупомянутые различия. Конечно, хорошее здоровье и продолжительность жизни отчасти объясняется и высоким статусом в обществе, доставшимся от родителей, и хорошим образованием. Но как тогда объяснить тот факт, что продолжительность жизни детей, усыновленных в Дании в 1924–1947 годах, коррелировала с социальным классом их биологических родителей, но не юридических? В этом случае классическая генетика просто «требует» наличия какого-то наследственного фактора, связанного одновременно и с IQ, и со здоровьем. Что же касается связи здоровья и активности вагуса, то здесь задействованы сразу две экспериментально подтвержденные гипотезы, названные по фамилии авторов: теория Трэйси, объясняющая низкую интенсивность воспалительных реакций при высоком тонусе вагуса, и теория Тэйера, связывающая через тот же блуждающий нерв эмоциональное и физическое состояние. Причем активность этого нерва, измеренная классической триадой (вариабельность и время восстановления сердцебиений, дыхательная синусовая аритмия), коррелирует не только со средней продолжительностью жизни и с частотой некоторых заболеваний, но и с расой. Вся эта система из полудюжины переменных разом упрощается при принятии «вагусной гипотезы CHMR2». Она не противоречит ни одной из упомянутых связей, но переставляет положения причины и следствия. Согласно «вагусной гипотезе», средний уровень IQ, средняя продолжительность жизни, тонус вагуса и социальный статус зависят от одного нуклеотида в положении rs8191992. Если это аденин (А-вариант гена), то количество рецепторов в клетках организма снижается, тонус блуждающего нерва падает и частота атеросклероза, диабета 2 типа, сердечно-сосудистых заболеваний возрастает – одновременно со снижением интеллектуальных способностей (внимания, способности к концентрации, памяти). Если же это тимин (Т-вариант), то – наоборот. Чтобы связать генетику с расой, Фрай воспользовался прошлогодними данными Элисон Келли-Хеджпет, изучавшей эти аллели в аспекте хронического воспаления. «Иерархия» осталась неизменной: у черных частота «неудачного» А-варианта – 0,86, у белых – 0,57, а самыми счастливыми оказались долгоживущие и мудрые восточноазиаты с 0,12. Новая теория объясняет и так называемый парадокс испанского здоровья: испаноговорящие жители США, равно как и индейцы, несмотря на относительно низкий по сравнению с белыми средний IQ и социальный статус, живут достоверно дольше. Но у них же частота «плохого» А-варианта оказалась равной 0,33. Это, в свою очередь, подтверждает преимущество логической цепочки «рецептор-вагус-здоровье» над доминировавшей до сегодняшнего дня «интеллект-образование-статус-достаток-здоровье». С изысканиями Фрая, равно как и с более чем достаточными табличными и графическими данными можно даже без специального образования познакомиться в Nature Precedings. И хотя разница не настолько велика, чтобы говорить о господстве одной расы над другой, в её достоверности усомниться не получается. В ближайшем будущем вряд ли появится новый фактор, способный так же сконцентрировать вокруг себя все переменные, как это удалось гену CHMR2.

Открытое письмо к Ивару Максутову и редколлегии портала Постнаука

 

Здравствуйте, уважаемый Ивар и члены редколлегии Постнаука!

Обращаюсь к Вам с предложением напечатать на Вашем портале небольшую заметку о пост-научном явлении/движение. Эта заметка будет интересна самому широкому кругу лиц. Во-первых, она напрямую связана с наиболее важными на сегодняшний день сферами научного исследования — персональной геномики. Причем речь пойдет именно о пост-научном, научно-партизанском или пост-академическом подходе к изучению этой области, а именно о крайне новаторской парадигме изучения персональной геномики — парадигме так называемых персональных геномных блоггерах и их некоммерческих проектах генетико-генеалогического изучения генотипов десятков и сотен тысяч людей по всему миру. Это зарождающаяся область внеакадимческого и абсолютно-прикладного характера уже удостоилась внимания издателей журнала Nature.

http://www.nature.com/news/2010/101215/full/468880a.html

Если Вы согласны с размещением моей краткой статьи на портале, то Вашему читателю представиться абсолютно уникальный шанс присутствовать при становлении новой научной платформы, которая с одной стороны уже сейчас гораздо проще и доступнее для конечных рядовых потребителей, которые получили огромный массив личных «генетических» данных, но не знаю что с ними делать. А во-вторых многие из этих любителей персональных геномных блоггеров уже сейчас имеют компетенцию выше и шире чем многие их академические коллеги.

Еще раз о важности митохондриальной ДНК

Пару дней тому назад в журнале Nature была опубликована весьма важная статья.

Постоянные читатели моего блога наверно помнят мои пространные сообщения насчет проявления в фенотипе мутаций митохондриального ДНК. В числе прочего — я указывал на том что наследуемая часть (heritability) интеллектуальных способностей очень тесно связано с мутациями в ДНК. А ведь эти же мутации определяют митохондриальную ‘женскую’ гаплогруппу.

Теперь наше предположение получило фактическое подтверждение в новой работе популяционных генетиков. Она важна для НМА не только в связи с объяснением генетических аспектов формирования интеллекта, но также из-за убедительной связи наследуемых мутаций и старения. По-моим многолетним наблюдениям, люди mito-JT стареют гораздо медленней людей HV.

Краткий реферат статьи c портала РИА новости.

«Ученые впервые показали, что процесс старения происходит не только в результате накопления мутаций в митохондриальной ДНК в течение жизни. Мутации, унаследованные от матери, могут ускорять процесс старения. МОСКВА, 21 авг — РИА Новости. Ученые впервые показали, что старение клеток организма определяется не только накоплением мутаций в ДНК в течение жизни, но и унаследованными от матери мутациями в митохондриальной ДНК, говорится в статье, опубликованной в журнале Nature. В процессе старения в клетках организма накапливаются мутации, нарушающие их работу. Наиболее важным элементом этого процесса ученые считают старение митохондрий. Митохондрии, присутствующие практически во всех клетках живых организмов, жизненно важны, поскольку преобразуют питательные вещества в АТФ — «топливо» для клеток. «У митохондрий есть своя собственная ДНК, которая меняется сильнее, чем ДНК ядра, и это существенно влияет на процесс старения. Накопление мутаций в митохондриях постепенно останавливает выработку энергии в клетках», — пояснил ведущий автор исследования Нильс-Горан Ларсон (Nils-Gоran Larsson) из Каролинского института в Стокгольме (Швеция). Ларсон и его коллеги провели эксперименты на мышах, специально выведенных с мутациями в митохондриальной ДНК. Ученые впервые показали, что процесс старения происходит не только в результате накопления мутаций в митохондриальной ДНК в течение жизни. Мутации, унаследованные от матери, могут ускорять процесс старения. Неожиданно для себя ученые также выявили, что унаследованные мутации в митохондриальной ДНК вместе с большим количеством мутаций, накопленных в течение жизни, могут приводить к деформации ткани мозга, особенно в гиппокампе, области, отвечающей за память и ориентацию в пространстве. Ученые полагают, что разработка терапии, замедляющей старение, возможна. В частности, изменение диеты и лекарственные препараты, например, антиоксиданты, могут восстановить работу митохондрий и уменьшить их гибель.

Ссылка на англоязычный вариант статьи.

Инструменты и программы в генетической генеалогии

Этой заметкой мы открываем новую серию записей, в которых мы будем давать краткое описание существующих инструментов генетического генеалога.

Поговорим в начале  о самых простых и самых новых инструментах.

GUI-wrapper этно-популяционного калькулятора DIY Dodecad.

Ссылка на сайт разработчика.

Многие люди жалуются на проблемы с пониманием принципов работы с калькуляторами Dienekes Dodecad, особенно что касается обработки файлов в программной среде R.  Благодаря неистощимой креативности программистов-любителей генетической генеалогии был написан wrapper (на основе платформы Microsoft.NET), позволяющий работать с калькуляторам без использования R.
Запустите исполняемое приложение exe и перетащите свой файл с генотипами от 23andme/FTDNA в окно приложения.

Отработав все циклы, программа выведет в окно приложения таблицу с процентным соотношением компонентов в исследуемом индивидуальном наборе генотипов.

 Chromosomal  Segment Painter

Программа для раскрашивания предковых хромосомных сегментов

http://blog.kittycooper.com/2013/08/chromosome-mapping-tool-released/

Концепт этот онлайнового приложения похож на стандартный инструмент Family Inheritance в 23andme, с той лишь разницой, что в отличие от 23andme, количество цветов в палитре индивидуализации сегментов гораздо выше, и в принципе неограниченно.

Эта программа требует на входе файла CSV наличие определенных заголовок, столбцов, содержания, перечисленных, с учетом регистра и в любом порядке. Первоначально этот инструмент был задуман для изображения общих по происхождению ДНК сегментов в геномах лиц, чье родство было заведомо известно,  а не для поиска перекрывающихся  ДНК-сегментов нескольких групп неизвестных родственников.

В принципе, программа будет работать в обеих случаях. Последняя версия программы будет работать с загруженными из DNAgedcom файлами CSV или с любым файлом CSV, содержающий отформартированный особым образом список людей и сегментов.

Рекомендуемый порядок работы с программой:
1) сначала нужно скачать CSV файл c координатами совпадающих сегментов с 23andme или FTDNA

2) осортировать в файле Excel крупные сегменты,  и сохранить его как CSV,

3) затем запустить его в преобразователь, чтобы увидеть двадцатку ваших лучших совпадений.

Будущая версия будет иметь более широкую функциональность для отображения нескольких неизвестных родственников ДНК, которые разделяют перекрывающиеся сегменты ДНК с вами. Причем если в настоящее время отображаются только две линий, то в будующем таких линий будет больше.

Чтобы лучше понять концепцию отображения сегементов хромосмоы, прочитайте статью вики на сайте ISOGG  про отображение.

Новая работа по геному неандертальцев и денисовцев.

В июле этого года в журнале Gene появилась замечательная работа Neanderthal and Denisova genetic affinities with contemporary humans:
Introgression versus common ancestral polymorphisms/Robert K. Lowery, Gabriel Uribe , Eric B. Jimenez , Mark A. Weiss, Kristian J. Herrera, 
Maria Regueiro, Rene J. Herrera. Gene . Особого внимания в этой работе заслуживает постановка вопроса в исследовании вопроса о схожести геномов денисовцев и неандертальцев с современными человеческими популяциями.  В этой связи я позволю себе удовольствие процитировать краткий реферат этой статьи в изложении профессионального русскоязычного генетика Людмилы Р.:

Авторы решали вопрос — являются ли те 1-4% генетического сходства между
архаичными гоминидами и современными людьми результатом имевшего место смешивания или общего наследственного полиморфизма, который сохранился в человеческой популяции?
Авторы сравнили 5 млн.SNPs (финальный набор 37,758 SNPs) ныне живущих людей (n=827 из 11 популяций) и архаичных гоминид. Они разделили снипы на 4 группы, которые, логично предположить, происходили в разные отрезки времени –
NdDa –у неандертальцев –derived (мутировавшие) и ancestral (предковые) – у денисовцев,
NaDd — у неандертальцев – ancestral и derived у денисовцев,
NdDd — derived у неандертальцев и денисовцев,
NaDa – ancestral у неандертальцев и денисовцев.
Ancestral и derived снипы определялись по сравнению с шимпанзе.
Ранее предполагалось, что не-Африканские популяции содержат 1-4% генома, доставшегося им от неандертальцев, в отличие от популяций Sub-Saharan-Africans, за счет того, что было смешивание с неандертальцами после выхода человека из Африки. По этому сценарию, все потомки древней человеческой популяции должны содержать равное количество неандертальской ДНК. При этом отличия Sub-Saharan-Africans и non- Sub-Saharan-Africans приписываются gene flow от неандертальцев. Но то, что какой-то SNP у человека, найден у неандертальцев, но не найден у шимпанзе, не означает, что он появился у неандертальца. Такая мутация могла произойти от времени разделения линий шимпанзе и гоминид ( 4-7 млн.лет назад) до времени разделения ветвей человека и неандертальца (400-800 тыс.лет назад). Т.е. выявленные общие SNPs у человека и неандертальцев могут означать их общий предковый полиморфизм.
Авторы не отказываются от “выхода человека из Африки”, но предполагают, что региональные различия в Африке внутри общей предковой популяции были уже на ранних стадиях, и люди, которые мигрировали из Африки, могли представлять собой субпопуляции с более высоким сродством с неандертальцами или денисовцами.
11 популяций, которые участвовали в сравнении:
Abbreviation n Region Populations included
a 123 Sub-Saharan Africa Yoruba, Mandenka, San, Bantu,
Biaka Pygmy, Mbuti Pygmy
b 41 Northern Africa Ethiopians, Egypt, Morocco
c 68 Caucasus Georgia, Armenians, Lezgins, Adygei
e 124 Europe Lithuanian, Belorussian, Romanian,
Cypriot, Hungarian, Basque, Russian,
Spanish, Chuvash
m 33 Melanesian Papuan, Bouganville
n 31 Amerindian Pima, Piapoco, Curripaco, Mayan
s 67 South Central Asia Paniya, Kannadi, Sakilli, Kalash, Uygur,
Barusho, Balochi
r 35 SouthWest Asia Iranian, Uzbekistan
d 30 South East Asia Yizu, Cambodian, Lahu, Malayan
t 34 North East Asia Yakut, Mongolian, Daur
z 241 Near-East Jordan, Samaritan, Syrian, Druze,
Bedouin, Mozabite, Palestinian,
Turkey, Lebanon, Saudi, Yemen
В работе использовали методы популяционной генетики — Principal component (PC) и Structure analyses, D-statistics. Авторы делают выводы, что присутствие 3,6 % неандертальских генов в европейских геномах более похоже на полиморфизм нашего общего предка, чем на результат спаривания видов. % общих генов уменьшается с продвижением на восток в Евразию. Предполагаемая примесь у меланезийцев денисовских генов может также свидетельствовать об их общем предке.

Примечательно, что задолго до публикации этой интересной статьи, к аналогичным выводам пришли любители — антрополог Джон Хоукз (анализ интрогрессии геномов в выборке 1000genomes) и уже ставший живой легендой геномный блогер Диенек Понтикос ( пост о вопросе наличия неандертальский/денисовский адмикса) . Эти выводы противоречат широко растиражированному в масс-медиа выводу о том что «неандертальцы занимались сексом с предками современных людей, за исключением африканцев из региона Суб-Сахары». Этот фривольный медиа-мем возник на основании вольной интерпретации серьезного исследования коллектива под руководством Сванте Паабо. Позже появилось еще одно исследование «The Shaping of Modern Human Immune Systems by Multiregional Admixture with Archaic Human», в котором было показано, что  вклад денисовца в евразийские гены оказался более скромным, однако его доля, как выяснилось, достигает 6% у современных меланезийцев и населения Новой Гвинеи. Соответственно, в средства массовой информация прошла очередная ‘сексуальная’ новость — оказывается, «cпособность успешно противостоять евразийским микробам мы обрели благодаря бракам с неандертальцами и денисовцами». Причем никто из журналистов, похоже не вникал в технические особенности этих работ, в которых ascertainment (установление) снипов производилось по субсахарской популяции бушменов.

Обсуждаемая здесь новая статья позволяет взглянуть на эту проблему под другим углом, c использованием новых методов попгенетики  анализ адмикса, главных компонентов разнообразия и D-статистики.  При интерпретации авторы обосновано отмечают ряд недостатков растиражированной в масс-медиа версии о сексе с архаичными гомининами:

Существуют два возможных сценария генезис снипов, которые обнаружены у неандертальцев, денисовских людей и современных людей: 1) они возникли у общих предков всех трех групп или 2) снипы могут являться следствием  обмена генами между эти тремя группами.

Результаты D-статистических анализов демонстрируют более высокое присутствие NdDd (derived у неандертальцев и денисовцев) аллелей в Африке к югу от Сахары относительно всех евразийцев и населения Северной Африки. Конечно, сочетание этих двух сценариев может объяснить происхождение подмножества снипов в наборе NdDd подмножество. В модели европейской примеси (адмикса),  у африканцев Субсахары должно быть меньше NdDd аллелей, чем у евразийцев и населения Северной Африки. Исходя из этого, высокий процент NdDd аллелей в субсахарских популяциях является решающим  аргументом в пользу происхождения этих аллелей от древних гоминид, а не в пользу версии смешивания с архаичными людими. Кроме того, к югу от Сахары доля 3 из 5 NdDd компонентов адмикса , включает в себя примерно 30% от общего числа снипов в NdDd  (1 компонент, 6 и 10 на рис. 10), что предполагает общее происхождение предков, а не трехстороннее смешивание для снипов, включенных в панель NdDd . Дополнительным аргументов в пользу сценария общего предкового полиморфизма является расположение снипов NdDd неандертальцев и Денисова NdDd в пространстве первого главного компонента разнообразия PC1 (рис. 5) рядом с субафриканскими популяциями. Этот результат является неожиданным, учитывая, что генотипы NdDd состоят только из деривативных (derived) аллелей. Интересно, что снипы NdDd демонстрируют сопоставимые характеристики D-статистики  в популяциях меланезийцев и африканцев Субсахары. Обе группы — меланезийцы и субсахарские африканцы —  генерируют более высокие показатели D-статистики на основании снипов NdDd основана D-статистики, — примерно на 0,7% выше, чем у выходцев из Северной Африки и на 1,5% выше, чем у жителей Северо-Восточной Азии (табл. 2;. Рис 11). Кроме того, если мы предположим, что смешивание между тремя группами (предками современных людей, неандертальцами и денисовцами) является важным источником снипов NdDd , то можно  было бы ожидать более высокую степень генетического обмена между европейцами и меланезийцами, однако, во всех наших анализах Structure, ни один такой обмен не наблюдается.

science science2

Эксперимент

С целью проверки выводов этого исследования я провел дополнительное исследование этого вопроса с использованием большого количества современных популяций (более трехста популяций), большего числа снипов (примерно 300 000 снипов) и альтернативных методов — программы Admixture и MDS (мультидименсионального скалирования).

Результаты нашего анализа замечательно согласуются с результатами в обсуждаемой статье. Например, на графике PCA (в пространстве двух первых главных компонентов генетического разнообразия), неандертальцы и денисовцы оказываются в окружении трех субсахарских популяций — гумуз, ари из Восточной Африки и лемба из южной Африки. 

R Graphics Output

R Graphics Output

Результаты Admixture также мало чем отличаются от результатов аналогичного анализа Structure в работе профессиональных попгенетиков. Снипы неандертальцев и денисовского человека (взятые из кураторского набора данных лаборатории Райха (SNP ascertainment panel)) образуют особый компонент вместе со снипами субсахарских популяций бушменов, коса и сандаве.

Denisova Denisova 99,98%
Neander Vindija 99,98%
San HGDP00991 99,98%
San HGDP01032 99,98%
San HGDP01036 99,98%
San SA36 99,98%
San SA34 99,98%
San SA52 99,98%
San SA19 99,98%
San HGDP00988 99,54%
San HGDP01029 99,19%
San HGDP00992 98,47%
San SA53 97,53%
San SA47 93,98%
San SA41 93,28%
San SA22 92,13%
San SA32 91,10%
Neander Clint 90,75%
San SA48 89,58%
San SA30 89,40%
San SA55 88,93%
San SA35 88,18%
San SA61 85,45%
San SA50 83,92%
San SA29 81,14%
San SA04 78,20%
San SA37 74,40%
San SA56 74,34%
San SA38 74,17%
San SA21 70,00%
San SA06 69,85%
San SA28 61,13%
San SA03 57,39%
San SA40 56,62%
San SA49 54,89%
San SA45 47,39%
San SA58 43,01%
San SA39 41,33%
San SA59 34,80%
Bantu HGDP01030 33,37%
Xhosa XH4 26,85%
Xhosa XH20 25,99%
Xhosa XH14 24,78%
Bantu HGDP00993 23,99%
Bantu HGDP00994 23,02%
Bantu HGDP01034 21,48%
San SA25 21,28%
Bantu HGDP01033 15,40%
Sandawe HG43 14,20%
Sandawe HG60 14,04%
Sandawe HG40 13,77%
Sandawe HG35 13,56%
Sandawe HG44 13,51%
Sandawe HG56 13,37%
Sandawe HG46 13,26%
Sandawe HG41 13,25%
Sandawe HG66 13,18%
Sandawe HG47 13,09%
Sandawe HG49 12,93%
Sandawe HG67 12,75%
Sandawe HG55 12,63%
Sandawe HG45 12,43%
Sandawe HG63 12,14%
Aricultivator Aricultivator11 12,13%
Ariblacksmith Ariblacksmith2 12,13%
Sandawe HG42 12,10%
Ariblacksmith Ariblacksmith3 11,92%
Sandawe HG38 11,85%
Ariblacksmith Ariblacksmith7 11,83%
Sandawe HG53 11,76%
Ariblacksmith Ariblacksmith6 11,70%
Aricultivator Aricultivator2 11,67%
AricultivatorIbd Aricultivator23Ibd 11,54%
Ariblacksmith Ariblacksmith10 11,49%
Ariblacksmith Ariblacksmith8 11,48%
Aricultivator Aricultivator17 11,46%
Aricultivator Aricultivator4 11,42%
AricultivatorIbd Aricultivator24Ibd 11,28%
Sandawe HG48 11,22%
Aricultivator Aricultivator15 11,18%

Более любопытные результаты получены при применении рекомендованного Диенеком Понтикосом метода Mclust, метода который позволяет за счет редуцирования числа измерений набора статистических данных избавиться от шума и проблем, связанных с различием в составе использованных выборок. Как видно, из приведенной ниже таблицы набор снипов неандертальцев и денисовцев кластеризуется не только с африканскими популяциями, но и с меланезийцами, и даже инбридинговыми популяциями индейцев из южной Америки, популяциями с хорошо заметным эффектом генного дрейфа

Neander Clint 100,00%
Denisova Denisova 100,00%
Neander Vindija 100,00%
Papuan HGDP00542 100,0000%
Papuan HGDP00554 100,0000%
NAN_Melanesian HGDP00662 100,0000%
NAN_Melanesian HGDP01027 100,0000%
Papuan HGDP00543 100,0000%
Papuan HGDP00555 100,0000%
NAN_Melanesian HGDP00663 100,0000%
Papuan HGDP00544 100,0000%
Papuan HGDP00556 100,0000%
NAN_Melanesian HGDP00664 100,0000%
Papuan HGDP00545 100,0000%
NAN_Melanesian HGDP00490 100,0000%
NAN_Melanesian HGDP00787 100,0000%
Papuan HGDP00546 100,0000%
NAN_Melanesian HGDP00491 100,0000%
NAN_Melanesian HGDP00788 100,0000%
Papuan HGDP00547 100,0000%
NAN_Melanesian HGDP00655 100,0000%
NAN_Melanesian HGDP00789 100,0000%
Papuan HGDP00548 100,0000%
NAN_Melanesian HGDP00656 100,0000%
NAN_Melanesian HGDP00823 100,0000%
Pima HGDP01048 100,0000%
Papuan HGDP00541 100,0000%
Papuan HGDP00553 100,0000%
NAN_Melanesian HGDP00661 100,0000%
NAN_Melanesian HGDP00979 100,0000%
Karitiana HGDP00998 100,0000%
Karitiana HGDP01011 100,0000%
Surui HGDP00833 100,0000%
Surui HGDP00846 100,0000%
Karitiana HGDP01010 100,0000%
Surui HGDP00832 100,0000%
Surui HGDP00845 100,0000%
Papuan HGDP00550 100,0000%
NAN_Melanesian HGDP00658 100,0000%
NAN_Melanesian HGDP00825 100,0000%
Karitiana HGDP00999 100,0000%
Karitiana HGDP01012 100,0000%
Surui HGDP00834 100,0000%
Surui HGDP00847 100,0000%
Papuan HGDP00540 100,0000%
Papuan HGDP00552 100,0000%
NAN_Melanesian HGDP00978 100,0000%
Karitiana HGDP01000 100,0000%
Karitiana HGDP01013 100,0000%
Surui HGDP00835 100,0000%
Surui HGDP00848 100,0000%
Karitiana HGDP01001 100,0000%
Karitiana HGDP01014 100,0000%
Surui HGDP00837 100,0000%
Surui HGDP00849 100,0000%
Karitiana HGDP01003 100,0000%
Karitiana HGDP01015 100,0000%
Surui HGDP00838 100,0000%
Surui HGDP00850 100,0000%
Karitiana HGDP01004 100,0000%
Karitiana HGDP01016 100,0000%
Surui HGDP00839 100,0000%
Surui HGDP00851 100,0000%
Surui HGDP00843 100,0000%
Pima HGDP01050 100,0000%
Karitiana HGDP01005 100,0000%
Karitiana HGDP01017 100,0000%
Surui HGDP00840 100,0000%
Surui HGDP00852 100,0000%
Karitiana HGDP01006 100,0000%
Karitiana HGDP01018 100,0000%
Surui HGDP00841 100,0000%
Karitiana HGDP00996 100,0000%
Karitiana HGDP01008 100,0000%
Papuan HGDP00551 100,0000%
Karitiana HGDP00995 100,0000%
Karitiana HGDP01007 100,0000%
Karitiana HGDP01019 100,0000%
Surui HGDP00842 100,0000%
Karitiana HGDP00997 100,0000%
Surui HGDP00830 100,0000%
Surui HGDP00844 100,0000%
NAN_Melanesian HGDP00657 100,0000%
NAN_Melanesian HGDP00824 100,0000%
Papuan HGDP00549 100,0000%
Hadza BAR01 100,0000%
Hadza BAR04 100,0000%
Hadza BAR07 100,0000%
Hadza BAR08 100,0000%
Hadza BAR10 100,0000%
Hadza BAR11 100,0000%
Hadza BAR13 100,0000%
Hadza END08 100,0000%
Hadza END09 100,0000%