Бета-версия нового этно-популяционного калькулятора MDLP K27

По многочисленным просьбам, я все же решил сделать релиз бета-версии нового MDL DIYкалькулятора. Калькулятор носит кодовое название K27 по числу принятых в качестве априорных предковых компонентов.
Нужно отметить, что перед принятием решения о релизе я долго думал о том, имеет ли смысл выкладывать калькулятор и сопутствующую ему версию Genomic Oracle в открытый доступ. После долгих колебаний я все же решил все же выложить

Хочу сразу отметить три важных нюанса:

1) Эта версия коренным образом отличается от тех бета-версий, которые я отправлял на тестирование ув. А.Бурнашеву и С.Козлову

2) Я не собираюсь (пока) встраивать его в калькуляторы Gedmatch

3) Самое важное: в силу гораздо большего охвата референсных популяций (а всего их 429) в мировом масштабе, этот калькулятор будет гораздо менее информативен для европейцев (восточных и западных), в сравнении с другими калькуляторами проекта, уже находящимися на gedmatch. Это связана прежде всего с тем, что между главными кластерами генетического разнообразия европейцев наблюдается крайне низкая степень дивергенции.  Низкая степень дивергенции заметна на графике MDS центроидов генетического разнообразия каждой из использованных популяций (европейцы находятся в очень узком кластере в центре большого скопления в правой части графика)

Скорее всего в  случае с чистыми европейцами, калькулятор будет показывать только ключевые исторические эпизоды смешения популяций. В калькуляторе из 27 кластеров только 3-4 имеют значение для типичных европейцев. Зато (скорее всего) он будет идеальным инструментов для людей с би- и трирасовым происхождением, а также америндов, азиатов, и африканцев. Остальным рекомендую принимать результаты, как говорят англичане, with a grain of salt.

С другой стороны,  судя по дендрограммам кластеров калькулятора, объединение и соединения компонентов имеют четкую и логичную структуру:

Кластеризация компонентов в эвклидовой метрике
Кластеризация по методу Complate Linkage/Chi-square
Chi-Square/Ward’s method

Инструкции по пользованию калькулятором такие же как и в базовой версии калькулятора от Dienekes Pontikos (эти инструкции можно найти в его блоге). Файл параметров называется test.par.

Что касается Oracle, команды аналогичные Dodecad Oracle, c той лишь разницей что рабочая функция называется cответственно MDLOracle и MOracle2.

Ccылки на скачивание

MDLOracle

Oracle

DIYCalculator

Примечание — в этом дистрибутив калькулятора по ошибке не был включен файл с названиями компонентов (test.txt) .
Этот файл содержит названия компонентов в следующем порядке

Nilotic-Omotic
Ancestral-South-Indian
North-European-Baltic
Uralic
Australo-Melanesian
East-Siberean
Ancestral-Yayoi
Caucasian-Near-Eastern
Tibeto-Burman
Austronesian
Central-African-Pygmean
Central-African-Hunter-Gatherers
Nilo-Saharian
North-African
Gedrosia-Caucasian
Cushitic
Congo-Pygmean
Bushmen
South-Meso-Amerindian
South-West-European
North-Amerindian
Arabic
North-Circumpolar
Kalash
Papuan-Australian
Baltic-Finnic
Bantu

Практические результаты использования калькулятора на примере исходных популяций выборки

Расклад предковых компонентов у Этци Тирольского человека

[1,] «S1» «0»
[2,] «28.1% Cypriot + 71.9% Sardinian» «10.4539»
[3,] «28.8% Cretan + 71.2% Sardinian» «10.5494»
[4,] «23.1% Druze + 76.9% Sardinian» «10.5847»
[5,] «19.9% Bulgarian-Roma + 80.1% Sardinian» «10.6089»
[6,] «19.8% Macedonian-Roma + 80.2% Sardinian» «10.6152»
[7,] «20% Roma + 80% Sardinian» «10.6193»
[8,] «29.9% Island-Greek + 70.1% Sardinian» «10.7168»
[9,] «30.3% Ashkenazi + 69.7% Sardinian» «10.8659»
[10,] «19.4% Georgian_Laz + 80.6% Sardinian» «10.928»

Структура компонентов в образцах древней ДНК из пещеры La_Brana

 BRA
[1,] «BRA» «0»
[2,] «75.5% North_Finn + 24.5% Spanish_Basque» «17.0606»
[3,] «24.2% French_Basque + 75.8% North_Finn» «17.3356»
[4,] «77.1% North_Finn + 22.9% Sardinian» «19.5163»
[5,] «24.1% Iberian + 75.9% North_Finn» «21.1495»
[6,] «76.2% North_Finn + 23.8% Spanish» «21.3459»
[7,] «78.5% North_Finn + 21.5% S1» «22.1884»
[8,] «76.7% North_Finn + 23.3% Portuguese» «22.5586»
[9,] «76.3% North_Finn + 23.7% Puerto-Rican» «22.7617»
[10,] «22.1% Corsican + 77.9% North_Finn» «23.2394»

Древнее ДНК пост-мезолитических жителей Швеции (Готланда)

[1,] «Swedish-Mesolithic» «0»
[2,] «8.9% AriblacksmithIbd + 91.1% Latvian» «13.1043»
[3,] «9% Ariblacksmith + 91% Latvian» «13.1644»
[4,] «9.3% Aricultivator + 90.7% Latvian» «13.9085»
[5,] «9.3% AricultivatorIbd + 90.7% Latvian» «13.9138»
[6,] «7.4% AriblacksmithIbd + 92.6% Lithuanian» «15.5735»
[7,] «7.4% Ariblacksmith + 92.6% Lithuanian» «15.6297»
[8,] «92.7% Latvian + 7.3% Wolayta» «15.8622»
[9,] «4.8% Kalash + 95.2% Latvian» «16.2399»
[10,] «7.4% Aricultivator + 92.6% Lithuanian» «16.2569»

Древнее ДНК неолитических жителей Щвеции

1,] «Swedish-Neolithic» «0»
[2,] «61.9% Georgian_Jew + 38.1% Selkup» «22.6282»
[3,] «38.7% Selkup + 61.3% SephardicBul» «22.7533»
[4,] «37.6% Selkup + 62.4% Sephardic_Bulgaria» «23.0667»
[5,] «62.6% Morocco_Jew + 37.4% Selkup» «23.2594»
[6,] «38.2% Selkup + 61.8% SephardicTurk» «23.6872»
[7,] «38.6% Selkup + 61.4% South-Sicilian» «23.7453»
[8,] «38.1% Selkup + 61.9% West-Sicilian» «23.8583»
[9,] «56.3% Georgian_Jew + 43.7% Udmurd» «23.9074»
[10,] «37.2% Ket + 62.8% SephardicBul» «24.21»

Древнее ДНК жителя палеолитической стоянки Мальта (Сибирь)

[2,] «33.7% Brahui + 66.3% Udmurd» «21.9804»
[3,] «34.5% Makrani + 65.5% Udmurd» «22.357»
[4,] «34.3% Balochi + 65.7% Udmurd» «22.413»
[5,] «33.3% Sindhi + 66.7% Udmurd» «24.1198»
[6,] «36.5% Burusho + 63.5% Udmurd» «24.211»
[7,] «39.7% Pashtun + 60.3% Udmurd» «24.3389»
[8,] «34.3% Pathan + 65.7% Udmurd» «24.716»
[9,] «32.2% Pakistani + 67.8% Udmurd» «24.753»
[10,] «41.4% Tadjik + 58.6% Udmurd» «24.852

Довольно-таки интересны результаты литовских татар. Они показывают что основу их популяции составляли группы близкие к современным каракалпакам. Доказан факт смешивание со славянскими популяциями.

[1,] «Tatar_Lithuania» «0»
[2,] «45.7% Belarusian + 54.3% Karakalpak» «4.114»
[3,] «48.2% East-Ukrainian + 51.8% Karakalpak» «4.362»
[4,] «53.2% Karakalpak + 46.8% South-Russian» «4.373»
[5,] «45.7% Center-Russian + 54.3% Karakalpak» «4.4215»
[6,] «51.8% Karakalpak + 48.2% Russian_cossack» «4.7105»
[7,] «53.7% Karakalpak + 46.3% Pole» «4.7189»
[8,] «51.1% Karakalpak + 48.9% Ukrainian» «4.7654»
[9,] «56.2% Karakalpak + 43.8% Russian» «4.9077»
[10,] «49.9% Karakalpak + 50.1% West-Ukrainian» «5.5127»

Результаты дагестанцев. У кумыков из Стальского замтене сдвиг в сторону европейского неолитического фона, у даргинцев из Уркараха — в сторону таджиков, бурушей и пакистанцев

[,1] [,2]
[1,] «Stalskoe» «0»
[2,] «89.3% Lak + 10.7% Sardinian» «5.9513»
[3,] «87.7% Lak + 12.3% S1» «5.9727»
[4,] «90% Lezgin + 10% Sardinian» «6.2035»
[5,] «91.1% Lezgin + 8.9% Spanish_Basque» «6.2534»
[6,] «88.6% Lezgin + 11.4% S1» «6.339»
[7,] «8.8% French_Basque + 91.2% Lezgin» «6.3573»
[8,] «14.8% S1 + 85.2% Urkarah» «6.613»
[9,] «87.4% Lezgin + 12.6% Puerto-Rican» «6.6176»
[10,] «11.3% Iberian + 88.7% Lezgin» «6.6416»

[1,] «Urkarah» «0»
[2,] «87.2% Lak + 12.8% Tadjik» «3.9718»
[3,] «7.4% Brahui + 92.6% Lak» «4.027»
[4,] «7.1% Balochi + 92.9% Lak» «4.1902»
[5,] «90.7% Lak + 9.3% Pashtun» «4.2146»
[6,] «92.9% Lak + 7.1% Makrani» «4.2644»
[7,] «96.3% Lak + 3.7% Orcadian» «4.4254»
[8,] «5.3% Burusho + 94.7% Lak» «4.4391»
[9,] «95.4% Lak + 4.6% Pakistani» «4.4458»
[10,] «95.3% Lak + 4.7% Sindhi» «4.4459»

Чеченцы, как и должно быть находятся как бы посередине между восточно-северокавказскими популяциями и популяциями западной части северного Кавказа (дагестанцами):

[1,] «Chechen» «0»
[2,] «41.7% Balkarian + 58.3% Lezgin» «1.2933»
[3,] «47% Balkarian + 53% Lak» «1.461»
[4,] «48.6% Adygei + 51.4% Lak» «1.5575»
[5,] «43% Adygei + 57% Lezgin» «1.7072»
[6,] «54.3% Lak + 45.7% North-Ossetian» «2.2724»
[7,] «62% Adygei + 38% Urkarah» «2.3513»
[8,] «60.2% Lezgin + 39.8% North-Ossetian» «2.3592»
[9,] «60.3% Balkarian + 39.7% Urkarah» «2.3594»
[10,] «32.1% Cirkassian + 67.9% Lezgin» «2.647»
Доказана примесь тюркских генов у русских казаков

[,1] [,2]
[1,] «Russian_cossack» «0»
[2,] «4% Karakalpak + 96% Pole» «1.6702»
[3,] «92.7% Pole + 7.3% Tatar_Lithuania» «1.673»
[4,] «3.5% Kyrgyz + 96.5% Pole» «1.6749»
[5,] «96.1% Pole + 3.9% Uyghur» «1.6836»
[6,] «96.3% Pole + 3.7% Uygur» «1.6839»
[7,] «3.6% Kazakh + 96.4% Pole» «1.7032»
[8,] «96% Pole + 4% Uzbek» «1.7071»
[9,] «96.1% Pole + 3.9% Turkmen» «1.7144»
[10,] «3.6% Hazara + 96.4% Pole» «1.7184»

Результаты  крымских татар также обнадеживают. Они представлены как смесь ногайцев, башкиров, литовских татар, — и румын, греков из разных областей, что логично.

[1,] «Tatar_Crim» «0»
[2,] «54.3% Nogay + 45.7% South-Greek» «2.26»
[3,] «46.4% Center-Greek + 53.6% Nogay» «2.9529»
[4,] «46.2% Greek + 53.8% Nogay» «3.1448»
[5,] «55.8% Nogay + 44.2% North-Greek» «3.2151»
[6,] «50% Nogay + 50% Romanian_Jew» «3.3766»
[7,] «41.4% Kosovar + 58.6% Nogay» «3.9495»
[8,] «73.3% Greek_Azov + 26.7% Tatar_Lithuania» «4.6688»
[9,] «22.5% Bashkir + 77.5% Greek_Azov» «4.8702»
[10,] «57.6% Nogay + 42.4% Romanian» «5.0906»

Cеверные финны из Куусамо. Они выходят наиболее истинными наследниками палеолитического населения Европы

[,1] [,2]
[1,] «North_Finn» «0»
[2,] «39.8% BRA + 60.2% Finland» «22.1224»
[3,] «49.2% BRA + 50.8% South_Finn» «24.2635»
[4,] «54.8% BRA + 45.2% Finn» «25.2111»
[5,] «64.1% BRA + 35.9% Inkeri» «25.9453»

Бета-версия нового этно-популяционного калькулятора MDLP K27: 6 комментариев

  1. Ancient DNA of post-Mesolithic population of Sweden (Gotland):

    WOW — a mix between 91% Latvian and 9% Ari — the latter are from Ethiopia?!

    Could it be that the Ari were intrusive to Ethiopia and were originally metal workers from elsewhere, like the Middle East?

Оставьте комментарий