По многочисленным просьбам, я все же решил сделать релиз бета-версии нового MDL DIYкалькулятора. Калькулятор носит кодовое название K27 по числу принятых в качестве априорных предковых компонентов.
Нужно отметить, что перед принятием решения о релизе я долго думал о том, имеет ли смысл выкладывать калькулятор и сопутствующую ему версию Genomic Oracle в открытый доступ. После долгих колебаний я все же решил все же выложить
Хочу сразу отметить три важных нюанса:
1) Эта версия коренным образом отличается от тех бета-версий, которые я отправлял на тестирование ув. А.Бурнашеву и С.Козлову
2) Я не собираюсь (пока) встраивать его в калькуляторы Gedmatch
3) Самое важное: в силу гораздо большего охвата референсных популяций (а всего их 429) в мировом масштабе, этот калькулятор будет гораздо менее информативен для европейцев (восточных и западных), в сравнении с другими калькуляторами проекта, уже находящимися на gedmatch. Это связана прежде всего с тем, что между главными кластерами генетического разнообразия европейцев наблюдается крайне низкая степень дивергенции. Низкая степень дивергенции заметна на графике MDS центроидов генетического разнообразия каждой из использованных популяций (европейцы находятся в очень узком кластере в центре большого скопления в правой части графика)
Скорее всего в случае с чистыми европейцами, калькулятор будет показывать только ключевые исторические эпизоды смешения популяций. В калькуляторе из 27 кластеров только 3-4 имеют значение для типичных европейцев. Зато (скорее всего) он будет идеальным инструментов для людей с би- и трирасовым происхождением, а также америндов, азиатов, и африканцев. Остальным рекомендую принимать результаты, как говорят англичане, with a grain of salt.
С другой стороны, судя по дендрограммам кластеров калькулятора, объединение и соединения компонентов имеют четкую и логичную структуру:
Инструкции по пользованию калькулятором такие же как и в базовой версии калькулятора от Dienekes Pontikos (эти инструкции можно найти в его блоге). Файл параметров называется test.par.
Что касается Oracle, команды аналогичные Dodecad Oracle, c той лишь разницей что рабочая функция называется cответственно MDLOracle и MOracle2.
Ccылки на скачивание
Примечание — в этом дистрибутив калькулятора по ошибке не был включен файл с названиями компонентов (test.txt) .
Этот файл содержит названия компонентов в следующем порядке
Nilotic-Omotic
Ancestral-South-Indian
North-European-Baltic
Uralic
Australo-Melanesian
East-Siberean
Ancestral-Yayoi
Caucasian-Near-Eastern
Tibeto-Burman
Austronesian
Central-African-Pygmean
Central-African-Hunter-Gatherers
Nilo-Saharian
North-African
Gedrosia-Caucasian
Cushitic
Congo-Pygmean
Bushmen
South-Meso-Amerindian
South-West-European
North-Amerindian
Arabic
North-Circumpolar
Kalash
Papuan-Australian
Baltic-Finnic
Bantu
Практические результаты использования калькулятора на примере исходных популяций выборки
Расклад предковых компонентов у Этци Тирольского человека
[1,] «S1» «0»
[2,] «28.1% Cypriot + 71.9% Sardinian» «10.4539»
[3,] «28.8% Cretan + 71.2% Sardinian» «10.5494»
[4,] «23.1% Druze + 76.9% Sardinian» «10.5847»
[5,] «19.9% Bulgarian-Roma + 80.1% Sardinian» «10.6089»
[6,] «19.8% Macedonian-Roma + 80.2% Sardinian» «10.6152»
[7,] «20% Roma + 80% Sardinian» «10.6193»
[8,] «29.9% Island-Greek + 70.1% Sardinian» «10.7168»
[9,] «30.3% Ashkenazi + 69.7% Sardinian» «10.8659»
[10,] «19.4% Georgian_Laz + 80.6% Sardinian» «10.928»
Структура компонентов в образцах древней ДНК из пещеры La_Brana
BRA
[1,] «BRA» «0»
[2,] «75.5% North_Finn + 24.5% Spanish_Basque» «17.0606»
[3,] «24.2% French_Basque + 75.8% North_Finn» «17.3356»
[4,] «77.1% North_Finn + 22.9% Sardinian» «19.5163»
[5,] «24.1% Iberian + 75.9% North_Finn» «21.1495»
[6,] «76.2% North_Finn + 23.8% Spanish» «21.3459»
[7,] «78.5% North_Finn + 21.5% S1» «22.1884»
[8,] «76.7% North_Finn + 23.3% Portuguese» «22.5586»
[9,] «76.3% North_Finn + 23.7% Puerto-Rican» «22.7617»
[10,] «22.1% Corsican + 77.9% North_Finn» «23.2394»
Древнее ДНК пост-мезолитических жителей Швеции (Готланда)
[1,] «Swedish-Mesolithic» «0»
[2,] «8.9% AriblacksmithIbd + 91.1% Latvian» «13.1043»
[3,] «9% Ariblacksmith + 91% Latvian» «13.1644»
[4,] «9.3% Aricultivator + 90.7% Latvian» «13.9085»
[5,] «9.3% AricultivatorIbd + 90.7% Latvian» «13.9138»
[6,] «7.4% AriblacksmithIbd + 92.6% Lithuanian» «15.5735»
[7,] «7.4% Ariblacksmith + 92.6% Lithuanian» «15.6297»
[8,] «92.7% Latvian + 7.3% Wolayta» «15.8622»
[9,] «4.8% Kalash + 95.2% Latvian» «16.2399»
[10,] «7.4% Aricultivator + 92.6% Lithuanian» «16.2569»
Древнее ДНК неолитических жителей Щвеции
1,] «Swedish-Neolithic» «0»
[2,] «61.9% Georgian_Jew + 38.1% Selkup» «22.6282»
[3,] «38.7% Selkup + 61.3% SephardicBul» «22.7533»
[4,] «37.6% Selkup + 62.4% Sephardic_Bulgaria» «23.0667»
[5,] «62.6% Morocco_Jew + 37.4% Selkup» «23.2594»
[6,] «38.2% Selkup + 61.8% SephardicTurk» «23.6872»
[7,] «38.6% Selkup + 61.4% South-Sicilian» «23.7453»
[8,] «38.1% Selkup + 61.9% West-Sicilian» «23.8583»
[9,] «56.3% Georgian_Jew + 43.7% Udmurd» «23.9074»
[10,] «37.2% Ket + 62.8% SephardicBul» «24.21»
Древнее ДНК жителя палеолитической стоянки Мальта (Сибирь)
[2,] «33.7% Brahui + 66.3% Udmurd» «21.9804»
[3,] «34.5% Makrani + 65.5% Udmurd» «22.357»
[4,] «34.3% Balochi + 65.7% Udmurd» «22.413»
[5,] «33.3% Sindhi + 66.7% Udmurd» «24.1198»
[6,] «36.5% Burusho + 63.5% Udmurd» «24.211»
[7,] «39.7% Pashtun + 60.3% Udmurd» «24.3389»
[8,] «34.3% Pathan + 65.7% Udmurd» «24.716»
[9,] «32.2% Pakistani + 67.8% Udmurd» «24.753»
[10,] «41.4% Tadjik + 58.6% Udmurd» «24.852
Довольно-таки интересны результаты литовских татар. Они показывают что основу их популяции составляли группы близкие к современным каракалпакам. Доказан факт смешивание со славянскими популяциями.
[1,] «Tatar_Lithuania» «0»
[2,] «45.7% Belarusian + 54.3% Karakalpak» «4.114»
[3,] «48.2% East-Ukrainian + 51.8% Karakalpak» «4.362»
[4,] «53.2% Karakalpak + 46.8% South-Russian» «4.373»
[5,] «45.7% Center-Russian + 54.3% Karakalpak» «4.4215»
[6,] «51.8% Karakalpak + 48.2% Russian_cossack» «4.7105»
[7,] «53.7% Karakalpak + 46.3% Pole» «4.7189»
[8,] «51.1% Karakalpak + 48.9% Ukrainian» «4.7654»
[9,] «56.2% Karakalpak + 43.8% Russian» «4.9077»
[10,] «49.9% Karakalpak + 50.1% West-Ukrainian» «5.5127»
Результаты дагестанцев. У кумыков из Стальского замтене сдвиг в сторону европейского неолитического фона, у даргинцев из Уркараха — в сторону таджиков, бурушей и пакистанцев
[,1] [,2]
[1,] «Stalskoe» «0»
[2,] «89.3% Lak + 10.7% Sardinian» «5.9513»
[3,] «87.7% Lak + 12.3% S1» «5.9727»
[4,] «90% Lezgin + 10% Sardinian» «6.2035»
[5,] «91.1% Lezgin + 8.9% Spanish_Basque» «6.2534»
[6,] «88.6% Lezgin + 11.4% S1» «6.339»
[7,] «8.8% French_Basque + 91.2% Lezgin» «6.3573»
[8,] «14.8% S1 + 85.2% Urkarah» «6.613»
[9,] «87.4% Lezgin + 12.6% Puerto-Rican» «6.6176»
[10,] «11.3% Iberian + 88.7% Lezgin» «6.6416»[1,] «Urkarah» «0»
[2,] «87.2% Lak + 12.8% Tadjik» «3.9718»
[3,] «7.4% Brahui + 92.6% Lak» «4.027»
[4,] «7.1% Balochi + 92.9% Lak» «4.1902»
[5,] «90.7% Lak + 9.3% Pashtun» «4.2146»
[6,] «92.9% Lak + 7.1% Makrani» «4.2644»
[7,] «96.3% Lak + 3.7% Orcadian» «4.4254»
[8,] «5.3% Burusho + 94.7% Lak» «4.4391»
[9,] «95.4% Lak + 4.6% Pakistani» «4.4458»
[10,] «95.3% Lak + 4.7% Sindhi» «4.4459»
Чеченцы, как и должно быть находятся как бы посередине между восточно-северокавказскими популяциями и популяциями западной части северного Кавказа (дагестанцами):
[1,] «Chechen» «0»
[2,] «41.7% Balkarian + 58.3% Lezgin» «1.2933»
[3,] «47% Balkarian + 53% Lak» «1.461»
[4,] «48.6% Adygei + 51.4% Lak» «1.5575»
[5,] «43% Adygei + 57% Lezgin» «1.7072»
[6,] «54.3% Lak + 45.7% North-Ossetian» «2.2724»
[7,] «62% Adygei + 38% Urkarah» «2.3513»
[8,] «60.2% Lezgin + 39.8% North-Ossetian» «2.3592»
[9,] «60.3% Balkarian + 39.7% Urkarah» «2.3594»
[10,] «32.1% Cirkassian + 67.9% Lezgin» «2.647»
[,1] [,2]
[1,] «Russian_cossack» «0»
[2,] «4% Karakalpak + 96% Pole» «1.6702»
[3,] «92.7% Pole + 7.3% Tatar_Lithuania» «1.673»
[4,] «3.5% Kyrgyz + 96.5% Pole» «1.6749»
[5,] «96.1% Pole + 3.9% Uyghur» «1.6836»
[6,] «96.3% Pole + 3.7% Uygur» «1.6839»
[7,] «3.6% Kazakh + 96.4% Pole» «1.7032»
[8,] «96% Pole + 4% Uzbek» «1.7071»
[9,] «96.1% Pole + 3.9% Turkmen» «1.7144»
[10,] «3.6% Hazara + 96.4% Pole» «1.7184»
Результаты крымских татар также обнадеживают. Они представлены как смесь ногайцев, башкиров, литовских татар, — и румын, греков из разных областей, что логично.
[1,] «Tatar_Crim» «0»
[2,] «54.3% Nogay + 45.7% South-Greek» «2.26»
[3,] «46.4% Center-Greek + 53.6% Nogay» «2.9529»
[4,] «46.2% Greek + 53.8% Nogay» «3.1448»
[5,] «55.8% Nogay + 44.2% North-Greek» «3.2151»
[6,] «50% Nogay + 50% Romanian_Jew» «3.3766»
[7,] «41.4% Kosovar + 58.6% Nogay» «3.9495»
[8,] «73.3% Greek_Azov + 26.7% Tatar_Lithuania» «4.6688»
[9,] «22.5% Bashkir + 77.5% Greek_Azov» «4.8702»
[10,] «57.6% Nogay + 42.4% Romanian» «5.0906»
Cеверные финны из Куусамо. Они выходят наиболее истинными наследниками палеолитического населения Европы
[,1] [,2]
[1,] «North_Finn» «0»
[2,] «39.8% BRA + 60.2% Finland» «22.1224»
[3,] «49.2% BRA + 50.8% South_Finn» «24.2635»
[4,] «54.8% BRA + 45.2% Finn» «25.2111»
[5,] «64.1% BRA + 35.9% Inkeri» «25.9453»
Ancient DNA of post-Mesolithic population of Sweden (Gotland):
WOW — a mix between 91% Latvian and 9% Ari — the latter are from Ethiopia?!
Could it be that the Ari were intrusive to Ethiopia and were originally metal workers from elsewhere, like the Middle East?
May best guess would be that Ari signals some kind of statistical noise.