Реконструкция миграций по палеоДНК

Сергей Козлов

Реконструкция миграций по палеоДНК

Накопившийся за последние годы объем информации по аутосомной палеоДНК стал уже слишком велик, а потому начал требовать систематизации. Для этой цели я нанес взаимоотношения между собой ряда образцов из Евразии на нижеследующую схему:

ВзаимоотношенияПалеообразцовv3

Стрелки отображают вероятные влияния, однако источником их не обязательно является культура, указанная в ячейке, из которой выходит стрелка. Здесь больше привязка к географии — если влиял и не этот конкретный источник, то какой-то близкий и схожий. Многие ячейки попросту оставлены пустыми. В противоположность этому, остриё каждой стрелки указывает на конкретные образцы из определенной культуры, проанализированные учёными.

Чтобы не загромождать схему, для Европы я не стал создавать множество колонок, поскольку они были бы структурно схожи между собой. Кроме отображенной в таблице Центральной Европы (в основном это образцы из Германии), неплохой временной срез существует по северной Испании, где пещеры хорошо сохранили древние образцы. Совершенно аналогично предыдущему случаю, в мезолите местность населяют охотники-собиратели WHG, далее появляются неолитические земледельцы (аутосомно близкие по всей Европе), после чего в их генофонде понемножку начинает расти доля WHG, вплоть до халколита. Более поздние палеообразцы оттуда мне пока неизвестны.

Охотники-собиратели юго-западной Скандинавии (SHG) по аутосомам находились между WHG и EHG (похоже, что мезолитические охотники-собиратели северо-западной Евразии формировали континуум с плавным переходом от WHG на западе к ANE на востоке). Впоследствии мы видим появление все тех же неолитических земледельцев, а еще позже в регион попадают «ямноподобные» носители CHG, как и в Германии. Среди археологов нередко принято выделять этих пришельцев в отдельную от их аналогов с южного берега Балтики (культура шнуровой керамики) культуру боевых топоров, или ладьевидных топоров. И генетика дает для этого некоторые основания — в отличие от германских шнуровиков, у образца из Швеции вклад CHG заметно ниже, а влияние северных охотников-собирателей — выше. Однако и здесь носители CHG явно свежие пришельцы, ранее этот компонент в регионе не находили.

Третьим регионом, по которому имеется временной срез, является Венгрия. Можно было бы включить ее в центральноевропейскую колонку, однако у венгерских образцов имеется своя специфика. Если на протяжении мезолита-неолита ситуация развивается по привычной схеме, то в эпоху бронзы новоприбывшее население заметно отличается от тех, кто мигрировал в более северные районы. Да, растет доля «кавказского» компонента, но он более «анатолийский», чем «степной-ямный» (казалось бы, именно в степной Венгрии можно в первую очередь ожидать «ямный» компонент). При этом доля «охотничьего» компонента у них также заметно повышена по сравнению с неолитчиками. Возможно, эти люди и ответственны за аутосомный сдвиг у представителей ККК и Унетицкой культуры, отображенный в таблице. С этого момента в Центральной Европе наличествуют все основные имеющиеся в ней в наши дни аутосомные компоненты и население становится достаточно схожим с нашими современниками.

К сожалению, между Волгой и Карпатами до сих пор не проанализировано ни одного образца из обсуждаемого периода (единственный удостоившийся подобной чести — палеолитический образец с Маркиной Горы (Костёнки-14), для нашей цели бесполезен). Поэтому остается лишь строить предположения, какие изменения происходили в генофонде населения Восточноевропейской равнины в это время. Когда будет закрыта эта дыра, на данный момент мне совершенно непонятно. Что касается Средней Азии и Кавказа, то мы можем ожидать появления новых результатов оттуда в обозримом будущем.

 

 

Охотники-собиратели Кавказа и южный генетический полюс ямников

Сергей Козлов

Охотники-собиратели Кавказа и южный генетический полюс ямников.

За прошедший год в научный оборот было введено множество палеогеномов из Европы и евразийской степи. Было доказано, что в западной части Европы произошло как минимум два резких смещения аутосомного ландшафта — сначала на палеоевропейские охотники-собиратели были замещены пришедшими из Анатолии неолитическими земледельцами (впрочем, часть их генофонда все же сохранилась), а впоследствии уже земледельцы оказались сильно потеснены новыми пришельцами, генетически схожими с представителями ямной КИО. Их след хорошо выделяется в современной Европе — во-первых, это относительно недавно обнаруженный, но ставший широко известным среди интересующихся геногеографией компонент ANE, во-вторых же, «загадочный» южный компонент ямников.

Авторы первой из опубликованных работ по аутосомам ямников смоделировали их, как смесь ~50 на 50 мезолитических восточноевропейских охотников-собирателей (EHG) и современных армян (впрочем, еще лучше на эту роль подошли иракские евреи, но их решили пропустить). Эта модель сразу вызвала во мне отрицательное отношение, поскольку у армян хорошо представлен аутосомный компонент неолитических земледельцев, а у ямников он не обнаружен в сколь-нибудь значимых количествах. Таким образом, модель изначально была неверна, но, к сожалению, была растиражирована еще до выхода статьи в свет (благодаря «утечкам» от авторов) и завладела многими умами. Постепенно вокруг слова «армянский» даже перестали ставить кавычки ))

К счастью, над палеогеномами работает целый ряд команд ученых и одна из них решила обратить внимание не только на северные палеообразцы, но и на остававшиеся долгое время в пренебрежении южные. Первой ласточкой стали два охотника-собирателя, жившие (согласно радиоуглеродной оценке) 9 и 13 тысяч лет назад на территории нынешней Грузии. В запаснике у этой команды еще немало могущих представлять интерес образцов древней ДНК, поэтому ждем дальнейших работ.

В качестве основного был использован более поздний из двух образцов, найденный в пещере Kotias. Он прочитан с весьма хорошим для палеогенома качеством (что позволило мне использовать его для подсчета IBD-сегментов). Моделирование показало, что в качестве «южного полюса» генофонда ямников кавказские охотники-собиратели (для них авторы статьи ввели новое сокращенное название — CHG) подходят намного лучше, чем любая из современных выборок:

CHGF3Stat

Это и неудивительно — ведь доминирующим аутосомным компонентом в предпочитаемом мной калькуляторе MDLP K27 у Kotias является Gedrosia-Caucasian, о котором я уже писал:

Однако с точки зрения предковых компонентов Admixture такая модель — далеко не лучший вариант, «южный» ямный компонент скорее связывается с чем-то в промежутке между Восточным Кавказом и Средней Азией. Как и предполагалось, он коррелирует с бимодальным компонентом, условно называемым Gedrosia. Исходя из современных максимумов, его исторический центр находится где-то в южном Прикаспии, возможно, восточнее. Судя по всему, он представляет собой результат смешения «ближневосточного» компонента ENF и ANE, поэтому теоретически исторического центра может и вообще не быть.

Как выяснилось, девять тысячелетий назад этот компонент преобладал и в более западных районах. Что ж, это делает его только еще более подходящим.

Результаты Kotias в K27:

0.42%   Nilotic-Omotic
  2.22% Ancestral-South-Ind.
  3.66% North-European-Balt.
  0.00% Uralic
  0.01% Australo-Melanesian
  1.79% East-Siberian
  0.00% Ancestral-Yayoi
30.28%   Caucasian-Near-East.
  0.00% Tibeto-Burman
  0.00% Austronesian
  0.00% Central-African-Pygm
  1.05% Central-African-HG
  3.66% Nilo-Saharian
  0.00% North-African
52.04%   Gedrosia-Caucasian
  0.00% Cushitic
  0.00% Congo-Pygmean
  1.73% Bushmen
  0.00% South-Meso-Amerind.
  0.00% South-West-European
  0.00% North-Amerindian
  0.00% Arabic
  0.01% North-Circumpolar
  3.13% Kalash
  0.00% Papuan-Australian
  0.00% Baltic-Finnic
  0.00% Bantu

Карта сумм IBD-сегментов Kotias с образцами из современных выборок:

KotiasSnpc-100IBDext

Лидерами по сумме сегментов оказались грузины (приведен список первых 25 результатов):

Georgian 71,79
Abkhazian 70,75
Lezgin 68,27
Greek_Azov 67,15
Balkarian 65,02
Kurd 64,38
Ossetian 62,66
Armenian 61,98
Nogay 60,38
Bosnian 60,23
Slovenian 60,02
Chechen 59,07
Adygei 58,39
Cypriot 58,28
Turkish 55,86
Kosovar 54,64
Ukrainian-West-and-Center 54,17
Bulgarian 53,21
Slovak 53,01
Cornish 52,46
Croatian 52,21
Kumyk 51,96
Makrani 51,91
Syrian 51,78
Greek 51,68

Что ж, можно их поздравить с генетической преемственностью на протяжении десятка тысячелетий. Однако по пропорциям компонентов Admixture грузины и абхазы довольно заметно отличаются от Kotias:

Abkhasian_S3 Georgian_Kaheti_R2 Georgian_West_R4 Svan_R3
Nilotic-Omotic 0,24 0,00 0,52 0,06
Ancestral-South-Indian 0,75 0,92 0,44 0,31
North-European-Baltic 8,58 5,60 6,87 6,93
Uralic 2,17 1,69 0,72 2,34
Australo-Melanesian 0,27 0,07 0,59 0,42
East-Siberean 1,20 0,00 0,20 0,42
Ancestral-Yayoi 0,72 0,00 0,00 0,44
Caucasian-Near-Eastern 40,79 41,08 45,61 42,85
Tibeto-Burman 0,00 1,09 0,12 0,38
Austronesian 0,72 0,20 0,00 0,23
Central-African-Pygmean 0,05 0,06 0,20 0,00
Central-African-Hunter-Gatherers 0,22 0,15 0,29 0,18
Nilo-Saharian 0,55 0,01 0,02 0,15
North-African 0,50 1,17 0,90 0,31
Gedrosia-Caucasian 32,01 31,65 33,18 35,31
Cushitic 1,17 1,56 0,31 0,42
Congo-Pygmean 0,00 0,25 0,18 0,35
Bushmen 0,04 0,00 0,00 0,00
South-Meso-Amerindian 0,27 0,04 0,14 0,12
South-West-European 2,68 5,06 2,73 1,91
North-Amerindian 0,13 0,04 0,13 0,23
Arabic 2,42 6,83 3,56 3,72
North-Circumpolar 0,47 0,09 0,99 0,41
Kalash 2,38 2,33 1,66 1,77
Papuan-Australian 0,42 0,11 0,33 0,32
Baltic-Finnic 1,25 0,00 0,20 0,14
Bantu 0,00 0,00 0,11 0,28

Как видно, компонент Gedrosia-Caucasian у них стал заметно ниже, а более западные и южные Caucasian-Near-Eastern, Arabic, South-West-European — выросли. Вырос и «северный» North-European Baltic. Думаю, что это связано с миграциями в регион новых групп, что несколько размыло изначальный генофонд. Поэтому современные грузины подошли на роль «южного компонента» в меньшей степени по сравнению с Kotias, и древние CHG выглядят на генетической карте более «восточными» (почему я и помещал этот компонент где-то в Прикаспии).

Кроме Кавказа, вызывает интерес явная связь CHG с рядом балканских популяций (и примыкающей к ним правобережной украинской выборке) — вероятно, это неспроста. Причем направление миграций здесь, очевидно, именно от CHG либо их родственников к балканцам.

Думаю, что сами CHG могут быть смоделированы, как смесь ближневосточников и носителей ANE откуда-то с родины компонента Gedrosia. Например, в калькуляторе ANE K7 Kotias получается таким (как обычно, «Африка» отображает архаику палеогеномов):

31.10%   ANE
  5.36% ASE
  0.01% WHG-UHG
  0.00% East_Eurasian
  2.47% West_African
  1.50% East_African
59.56%   ENF

Однако же никаких связей с Сибирью на карте IBD-сегментов он не проявляет. Таким образом, вновь встает вопрос о «южном» и «северном» вариантах ANE. Методами Admixture разделить его пока не удалось (если говорить о «чистом» ANE а не более новых компонентах, куда он входит составной частью). Возможно, он сам по себе является композитом — результатом смеси охотников северной Евразии и пришельцев с юга? Тогда у Kotias проявляется лишь его южная часть. Во всяком случае, мы можем выделить этот «восточный» компонент Kotias  в том числе и методом IBD-анализа, рассмотрев его разность с европейскими неолитическими земледельцами (EEF), выступающими здесь «прокси» ближневосточного компонента:

CHGMinusEEFIBDext

Результат прекрасно совпадает с распределением компонента Gedrosia-Caucasian — один из пиков оказался в Дагестане (лезгины), второй — рядом с исторической Гедрозией. Можно поздравить Вадима Веренича с удачным калькулятором. Любопытно, что соседи лезгинов по Восточному Кавказу — чеченцы и кумыки не оказались ярко выделенными, несмотря на немногим уступающую лезгинам долю ANE. Зато они выделяются у ямников и оленеостровца EHG. Возникает предположение, что либо эти народы в наибольшей степени испытали «ямное» влияние, либо «южный компонент» ямников наиболее связан с ними, либо их ANE относится к чуть другой веточке по сравнению с Kotias, более близкой к ямной. Во всяком случае. здесь есть, над чем подумать.

Теперь сравним Kotias с самими ямными геномами:

CHGMinusYamnayaIBDext

Как видите, связь с ямниками у выборок из Северной Европы и Поволжья-Урала очень сильна по сравнению со связью с CHG. Думаю, что основное объяснение этому — отсутствие у Kotias компонентов WHG и «северного» ANE. Они занимают основную часть как генофонда европейцев, так и ямников. Более интересна ситуация в Азии — в Средней Азии сильнее связь с ямниками, далее при движении на юг, к Индийскому океану, постепенно идет выравнивание в пользу CHG (возможно, это говорит о том, что ямное влияние сокращается и мы видим более «фоновое» родство) и на самом дальнем юге возвращается равновесие (эти популяции уже мало связаны как с ямниками, так и с CHG). «Ямный язык», вдающийся в Китай через алтайцев, уйгуров и Ту — не след ли это тоже индоевропейской миграции? Хотя это может быть и совпадением.

Что касается родного для Kotias Кавказа, то если на западе связь с ним очень сильна, к северо-востоку, как уже писалось, «ямное» влияние нарастает.

Некоторый интерес представляет и сравнение охотников-собирателей Кавказа с уже не раз упоминавшимися в этой заметке западноевразийскими охотниками-собирателями (WHG):

CHGMinusWHGIBDext

Поскольку WHG входит составной частью в генофонд неолитических земледельцев Европы (EEF), то «ближневосточное» влияние в Южной Европе, связанное с их миграциями, частично отфильтруется. Например, считающиеся наиболее схожими с EEF среди наших современников жители острова Сардиния здесь ярко-зеленые. Можно сделать вывод, что на Балканах и в южной Италии влияние CHG довольно серьезно (что мы и видели на первой карте). Хотя из-за влияния «чистого» WHG повсюду в Европе делать точные оценки сложно.

В заключение можно подытожить, что расшифровка геномов охотников-собирателей Кавказа является очередным, и достаточно заметным, шагом в деле восстановления доисторических миграций и формирования современной генетической картины в Евразии.

 

Визуализация количества общих (IBD) сегментов у жителей Европы и Северной Азии

Визуализация количества общих (IBD) сегментов у жителей Европы и Северной Азии.

Этнокалькуляторы на базе Admixture, представляющие результат «просчета» генома испытуемого в виде смеси предковых компонентов, достигли уже очень хорошей точности. Однако у них есть и определенные недостатки. Во-первых, случается, что у двух разных народов пропорции смешения этих компонентов довольно близки, хотя близкого родства между ними не наблюдается. Обычно для исключения такого эффекта увеличивают число компонентов, то есть повышают детализацию. Однако при этом зачастую возрастает и «шумность», случайные отклонения от ожидаемых значений. Кроме того, бывает тяжело понять — смешение произошло в предыдущем поколении, или тысячу лет назад? Если человек происходит из двух отдаленных народов, он часто позиционируется в географической точке, находящейся между ними, и непохож ни на один из родительских народов. При более сложносоставном происхождении все запутывается еще сильнее.

Нет ли метода напрямую измерить уровень родства отдельного человека с той или иной популяцией? При такой постановке вопроса сразу приходит на ум один из возможных ответов — необходимо просчитать количество IBD (то есть идентичных благодаря общности происхождения) аутосомных сегментов. Такой подход уже реализован в утилите от 23andMe под названием Countries of Ancestry, однако с рядом заметных недочетов. Используются результаты опроса пользователей сервиса о стране их происхождения, при этом непонятно, каков размер выборки от каждой страны. Да и детализация уровня «страна» для жителей России явно не подходит — зачем мешать в одну кучу карел, осетинов и якутов.

К счастью, эти проблемы можно частично устранить, используя научные выборки (либо коммерческие, однако набрать подобный объем из коммерческих выборок мне сейчас не по силам). С удешевлением процесса генотипирования количество имеющихся в открытом доступе выборок начало быстро расти. В первую очередь я использовал выборки, выложенные на сервере Эстонского биоцентра . Они стали основой. Часть пробелов была заполнена выборками из недавней работы Hellenthal , их пришлось переконвертировать из build 36 в build 37. Отдельное спасибо Вадиму Вереничу за помощь с несколькими выборками, хорошо увеличившими охват этнокарты.

Главной сложностью в работе оказалось сведение геномов из всех источников вместе. В каждой научной работе использовался свой набор снипов, часто с разной ориентацией. Коммерческие выборки тоже неоднородны — например, в FTDNA, как оказалось, существует четыре варианта файлов raw data со слегка отличающимся набором снипов и разной ориентацией примерно трех сотен из них. Добавьте к этому два варианта выравнивания и трансферы из 23andMe (у которой нашлись свои заморочки, например, дублирование одних и тех же снипов под разными названиями).

Конечно, хотелось использовать как можно большее количество снипов. Однако после ряда попыток придумать коэффициенты пересчета и прочее, стало понятно, что это методологически неверно. Пришлось оставить лишь те снипы, которые присутствовали во всех используемых выборках, в стандарте FTDNA, а также на чипе v3 от 23andMe. Вероятно, в будущем придется включить в просчет и новый, четвертый чип от этой компании, однако пока я решил с ним не связываться. В общем итоге осталось около 244 тысяч снипов — не так уж мало, я опасался худшего. От покрытия FTDNA это составляет чуть больше трети.

Компания FTDNA и сервис Gedmatch используют для фильтрации общих сегментов критерий наличия не менее 700 снипов. Однако для мелких сегментов он выполняется не так уж часто (из-за чего у клиентов FTDNA возникает иллюзия сравнительно небольшого количества таких сегментов). Поэкспериментировав, я остановился на рубеже в 150 снипов — менее него количество сегментов, являющихся статистическими артефактами, начало быстро расти. Основным показателем для отрисовки на этнокарте я взял общую сумму сегментов длиной более 3 сМ. Конечно, более длинные сегменты являются более четким показателем родства, однако их заметно меньше. А это значит, что их количество более подвержено случайным отклонениям. С другой стороны, более мелкие сегменты сливаются в общую кашу. Таким образом, выбранный критерий является компромиссом. При увеличении объема выборок на порядки станет возможно использовать только длинные сегменты и улавливать родство более четко.

Метод дает релевантные результаты при сравнении с выборками свыше 10 человек. Чем меньше размер выборки, тем сильнее влияние случайных отклонений. Из-за этого часть выборок я объединил вместе (например, литовцы и латыши стали балтами), часть исключил с карты. Однако некоторые все же пришлось оставить — в первую очередь это финны (2 человека), западные украинцы (6), башкиры (6) и австрийцы (4). Если для какой-то популяции значения явно выпадают из ряда соседей, всегда обращайте внимание на размер выборки, приведенный в сопроводительной таблице.

Одновременно достоинством и недостатком метода является сильное влияние «эффекта основателя», «множественного родства», «бутылочных горлышек» и т.д. За этим перечислением скрывается примерно одно и то же — когда популяция происходит от сравнительно небольшой группы людей, ее члены разделяют между собой большое количество общих сегментов. Наиболее известным примером являются евреи-ашкенази — достаточно иметь одного отдаленного предка из этого народа, чтобы получить множество генетических «кузенов». Таким образом, родство с народом, подвергшемуся такому эффекту, видно более четко. Но это же искажает общую картину — одинаковое количество генетических пересечений может означать совершенно разную степень близости в зависимости от истории популяции.

Я сравнил 26 человек из коммерческих выборок, представляющие различные популяции интересующих меня регионов, с набором из 1130 геномов, взятых из научных выборок. Результаты сведены в таблицу и частично визуализированы на картах. При интерпретации помните о вышеперечисленных искажениях!

Начнем с представителя народа, считающегося наиболее архетипичными восточноевропейцами в большинстве этнокалькуляторов. Это литовцы (картинка увеличивается по клику):

 

LithuanianIBD

Как видно, литовец оправдывает это звание и по количеству общих сегментов. Красное пятно закрывает большую часть Восточной Европы, в том числе и балтийских финнов. Условно говоря, на этой карте мы видим некий «базовый уровень родства» среди восточноевропейцев.

Пятно восточного финна практически совпадает по форме, однако распределение интенсивности иное:

Finnish-EastIBD

Я бы сказал, что в основном это более частный и специфичный вариант того же, что мы видим у литовца. Доказательством может служить высокий уровень пересечения с балтской выборкой. В то же время, существует и финская специфика, например, пересечение с саами, которые у литовца довольно бледные. Более яркое и пересечение со шведами. Скорее всего, здесь мы видим результат включения в состав шведов финского субстрата, поскольку с теми же норвежцами интенсивность явно ниже.

Крайней западной точкой у нас будет представитель российских немцев. На этнокалькуляторах Admixture он получается достаточно типичным представителем немецкого народа, поэтому версию о заметном влиянии на его наследственность русских можно исключить.

German_RussiaIBD

К сожалению, немецкой выборки у меня нет, поэтому Германия закрашена серым. Некоторым заменителем является Швеция, которая чуть ярче соседей. К некоторому  удивлению, французы и британцы не показали заметной общности с немцем, хотя ее уровень все же выше средневосточноевропейского. Частично это может объясняться тем, что в британской выборке лишь семь человек из 23 — англичане, остальные являются ирландцами. шотландцами и валлийцами. Пятно у восточных украинцев и южных русских также загадочно — неужели это след знаменитых готов?

Невозможно исследовать генетическое разнообразие восточноевропейцев и обойти при этом ашкенази. Поэтому я позволил себе небольшую некорректность и разместил их на карте в районе нынешней Одессы. Картинка для ашкенази из коммерческой выборки:

AshkenaziIBD

Ожидаемое ярко-красное пятно сходства с родной популяцией, остальные все довольно далеко (на втором месте получилась выборка сефардов, но ее на карте нет). Повышение у басков и греков показывает родство ашкенази со средиземноморскими популяциями, пятно у восточных украинцев и белорусов объяснимо длительным совместным проживанием.

Перейдем к восточным славянам. Небольшой размер выборки западных украинцев не помешал им оказаться на первом месте у карпатского русина:

Carpathian_RusinIBD

Пятна на остальной территории получились довольно неровными. Я бы не стал делать из этого каких-то глубоких выводов о древних пересечениях карпатцев и финнов или эрзян.

Северо-восточная Беларусь:

BelarusianIBD

Украина (Полтава):

Ukrainian-PoltavaIBD

Обращает на себя внимание пересечение с поляками.

Человек смешанного происхождения — донские казаки и украинцы:

RuUa-CossackIBD

Тверь-Рязань:

Russian-CenterIBD

Как видно, балто-славянская общность улавливается всегда, в то время как более тонкие различия частично видны, частично скрываются шумом (случайными отклонениями).

Представители эрзи и мокши явно в своей основе близки балто-славянам. При этом балтийские финны никак не выделяются, а народы волго-уральского региона уже довольно далеки. Все это не является новостью для интересующихся темой людей, однако независимое подтверждение результатов показывает действенность методики.

Эрзя:

ErzyaIBD

Мокша:

MokshaIBD

Мокшанская выборка не помещена на карту из-за своего маленького размера (давала слишком большие случайные отклонения). У мокши «родная» выборка получилась заметно ближе эрзянской, у эрзи, соответственно, наоборот. Вероятно, это значит, что, несмотря на родственность двух групп, различие между ними с точки зрения разделяемой популяционной истории существенно (простыми словами, женились преимущественно внутри своего народа).

У северного русского видно родство как с балто-славянскими выборками, так и с балтийскими финнами:

Russian-NorthIBD

Наряду с этим, у русского из Пермского края ощущается влияние коми. Вероятно, с этим же связано и приближение других народов Урала:

Russian-PermIBD

В то же время, сами коми-зыряне скорее относятся к тому же «балто-славяно-финскому» кругу популяций:

KomiIBD

Чтобы не делать пост бесконечным, карты для народов волжско-уральского региона (в широком смысле) будут приведены в следующей части.

ALDER: анализ адмикса грузинских популяций

По просьбе уважаемого Джемала Гогитидзе проанализировал компоненты адмикса у трех популяций:

1) общей популяции грузинов
2) популяции грузинов из исторической области Имерети
3) популяции грузинов-лазов из Турции

I.

Начну с имеретинцев. Исходные параметры те же, что и в предыдущем эксперименте. Из положительных результатов я выбрал только те, которые являются статистически значимыми и обе референсные популяции коррелируют по взвешенным значениям кривой угасания LD между генетическими маркерами.

DATA: success 0 Georgian_Imereti Latvian_V Russian_cossack 0.83 3.53 2.13 25% 28.47 +/- 25.43 0.00002239 +/- 0.00002694 34.41 +/- 7.50 0.00008249 +/- 0.00002334 36.45 +/- 14.39 0.00004179 +/- 0.00001966
DATA: success 0 Georgian_Imereti Saami Parsi 0.14 2.70 2.07 8% 8.67 +/- 44.21 0.00000557 +/- 0.00004042 8.71 +/- 3.03 0.00002525 +/- 0.00000935 9.40 +/- 3.88 0.00001202 +/- 0.00000582Второй результат — c большим уровнем статистического шума, на что эксплицитно указывает невероятный интервал времени адмикса 8.67 +/- 44.21. Поэтому я его рассматривать не буду, хотя сам по себе факт присутствие адмикса со стороны парсов примечателен.Первый результат — статистически значимый адмикс со стороны южнорусских козаков. Хотя разброс времени адмикса также велик по своей амплитуде — от 54 до 2 поколений тому назад. Поэтому уровень удельной доли популяций из южной части России в компонентах адмикса у грузинов-имеретинцев довольно высок. Скорее всего это отражает процесс генетического обмена с популяциями прикавказских степей на протяжении последнего тысячилетия.II.

Cледущая на очереди грузинская популяция — популяция лазов.
Условия эксперимента в программе ALDer те же самые (ceteris paribus). Зато результаты получились несколько противоречивыеДля начала результаты предварительного теста
Pre-test: Does Georgian_Laz have a 1-ref weighted LD curve with…
Italian-Center: NO (z = 0.02)
Sicilian: NO (z = 0.00)
Sardinian: NO (z = 0.00)

German: NO (z = 1.34)
Lithuanian_V: NO (z = 0.93)
Lithuanian: NO (z = 0.55)
Latvian: NO (z = 1.07)
Belarusian: NO (z = 1.42)
Swedish: NO (z = 0.00)
Polish_V: NO (z = 0.48)
Russian_V: NO (z = 0.26)
Russian_Center: NO (z = 0.80)
Latvian_V: NO (z = 1.16)
Inkeri: NO (z = 0.84)
Russian_South: NO (z = 0.00)
Ukrainian_V: NO (z = 0.69)
Slovakian: NO (z = 0.92)
Czech: NO (z = 1.64)
Sorb: NO (z = 1.76)
Estonian: NO (z = 0.13)
Ukrainian: NO (z = 0.90)
Belarusian_V: NO (z = 0.66)
Ukrainian-East: NO (z = 0.97)
Ukrainian-West: NO (z = 0.00)
Mordovian: NO (z = 0.16)
CEU: NO (z = 1.35)
CEU_V: NO (z = 0.53)
British: NO (z = 0.00)
French: NO (z = 0.00)
Orcadian: NO (z = 0.00)
German-South: NO (z = 1.14)
German-North: NO (z = 0.01)
German_V: NO (z = 1.16)
Bulgarian: NO (z = 0.29)
Finnish-North: NO (z = 0.00)
Cirkassian: YES (z = 2.73)
Russian_cossack: NO (z = 0.37)
Saami: NO (z = 0.29)
Udmurd: NO (z = 0.63)
Komi: NO (z = 1.78)
Karelian: NO (z = 1.07)
Vepsa: NO (z = 0.15)
Mari: NO (z = 0.63)
Bashkir: NO (z = 0.19)
Nenets: NO (z = 1.61)
Hant: NO (z = 1.21)
Chuvash: NO (z = 1.57)
Mansi: NO (z = 0.86)
Finnish-South: NO (z = 0.74)
Polish: NO (z = 0.00)
Gagauz: NO (z = 0.00)
Moldavian: NO (z = 0.89)
Romania: NO (z = 0.00)
Bosnian: NO (z = 0.04)
Adygei: NO (z = 0.00)
Croatian: NO (z = 0.88)
Serbian: NO (z = 1.79)
Slovenian: NO (z = 0.00)
Montenegrin: NO (z = 0.00)
Macedonian: NO (z = 0.00)
Kosovar: NO (z = 0.66)
Austrian: NO (z = 1.34)
Greek_Azov: NO (z = 0.96)
Greek_Center: NO (z = 0.27)
Greek_North: NO (z = 0.00)
Greek_South: NO (z = -0.90)
Tatar_Crim: NO (z = 1.38)
Azeri: NO (z = 0.92)
Tadjik: NO (cannot pre-test: long-range LD)
Kyrgyz: NO (z = 0.89)
Kazakh: NO (z = 0.49)
Georgian: NO (z = 1.58)
Georgian_Imereti: NO (z = 0.53)
NorthOssetian: NO (z = -0.69)
Armenian: NO (z = 0.00)
Kumyk: NO (z = 0.00)
Chechen: NO (z = 0.00)
Turk: NO (z = 0.00)
Turkmen: NO (cannot pre-test: long-range LD)
Uzbek: NO (z = 1.44)
Mongol: NO (z = 1.41)
Karakalpak: NO (z = 1.23)
Lak: NO (z = 0.21)
Balkarian: NO (z = 0.00)
Lezgin: NO (z = 0.00)
Abhkasian: NO (z = 0.34)
Kalmyk: YES (z = 1.96)
Syrian: NO (z = 0.00)
Kurd: NO (z = 1.07)
Tabassaran: NO (z = 1.29)
Hakas: NO (z = 1.59)
Altaic: NO (z = 1.61)
Tatar_Kryashen: NO (z = 1.73)
Tartar_Mishar: NO (z = 1.78)
Parsi: NO (z = 0.53)
Avar: NO (z = 0.56)
Nogai: NO (z = 0.66)
Italian-North: NO (z = 0.01)
Hungarian: NO (z = 0.89)Обратите на тот факт что с таджиками и туркменами лазы разделяют длинные сцепленные по неравновесному наследованию участки ДНK. Скорее всего это свидетельствует о смешении лазов с тюркскими популяциями турков сельджуков и османов. Однако в силу протяженности этих участков pre-test не удался.Из всех популяций положительный результат на тест адмикса дали только черкесы и калмыки.*** Admixture test summary ***

Weighted LD curves are fit starting at 0.5 cM

Does Georgian_Laz have a 2-ref weighted LD curve with Cirkassian and Kalmyk?
2-ref decay z-score: 0.99
2-ref amp_exp z-score: 0.74
NO: curve is not significant

Do 2-ref and 1-ref curves have consistent decay rates?
1-ref Cirkassian — 2-ref z-score: -0.61 (-89%)
1-ref Kalmyk — 2-ref z-score: -0.86 (-154%)
1-ref Kalmyk — 1-ref Cirkassian z-score: -1.91 (-99%)
WARNING: decay rates are inconsistent

Test FAILS (z=0.74, p=1.2e+03) for Georgian_Laz with {Cirkassian, Kalmyk} weights
note: p-value is multiplied by 2556 for multiple-hypothesis correction

DATA: failure (warning: decay rates inconsistent) 1.2e+03 Georgian_Laz Cirkassian Kalmyk 0.74 2.73 1.96 154% 136.64 +/- 137.79 0.00012196 +/- 0.00016441 52.24 +/- 16.04 0.00011765 +/- 0.00004317 17.68 +/- 9.01 0.00001803 +/- 0.00000795

Как видно из результатов, частота угасания LD между референсными популяциями в плане корреляции неустойчива. Это означает что популяции-доноры были разными. Адмикс с популяцией похожей на калмыцкую произошел сравнительно недавно 17.68 +/- 9.01 (Mixture fraction % lower bound (assuming admixture: 28.9 +/- 0.0%)

Метисизация с северно-кавказскими (аланы? кто был предками черкессов?) популяциями более древняя (52.24 +/- 16.04 поколений тому назад).

III
Наконец, результаты анализа по общей популяции грузинов:
DATA: success 0 Georgian Finnish-North Kazakh 2.64 2.55  2.72 17% 180.82 +/- 38.06 0.00011043 +/- 0.00004176 152.67 +/- 59.34 0.00005489 +/- 0.00002157 179.04 +/- 50.57 0.000164 01 +/- 0.00006020
DATA: success 0 Georgian Udmurd Nenets0.04 3.04 3.09  15% 50.95 +/- 684.55 0.00003125 +/- 0.00074081 53.70 +/- 17.64 0.00003998 +/- 0.00001263 46.07 +/- 10.30 0.00005336 +/- 0.00001729На основании этих результатов можно выдвинуть предположении о наличии в генофонде грузинов очень слабого сигнала адмикса со стороны древних популяций Центральной-Азии и Северо-Западной Сибири. Из-за присутствия популяционного шума и сложной модели смешивания этих популяций, ALDer не смог определить точный интервал события смешивания популяций в триплете [Georgian; Udmurd, Nenets], и как видно из результатов разброс значений приличный  — 50.95 +/- 684.55 поколений до настоящего времени. В случае с триплетом [Georgian;  Finnish-North, Kazakh] датировка события адмикса вызывает большее доверие: 180.82 +/- 38.06 поколений. Принимая на поколение 29 лет и за временной предел настоящего времени 1960 год, мы может перевести датировку в поколениях в привычную датировку в годах:  3300 +-1100 г. до нашей эры. Этот интервал времени частично перекрывается с интервалом бронзового века в степной полосе Евразии.
Википедия:Курганная гипотеза относит к периоду поздней бронзы раскол прежде единой протоиндоевропейской общности, населявшей причерноморские степи. Обозначения бронзы в различных индоевропейских языках происходят от одного корня. Мария Гимбутас и её последователи связывают с протоиндоевропейцами такие культуры раннего бронзового века, как катакомбная и ямная. К началу II тыс. до н. э. начинается распространение индоевропейских племён на восток и запад. Андроновская культура, связываемая с индоиранцами, занимает обширные пространства Центральной Евразии (см. СинташтаАркаим). Залогом успеха распространения индоевропейцев стало наличие у них таких новаторских технологий, как колесница и меч.Влиянием европеоидных пришельцев с запада отмечены культуры бронзового века в Южной Сибири — в первую очередь, карасукская и тагарская. Находки идентичного оружия на территории в тысячи километров (т. н. сейминско-турбинский феномен) позволяют археологам предположить, что над туземными народами лесной полосы Евразии с XVI в. до н. э. господствовала некая подвижная дружинная элита.
IV.

Обсуждение результатов
Jemal Gogitidze: Вадим, а насколько значителен «южнороссийский» адмикс у имеретинцев?
если судить по admixture painting, которое выкладывал ув. Александр в группе Молген, у них почти отсутствует СВ Европейский компонент. понятно, что алдер работает по иному принципу, но наверно примесь должна была бы отразиться и в admixture painting?
Vadim Verenich: Действительно, принципы работы у Alder и Admixture разный. Поскольку интервал адмикса большой, то и уровень адмикса значителей 80%. Скорее всего это отражает генетический обмен с жителями степи.
Valikhan Dumshebayev: Калмыки на Волге появились в первой половине 17 века. На Кавказ они так массово не мигрировали, чтобы оставить хоть какой-то генетический след у лазов.
Vadim Verenich: Калмыки — в данном случае это прокси тюркско-монголоидных популяций. Также как и черкесы скорее всего прокси северокавказских популяций.

Valikhan Dumshebayev: Да, я заметил что вы именно так и написали, популяция похожая на калмыков. На калмыков попадает только нижняя граница. Для кипчаков это поздно, не говоря об огузах. А если делать предположение, то это вполне могут быть ногаи, как потомки мангытов, которые то ли монголы, то ли тюрки.

Valikhan Dumshebayev: Про таджиков и туркмен довольно интересно. Я бы предположил что это скорее не тюрки-огузы, а некое автохтонное население от южного побережья Каспия до Памира. Но вот парсы и азербаиджанцы выпадают.