Анализ аутосомного генофонда балтийских этносов: эстонцев, латышей, литовцев. Часть II

Теперь перейдем к южным соседям эстонцев — латышам.

Как я ожидал, результаты анализа ALDER подтвердили мои более ранние предположения о том, что латыши являются одним из наиболее «чистых» европейских народов. Под чистотой здесь подразумевается практически полное отсутствие позднейших «примесей» со стороны других популяций.

И действительно, программа ALDER смогла обнаружить односторонний сигнал предпологаемого адмикса только со стороны трех популяций: жителей юго-центральной части России, грузинов-лазов и вездесущих «монголов».  Однако исходя из провала тестов на двухстороннюю корреляцию угасания сцепеления,  источники адмикса были совершенно разные:

Result Target ReferenceA ReferenceB Admix_dating Admix on Reference A Admix on ReferenceB
failure (warning: decay rates inconsistent) Latvian Russian_South Mongol 34.81 +/- 10.74 12.75 +/- 5.58 43.33 +/- 11.11
failure (warning: decay rates inconsistent) Latvian Georgian_Laz Mongol 63.83 +/- 28.13 75.62 +/- 27.37 43.33 +/- 11.11

Поскольку оба теста провалились, то нет особой нужды дополнительно комментировать результаты. В принципе кавказский компонент, влившийся в генофонд латышей при посредничестве какой-нибудь восточнославянской популяции может быть продуктом довольно-таки древнего смешения,63.83 +/- 28.13 поколений назад.  «Cибирская по происхождению» незначительная часть генофонда скорее всего попала в Приблатику в том же генетическом потоке, который принес в Эстонию «монгольские гены». Датировка этого события лежит в широком интервале от 5 до 13 века нашей эры, и скорее всего это была многократная серия событий смешивания популяций. Примечательно, что «восточносибирских генов» у латышей вдвое меньше (2.9 +/- 1.1) в сравнении с эстонцами. Зато «кавказских» — примерно столько же (21.5 +/- 7.2).

Анализ аутосомного генофонда балтийских этносов: эстонцев, латышей, литовцев. Часть I

Я решил продолжить эксперименты с новым программным обеспечением ALDER, хорошо зарекомендовавшим себя в анализе ряда кавказских и сибирских популяций. На этот раз я решился взятся за крепкий орешек — популяции восточной Прибалтики. Я не случайно назвал эти популяции крепким орешком, так как с точки зрения популяционной генетики, аутосомный генофонд этих популяций представляет собой гомогенный континуум с крайне малым количеством вариантов, отличающих одну популяцию от другой. По крайней мере, при стандартном использовании классических алгоритмов программ STRUCTURE/ADMIXTURE, или статистических методов PCA/MDS, эти популяции оказывались практически неотличимыми друг от друга.

Условия и параметры ALDER эксперимента оставлены практически неизменными — состав популяций и количество SNP-вариантов не поменялся. Я отказался от эксплицитного определения параметра mindis, так как в том случае, когда мы имеем дело с близкими популяциями, очень сложно дать априорную оценку генетической дистанции, при которой программа может вычислить уровень экспонентного угасания генетического сцепления локусов в аутосомах.

После проведения соответствующих анализов, я получил результаты по трем популяциям — эстонцам, литовцам и латышам. Каждая из популяций была представлена 13-20 индивидами.

Итак,  начну с эстонцев.

Эстонцы

Из вычисленных в программе комбинаций референсных популяций около двух десятков комбинации показала двухсторонную корреляцию угасания генетического сцепления в отношении таргентной популяции эстонцев.  После того, как я отсеел ряд комбинаций с большим разбросом датировки события адмикса, мною были выбраны наиболее устойчивые варианты.

Result Target ReferenceA ReferenceB Admix_dating Admix on Reference A Admix on ReferenceB
success Estonian Swedish Karakalpak 77.4 +/- 45.6 64.55 +/- 18 49.12 +/- 17.87
success Estonian Gagauz Karakalpak 68.18 +/- 38.27 6.78 +/- 3.17 49.12 +/- 17.87
success Estonian CEU Mongol 66.9 +/- 24.82 26.04 +/- 7.49 60.86 +/- 18.02
success Estonian NorthOssetian Karakalpak 61.9 +/- 41.5 78.29 +/- 26.94 49.12 +/- 17.87
success Estonian Saami Karakalpak 53.07 +/- 18.46 10.32 +/- 5.23 49.12 +/- 17.87
success Estonian Mongol Karakalpak 44.55 +/- 16.47 60.86 +/- 18.02 49.12 +/- 17.87
success Estonian CEU Karakalpak 43.92 +/- 20.09 26.04 +/- 7.49 49.12 +/- 17.87
success Estonian Swedish Saami 38.57 +/- 28.37 64.55 +/- 18 10.32 +/- 5.23
success Estonian Swedish Mongol 38.1 +/- 14.45 64.55 +/- 18 60.86 +/- 18.02
success Estonian NorthOssetian Mongol 33.34 +/- 21.02 78.29 +/- 26.94 60.86 +/- 18.02
success Estonian Saami Mongol 30.18 +/- 12.76 10.32 +/- 5.23 60.86 +/- 18.02
success Estonian CEU Saami 27.56 +/- 18.66 26.04 +/- 7.49 10.32 +/- 5.23
success Estonian Italian-Center Saami 18.61 +/- 8.75 79.75 +/- 23.77 10.32 +/- 5.23

Наиболее близкая к нашему времени времени датировка события адмикса в эстонской популяции 18.61+-8.75 поколений назад, то есть  между 1450-1670 годами. Источники адмикса общий — программа улавила сигнал адмикса со стороны популяции которая на 86.1 +/- 5.2% напоминает cовременных шведов,  50.2 +/- 9.2% процента напоминает по генофонду популяцию современных северных итальянцев, и на 44.3 +/- 9.7 % напоминает выходцев из северо-западной Европы.  Теоретически, это может быть любая популяция из северо-западной Европы (это,кстати, подтверждают положительные результаты корреляции с CEU). Второй компонент того же адмикса связан с популяциями Фенноскандии, прежде всего саамами, однако он достаточно слаб (истинная популяция адмикса содержала в своем генофонде около 3.3 +/- 1.5 генов саамов).

Более экзотичные комбинации содержат адмикс со стороны популяций, несущих в себе умеренный % кавказских (26.2 +/- 5.1) и незначительный процент % восточносибирских аллелей (4.7 +/- 1.6 %).  Большая часть интервала датировки этих адмиксов перекрывается и уходить в эпоху великого переселения народов в первые века нашей эры. Поэтому эти компоненты проникли в эстонский генофонд опосредованно через смешивание с какой-то восточноевропейской популяцией, уже содержащей в себе генетические наследие смешивания с популяциями Кавказа и степи.