Я решил продолжить эксперименты с новым программным обеспечением ALDER, хорошо зарекомендовавшим себя в анализе ряда кавказских и сибирских популяций. На этот раз я решился взятся за крепкий орешек — популяции восточной Прибалтики. Я не случайно назвал эти популяции крепким орешком, так как с точки зрения популяционной генетики, аутосомный генофонд этих популяций представляет собой гомогенный континуум с крайне малым количеством вариантов, отличающих одну популяцию от другой. По крайней мере, при стандартном использовании классических алгоритмов программ STRUCTURE/ADMIXTURE, или статистических методов PCA/MDS, эти популяции оказывались практически неотличимыми друг от друга.
Условия и параметры ALDER эксперимента оставлены практически неизменными — состав популяций и количество SNP-вариантов не поменялся. Я отказался от эксплицитного определения параметра mindis, так как в том случае, когда мы имеем дело с близкими популяциями, очень сложно дать априорную оценку генетической дистанции, при которой программа может вычислить уровень экспонентного угасания генетического сцепления локусов в аутосомах.
После проведения соответствующих анализов, я получил результаты по трем популяциям — эстонцам, литовцам и латышам. Каждая из популяций была представлена 13-20 индивидами.
Итак, начну с эстонцев.
Эстонцы
Из вычисленных в программе комбинаций референсных популяций около двух десятков комбинации показала двухсторонную корреляцию угасания генетического сцепления в отношении таргентной популяции эстонцев. После того, как я отсеел ряд комбинаций с большим разбросом датировки события адмикса, мною были выбраны наиболее устойчивые варианты.
Result |
Target |
ReferenceA |
ReferenceB |
Admix_dating |
Admix on Reference A |
Admix on ReferenceB |
success |
Estonian |
Swedish |
Karakalpak |
77.4 +/- 45.6 |
64.55 +/- 18 |
49.12 +/- 17.87 |
success |
Estonian |
Gagauz |
Karakalpak |
68.18 +/- 38.27 |
6.78 +/- 3.17 |
49.12 +/- 17.87 |
success |
Estonian |
CEU |
Mongol |
66.9 +/- 24.82 |
26.04 +/- 7.49 |
60.86 +/- 18.02 |
success |
Estonian |
NorthOssetian |
Karakalpak |
61.9 +/- 41.5 |
78.29 +/- 26.94 |
49.12 +/- 17.87 |
success |
Estonian |
Saami |
Karakalpak |
53.07 +/- 18.46 |
10.32 +/- 5.23 |
49.12 +/- 17.87 |
success |
Estonian |
Mongol |
Karakalpak |
44.55 +/- 16.47 |
60.86 +/- 18.02 |
49.12 +/- 17.87 |
success |
Estonian |
CEU |
Karakalpak |
43.92 +/- 20.09 |
26.04 +/- 7.49 |
49.12 +/- 17.87 |
success |
Estonian |
Swedish |
Saami |
38.57 +/- 28.37 |
64.55 +/- 18 |
10.32 +/- 5.23 |
success |
Estonian |
Swedish |
Mongol |
38.1 +/- 14.45 |
64.55 +/- 18 |
60.86 +/- 18.02 |
success |
Estonian |
NorthOssetian |
Mongol |
33.34 +/- 21.02 |
78.29 +/- 26.94 |
60.86 +/- 18.02 |
success |
Estonian |
Saami |
Mongol |
30.18 +/- 12.76 |
10.32 +/- 5.23 |
60.86 +/- 18.02 |
success |
Estonian |
CEU |
Saami |
27.56 +/- 18.66 |
26.04 +/- 7.49 |
10.32 +/- 5.23 |
success |
Estonian |
Italian-Center |
Saami |
18.61 +/- 8.75 |
79.75 +/- 23.77 |
10.32 +/- 5.23 |
Наиболее близкая к нашему времени времени датировка события адмикса в эстонской популяции 18.61+-8.75 поколений назад, то есть между 1450-1670 годами. Источники адмикса общий — программа улавила сигнал адмикса со стороны популяции которая на 86.1 +/- 5.2% напоминает cовременных шведов, 50.2 +/- 9.2% процента напоминает по генофонду популяцию современных северных итальянцев, и на 44.3 +/- 9.7 % напоминает выходцев из северо-западной Европы. Теоретически, это может быть любая популяция из северо-западной Европы (это,кстати, подтверждают положительные результаты корреляции с CEU). Второй компонент того же адмикса связан с популяциями Фенноскандии, прежде всего саамами, однако он достаточно слаб (истинная популяция адмикса содержала в своем генофонде около 3.3 +/- 1.5 генов саамов).
Более экзотичные комбинации содержат адмикс со стороны популяций, несущих в себе умеренный % кавказских (26.2 +/- 5.1) и незначительный процент % восточносибирских аллелей (4.7 +/- 1.6 %). Большая часть интервала датировки этих адмиксов перекрывается и уходить в эпоху великого переселения народов в первые века нашей эры. Поэтому эти компоненты проникли в эстонский генофонд опосредованно через смешивание с какой-то восточноевропейской популяцией, уже содержащей в себе генетические наследие смешивания с популяциями Кавказа и степи.