Этногеномика беларусов — часть V

Обсуждение результатов и выводы

 

Как отмечалось в введении к нашей статье, главной задачей нашего исследования являлась проверка двух рабочих гипотез, озвученных в предыдущих исследованиях профессиональных попгенетиков. Во-первых, это гипотеза о присутствии трех основных древних компонентов , которая указывает на возможность общего происхождения славян и балтов. Во-вторых, это утверждение о том, что своеобразие аутосомного генофонда беларусов может быть связанно с вкладом балтского субстрата.

После внимательного изучения результатов нашего исследования,можно сказать, что оба из приведенных выше заключений представляют собой крайне упрощеные варианты сложного процесса формирования аутосомного генофонда беларусов. Хотя мы и не можем предоставить окончательных аргументов в пользу или опровержение каждой из этих версий, мы может предоставить более полное и подробное обозрение структуры аутосомного генофонда. В отличие от трех основых компонентов, упомянутых выше, в нашем исследовании мы выделили шесть основных компонентов, типичных для европейцев в целом. Основу генофонда составляет компонент, который мы обозначили как северо-восточно-европейский компонент. Именно этот компонент выделяет беларусов среди других восточных славян, приближая их к современным балтийским популяциям (у литовцев процент компонента составляет 81,9, у латышей — 79,5%, у беларусов -76,4%, у эстонцев — 75,2%). Примечательно, по мере удаления от территории Беларуси на север в с торону Латвии и Эстонии, увеличивается процент северо-европейского генетического компонента (как мы полагаем, этот компонент доминировал в генофонде доисторических жителей Скандинавии в эпоху до распространения финно-угоров и индо-европейцев). С другой стороны, беларусов и других восточных славян отдаляет от балтов и сближает друг к другу более высокий процент так называемого западно-азиатского или кавказского компонента (любопытно, что в этом случае эта закономерность может свидетельствовать в пользу западно-азиатской теории происхождения индо-европейцев).

Далее, как показывает анализ в программе fineStructure, генофонд беларусов характеризируется высокой степенью генетических контактов как с балтами, так и остальными славянами, а также с рядом финно-угорских популяций (например, c эрзя и мокша). О симметричном характере межпопуляционного обмена свидетельствует симметричное расположение популяции беларусов относительно этих трех групп.

Исходяизвышенаписанного,представляетсялогичнымсделатьвыводотом,чтоосновнойкритическийэтапстановленияаутосомногогенофондапришелсянапериодсмешиванияносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,послечегопредковыйаутосомныйгенофондбеларусовприобрелотносительнуюстабильность.Разумеется,даннаямодельнеисключаетпозднейшиеэпизодысмешиванияпопуляций,ноониоставилименьшийследвструктуреаутосомногогенофондабеларусов.Вэтойсвязивозникаеточевидныйвопрос–вкакойименноисторическийпериодпроизошлосмешениеносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,иктобылиихносителями?
В начале сентября 2012 года известная американская лаборатория популяционной генетики доктора Райха опубликовала альфа-версию программного продуктаADMIXTOOOLS1.0. Альфа-версия была разработана для внутреннего использования, поэтому modusoperandiэтого продукта вряд ли является кристально понятным для стороннего пользователя. Положительным аспектом на мой взгляд является то, что ADMIXTOOLSпакет обеспечивает полную совместимость с форматом другой очень популярной программыEIGENSOFT, которая была разработана в той же лаборатории. Это немаловажное обстоятельство намного упрощает процесс обучения в ADMIXTOOLS.

Вышеупомянутый пакет включает в себя 6 приложений, среди которых я считаю наиболее полезнойqp3Popи утилиты для вычисления частотной характеристики аллелей. Впрочем, я не собираюсь обсуждатьqp3popво всех деталях и в контексте данной заметки достаточно отметить, что эта программа реализует тест three_pop(F_3), подробно описанный в известной статье Рейха и соавт. 2009.

Однако другой имплементированный в пакете метод, – метод rolloff– нуждается в более пристальном внимании. Этот метод позволяет производить математическую оценку как времени, так как и уровня адмикса. Оценка производится на основании анализа неравновесия по сцеплению между SNP-ами. Тут необходимо вспомнить стандартное определение неравновесия по сцеплению.Неравновесием по сцеплению (часто используется английская аббревиатураLD) называется неслучайная связь между двумя аллелями, в силу которой определенные комбинации аллелей встречаются наиболее часть. В теории, чем дальше друг от друга находятся SNP-ы ,тем меньше будет уровень LD. Темп угасания снижения LDв адмиксе напрямую связана с числом поколений, прошедших с момента адмикса, так как cвозрастанием числа поколений увлечивается число рекомбинаций произошедших между двумя отдельными SNP-ами. Проще говоря: Rolloffсоответствует экспоненциальной кривой угасания уровня LDот расстояния, и эта скорость экспоненциального снижения как раз и используется для оценки числа поколений, так и уровня адмикса в анализируемой популяии. Учитывая, что одно поколение примерно равно 29 лет, можно преобразовать число поколений в года.

Этот метод открывает интересные перспективы. Для целей этого анализа, я создал специальный набор SNP-данных, который включает в себя около 750 000 cнипов, частично или полностью в 250 различных популяциях человека. Далее, я разбил популяции 3 * 62 000 трио в следующем виде (X, Y, Z), где X и Y – пара рефренсных групп, а Z – белорусы из коллекцииBehar et al.2010. После этого я провел q3Pop анализ этих трио.

Результаты изложены в нижеприведенной таблице

Indian Polish Belarusian -0.000736 0.000251 -2.935
Polish Indian Belarusian -0.000736 0.000251 -2.935
Karitiana Sardinian Belarusian -0.001278 0.000517 -2.471
Sardinian Karitiana Belarusian -0.001278 0.000517 -2.471
Otzi North_Amerind Belarusian -0.002556 0.001126 -2.271
Cirkassian Polish Belarusian -0.000488 0.000231 -2.113
Polish Cirkassian Belarusian -0.000488 0.000231 -2.113
Pima Otzi Belarusian -0.002727 0.00137 -1.99
Pima Sardinian Belarusian -0.000794 0.000431 -1.843
Sardinian Pima Belarusian -0.000794 0.000431 -1.843
Otzi Surui Belarusian -0.002938 0.001931 -1.522
Surui Otzi Belarusian -0.002938 0.001931 -1.522

 

На первый взгляд, результаты нашего эксперимента с 3qPop, кажется, неплохо согласуются с выводами, содержащимися в работеПаттерсон и др. 2012: “Самый поразительный вывод состоит в обнаружени четкого сигнала адмикса в северной Европе, один из элементов которого связан с предками населения наиболее близкого по своей генетике к баскам и жителям Сардинии, а другой – с предками современного населения северо-восточной Азии и Америки. Этот явный сигнал, вероятно, отражает историю смешивания неолитических мигрантов с коренным населением Европы, что подтверждается недавним генетическим анализом древних костей Швеция и секвенированием полного генома Отци Тирольца”. Что касается собственно белорусов, то источники сигнала смешивания с посторонними популяцими менее ясны и расплывчаты. Как было показано ранее, с точки зрения формального анализа примесей (f3 статистики), белорусы могут быть представлены в виде популяционного микса поляков и индусов / черкессов. Первый компонент смеси может быть связан с носителями культуры шнуровой керамики/боевых топоров и культуры колоковидных кубков; второй, в соответствии с результатами, должен быть общим для индусов и черкесов.

 

Белорусы = ((неолитические культуры Европы) + “носители культуры колоковидных кубков”) + (мезолитическое население Европы) + компонент носителей культуры шнуровой керамики)) + скифо-сарматский тип

 

Для оценки дата события базового адмикса в белорусской популяции, мы использовали в качестве референсных популяций поляков и индусов (Примечание: мы снизили порог генетических дистанции в параметрах Rolloff для снижения уровня шума от более поздних адмиксов).

 

rolloff

Как вы можете видеть, сигнал присутствия адмикса обнаруживается гораздо хуже, и в силу этого, погрешности в оценке временного промежутка высоки:

154,158 + -87,024 поколений назад (или, 4470 + -2523 года до настоящего времени / 2510 – +2523 лет до н.э.).

 

Исходя из этого, мы решили модифицировать Rolloff-анализ генофонда белорусов, используя на этот раз в качестве референсов литовцев и пуштунов. Следуя этому совету, я решил предпринять вторую попытку формального анализа адмикса в двух имеющихся у нас выборках беларусов ( выборка беларусов из статьи Behar et al. 2011), и выборка беларусов, собранная в нашем проекте.Ниже приведены результаты эксперимента с двумя этими группам (в отличие результатов нашей предыдущей попытки, результаты данного эксперимента менее “зашумленные”):

rolloff2

 

Интервал числа поколений, прошедших со времен анализируемого адмикса (105.086+-52.59) или 3069 +- 1525 лет до настоящего времени, что соответствует временном интервалу 2 тыс. до нашей эры – 6 век нашей эры. Принимая во внимание эти выводы, мы можем предположить, что основной аутосомный эпизод смешивания предковых популяций беларусов произошел в течении довольно таки продолжительного времени, охватывающего несколько тысяч лет. В этой связи, вопрос о том, кто именно был носителями северо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента, остается открытым.

Гагаузы: ALDER анализ

Недавно я прочитал книгу о этногенезе гагаузов « Очерки истории гагаузов — потомков огузов (середина VIII- начало XXI вв.)» Федор Ангели.

На странице 285 при описании процесса заселения территории современной Гагаузии, Ангели приводит интересную информацию: » В официальном приеме иммигрантов царские власти не были последовательными. В 1770 году они на 12 лет запретили переселение иностранцев в Россию. Процесс этот возобновился в 1782 году. Колонистов стали расселять в Херсонской губернии. Вначале это были, в основном, шведы, а затем их ряды стали пополнять немецкие колонисты. Переселенцев с Балканского полуострова было мало. Подчеркнем, однако, что царские власти предоставляли широкую возможность выходцам из балканских народов, служившим в русской армии, обосноваться в пределах империи. Среди этой категории колонистов были гагаузы, болгары, греки.»

Не вызывает никакого сомнения, что гагаузы как относительно молодая популяция представляют собой интересный объект исследования процессов смешивания разных групп популяций. Именно поэтому я решил протестировать возможности программы ALDER применительно к  анализу гагаузов, благо что в моем проекте MDLP имеются данные по 7 гагаузам.

Как и в серии предыдущих анализов ALDER, я использовал дефолтные параметры программы, а также отфильтровал те результаты, которые соответствовали строгим условиям статистической значимости.  С целью еще более тщательного анализа, я также исключил из «положительных» результатов те комбинации, в которых датировка события смешивания популяций либо стремилась к нулю, либо давала громадный разброс значений в доверительном интервале.

Для всех референсных популяций в отфильтрованных комбинациях был расчитан нижний порог %- истинного адмикса.
Во избежание конфуза необходимо сделать важное примечание: согласно мануалу программы ALDER — «in practice, the true mixing population A is not available for sampling, but a closely-related population A0 may be. In this case, the value of a^ given by equation (12) with A0 in place of A is a lower bound on the true mixture fraction (Appendix 1).»  (На практике, истинная исходная популяция микса чато не доступна для сэмплирования, и вместо нее в выборке присутствует близкородственная популяция A0. В этом случае значение a^, заданное уравнением (12) с заменой  A0 вместо A  — является нижней границей на истинную фракцию микса (Приложение 1).)  Иными словами, это значение определяет насколько близка референсная популяция в выборке к истинной популяции адмикса.


Как видно, большинство дат предполагаемых событий адмикса попадает в интервал 13-14 поколений тому назад, то есть середина и  конец 16 века. Это был период когда предки гагаузов жили на территории Османской империи в провинции Добруджа. Единственная комбинация, выпадающая из этого тренда — калмыки+чуваши— дает датировку, верхний интервал которой попадает в эпоху распада Золотой Орды. Но основная часть приходится на середину-конец 16 века.

Любопытно, что датировка  подтверждается данным глоттохронологии в работах Мудрака (Язык во времени. Классификация тюркских языков.Лекция Олега Мудрака. 30 апреля 2009, 11:18): «Самые поздние деления. Вот делятся между собой язык гагаузский и язык турецкий. Гагаузы живут на территории Молдавии, Добруджи, Добруджа – это устье Дуная и сопредельные территории в северо-западном углу Черного моря. Про гагаузов, в том числе и у них самих, существует много разных легенд. Свое название они этимологизируют как «голубые» или «синие огузы», что, по-видимому, правильно. Но они считают, что они появились еще с тех времен, когда существовали печенеги, что они являются прямыми наследниками тех кочевых народов, про которых говорили и писали древнерусские летописи и византийские хроники. Это не так. При некоторой натяжке можно говорить, что гагаузский является просто диалектом турецкого языка. Его глубина очень мала и соотносима с глубиной голландского по отношению к африкаанс. Африкаанс – это язык голландских колонистов, попавших в Южную Африку. Оказалось, что все эти узлы ложатся на некоторые значимые исторические даты. Время распада гагаузского и турецкого – 1610-е годы плюс минус 10 лет. Это попадает на договор Житва-торок. По этому договору территория Валахии и Молдавии получают автономию, став независимыми господарствами в рамках Османской Империи. Там вводится своя администрация. Это была полоса неудач для Османской Империи. С этого момента получается, что туркоязычное население этих территорий прекращает прямой контакт с остальным населением и начинает оформляться гагаузский язык.«

Значения нижнего порога истинного адмикса (mixture fraction lower bound) по статистически значимым популяциям дают четкое представление о процессе этногенеза гагаузов, основу которого составляют балканские и карпатские популяции. Наиболее близкими к истинным популяциям адмикса оказываются популяции черногорцев, греков из центральной части Греции,  словаки и поляки. Самая близкая к истинной популяции адмикса тюркская популяция — популяция чувашей — имеет относительно низкое значение этого параметра 20.2+-8.0 %. Примечательно также присутствие североевропейского компонента, представленного в популяциях шведов, СEU и эстонцев.

Target ReferenceA ReferenceB Admixture dating Mixture fraction % Mixture fraction %
Gagauz Estonian Montenegrin 16.06+/-7.58 50.3 +/- 10.2 87.6 +/- 5.4
Gagauz Lithuanian_V Greek_Center 10.93+/-8.63 59.7 +/- 12.6 84.1 +/- 8.6
Gagauz Russian_V Greek_Center 10.81+/-3.91 68.0 +/- 9.1 84.1 +/- 8.6
Gagauz Nenets Greek_Center 8.99+/-4.54 2.5 +/- 1.1% 84.1 +/- 8.6
Gagauz Slovenian Greek_Center 12.11+/-9.33 79.6 +/- 9.5 84.1 +/- 8.6
Gagauz Nenets Polish 9.12+/-3.23 2.5 +/- 1.1% 69.0 +/- 6.2%
Gagauz Swedish Russian_V 10.75+/-3.1 58.9 +/- 9.9 68.0 +/- 9.1
Gagauz Slovakian CEU 12.8+/-9.45 78.7 +/- 6.7 66.1 +/- 12.2
Gagauz Ukrainian-West Nenets 9.24+/-3.76 74.9 +/- 8.1 2.5 +/- 1.1%
Gagauz Russian_Center Kalmyk 14.09+/-3.26 64.4 +/- 12.1 1.5 +/- 0.6
Gagauz Chuvash Kalmyk 12.13+/-12.05 20.2 +/- 8.0 1.5 +/- 0.6