О «ближневосточном компоненте» палеолитических охотников-собирателей Европы

Сергей Козлов

О «ближневосточном компоненте» палеолитических охотников-собирателей Европы

Описание
Рассмотрена статья Qiaomei Fu et al. «The genetic history of Ice Age Europe». Проведен анализ европейских палеогеномов возрастом от 37 до 8 тысяч лет из данной статьи и более ранних работ. Аутосомный компонент западных охотников-собирателей (WHG) — преимущественно результат генетического дрейфа, гипотеза авторов о его формировании в результате однократной миграции в Европу около 14 тысяч лет назад носителей ближневосточных аутосомных компонентов несостоятельна. Вместе с тем, обмен генофондом с ближневосточными популяциями несомненно происходил, однако для прояснения его истории необходимы палеогеномы с Ближнего Востока. Подтверждаются выводы из более старых работ о наличии ближневосточного («базального») компонента у образца Костенки-14 (человек с Маркиной Горы), отрицаемые в рассматриваемой статье. Вероятно, он связан с компонентом охотников-собирателей Кавказа (CHG). Опровергается вывод авторов о восточноазиатском влиянии на поздних WHG. Проведено моделирование ряда возможных событий смешения и построено дерево вероятных взаимосвязей аутосомных компонентов с размещением на нем имеющихся палеогеномов.

Обсуждение работы Qiaomei Fu et al на форуме «Молекулярная генеалогия».

Новые палеогеномы из статьи
В рассматриваемой статье впервые произведен временной срез геномов жителей Европы верхнего палеолита. Конечно, единичные геномы у нас были и раньше (Костенки-14, Oase1), однако не хватало системности для построения целостной картины изменений в генофонде европейцев на протяжении этого периода. Статья частично решает эту проблему — прочтено несколько десятков новых геномов. К сожалению, остался неохваченным период 19-28 тысяч лет назад (а с учетом лишь геномов приемлемого качества — 19-30 тлн), но и имеющиеся образцы позволяют сделать ряд интересных выводов.

Коротко о содержании рассматриваемой работы, критика
Авторы подтверждают выводы из более ранних работ об угасании вклада неандертальцев в генофонд современных европейцев с ходом времени (предположительно, на неандертальские участки ДНК действовал отрицательный отбор). Далее они касаются нескольких интересных мелочей (присутствие Y-гаплогруппы R1b в палеолитической Европе — образец Villabruna возрастом 14 тысяч лет, появление «мутации светлоглазости» почти одновременно в Европе и на Кавказе (разумеется, это не отменяет вероятности нахождения более древних образцов с этой мутацией впоследствии) и необычные для региона в наши дни митогаплогруппы). После этого авторы переходят к объединению образцов в кластеры и попытке реконструкции их взаимоотношений. По сути, здесь все просто — европейские палеогеномы из одной эпохи объединяются в один кластер. Классические европейские WHG выступают под псевдонимом «кластер Villabruna», их непосредственные предшественники — el Miron, и ряд геномов возрастом 30 тысяч лет (из них лишь один заслуживающего рассмотрения качества) — кластер Vestonice. Чуть более старые GoyetQ116-1 и костенковец не вошли ни в один кластер. Далее делается очень странный вывод, что с появлением кластера Villabruna (в дальнейшем я буду называть их «WHG» согласно общепринятой терминологии), произошло резкое изменение генофонда в результате вливания компонента, связанного с современными ближневосточными популяциями. Формально приводится и альтернативное объяснение — результат нормальной изменчивости среди охотников-собирателей, и группы с меньшей общностью с Ближним Востоком были замещены группами, изначально имевшими большую общность. Однако в abstract статьи попал лишь первый вариант.

Мое объяснение
Даже из диаграммы, которая должна иллюстрировать точку зрения авторов, следует прямо противоположный ей вывод — изменения, относимые к появлению классических WHG, начались задолго до этого и происходили постепенно. «Ближневосточное влияние» (зеленые ромбики) появляется в заметных масштабах уже в предшествующем кластере el Miron, на пять тысячелетий ранее. Но перед этим кластером находится разрыв в девять тысячелетий, где, вполне возможно, мы тоже могли бы увидеть это влияние. Однако на картинке разрыв закрыт и создается впечатление резкого перехода.
Исходное изображение:

ИсходнаяСхема
Отмасштабированная пропорционально реальной временной шкале картинка:
Безымянный-3
Как я покажу в дальнейшем, общность палеообразцов с классическими WHG и современными северными европейцами (которые являются преимущественно потомками WHG) с ходом времени росла постоянно — от костенковца и GoyetQ116-1 к el Miron, Villabruna и Loschbour. По моим предположениям, основной механизм здесь — дрейф генов. Не надо думать, что это был некий целенаправленный процесс — наоборот, дрейф генов во многом случаен (хотя и отбор наверняка сыграл свою роль), но именно то, что получилось в его результате, и стало европейскими охотниками-собирателями мезолита. Поэтому естественно, что чем ближе к нашему времени, тем выше сходство с итоговым результатом процесса.
Вместе с тем, с ходом времени мы наблюдаем и относительное повышение общности с ближневосточными популяциями, хотя и в заметно меньшем масштабе. Однако трудно сказать, кто, когда, сколько раз и на кого влиял. Допустим в качестве модели, что несущие компонент WHG группы повлияли на ближневосточников в относительно недавнем прошлом. Тогда повышение сходства палеогеномов с WHG автоматически будет немного повышать сходство и с ближневосточниками пропорционально доле WHG в их генофонде, даже если в ту эпоху на Ближнем Востоке о WHG и не слыхали. С другой стороны, небольшие равномерные вливания с Ближнего Востока в Европу могли дать такой же эффект. Или же третья группа, вроде CHG, могла повлиять как на WHG, так и на ближневосточников (необязательно одновременно). Словом, точку здесь поставит лишь хорошая выборка палеогеномов с Ближнего Востока -сравнение с современными популяциями всегда оставит место гаданиям.
Что касается восточноазиатского влияния на часть WHG (внимательные читатели критикуемой работы могли заметить, что оно «проявляется» и у одного из древнейших образцов — GoyetQ116-1), то оно объясняется ошибочностью принятия основой для сравнения образца Kostenki-14. Далее я еще коснусь этого.

Использованные для анализа методы и палеообразцы, причины их выбора
В этой заметке я не стал применять свой излюбленный метод — подсчет сумм общих (IBD) сегментов. Хотя качество некоторых образцов вполне позволяет его применить, трудно понять, как при этом надежно сравнить между собой образцы из эпох, разделенных десятками тысячелетий? Ведь сегменты со временем уменьшаются в размерах, при этом скорость процесса сильно зависит от популяционной истории — в одной выборке быстрее, в другой медленнее… Добавим к этому резко различающееся качество прочтения палеогеномов, и за корректность сравнения поручиться становится совершенно невозможно.
Поэтому я решил пойти путем подсчета доли общих снипов (IBS), как простого и объективного показателя. Чем больше значений снипов совпадает, тем выше генетическая близость. Я не согласен с мнением, что учитывать надо лишь производные (derived) аллели — ведь если оба варианта закрепились в популяции, то для дрейфа генов уже безразлично, какой из них предковый. Для того, чтобы поставить геномы разного качества в одинаковые условия, я случайным образом выбрал для каждого аллеля одно из прочтений и оставил лишь его, то есть создал искусственную гаплоидность, как часто делается с палеогеномами от лаборатории Райха. Обычно я ругаю этот подход, как разрушающий IBD-сегменты, но в данном случае он приносит пользу. Далее я ограничил набор снипов пересечением трех множеств — снипы, используемые мной для сравнения с современными выборками и снипы, прочитанные у образцов Villabruna и GoyetQ116-1. Более логично было бы выбрать в качестве базового образца WHG прочитанный наиболее качественно из всех Loschbour, однако носитель R1b Villabruna в любом случае будет вызывать интерес общественности и подозрения в отличиях от других WHG, поэтому решение было принято в его пользу. Что касается GoyetQ116-1, то из всех древних образцов он наиболее связан с «промежуточным» между палеолитическими европейцами и WHG el-Miron, за что и был выбран в качестве второй опоры. Итоговый набор составил около 107 тысяч снипов. Для сравнения Villabruna и Goyet с el Miron было проведено отдельное уменьшение набора до присутсвующих у всех троих 65 тысячи снипов.
Среди остальных использованных палеообразцов хорошо прочитанные Loschbour, Ust-Ishim, Kostenki, NE1, Kotias отмасштабировались практически без потерь в количестве снипов, Mota1 и Motala12 — с незначительными потерями. Несколько хуже отмасштабировались Vestonice16, «карел» c Оленьего острова I0061, «мальтинец» и один из наиболее ранних геномов неолитчических земледельцев Анатолии I0707, но они также были включены в сравнение, поскольку представляют явный интерес. Судя по сравнению результатов I0707 и его близкого аналога из Европы NE1, подсчеты сохранили корректность.

Таблица результатов и ее применение
Результаты сравнения сведены в таблицу, с которой желающие могут ознакомиться по ссылке. Кроме современных выборок, приведены и выборки из имеющихся палеогеномов (конец таблицы), хотя их качество очень разное. Впрочем, интересующие нас в первую очередь западные охотники-собиратели WHG и ранние неолитические земледельцы Анатолии AEF представлены вполне неплохо, хотя по Анатолии пока, к сожалению, охвачена лишь крайняя западная часть. Наиболее древние европейцы — Kostenki14, GoyetQ116-1, Vestonice16 объединены в выборку pre-WHG. Число в каждой ячейке — доля совпадающих аллелей для текущего образца с этой выборкой — допустим, 65 означает 65% общих снипов (на данном наборе снипов — число сильно зависит от набора).
Несмотря на все ухищрения, призванные поставить геномы в равные условия, прямое сравнение результатов оказалось невозможным — у некоторых образцов чуть больше совпадающих снипов со всеми выборками, у некоторых — чуть меньше. Разница невелика, но в этом методе играют роль даже доли процента. Возможно, причина — в разном качестве прочтения, возможно — индивидуальные особенности образцов или что-то еще. Однако решение проблемы существует. Поскольку увеличение или уменьшение доли совпадающих снипов примерно пропорционально для всех выборок, можно взять соотношение этой доли с выборкой, равно удаленной от всех («outgroup»). В качестве подобного ориентира я решил взять объединение всех четырех используемых мной выборок из Африки южнее Сахары — представителей пигмеев мбути и бьяка, кенийских банту, нигерийского племени йоруба. На графике ниже приведена доля общих снипов для каждого из палеогеномов с соответствующей выборкой (Balt, Druze, WHG и т.д.) после приведения доли общих снипов с африканцами к одинаковому с другими образцами значению путем домножения на коэффициент. Для проверки корректности метода на график помещены другие outgroups, которые в исследуемый период явно не могли участвовать в обмене генами ни с африканцами, ни с исследуемыми палеообразцами — выборка папуасов. Как интерпретировать их результат, я опишу чуть ниже.
График1
Палеогеномы (kya означает тысяч лет назад):
Ust-Ishim — усть-ишимский человек, наиболее древний приемлемо прочитанный геном человека современного типа.
Kostenki-14, GoyetQ116-1, Vestonice16 — древние геномы из Европы
el-Miron — предшественники WHG
Villabruna, Loschbour — WHG
Motala12 — охотник-собиратель из Швеции, представитель группы SHG (охотники-собиратели Скандинавии)
Karelian — образец с Оленьего Острова, так называемый EHG (восточный охотник-собиратель). Malta — древний «сибиряк» со стоянки Мальта, образец аутосомного компонента ANE — предковые северные евразийцы
EHG находятся в промежутке между WHG и ANE и, вероятно, являются их смесью.
I0707 — ранний неолитический земледелец с запада Анатолии
NE1 — ранний неолитический земледелец с территории Венгрии
Kotias — мезолитический охотник-собиратель с Кавказа

Ради интереса я также поместил на график результаты современного восточноевропейца с предками из трех восточнославянских народов (Modern EE).

Левая часть графика иллюстрирует изменения в генофонде европейцев с течением времени (усть-ишимский человек добавлен для сравнения, хотя он и не из Европы), правая — другие представляющие интерес геномы.
При сравнениях палеогеномов с палеовыборками сравнение «сам с собой» пропускалось.

Интерпретация сравнения с выборкой папуасов
Как мы видим, соотношение «родство с папуасами»/»родство с африканцами» для палеоевропейцев представляет собой почти горизонтальную линию. Это значит, что с какой скоростью европейцы «отдрейфовывали» от папуасов, примерно с такой же они отдалялись и от суб-сахарцев. Выглядит логично. Усть-ишимец выше всех, и это тоже логично — ведь он находится наиболее близко во времени к моменту расхождения папусов, восточноазиатов и WHG/ANE — значит, он и должен иметь относительно больше общего с папуасами. С другой стороны, для образца Kotias, имеющего много «базального» компонента, логично иметь заметно более низкое значение этого соотношения — момент расхождения «базальников» и предков остальных не-африканцев (включая папуасов) был очень давно. Ранние земледельцы, как смесь «базальников» и WHG, закономерно находятся в промежутке между WHG и Kotias. Даже неравномерности в графике охотников-собирателей находят свое объяснение — как я покажу позже, у костенковца вероятно небольшое влияние «базальников», и он проваливается на графике. Также я предполагаю небольшое базальное влияние у WHG и el Miron — соответственно, они находятся чуть ниже Goyet, мальтинца и оленеостровца. Итак, контрольная проверка показала применимость метода.

Важная ремарка — когда я в дальнейшем буду писать о росте доли общих снипов (график с течением времени идет вверх), надо понимать, что этот рост относительный. Есть некий базовый «уровень разбегания» — это скорость, с которой мы с каждым поколением отдаляемся от африканцев и папуасов из-за дрейфа генов и других факторов. Если в относительных значениях общность с друзами растет, это не значит, что она точно растет в абсолютных значениях — возможно, она тоже падает, но из-за обмена генами с нами падает медленнее, чем могла бы. А может, с друзами общность медленно растет, но с отстающими от них йеменцами медленно падает. Все зависит от соотношения скорости дрейфа генов, который нас растаскивает, и скорости обмена генами, который объединяет. В данном случае нас интересует, что удается увидеть наличие факта этого обмена.

Интерпретация графика
В первую очередь бросается в глаза пунктирная красная линия вверху — доля общих снипов с выборкой WHG. Как легко заметить, рост был почти непрерывен в течение всего времени, лишь, немного споткнувшись на образце Vestonice (возможно, поэтому в статье отнесли этот кластер к «тупиковой ветви». Впрочем, на сравнении с балтской выборкой такого не происходит, а современные выборки все же качеством на порядок выше — значит, доверия им больше). Ниже сплошной красной линией приведено сравнение с наиболее близкой к WHG выборкой наших современников — жителями восточного побережья Балтики (выборка Balt состоит из 11 литовских образцов, 6 латышских, 2 из Латгалии и одного с российско-латышской границы). Здесь картина аналогична — каждый следующий во времени образец ближе к балтам, чем предыдущий, включая даже Vestonice16. Очевидно, что объяснить это монотонное приближение единоразовой миграцией невозможно, а вот процессы генетического дрейфа укладываются в модель замечательно. Зеленые линии — аналогичная пара для неолитических земледельцев (пунктир) и считающихся (по результатам аутосомного анализа) наряду с армянами их наиболее сохранившимися представителями на Ближнем Востоке друзами Палестины. Здесь мы тоже видим рост, но более медленный по сравнению с ростом сходства с WHG. Если учесть, что порядка четверти генофонда AEF считается полученным от WHG, то примерно половину роста необходимо отнести на этот фактор. Оставшаяся половина и будет искомым обменом генами между «базальниками» и WHG. Для моделирования «базальников» зачастую применяют выборку из Йемена, как наиболее отдаленную от европейцев среди ближневосточников. Неизвестно, насколько это моделирование корректно, однако я включил их в сравнение (голубая линия). Родство с ними также растет, хотя и медленнее, чем с AEF или друзами. Однако, начав заметно ниже папуасов, ближе к нашему времени йеменцы успешно обгоняют их и становятся более близкими к WHG. Ведь обмен генами с йеменцами гораздо менее затруднен географически, чем с папуасами.

Несколько слов о правой половине графика
Представитель сестринской к WHG клады — ANE, мальтинец (24 тлн), обладает относительным сродством с WHG примерно на уровне европейских образцов 30-37 тысяч лет назад. Можно предположить, что момент расхождения был не слишком задолго до этого времени. При этом сродство с «балтской» выборкой относительно выше — поскольку в Восточной Европе присутствует не только WHG, но и доля ANE. У «карела» EHG связь с WHG закономерно выше (поскольку он и сам частично WHG), соответственно выросла и связь с ближневосточниками. То же самое, но в еще большей степени можно сказать про образец из Швеции Motala12 (скандинавские охотники-собиратели — SHG считаются WHG с примесью ANE). На паре AEF/NE1 можно пронаблюдать, как при продвижении в Европу у неолитчиков вырос вклад WHG, зато упал «ближневосточный» компонент. У «палеокавказца» Kotias по сравнению с ними резко падает связь с восточноевропейцами, и менее резко, но тоже падает — с ближневосточниками.

Определенный интерес представляет и сравнение с некоторыми другими современными выборками. Я не стал помещать их на основной график, чтобы избежать его перегруженности, но размещаю более полный вариант ниже.
График2
Сардинцы добавлены, как наиболее яркие современные представители неолитических земледельцев, удмурты — как связанные с EHG, корнцы — с более западным вариантом WHG, калаши — за «калашский» кластер, кеты и южноамериканские индейцы каритиана — за связь с ANE.

Карты для палеогеномов

Теперь перейдем к рассмотрению каждого из палеогеномов отдельно. Для начала несколько слов об усть-ишимце. Хотя он и наиболее близок к общему корню, но все же, судя по всему, в его времена расхождение неафриканского человечества на основные ветви уже состоялось. Ближайшими к усть-ишимцу выборками оказались меланезийцы и папуасы, далее идут жители юго-восточной Азии, тамилы и восточноазиаты.

Каждая карта нормируется отдельно — ярко-красным выделяется наиболее хорошо связанная с этим геномом выборка из представленных, ярко-зеленым — наименее связанная. Не представленные на карте выборки (четыре африканские, две америндские, папуасы и меланезийцы) в нормировании не участвуют, по сравнению с африканцами все неафриканцы были бы просто разными оттенками красного. Карты в этой статье построены согласно доле общих снипов (IBS), по тем же таблицам, что и предыдущий график. Это не IBD-анализ. В более хорошем качестве карты можно загрузить отсюда
UstIshim.png
Хотя европейцы и среднеазиаты чуть ближе к усть-ишимцу, чем североафриканцы и ближневосточники, разница сравнительно невелика. Частично удаление европейцев от усть-ишимца следует отнести на влияние «базальников», но думаю, WHG и сами по себе успели хорошо удалиться от восточной ветви человечества. Поэтому на роль представителя общей для всех базы усть-ишимец не годится.

GoyetQ116-1
По причинам, описанным мной в разделе «Использованные для анализа методы и палеообразцы», из наиболее древних европейских геномов на роль «базового» был выбран GoyetQ116-1. И, как показывает карта, уже 35 тысячелетий назад европейские аутосомы начали приобретать свои основные черты. На первом месте по схожести — уже упоминавшаяся выборка «Balt», она будет попадаться нам вновь и вновь. Родство с остальными европейцами выражено вполне отчетливо. Однако интересно обратить внимание на другие регионы. Во-первых, родство с североафриканскими и ближневосточными популяциями находится на том же уровне, что и родство с восточноазиатами. Видимо, мы поймали тот момент, когда протоевропейцы были равноудалены от этих двух стволов. В дальнейшем родство с восточноазиатами будет ослабевать, а с ближневосточниками — усиливаться. Как говорится, «география-это судьба».

GoyetQ116-1.png
Еще раз повторюсь, что речь идет о современных ближневосточниках. Насколько они репрезентативны по сравнению с населением региона 10, 20, 50 тысяч лет назад — совершенно непонятно.
Очень интересно «вторичное пятно» в Индии. Вероятно, оно было бы соединено яркой полосой с европейским ареалом, если бы не размывшие ее миграции «базальников» с юго-запада и восточноазиатов с северо-востока. При этом в юго-восточной Индии и Бирме ареал связи с прото-WHG перекрывается с ареалом хорошей связанности с усть-ишимцев. Не отсюда ли когда-то разошлись две наших ветки? Я не являюсь специалистом по Y-гаплогруппам, но кажется, с максимумом разнообразия макрогаплогруппы K, включающей в себя в качестве ветвей такие известные гаплогруппы, как N, O, R, Q, это соотносится хорошо (в таком случае, «базальников» можно связать с IJ). Разумеется, сюда также относится оговорка о возможной несхожести современного и древнего населения.

Vestonice16
Картина для Vestonice16 довольно схожа с картой GoyetQ116-1.

Vestonice16.pngПри сравнении видно, что связь с восточной (и в первую очередь Юго-Восточной) Азией несколько ослабла, а связь с западными выборками (как европейскими, так и ближневосточными) слегка усилилась. Однако разница невелика и из-за этого сравнительная карта выглядит некрасиво. Чтобы избежать загромождения излишними иллюстрациями, ее не привожу.

Kostenki14
Как и Вестонице, костенковец весьма схож с GoyetQ116-1. В данном случае мне хочется привести именно карту разницы со вторым палеогеномом, чтобы продемонстрировать его «южный» компонент. Зеленое — больше общего с костенковцем, красное — с Goyet.
GoyetQ116-1VsKostenki14Merged.png
Из-за схожести двух геномов карта очень зашумлена, однако противоположности проявляются хорошо. Ярко-зеленое прекрасно совпадает с областью распространения компонента кавказских охотников-собирателей CHG (ниже будет приведена карта и для них). Видны его максимумы на Кавказе и у калашей, на Балканах, и даже (хотя это может быть погрешностью) замечавшееся при анализе «ямных» геномов пятно в северо-западной Европе. Красное же в юго-восточной Азии — район максимальной «небазальности». Оттенки бурого и близкие к ним разглядывать нет смысла, также, как и отдельные «выбросы».
Как будет показано далее, костенковец наиболее успешно моделируется, как смесь 86% GoyetQ116-1 и 14% Kotias. Строго говоря, мы не можем утверждать, что GoyetQ116-1 представляет чистых прото-WHG, а костенковец является смесью с южанами. Не исключено, что «южный» компонент присутствует и у GoyetQ116-1, просто его меньше. В конце концов, смешение могло произойти еще по пути в Европу.

el Miron
Закончив с наиболее древними геномами, мы можем перейти к рассмотрению динамики европейского генофонда во времени (впрочем, до момента прибытия неолитических земледельцев она довольно однообразна). Поэтому ближайшие карты будут только сравнительными. Итак, красное — выборки, сходство с которыми у образца el Miron (19 тлн) усилилось по сравнению с образцом GoyetQ116-1 (35 тлн). зеленое — выборки, сходство с которыми ослабло. Бурое — возможно, слегка усилилось, возможно, ослабло, но не так сильно, как с зеленым. Об этом я написал в разделе «важная ремарка» после графика.

elMironVsGoyetQ116-1.png

Villabruna

VillabrunaVsElMiron.pngКак видите, прибытие Villabruna никакого переворота не произвело. Как и раньше, с ходом времени сходство с циркумбалтийцами усиливалось, с восточноазиатами — ослабевало, с ближневосточниками — то ли слегка усиливалось, то ли медленно ослабевало, но медленнее, чем с восточноазиатами.

Loschbour
Этот образец настолько схож с предыдущим (см график), что разностная карта показывает один шум. Поэтому я приведу конечный итог — вот к чему пришли WHG спустя 29 тысячелетий:
LoschbourVsGoyetQ116-1.png
А также сравнение — где произошли наибольшие изменения
Сравнение Loschbour и GoyetQ116-1

LoschbourVsGoyetQ116-1.png
Дальше всего «убежали» от протоевропейцев жители юго-восточной Азии, далее идут Индия, Восточная Сибирь и Северная Африка. За пределами основного региона меньше всего «скорость убегания» на Северном Кавказе, у ираноязычных памирцев, греков-киприотов и кетов (везде можно предположить контакты с носителями WHG).

Теперь перейдем к Кавказу и Анатолии. Уже упоминавшийся в пояснениях к карте для костенковца кавказский охотник-собиратель Kotias:

Kotias.png

Интересно попытаться расщепить этот компонент на составляющие. В значительной части он несомненно связан общим корнем с прото-WHG (хорошо выделяются оба значимых для этого компонента региона — Европа и Индия). Попробуем вычленить не-WHG часть путем сравнения с GoyetQ116-1.

KotiasVsGoyetQ116-1.png

В первую очередь закономерно выделяются зоны наибольшего распространения CHG — Кавказ и Афганистан (калаши)/Пакистан/Иран. Однако кроме этого, проявляется и связь с Ближним Востоком, Анатолией, Балканами — регионами распространения ранненеолитических земледельцев. Таким образом, можно предположить, что у CHG имеется связь с ближневосточным аутосомным компонентом (знаменитые «базальники»), который впоследствии стал основой генофонда неолитических земледельцев и через них повлиял на современных европейцев. Потому-то Европа и выглядит на этой карте в целом нейтрально — на юго-востоке персиливает влияние «базальников», на северо-востоке — WHG. И наоборот, Восточная Азия, куда базальники не добрались, оказалась ярко-зеленой — это говорит о том, что время их расхождения с восточноазиатами древнее, чем время расхождения восточноазиатов и WHG.

Тот же самый эффект, но с противоположной стороны мы можем наблюдать, сравнив Kotias и геном ранненеолитического земледельца из Анатолии:KotiasVsAEF.png

Поскольку теперь Kotias менее «базальный», на этот раз Восточная Азия оказалась красной. Хотя наиболее выражен «не-базальный» компонент Kotias в Индии. Поэтому я считаю, что компонент CHG следует считать смешанным между «ближневосточным» (предковым к AEF) и «индийским» (предковым к WHG) компонентом.

Раз уж я неоднократно упомянул AEF, приведу карту и для представителя этой выборки I0707.

AEF.png

Среди наших современников наиболее схожими с ним являются жители острова Сардиния, находящемся в западной части Средиземного Моря. Можно сказать, что компонент ранних земледельцев сохранился там, словно в заповеднике. В целом он лучше представлен в южной Европе, чем на Ближнем Востоке. Хотя не стоит забывать — для анализа у нас есть лишь палеогеномы с крайнего запада Анатолии, на границе с Европой. Вполне возможно, что ближневосточные геномы оказались бы ближе к современным выборкам с Ближнего Востока. Пока же мы можем сказать, что в регионе наиболее схожими с имеющимися образцами неолитчиков оказались армяне, друзы и греки-киприоты.

Наконец, последними я хочу привести две карты для образца возрастом в 24 тысячелетия со стоянки Мальта в Прибайкалье. На основе его анализа в свое время было выдвинуто предположении о существовании «популяции-призрака» — ANE, предковых северных евразийцев, которые повлияли на многих соседей, в том числе на американских индейцев, но сами к нашему времени исчезли. ANE считаются родственной к WHG веткой и не несут восточноазиатского или ближневосточного влияния. В схожести картин можно легко убедиться:

MaltaIBDext.png

Если WHG это западный вариант, то у ANE основная тяжесть приходится на выборки из Западной Сибири (кеты), Урала (манси) и недавных мигрантов из этого же региона (саами). Очевидно, в прошлом ареал ANE простирался заметно восточнее, но к нашим дням они оказались вытеснены мигрантами с юга, из Восточной Азии. Интересно сравнить, каковы же основные отличия ANE от прото-WHG:

MaltaVsGoyetQ116-1.png

Пятно в западной Сибири вполне ожидаемо. Меня более заинтересовало пятно вокруг выборки калашей в средней Азии. Если вспомнить о связи этого же региона с кавказскими охотниками-собирателями, то уместно предположить, что здесь мы нащупали корень не-ближневосточной части CHG. При анализе Admixture мальтинец показывал наличие около 30% CHG, поэтому я долго ломал голову, как связать этот факт с явной не-ближневосточностью мальтинца. Теперь все становится на свои места — взаимосвязь идет через «калашский» компонент.
Что касается отличий прото-WHG от ANE, то они чуть ближе к восточноазиатам (может, их точка отделения чуть юго-восточнее, чем у ANE?), и ближе к «базальникам», что вновь заставляет меня думать о «базальном» влиянии уже у GoyetQ116-1. В конце концов, если у двух других образцов оно есть, может быть и у этого. Но пока более «чистых» образцов у нас нет, сравнить не с кем. С другой стороны, мальтинский образец на одиннадцать тысячелетий моложе — возможно, за это время он сильнее отдрейфовал от остальных веток.

Численная оценка доли вклада каждого компонента в некоторые из адмиксов.
В процессе работы над сравнительными картами у меня возникла мысль, не попробовать ли сделать численную оценку на основе все тех же таблиц общности IBS с современными выборками. Действительно, если я предполагаю, что не-WHG компонент костенковца очень похож на результаты кавказского охотника-собирателя Kotias, то я могу проверить, насколько близка к костенковцу будет комбинация 1% Kotias + 99% GoyetQ116-1, 2% Kotias + 98% GoyetQ116-1 и так далее, проверив сумму среднеквадратичных отклонений по всем столбцам. Для того, чтобы исключить влияние уже упоминавшегося в начале статьи эффекта, для каждой тройки сравниваемых геномов производилось нормирование. Таким образом, суммы IBS с современными выборками по каждому геному совпадали.

Для проверки модели я решил использовать геном, смешанное происхождение которого достоверно известно. Как мы знаем, по мере продвижения в Европу и с ходом тысячелетий исходный генофонд неолитических земледельцев постепенно размывался благодаря влиянию местных охотников-собирателей. Следовательно, геном семитысячелетней давности земледельца из Венгрии NE1 должен хорошо моделироваться, как смесь земледельца из Анатолии AEF (возраст генома на тысячу лет больше) и WHG. Так и получается — если в роли представителя WHG выступает более ранний геном Villabruna, модель предсказывает соотношение 11% WHG на 89% AEF, для более позднего Loschbour соотношение почти такое же — 10% WHG на 90% AEF. Среднеквадратичное отклонение при этом меньше единицы — в дальнейшем будем считать такое значение признаком того, что смешение моделируется хорошо.
Ряд результатов для заинтересовавших меня вариантов моделирования приведен на изображениях ниже:
Оракул01.png
Кратко прокомментирую. При попытке смоделировать NE1, как смесь WHG и CHG отклонение резко возрастает, что говорит о неудачности такой модели по сравнению с предыдущим вариантом. Родственные WHG охотники-собиратели ANE могут частично служить заменой Villabruna, однако результат хуже. Таким образом, результаты моделирования полностью соответствуют здравому смыслу. Я решил попробовать сделать еще один шаг и ввести в модель искусственный образец «базальника», полученный вычитанием из геномов неолитических земледельцев 15-20 процентов вклада WHG. Конечно, точная доля компонента WHG в геномах неолитчиков нам неизвестна, однако это лучше, чем применять в качестве «базального» образца геном AEF.
Результат костенковца действительно лучше всего моделируется, как смесь 86% прото-WHG и 14% CHG (Kotias), что мы и наблюдали на сравнительной карте. Чуть хуже вариант 94% прото-WHG на 6% базальников. Для другого древнего образца из Европы, Vestonice16, картина противоположная — базальники лучше подходят в качестве второй стороны, чем кавказцы. Интересно, что наиболее старые образцы Y-гаплогруппы I пока что найдены именно у представителей кластера Вестонице — возможно, это не случайное совпадение и вливание «базального» компонента связано с приходом носителей этой гаплогруппы.
«Опорный» прото-WHG GoyetQ116-1 не моделируется, как смесь кого-либо из двух других представителей группы и южан. Однако он может быть относительно неплохо смоделирован, как 88% костенковца и 12% мальтинца. Вероятно, это связано с отсутствием «базального» компонента у образца со стоянки Мальта.

Оракул02.png
Носитель R1b Villabruna может быть смоделирован, как смесь одного из своих предшественников и базальников, однако отклонение при этом слишком велико, чтобы считать моделирование успешным.
CHG Kotias плохо моделируется, как смесь каких-либо двух других образцов. Наиболее удачный вариант — 48% Мальта и 52% базальники (что еще раз говорит о его промежуточном положении между двумя кладами).
«Оленеостровец» EHG наиболее хорошо моделируется, как  смесь 51% SHG (Motala12) и 49% ANE (мальтинец), отклонение великовато.

Оракул03.png
«Скандинав» Motala12 хорошо моделируется, как смесь 72% WHG и 28% EHG
Промежуточный между прото- и классическими WHG образец el Miron оптимально моделируется именно как смесь первых (GoyetQ116-1) и вторых (Villabruna). Однако при этом он оказывается ближе к более древним родственникам, хотя расстояние по времени до них гораздо больше. Возможно, это объясняется ускорением дрейфа в эпоху 19-14 тлн, но мне кажется более правдоподобным другое объяснение — WHG это потомки сестринской к el Miron ветви, поэтому часть дрейфа у них прошла отдельно.

Дерево вероятных взаимосвязей
Попытавшись максимально подробно и непротиворечиво свести вместе как данные, полученные в результате вышеописанных исследований, так и информацию из других работ, я изобразил дерево возможных взаимодействий палеообразцов и аутосомных компонентов. Схема достаточно условна, поэтому размещать на ней датировки далее 40 тысяч лет назад не имеет смысла. Гипотетический общий компонент «мальтинца» и охотников собирателей-кавказа я обозначил «Kalash», но надо понимать, что под этим вовсе не подразумеваются современные калаши — просто неким образом связанная с ними древняя предковая популяция. Серыми стрелками между «базальниками» и CHG, «базальниками» и WHG обозначено, что взаимодействия, по-видимому, были, но обозначить их одиночной линией на схеме тяжело. «Уральский» компонент — это часть генофонда народов Урала и западной Сибири, которую можно отнести к европейской ветви, для получения картины современного состояния необходимо объединить ее с восточноазиатским влиянием.

Дерево08.png

Думаю, что на самом деле все гораздо сложнее и запутаннее, чем изображено здесь )) Будем ждать новых расшифровок древних геномов для дальнейшего развития схемы.

Реклама

Тезисные выводы статьи о эволюции «динарской подгруппы» гаплогруппы I2a

На протяжении последних двух месяцев я уделил много cвободного времени организации собранного мной на протяжении последних 6 лет материала и экспериментальных данных, касающихся демографической истории популяции носителей «мужской» (Y-хромосомной) гаплогруппы I2a, причем в фокусе исследования находился тот вариант, который наиболее распространен в Восточной Европе — т.н «динарская ветвь» или «динарская субклада». К началу декабря окончательный вариант статьи (объемом в 50 страниц) был подготовлен к реценизированию, которое должно занять несколько месяцев.

Пару дней назад один из рецензентов, историк Вячеслав Носевич из Беларуси, опубликовал публичный вариант рецензии статьи (этот вариант рецензии я размещу чуть ниже).

Пока ожидается рецензия второго рецензента, я хочу познакомить читателя с главными выводами исследования


Выводы исследования

 

Перед тем как приступить к  обсуждению результатов исследования, необходимо вкратце сформулировать в виде тезисов основные результаты анализов, проведенных в рамках системного метода:

  1. Гаплогруппа I2a1b2a1 определяется снипами CTS176/S2621, CTS1293/S2632, CTS1802/S2638, CTS5375/S2679, CTS5985/S2687, CTS7218/S2702, CTS8239/S2715, CTS8486/S2722, CTS11030/S2768, L178/S328 (и пр.). Согласно данным экспериментальной филогении (эспериментальному дереву гаплогрупп) Yfull (2014) и ISOGG, эта клада разбивается на субклады новыми снипами I-S17250 (к этой субкладе принадлежат все из протестированных представителей т.н «южного динарского Y-STR кластера» и часть представителей т.н. «северного динарского кластера», в то время как у остальной части обнаружено «предковое значение» аллели снипа I-S17250 –), I2a1b2a1b — Y4460 (Y3106, в эту кладу входят выходцы из Беларуси, Латвии, Росии, Польши), и Z17855 (в эту «безымянную» субкладу, еще не принятую в номенклатуре ISOGG, входит часть болгар, македонцев и украинцев).
  2. Самый большую подгруппу образуют дочерние кластеры самой большой субклады I-S17250 (обозначенной в дереве ISOGG как I2a1b2a1a): I2a1b2a1a1-Z16971(Y5596,Y5595, обнаружена у представителей небольшого кавказско-украинского кластера, чей возраст по расчетам дисперсии Y-STR составляет 1000 лет), I2a1b2a1a2-Y4882 (Y4883, представлена в выборке беларусов, украинцев и поляков), I2a1b2a1a3-A356/Z16983 (Y4790, Y4789, данные снипы найдены у части представителей описанного выше «южного-динарского» кластера). Данное распределение субклад гаплогруппы I2a1b2a1 показывает, что разнообразие субклад (ветвей) этой гаплогруппы гораздо выше в восточной Европе, где ареалы распространения дочерних субклад динарского субклала в значительной степени накладываются друг на друга. На Балканах и в южной Европе разнообразие дочерних субклад I2a1b2a1 ниже.
  3. Исходя из имеющихся ныне фактов, можно сделать вывод о том, что так называемый северно-динарский Y-STR кластер I2a1b2a1 («Dinaric-N») соответствует той части родительской ветви I2a1b2a1CTS5966, которая не входит в субкладу I2a1b2a1a3- Z16982/ Z16983/A356 (последняя включает значительную часть южно-динарского Y-STR кластера)[1]. У большинства представителей всей динарской гаплогруппы I2a1b2a1 обнаружены мутировавшие аллели в Y-снипах Y3548, S17250, и YP205. Cледовательно, варианты Y-хромосомы гаплогруппы I2a1b2a1, не имеющие эти три снип-мутации, представляют собой самое ранее кладистическое разделение гаплогруппы I2a1b2a1-CTS5966, видимо незадолго до последующей популяционной экспансией. Прямая патрилинейная родословная носителей этих «предковых вариантов» прослеживается в регионы юго-восточной Польши и смежных регионов западной Украине. Кроме того, в ходе коммерческих исследований проекта FTDNA I2a, у одного из представителей субклада «Disles» (I2a1b2a-CTS10936) — ближайшего (и возможно «родительского») по отношению к корневому уровню «динарской субклады» были определены 2 предковых (-) значения снипов, играющих важное значение в кладистическом разделении «динарского субклада» — CTS10936 + CTS10228- CTS5966-. Примечательно, что этот мужчина по прямой линии тоже происходит из южной Польши. Подводя итог сказанному, можно заметить, что распространение гаплогруппы I2a1b2a1CTS5966 началось в регионе западной Украины или юго-восточной Польше, где до сих пор сохранились «реликтовые» клады (ветви) I2a1b2a1CTS5966 с  «предковыми значениям» трех снипов.[2]
  4. Таким образом, более раннее разделение субклады I2a1b2a1 по 2 DYS-локусам на два кластера – южной и северный — не отражает истинной филогении: по состоянию на конец 2014 года субклад разделяется на 2-3 группы с дальнейшим разбиением на подгруппы; однако в настоящий момент из-за недостатка статистических данных трудно сказать, какие из данных мутаций являются приватными (генеалогическими), а какие актуальны для этнопопуляционных построений.

[1]  Кроме этих снипов, формирующих четко выраженные клады в структуре дерева I2a1b2a1, в одном из  тестов Geno 2.0  у представителя этой гаплогруппы были обнаружен снип CTS8429, чье положение в структуре дерева I2a1b2a1 неизвестно. Стоит также упоминуть снип YP206 (находящийся под снипом  S17250);  зафиксированный в полных геномных данных двух сардинцев из работ Francalacci et al. (2013); а также одноуровневые снипу YP206 ( M1345/CTS934).

[2] В частной переписке К.Нордтведт высказал мнение о том, что первичный ареал распространения этой  гаплогруппы находился в Польше, к югу от Вистулы.

  1. Генография субклад I2a носит нон-инклюзивный характер по отношению других субклад I2a, иными словами ареалы распространения отдельных субклад I2a практически не пересекаются. Распространение I2a1b-M423 в восточной Европе (где представлена главным образом ее «динарская субклада» I2a1b2a1) характеризуется резким градиентом частот: частоты Y хромосом этой субклады резко уменьшаются по мере удаления к западу от Балкан – так, например, этот субклад практически отсутствует у итальянцев, немцев, французов, и швейцарцев. При движении на северо-восток уменьшение частот гораздо более плавное, I2a1b-M423 сохраняет заметные частоты среди населения, говорящего на славянских языках. Распространение частот гаплогруппы I2a1b-M423 в восточной Европе носит бимодальный характер – с максимальным пиком (30-50 %) на Балканах, и с менее выраженным пиком (20-30%) в карпатско-полесском регионе. Наибольшие частоты распространения I2a1b встречаются у жителей Боснии-Герцеговины и хорватов Далмации от 40 до 60%, у сербов и македонцев 20-30%, примерно столько же в Молдавии у гагаузов.
  2. Благодаря находкам древнй ДНК удалось уточнить место первоначального распространения гаплогруппы I2a1b M423 (северо-западная часть Европы), по-крайней мере одной из ее древнейших исчезнувших ветвей, выделившейся из родительской гаплогруппы примерно 8700-9000 лет назад. Образец Лошбур (Loshbour) принадлежит к ветви, параллельной современным дочерним субкладам, которая отделилась от основной ветви не позднее чем 10 000 лет тому назад: к этой исчезнувшей ветви принадлежат и несколько образцов ДНК жителей шведской мезолитической стоянки Motala (Motala 3, Motala 12), которая существовала синхронно Лошбуру. Видимо, в этом же регионе и произошло выделение предковой ветви I2a1b2a12/CTS5966, так как ближайшая к динарской субкладе сестринская субклада I2a1b2a* (так называемый кластер Disles) встречается как в Польше, так и на британских островах, а следующая по удаленности клада (островная субкладаIsles I2a1b1 (L161.1/S185)) встречается практически исключительно на британских островах (подобный изолированный характер может быть связан с обособлением этой ветви в мезолите как следствие гипотетического затоплением Доггерланда около 8500 лет тому назад (Weninger 2008)). Кроме того, оба найденных (в захоронениях древних жителей Паноннской равнины) образцов ДНК гаплогруппы I, (образец NE7 — I2a2a-L1228 и образец KO1 – I2a-L68) принадлежат к параллельным ветвям, ни одна из которых не является предковой ветвью динарской субклады I2a1b2a1.  Исходя из этого можно сделать осторожное предположение о том, что представители динарской субклады I2a1b2a1L147.2/CTS5966 появились на Балканах гораздо позднее неолитического периода.
  3. Визуальное изучение структур минимального остовного и штейрновского деревьев филогенетической сети гаплотипов I2a1b2a1 показало, что большое скопление гаплотипов вокруг большых узлов обеих деревьев  имеет типичную форму филогенетического старкластера  Подобная форма филогенетических кластеров в основном наблюдается в тех случаях, когда происходит быстрый демографический рост одного конкретной филогенетической линии, и этот рост приводит к появлению серии одновременных мутационных событий. Большинство из гаплотипов, входящий в большой узел графа, принадлежат к этнопулам жителей южной Европы (главным образом, Балкан) Исходя из этого можно предположить что экспансия носителей I2a1b2a1-L2/CTS5966 на территории Балкан сопровождалась быстрым демографическим ростом попуялции.
  4. На реконструированной карте место «выделения» I2a1b родительской популяции современных представителей субклады I2a1b2a1 -разместилось чуть южнее швейцарских Альп (обозначено большой красной точкой) (Рисунок 10), примерно в 420 километрах к юго-востоку от места обнаружения древнейшего (8000 лет до настоящего времени) образца ДНК мужчины, принадлежавшего к гаплогруппе I2a1b (Loschbour-Heffingen, Luxembourg) и примерно в 650 километрах к югу от Лихтенштейнской пещеры, в которые были обнаружены 4 скелета мужчин с древнейшими (3000 лет до настоящего времени, культура полей погребения) из найденных образцов гаплогруппы I2a2b, а также в 920 к юго-западу от местонахождения неолитического поселения Apc-Berekalja (Венгрия), где был обнаружен древнейший из найденных образцов I2a2a (возрастом в 6700 лет ). Заметная близость реконструированного места выделения предковой линии I2a1b2a1 к местам нахождения древнейших образцов гаплогруппы I2a в Европе подтверждает правдоподобность подобной реконструкции.
  5. При сопоставлении интервалов возрастов гаплогруппы (т.е расчетных времен жизни ближайшего общего предка гаплогруппы) I2a1b2a1, мы получили среднее медианное значение интервала полученных возрастов. Оно составляет 2757 лет, стандартное отклонение 404 лет (2757 ± 404), верхний предел интервала TMRCA перекрывается с интервалом TMRCA, вычисленного с помощью ρ-статистики 3400 ± 200 лет: Примечательно также, что время расхождения Y-STR кластеров внутри филогенетического дерева лежит в интервале 1700-1300 год до настоящего времени. Это означает, что в этот период времени (т.е между 4 и 7 веками нашей эры) гаплогруппа I2a1b2a1 находилась в активной стадии экспансии.
  6. Безусловный пик-максимум распространения I2a1b2a1 приходится на Балканы (особенно на регион Боснии-Герцеговины), а один из пиков значений дисперсии (разнообразия) гаплотипов — на полесско-карпатский регион Восточной Европы. Исходя из общего правила о приоритете разнообразия (дисперсии) над частотой распространений генетических линий при определении «начальной точки экспансии», предпочтение было отдано дисперсии как  более устойчивому индикатору, в то время, как частоты гаплогрупп больше подвергнуты флуктуациям.
  7. Полученные этнопулы или этнические кластеры имеют специфический: например в выборке выделяется характерный еврейский кластер (украинские и белорусские евреи-представители этого кластера имеют редкие характерные значения Y-STR локусов: DYS537 = 11, DYS464a = 13, DYS456 = 14, DYS458 = 18, DYS576 = 19,DYS570 = 16) с самой высокой интерпопуляционной дистанцией от остальных кластеров и самым низким разнообразием азывает на недавнее происхождение кластера как следствие чистого эфекта основателя, имевшего место примерно 500 лет назад. Боснийско-герцеговинский кластер (второй после еврейского кластера по величине интерпопуляционной дистанции), но с более высоким уровнем разнообразия указывает на более удаленный по времени популяционный эфект основателя. В то время, как географически близкий к боснийско-гецеговинскому кластеру хорватский кластер  I2a1b2a1 характеризуется относительно низким уровнем молекулярного разнообразия (многие хорватские гаплотипы I2a1b2a1 имеют характерный гаплотипный мотив DYS19=14), и незначительной дистанцией с другими популяциями, что отражается в более низком значении индекса стандартного разнообразия (что подразумевает изменение размера эффективной популяции). Данный эффект можно объяснить кумулятивным действием двух параллельных популяционных эффектов -эффекта основателя и эффекта «бутылочного горлышка»
  8. Полученные в ходе анализа молекулярного разнообразия I2a1b2a1 данные свидетельствуют в пользу нашего предположения о том гаплогруппа I2a1b2a1 не является автохтонной гаплогруппой Балкан и Динарских Альп, в противном случае наблюдалась более существенная корреляция между популяцией носителей этой гаплогруппы и антротипом. Поскольку популяции I2a1b2a1 лучше коррелируют с языком, а не с антротипом, то можно сделать два вывода: 1) экспансия носителей субклада I2a1b2a1 произошла недавно, т.к. не утерялась связь представителей генетической линии с языком; 2) поскольку славянские языки были явно привнесены на Балканы, то нужно признать, что I2a1b2a1 были в числе генетических линий, представители которых привнесли славянские языки на Балканы.
  9. По мнению авторов статьи (Boattini et al. 2011) генофонд (включая генофонд Y хромосом) изолированной популяции арберешей не только должен отражать структуру генетического пула алабанцев 500 летней давности, но и служить своего рода «эталоном» генофонда древних балканских популяций. Принимая во внимание низкую частоту встречаемости динарского субклада I2a1b2a1 у современных арбарешей, можно предположить, что субклада I2a1b2a1 встречалась в генофонде популяцих южной части Балканского полуострова 500 лет назад гораздо реже, чем сейчас. Очевидно, что в ходе дальнейших демографических процессов %-ная доля I2a1b2a1 в генофонде южнобалканских популяций значительно увеличилась.
  10. Гипотетическое направление миграций можно восстановить с помощью проекции градиентов значений индекса молекулярного разнообразия на векторную карту со стрелеками, отображающими направление уменьшения значений индекса молекулярного разнообразия. Примечательно, что стрелки направления уменьшения разнообразия гаплотипов в значительной мере перекрываются с маршрутами славянской экспансии.
  11. Результаты теста Мантеля говорят о том, что в выборке I2a1b2a1 не наблюдается статистически значимой корреляции между географической и генетической дистанцией.

Обсуждение выводов исследования

 

Как представляется автору этой статьи, вопрос происхождения и миграции носителей «динарской субклады» I2a1b2a1 невозможно изучить вне интердисциплинарной подхода, т.е подхода в котором тезисы результатов популяционно-генетического исследования будут рассмотрены в более широком ключе, c привлечением данных из исторических наук. В этой связи необходимо посмотреть на эту проблему глазами историка, тем более что время экспансии «динарцев» отлично накладывается на временной интервал экспансии славян на Балканы в «историческое время».

В силу фрагментарности обзора мы не будем касаться не менее важных вопросов о том, как и когда гаплогруппа I появилась в Европе, а также вопросов о времени и месте разделения базальной ветви I на гаплогруппы I1 и I2. В настоящее время мы не располагаем достаточным количеством фактов в пользу одной из многочисленных и равновероятных версий сценария, и поэтому просто обойдем эти вопросы стороны в надежде на предстоящее изучение древней ДНК жителей Европы среднего палеолита и мезолита. По имеющимся в настоящее время данным палеогенетики, гаплгогруппа I (и одна из ее двух основных ветвей — I2a) была широко распространена в западной и северной Европе уже вскоре после окончания последнего ледникового максимума (последняя ледниковая эпоха закончилась между 15 000 и 10 000 годами до н. э., а древнейшие образцы палео-ДНК с гаплогруппой I2a1b датируются 6 тыс. до н.э). Около 14 000 лет до настоящего времени из гаплогруппы I2a выделились I2a1a-M26/PF4056 (эта группа мигрировала к югу от швейцарских Альп в сторону Пиренейского полуострова, и I2a1b-M423, которая мигироровала на север вслед за отступающим ледником и тундровой фауной. Примерно 10 000 лет назад, где-то на территории современной Германии из I2a1b выделились линия  I2a1b1 (кластер «Isles», мигрировавший на Британские острова) и линия I2a1b2 (динарский кластер и кластер Disles). Можно предполагать, что в последующее время I2a1b2 была связана со свидерской культурой — археологической культуры финального палеолита (9 – 8 тыс. до н.э.) на территории Центральной и Восточной Европы, которая была представлена стоянками тундровых охотников на северного оленя, которые использовали стрелы с кремневыми наконечниками. Гипотетическое развитие дальнейшей истории общности носителей I2a1b2 — непосредственных предков I2a1b2a1 – можно выстроить в виде цепочки приемственности культур вплоть до культур участвовавших в этногенезе славян, однако из-за недостаточных сведений о мужском палеогенофонде представителей этих культур данная реконструкция не может быть использована как основание для дальнейших заключений.

К сожалению, cпециальных популяционно-генетических исследований гаплогруппе I крайне мало. Достаточно сказать, что последние специальные исследования по этой гаплогруппе были опубликованы почти 10 лет назад в 2004,2006, 2007 годах – (Rootsi et al. 2004; Roewer et al. 2005; Underhill et al. 2007). Остальные работы, особенно касающиеся Y-хромосомного разнообразия популяций на территории Балкан и бывшей Югославии, преимущественно повторяют выводы озвученные в вышеупомянутых трех работах, ничего не добавляя от себя (Marjanović et al.2005; Peričić et al. 2005; Rebała et al. 2007). Более новые работы со специфическим фокусом на гаплогруппе I1 (Shtrunov 2010) и (De Beule 2010) были незаслуженно обойдены вниманием научного сообщества, так как были написаны «любителями» и опубликованы в неакадемических изданиях.  Поэтому именно работы эстонской исследовательницы-популяционного генетика Роотси задали целый ряд основных положений-гипотез по вопросу происхождения гаплогруппы I, закрепившихся позднее в научных и научно-популярных (Википедия) источниках. Со временем данное положение стало общим местом статей популяционных генетиков при описании особенностей генофонда различных популяций. Если на заре популяционной генетики, выводы делались лишь на основании распределения частот гаплогрупп (большой группы схожих гаплотипов) Y хромосом, то с накоплением фактического материала и совершенствованием методов исследования  появилась возможность кроме частоты учитывать  молекулярное разнообразие и генетические дистанции. Уже без этих исследований выводы на основании только частот являются неполными, а часто и совершенно неверными.

В настоящее время, исходя из описаного выше опыта полисистемного анализа и синтеза молекулярно-генетических (филогенетических и статистических), исторических, археологических данных, а также данных археогенетики (древняя ДНК), можно предположить динарская субклада I2a1b2a1 в массовом количестве появились на Балканах не ранее 2-3 в.н.э и не позднее 6-7 в.н.э., что точно соответствует времени великого переселения народов. В числе значительных миграций населения на Балканы в этом период времени можно назвать миграцию готов, гепидов с севера, а также более позднюю по времени экспансии славян (вернее, генофонда общности, которая говорила на славянском или протославянском языках), которые и принесли с собой этот субклад на Балканы.  Кроме этих двух вариантов, можно рассмотреть и третий вариант, согласно которому субклад I2a1b2a1 уже присутствовал на генофонде балканских популяций на момент начала переселения народов (эта гипотеза предполагает что первоначально популяционная общность носителей  I2a1b2a1 была так или иначе  с дако-фракийским кругом археологических культур). В статье 2010 года (Носевич 2010), Вячеслав Носевич напрямую связывает носителей I2a1b2a1 с фракийским субстратом в формировании славян, отмечая что более высокая концентрация I2а1b2a1 на Полесье по сравнению с Западной Украиной и Словакией говорит в пользу это предположения. Традиционно считается, что вся гаплогруппа I2a cвязана с кругом культур балканского неолита и в том числе, c культурами близкими к трипольцам. Такой вариант возможен, однако окончательный вариант должны дать палеогенетического исследования останков представителей этих культур. Но, если гаплогруппа I2а и присутствовали у трипольцев, их вряд ли можно считать коренным элементом (ядро которого составляли выходцы с Ближнего Востока), скорее всего они представляли остатки местного мезолитического элемента, инкорпорированного в состав этой культуры.

При взвешенном сопоставлении эмпирических статистических данных о характере распространения и разнообразия I2a1b2a1 с различными моделеми миграциий тезис о связи доисторических носителей I2a1b2a1 с фрако-дакийцами представляется несколько натянутым. Этот тезис завязан целико на интерполяции современных частот гаплогрупп на гаплогруппные частоты в прошлом — однако манипуляции с современными частотами в целях реконструкции гипотетических частот распространения в генофонде древних народов всегда вызывают закономерные вопросы. По-крайней мере, подобные эксперименты возможны только исходя из генетических данных полученных в результате анализа останков из захоронений соотвествующих культур или народностей. В противном случае – расчеты могут оказаться совершено произвольны, и им нельзя будет доверять. Однако даже если мы будем из реконструкции предковых частот, то увидем, что I2a1b2a1 вряд ли могла присутствовать в столь значительных количествах у фракийцев, так как и у современных «потомков фракийцев и даков» (болгаров и румын) как частоты распространения, так и уровень дисперсии гаплотипов I2a1b значительно ниже чем у тех же словаков и западных украинцев.  Далее, «балкано-иллирийско-фракийская гипотеза» совершенно не объясняет высокие частоты т.н. «динарской субклады» I2a1b2a1 в Полесье. Не объясняет эта теории и того, что филогенетически I2a1b2a1  не образует удалённых кластеров, что невозможно объяснить допуская автохтонность носителей этой гаплогруппы на Балканах. Ведь за тысячи лет эта линия должна была разветвиться. Но сегодняшние её носители исключительно близки друг к другу и подавляющее их число — славяне.

Тезис о связи носителей I2a1b2a1 c германских субстратом в этногенезе славян также вызывает определенные вопросы. Можно предположить, что присутствие носителей I2a1b2a1 вполне может быть связано как с особенностью ранних (прото-)славянских популяций, так и с непосредственной инвазией северных германцев (например, готов). По крайней мере сейчас уже доказно, что более 8 тысяч лет назад параллельная ветвь носителей I2a1b-M423 проживали в том числе на юге Скандинавии, а зафиксированные в историческое время (эру великого переселения народов) места проживания готов в Восточной Европы (королевство остготов на Балканах и «черняховская» культура в западной Украине) По крайней мере, среди современных этнических скандинавских германцев гаплогруппа I2a1b2a1 не встречается, также как и в Испании, Италии (где  находились королевства готов в раннем средневековье), зато с заметной частотой встречается по всему славянскому ареалу :очень высокие концентрации действительно отмечаются на Балканах, но и у западных славян присутствие его значительно, 8-10% у чехов и поляков, до 20% у словаков).

Довольно высокие частоты распространения и высокий уровень внутригаплогруппного разнообразия, специфическая топология филогенетических деревьев гаплогруппы I2a1b2a1, а также факт нахождения «реликтовых вариантов» гаплогруппы I2a1b2a1 в Польше и Западной Украины  свидетельствует о формировании предкового пула этой субклады в северо-восточной Европе в 1 тыс. до нашей эры и экспансии в 1 тыс. нашей эры. В свете представленных в виде тезисов основных выводо исследованиях, наиболее предпочтителен вариант распространения гаплогруппы I2a1b2a1 на Балканах и всей восточной Европе во время славянской экспансии. Новизна предложенного нами варианта заключается в том, что  коренным образом противоречит принятому в оффициальной популяционной генетике представлению о Балканах, как «прародине» популяции I2a2b (см. раздел (Гаплогруппа I2a общие сведения и обзор публикаций)). Обычно в качестве одного из главных аргументов против версии распространения гаплогруппы I2a1b2a1 вместе с миграциями славянской выдвигается тезис о  однородности состава гаплогрупп у  ранних славян (предполагается, что они принадлежали к различными субкладам R1a1-Z283, (Rebala et al. 2007) особенно R1a1-M458 (Underhill et al. 2009), современный эпицентр распространения которой приходится на ареал пшеворской культуры). Данный аргумент не может быть воспринят так как последние исследования генофонда неолитических культур Европы показали, что уже генофонд этих ранних культур был далеко неоднородны, а в бронзовом веке и позднее степень смешения должна была только увеличится хотя бы в сиду большей мобильности населения. Более вероятным представляется сценарий, в котором уже ранняя славянская общность (которая определяется лингвистическими и археологическими, а не генетическом признаками) была достаточно гетерогенна и включала в себя, наряду с типичными «славянскими» сублкадами R1a1-Z283 (прежде всего дочерних субклад R1a1-M458 и R1a1-Z280), и субклады других гаплогрупп, в частности и I2a1b2a1. В этом случае  ранние славяне образовались в результате «наслоения» R1a-Z280 и/или R1a-M458 на I2a1b2a1. Эта (одна из возможных) модель этногенеза соответствует одной из существующих моделей происхождения славянских языков: неиндоевропейский субстрат оторвал балтов от славян и дал отчёт их самостоятельному существованию в истории как языковой группе, так и целому археологических ряду культур связанных с ними.

 


Первая рецензия В.Л.Носевича

К вопросу о предыстории славян

 

 

 

 

Еще раз о эволюции «динарской клады» гаплогруппы I2a1b и славянизации Балкан

Как известно моим постоянным читателям, я уже на протяжении почти 5 лет пытаюсь опровергнуть устоявшееся в популяционное генетике представление о том, что частотный пик распространения на Балканах гаплотипов так называемой динарской клады гаплогруппы I2a1b можно объяснить  непрерывной генетической приемственностью населения этого региона со времен палеолита. Даже само кодовое название «ветви» — «динарская» — носит условный характер. Вопреки популярной точки зрения,  на самом деле название восходит не к трудам Нордтведту (который его просто популяризировал), а к известной cтарой статье Barac et al.2003. Авторы описали Dinaric Modal Haplotype в его 5-маркерной форме «(DMH: 16–24–11–11–13) by DYS19–390–391–392–393, respectively». Позднее он был расширен до 17, 37,67 и 111 маркеров и обнаружен не только на Балканах, но и по всей Восточной Европе

К сожалению, большинство из моих убедительных аргументов остаются без должного внимания со стороны профильных популяционных генетиков.  На дворе уже 2014 год и что мы видим в свежих работах по популяционной генетике населения Восточной Европы? Собственно говоря, ничего нового. В статье В.С. Панкратова, О.Г. Давыденко «Структура генофондов населения двух регионов Белорусского Полесья» 2013, стр.46 читаем: «Различие частот гаплогруппы I2a2 между популяциями «Вичина» и Западного Полесья не является достоверным, соответственно, она могла попасть в «Вичин» из других регионов Западного Полесья, при этом не происходило событий, приводящих к сильному генетическому дрейфу. Напомним, что для данной гаплогруппы характерна более высокая частота в Полесье, чем в других частях Беларуси, что предположительно является результатом мигра- ции ее носителей из потенциального балканского ледникового рефугиума на территорию юга современной Беларуси. Таким образом, заселение «Вичина» носителями Y-хромосомы I2a2 произошло либо так же, как и заселение других регионов Западного Полесья (в результате миграции с Балкан), либо позже в результате миграции с прилежащих территорий).»  Что характерно — здесь эта гаплогруппа (а речь идет конечно же о печально известной динарской субкладе этой гаплогруппы) названа I2a2 по старой терминологии, а в таблице частот уже по более новой I2a1. Это обстоятельство указывает на то, что статья писалась (или дописывалась) в разные времена. Похоже это общее место всех работ в области популяционой генетики,  так или иначе затрагивающих проблематику балканского палеолитического рефугиума, уже никогда не устранить. И это несмотря на то, что открытие новых снипов и соответствующие изменения в филогенетическом дереве гаплогруппы I2a-P37.2  дают надежные доказательства верности моей первоначальной гипотезы. Вот так, например, выглядит разметка филогенетического древа I2a-P37.2 по состоянию на начало 2014 года.

Еще более глубокая структура субкладов I2a1b приведена в черновой рабочей схеме компании Yfull.

I2_M423_20140203

Несмотря на интуитивно понятную структуру организации информации в филогенетических деревьях (кладограммах), они не могут быть использованы в качестве окончательного аргумента при строгом логическом доказательстве какой бы то ни было гипотезы.
Так уж повелось, что при аргументировании своей позиции в попгенетике надо оперировать языком сухой статистики и математики. Выводы и модели могут быть верными, частично неверными или даже полностью неправильными. Но если они выражены в формально-математическом виде, они имеют полное легитимное право на принятие к обсуждению в ситуации рациональной и конструктивной дискуссии. Поэтому статья (с рабочим названием » ‘Динарская субклада’ I2a1b: маркер славянской экспансии на Балканы?»)  должна  включать в себя, к примеру,  графическое отображение графа филогенетической сети гаплотипов динарской клады, но традиционными методами эту задачу решить крайне сложно. Я наткнулся на интересную альтернативу для тех случаев, когда вместо филогенетической схемы гаплотипов нужно строить гаплотипные сети (haplotype networks), но из-за больших объемов данных построить их в стандартной попгенетической программе Fluxus-Network в течении разумного времени не получается.

Вместо классического, но медленного FN можно использовать бесплатное программное обеспечение Arlequin > HapStar > Graphviz/Gephi/R-Graphviz. Первая попытка визуализации в Gephi:

1526576_10202941657572217_2008628619_n
Поскольку с эстетитческой точки зрения эта попытка была не очень удачной, то я решил повторить эксперимент с визуализацией MST динарского кластера гаплогруппы I2a — на этот раз в цветном исполнении.  В самом центре белоруские гаплотипы, окруженные украинскими гаплотипами. Ветвь Вереничей (Belarus19) в кластере гаплогруппы I2a: Belarus32->Bulgaria68->Poland365->Belarus 19, и очень близко к центру.

1048962_10202961233661607_1211213762_oЗатем я  частично переработал граф сети гаплотипов динарского кластера гаплогруппы I2a1b. Алгоритм Force Atlas 2, хотя и позволяет разглядеть мелкие детали размещения отдельных гаплотипов, — в конечном итоге дает уникальную структуру графа, и эта структура существенным образом отличается от привычной структуры сети гаплотипов в работах попгенетиков. Исходя из этого, я решил ограничиться применением Force Atlas, а затем сгруппировал перекрывающиеся узлы графа в одну группу. Благодаря этому незамысловатому трюку, на выходе я получил гораздо более приемлимый с точки зрения академического стандарта графический вариант. Это, конечно же, не штейнеровское MP-дерево гаплотипов в Fluxus Network, однако и оно дает неплохое представление о характере развития динарского кластера.

Задача: как вы думаете, где находится визуальный центр равновесия графа?

Подсказка: Иногда люди ошибочно полагают, что предковые гаплотипы — это гаплотипы в самом большом кластере. Например, в данном случае — в оранжевом метаузле. Однако это предположение работает только в том случае, если в популяции не было быстрого роста и экспансии. В противном случае может статься так, что носитель маргинального гаплотипа способен, в силу случайных и неслучайных причин вызвать эффект основателя, породив множество потомков. В таких случаях мы можем наблюдать картину характерную для данного графа. И это далеко не единственный случай

1555325_10202973979300240_689832560_n

Еще немного покопался в графе (MST) гаплотипов динарского кластера I2a1b. На полпути зум в Gephi сломался, и процесс «причесывания» начального графа пришлось заканчивать уже в Adobe Illustrator и Adobe Photoshop. Но надеюсь, что теперь-то граф представлен в удобоваримом формате:


1536644_10202976299438242_1824667689_nВ процессе подготовки материала к своей статье о динарской субкладе I2a1b, я сделал график многомерного шкалирования по вычисленной в Арлекине матрице Fst-расстояний между 42 популяционными группировками гаплотипов динарской субклады.

1656113_10203040706128369_1678657762_n

Примечательно что скорректированный коэффициент детерминации R2 в данном случае негативный (что редкость), впрочем этого можно было ожидать так как сам коэффициент детерминации R2 достаточно близок к нулю (R2=0.015), то есть данная модель — разбивка носителей по этногеографическим группам — объясняет 1.5% всей статистической вариативности всей выборки. Кроме того, p-value=1, а это означает, что мы должны принять нулевую гипотезу (отсутствие корреляции). Это близко к полученным значениям AMOVA, согласно которым на генетическое разнообразие между этническими группами приходится только 1% всего генетической разнообразия выборки. 98% приходится на разнообразие между отдельными гаплотипами. Говоря простыми словами, в выборке динариков-I2a1b отсутствует значимая кластеризация по этническому признаку.

Более надежное доказательство вышеозвученного вывода было получено при выполнения теста Мантеля, в котором определялась наличие и надежность корреляции между матрицнй географических расстояний и матрицы попарных Fst между группами популяций. Значения p-value c двухсторонним критерием (two-tailed p value) значительно больше 0.05, что означает  только одного — значимой корреляции не наблюдается, несмотря даже на приличный размер выборки — 774 гаплотипа.

Разумеется, если бы моя статья сопровождалось только схемами и результатами вычислений, то тогда это было бы статья стандартного формата популяционной генетики. Однако, как мне представляется, гораздо интереснее рассмотреть вопрос эволюции и миграции носителей «динарской клады» I2a1b в интердисциплинарном ключе. В этой связи необходимо посмотреть на эту проблему глазами историка, тем более что время экспансии  «динарцев» отлично накладывается на временной интервал экспансии славян на Балканы.

Как я уже отмечал ранее, в журнале Studia Slavica et Balcanica Petropolitana cодержится немало интересных статьей, в которых освещается современное состояние вопроса о так называемой славянизации Балкан во второй половине первого тысячелетия нашей эры.
По непонятной причине, в этом вопросе задают тон те слависты-историки, которые занимаются изучением проблем хорватского этногенеза. По этой причине в журнале представлены сразу 4 альтернативные взгляда на происхождение хорватов, которые представляют собой не столько развитие традиционных конкурирующих теорий автохтонности хорватов (Иван Лучич, Фердо Шишич, Франьо Рачки и пр.) versus миграционной модели (кульминировавшей в дискурссе иллиризма в середине 19 века), сколько новый тренд постмодернистского переосмысления многих традиционных понятий обеих теорий и исторических источников в виде идеологических конструктов и дискурссивных формантов.

  1. Алимов Д. Е. В поисках «племени»: этногенетическая модель «Венской школы» и проблема появления хорватской этничности.
    Алимов отвергает примордиалистский подход к хорватской этничности, в которой далмацкие хорваты виделись осколками первичной хорватской этничности. Термин «хорват» гентилистский, а не этнический: в Аварском каганате этот термин обозначал одну из (много) этно-социальных групп gentes разного происхождения, объединенных не родовыми связями, а принадлежностью к общей воинской группе.Может ли хорватский гентилизм служить свидетельством неславянского характера хорватской этничности или его следует понимать как закономерный социальный продукт миграции со свойственным этому процессу выдвижением на передний
    план — в том числе и в процессах групповой идентификации — воинского дружинного элемента? В свое время Х. Л овмяньский, размышляя над путями формирования так называемых «больших племен» в славянском мире, предположил, что в условиях славянских миграций и колонизации новых пространств закрепить название старого «большого племени» на новом месте, образовав новое «большое племя» со старым названием, могли только хорошо организованные воинские группы [34, Подобным же образом рассуждает и М. Анчич, полагая, что под хорватами и сербами Константина Багрянородного следует разуметь правящие слои соответствующих политий, состоявшие из знатных родов. Во время распада Аварского каганата разные группы хорватов укрылись кто в горах Карпат, кто в Судетах, кто в Восточных Альпах, кто на Динарском нагорье. Поскольку обозначение хорват обозначал лишь принадлежность к определенной социальной группе аварского каганата, то между карпатскими, силезскими, альпийскими и далматскиим славянами нет родства. То есть хорватская идентичность есть продукт трансформации соционима в этноним.
  2. Известная работа Флорина Курты «Создание Славян».
    Если выразить смысл этой работы одним предложением, то автор отрицает самое существование славян до их встречи с византийцев. Само слово славяне и понятие славянства есть продукт византийского имперского дискурса, и первоначально включал в себя не только славян в собственном смысле этого слова, но и германцев, иранцев, фракийцев и так далее.Заключительный раздел труда Ф. Курты суммирует выводы исследования. Особенно важным представляется вывод о том, что раннеславянская этничность не основывалась на языковой общности. (При этом, автор совершенно справедливо замечает, что сам этноним словене появляется гораздо позднее и лишь на периферии славянского ареала.) «Создание славян, — пишет Ф. Курта, — явилось не столько результатом этногенеза, сколько итогом инвенции, воображения и систематизации византийских авторов. … Это была… Самобытность сформированная в тени Юстиниановых крепостей… Имеются существенные основания утверждать, что эта самобытность была значительно более сложной, чем дублет «cклавены — анты» навязанный византийской историографией. … Первое отчетливое утверждение «мы — славяне» происходит из Повести временных лет XII в. Этой летописью завершается процесс создания славян…» (с. 349-350).
  3. Мягкий вариант синтеза «готской теории» и «автохтонтизма» в статьях Мужича. На основании источников, содержащих информацию о переселениях на современную хорватскую территорию, автор приходит к выводу, что именем Sclavi(ni) в принципе назывались полиэтничные переселенцы на Балканах. Суммируя результаты антропологических и генетических исследований, автор заключает, что современные хорваты по преимуществу являются потомками автохтонного населения Балкан. Автор доказывает, что хорватский народ возник как новая этническая общность на Балканах этническим соединением и социальным взаимодействием пришедших с севера воинских контингентов «гото-склавинов» и проживавших здесь различных популяций более многочисленных автохтонов.
  4. Постмодерниcтский-постколониальный этнодискурс австралийского исследователя Дэниела Дзино — книга «Becoming Slav, becoming Croat: identity transformations in post-Roman and early medieval Dalmatia» (Leiden; Boston: Brill, 2010). В книге на методологической платформе постмодернизма и конструктивистского подхода к этничности рассматриваются этносоциальные процессы, протекавшие на территории Далмации (Хорватия) в период поздней античности и раннего Средневековья.

<

p>Попробуем подвести промежуточные выводы этих моделей. Ведущие хорватские историки-слависты, а также некоторые российские «хорватоведы» рассматривают процесс генеза славян в виде некоего подобия черного ящика. Напомню: черный ящик — это система, в которой внешнему наблюдению доступны лишь входные и выходные величины, а ее внутреннее устройство и протекающие в ней процессы не известны. В этом смысле, Аварский кагант действительно хорошо подходит на роль «черного ящика». Большинство исторических сведений об Аварском каганате касается лишь его внешней политики (прежде всего, военных действий). Что касается внутреннего устройства этой кочевой империи, то оно по-прежнему остается terra incognita для историков в силу скудности, фрагментарности и противоречивости имеющихся источников о государственно-административном устройстве этого государства. Поэтому приходится либо интерпролировать имеющиеся сведения о социально-политической структуре других кочевых империй (тюрков, гуннов, монголов), либо просто фантазировать.
Согласно мнению Курты и его сторонников, процесс этногенеза славян протекал следующим образом. Где-то в середине 6 века нашей эры некие ещенеславянские сообщества людей попадают в «черный ящик» Аварского каганата. Спустя несколько поколений «инкубации» славянства из черного ящика Аварского каганата выходит некая, как говорили марксисты, «новая сообщность людей». Эта «новая сообщность», nihilnominus Sclavi («ничтожные именем склавины», как выразился один франкский летописец) внезапно (!) появляется в поле зрения византийцев, «выходя из-за тени построенных Юстинианом на Дунае крепостей» (Ф.Курта). Именно им византийцы и дают имя «славян», имя которых потомки разнесут по всей восточной Европе.

Я конечно же понимаю, что перед хорватскими историками перед самым кануном вступления Хорватии в ЕС, был поставлен политический заказ воскресить старые идеи неславянского происхождения хорватов времен младонационалистического иллирического романтизма в новом, постмодернистском исполнении. Перефразируя вышеупомянутого Д.Дзино, суть этого идеологического заказа можно выразить следующим девизом: «Перестанем быть славянами -станем европейцами!». Но зачем так ненавидеть свои корни, cвое происхождение и свои истоки — это мне непонятно.

Этот конструктивистский подход к вопросу этнической идентичности, согласно которому Аварский каганат выступил в роле катализатора этноформирующей реакции, в результате которой миру была явлена славянская идентичность, мне представляется сомнительным. Здесь уместно вспомнить этническую ситуацию в более поздних империях, например в империи Габсбургов, СССР, ту же Югославию времен Броза Тита. Пример СССР особенно поучителен, особенно если мы учтем тот факт, что СССР существовал примерно столько же лет, сколько и власть Аварского каганата на территории современной Хорватии (не больше 70-80 лет). Хорошо известно, что одной из основной задач национальной политики CCCР было создание новой общности людей — «homines sovetici» («советские люди»). Однако как показала история, в процессе крушения империи (также как и в Югославии) этноцентробежные силы не только не исчезли, но скорее даже усилились. Нет никакого основания полагать, что во времена падения Аварского каганата все могло выглядеть иначе.

При сопоставлени этих моделей мы неизбежно сталкиваемся с закономерным вопросом: а что генетика или ДНК-генеалогия могут прояснить в хитросплетениях исторических фактов?  К счастью, многие историки начинают всерьез интересоваться методами популяционной генетики и ДНК-генетика применительно к вопросам этногенеза и миграции отдельных исторических этносообществ. К несчастью, нейтральные выводы генетики зачастую искажаются или подгоняются историками под те априорные модели, которых эти историки придерживаются. Вот, в свете этой переводной статьи хорвата Ивана Мужича, становится ясно, каким образом происходят злостные манипуляции с интерпретацией данных популяционно-генетического анализа. Этот автор придерживается комбинированной модели происхождения хорват (смешивание автохтонов и готов), поэтому он интерпретирует выкладки популяционной генетики по структуре Y-хромосомного генофонда хорват исключительно в свете предпосылки антропологической и генетической приемственности населения Балкан со времен палеолита.

1743460_10203015436016632_1110433635_n
Такие манипуляции нуждаются в опровержении — и именно эту задачу я считаю главной в своем исследовании.

Происхождение гаплогруппы I2a и путь миграции ее носителей в Европе (часть 2)

Еще в 2010 году я пробывал спроецировать итоги дискуссии о «начале гаплогруппы I» (Молген), а  также возраста гаплогрупп I1,I2a1,I2a2,I2b1,I2b2* (рассчитаные Кеном Нордтведтом)  на археологическую карту Европы эпипалеолита и раннего мезолита.
*——
С 2010 года ISOGG-номенклатура субклад гаплогруппы I поменялась. Я не стал вносить изменения в ранее сделанную карту, однако в целях синхронизации предыдущих своих наработок с современной номенклатурой нужно отметить что I1,I2a1,I2a2,I2b1,I2b2 в современной номенклатуре называются I1,I2a1a,I2a1b,I2a2a,I2a2b.

Карта строилась из предположения о моногаплогрупности Европы в палеолите. Это минимальное допущение — но возможно, что оно методологически
неверно. Во-первых, теоретически в Европе периода палеолита могло быть больше гаплогрупп, а в пределах I -больше «гипотетических субкладов»**.

**————

Данные статьи Lazaridis et al. 2013.  содержат убедительную аргменты в пользу существования в структуре I потерянных I* cубклад. В частности два образца с мезолитической стоянки Motala (Motala 2 и Motala 9) были определены как I*.
Если первое кажется маловероятным (т.к. если гаплогруппа I осталась в Европе, почему не остались другие), то второе заключение о большем разнообразии гаплогруппных субкладов кажется логичным.Тем не менее, ответ можно узнать только после анализа древних Y-ДНК.

Вот что примерно получилось.

Главнывывод, наверное, следущий -наибольшое разнообразие субкладов было в «Атлантидемезолитической Европы» — Доггерланде, на котором, видимо, находился эпицентр круга целого ряда мезолитических культур Маглемозе. Почему именно там? Около 8000 г. до н. э. северное побережье массива суши, Доггерленд, представляло собой береговую линию с лагунами, болотами, приливными берегами и пляжами. Возможно, в эпоху мезолита этатерритория была богатейшей в Европе с точки зрения охоты, добычи птицы и рыболовства ( Vincent Gaffney, «Global Warming and the Lost European Country»;
Patterson, W, «Coastal Catastrophe» (paleoclimate research document), University of Saskatchewan).

Следовательно, принимая во внимание богатство экологических ресурсов, охотники и рыболовы позднего палеолита и мезолита должны были стекаться туда в большем количестве. Доггерланд погрузился под воду в результате гигантского оползня Стурегга (когда от Норвегии откололся кусок побережья объемом 3 000 куб.кум) или вызванного оползнем цунами около 8200 лет назад (6200 г. до н. э.). Это отрезало мезолитические культуры Британских островов и часть популяции субклада I2a2a от континента. Что интересно — по расчетам Нордведта точка коалисценции (схождения генетических линий субклад
I2a2a-Isles***) составляет как раз примерно 8 000 лет до нашего времени.

***___________

В номенклатуре ISOGG I2a1b2. Isles — условное название кластера, представленного главным образом на Британских островах.

Представляю читателю результаты проекции гипотетических ареалов субклад I на карту Европы эпохи финального палеолита и мезолита.

Археологические культуры обозначены следующим образом:

1 — маглемозе (по Г. Кларку); 2 -аренсбургская; 3 — свидерская; 4 — тьонгер; 5 — рёссен; 6 — федермессер; 7 -ларнийская; 8 — обанская; 9 — крезвельская; 10 — фосна; 11 — комса; 12 -суомусярве; 13 — аскола; 14 — кунда; 15 — днепро-деснинская; 16 — верхнедонская;17 — волго-окская; 18 — днепро-донецкая; 19 — астурийская; 20 — раковинных куч устья р. Тахо; 21 — тарденуазская; 22 — советеррская; 23 — микролитические памятники Прованса; 24 — азильская; 25 — эпиграветт; 26 — альпийская; 27 -чешско-тюрингский мезолит; 28 — типичная капсийская; 29 — капсийская и иберо-мавританская; 30 — мезолитические памятники испанского Леванта

Источник (исходник) карты: Археология Западной Европы. Каменный век., Монгайт А.Л.

Субклады I и Европа в эпоху финального палеолита и мезолита
Европа в эпоху финального палеолита и мезолита

Происхождение гаплогруппы I2a и путь миграции ее носителей в Европе (часть 1)

Происхождение Y-хромосомной гаплогруппы I2a, ее эволюция и пути миграции популяций носителей этой гаплогруппы являются предметом моего специального изучения уже на протяжении 5 лет, начиная с того времени когда я увлекся активным изучением популяционной генетики человека.

Причина моего интереса к этой гаплогруппе  довольно проста — генетический анализ моей Y-хромосомы (Y-STR + Y-снипы) показал, что с точки зрения филогенетической классификации  она принадлежит к одной из ветвей этой гаплогруппы, и в силу этого банального биологического факта по своей прямой мужской линии я происхожу от древних представителей этой гаплогруппы.  Менее важной причиной моего вовлечения в исследование этой гаплогруппы служит досадная малоизученность как I2, так и всей гаплогруппы I. Достаточно сказать, что последние специальные исследования по этой гаплогруппе были опубликованы  в 2004,2006, 2007 годах — Rootsi, Siiri et al. (2004), Rootsi, S. (2006), Peter Underhill et al (2007)). Остальные работы, особенно касающиеся Y-хромосомного разнообразия популяций на территории Балкан и бывшей Югославии, преимущественно повторяют выводы озвученные в вышеупомянутых трех работах, ничего не добавляя от себя (Marjanović, Damir; et al.2005, Peričić, Marijana et al.2005; Rebała K., et al. (2007 ).  Поэтому именно работы эстонской исследовательницы-попгенетика Роотси определили целый ряд основных положений-гипотез по вопросу происхождения гаплогруппы I, закрепившихся позднее в научных и научно-популярных (Википедия) источниках.  К сожалению, значительная часть из этих гипотез оказалась ложными.

Ниже мы приведем содержащиеся в Википедии-статье о I2  некоторые положения общепринятые в официальной консервативной популяционной генетики, причем, судя по статье, некоторые из приведенных положений были позднее переосмыслены и развиты в окологенетических кругах любителей.

Наивысшей концентрации гаплогруппа I2 достигает у жителей БоснииСербии и Хорватии — ныне эти народы говорят на славянских языках, тем не менее концентрация «индоевропейской» гаплогруппы R1a у них минимальна, что позволяет видеть в них прямых потомков дославянского субстрата, каковыми на Балканах были иллирийцы и фракийцы, а также их предки — носители культуры Балканского неолита (в том числе и Трипольской культуры[2]). Последний тезис подтверждается тем фактом, что как балканский неолит является развитием ближневосточного, так и балканская гаплогруппа I родственна ближневосточной гаплогруппе J, хотя данные об их расхождении разнятся.Также широкое распространение данная гаплогруппа имела в центральной Европе эпохи Бронзового века (Культура полей погребальных урнПещера Лихтенштейн), что, однако, несколько пошатнуло традиционные представления о том, что в то время Европу населяли кельты — носители либо «кельтской» гаплогруппы R1b, либо «арийской» R1a. Родство балканской гаплогруппы I2 и скандинавской гаплогруппы I1, при разорванности их популяций позволяет сделать вывод о том, что они были рассечены вторжением народов «кельтской» (а точнее иберийской) гаплогрупп.

Оставляя в стороне вопрос о связи между гаплогруппой  и языком, гаплогруппой и археологической культурой (эти связи заслуживают отдельного исследования),  мы увидим что главным аргументом Роотси в пользу балканской прародины I является значительное присутствие этой гаплогруппы в районе Динарских Альп/Балкан.  Самое простое и дешевое с точки зрения парсимонии объяснение такой численности состоит в допущении преемственности части генофонда населения Балкан со времен последнего ледникового максимума в Европе (20 тыс. лет назад) т.е со времен балканского ледникового убежища. Как известно, географическое происхождение гаплогрупп Y-хромосомы можно установить по следующему эмпирическому критерию: в том месте или популяции, где возникла данная гаплогруппа, ее частота и STR-дисперсия (или возраст STR-изменчивости) максимальны по сравнению с другими популяциями (Sengupta et al., 2006). Эта простая, и казалось бы, логичная схема при более детальном рассмотрении на примере гаплогруппы I не выдерживает критики в свете новых данных. Стоит, однако, помнить что установка в статьях Роотси была задана в те времена, когда ученные-генетики имели только общее представление о структуре гаплогруппы I. Последующие исследования профильных ученных-популяционных генетиков вкупе с самоотверженным любительским изучением гаплогруппы I в коммерческих проектах FTDNA (Family Tree DNA — Haplogroup I Y-DNA Project, FTDNA I1 yDNA HaplogroupFTDNA I2*New ISOGG I2bFTDNA I2a Y-HaplogroupFTDNA I-M223 Y-HaplogroupFTDNA I2a2b-L38) и особо значимых  усилий отдельных исследователей-любителей в так называемой ДНК-генеалогии (Kenneth Nordtvedt, Bernie Cullen, Steve Trangsrud, William Hartley, Yme Drost, Aaron J. Hill, Peter Hrechdakian, Hovann Simonian, Bob May, Vadim Verenich, Bill Morrow, Lawrence Mayka, Vladimir Semargl etc.) позволили лучше и глубже понять филогенетические отношения и структуры ветвей-субклад гаплогруппы, а также дать хронологические и географическую привязку по отдельным ветвям-субкладам гаплогруппы. Данное исследование ограничится лишь кратким образом современного состояния наших знаний о происхождении и ‘эволюции’ гаплогруппы I2a.

Происхождение и пути миграции гаплогруппы I2a.

В силу фрагментарности обзора мы не будем касаться не менее важных вопросов о том, как и когда гаплогруппа I появилась в Европе, а также вопросов о времени и месте разделения базальной ветви I на гаплогруппы I1 и I2. В настоящее время мы не располагаем достаточным количеством фактов в пользу одной из многочисленных и равновероятных версий сценария, и поэтому просто обойдем эти вопросы стороны в надежде на предстоящее изучение ДНК жителей Европы среднего палеолита.

Вместо этого мы начнем описание с представления филогенетического (‘родословного’) древа гаплогруппы I2a, оставляя в стороне остальные ветви этой группы.  Вместо стандратных простых схем гаплогруппы I мы предлагаем каноническую версию древа в обработке Нордтведта (версия 2013 года). Основным ее преимуществом является наглядное изображение взаимного топологического расположение ветвей субкладов и внутрикладовых кластеров гаплотипов. Кроме того, приведенная под деревом шкала построена с учетом интеркладового времени дивергенции (расхождения) ветвей,  вычисленных по методу кросс-дисперсии Кеном Нордтведтом. Наконец, графическое представление филогенетического древа дополняется  конъюнктурной реконструкцией движения носителей гаплогруппы I в хронотопе доисторической Европы.

Хронология разделения гаплогруппы I2a выглядит следующим образом (наша версия):

Около 14 000 -15 000 лет тому назад из I2a   L460/PF3647/S2381 выделилась ветвь I2a2-L35/PF3862/S150, L37/PF6900/S153, L181, M436/P214/PF3856/S33, P216/PF3855/S30, P217/PF3854/S23, P218/S32, которая практически сразу разделилась на I2a2a-L34/PF3857/S151, L36/S152, L59, L368, L622, M223, P219/PF3859/S24,
P220/S119, P221/PF3858/S120, P222/PF3861/U250/S118, P223/PF3860/S117,  Z77
(ок.12 000 — 8 000 лет) и I2a2b  L38/S154, L39/S155, L40/S156, L65.1/S159.1, L272.3 (ок.12 000 -8 000 лет).

Параллельно с этим из гаплогруппы I2a выделилась подветвь I2a1-P37.2 (15 000-10 000 лет до настоящего времени). Примечательно, что в ходе расширенного анализа был выделена отдельная гаплогруппа I2a1-F (определяющий не включенными в ISOGG древо снипами L1294 L1297 L1298). По вычисленным Нордтведтом интеркладовым возрастам, этот кластер выделился позднее выделения I2a1a, но раньше выделения I2a1b (т.е посередине между двумя ветвями). По мнению Нордтведта, последний общий предок I2a1-F и I2a1a мог жить не позднее 20 000 лет до нашего времени.  Характерно, что представители I2a1*-F живут преимущественно на территории современной западной Франции. Кроме того, в Западной Европей живут и представители I2a1c.

Tree and Map for Hg I_Page_3

Из   I2a1-P37.2 в период между 20 000 и 15 000 годами до настоящего времени выделились I2a1a   L158/PF4073/S433, L159.1/S169.1, M26/PF4056((время жизни последнего общего предка — — 8 000- 6 000) и I2a1b-M423  L178/S328, M423 (время жизни последнего общего предка — не меньше 14 000 лет до настоящего времени), из I2a1b-M423  L178/S328 по интеркладовому счету около 13 500 лет выделились предковые линии I2a1b3 и I2a1b2 — (Dinaric+Disles) и Isles. Интересно, что время жизни последнего общего предка первых мы оцениваем примерно в 6600 лет до настоящего времени у Isles примерно 8000 лет.  

Tree and Map for Hg I_Page_2

Более поздние внутрикладовые разделения (на уровне 8 тыс.-6 тыс. лет до настоящего времени) неплохо коррелируют с реконструированным палеоклиматологами глобальным похолоданием ок. 6200 года до нашей эры, что привело к к отмеченному специалистами демографическому кризису неолита, когда количество народонаселения в Европе явно сократилось. На севере Европе в то же самое время (примерно в 6500 -6200 году д.н.э) произошло событие, географически разделившее (филогенетически разделившиеся уже ранее) популяции I2a1b2-Isles и I2a1b3, а также часть субклада I2a2-M284 – Isles от остальных субкладов I2a2.  Речь идет об   затоплении Доггерланда.  Определенные свидетельства, в том числе контуры современного морского дна, показывают, что в эпоху последнего оледенения водораздел между Северным морем и Ла-Маншем проходил от Восточной Англии на юго-восток до Хук-ван-Холланда, а не через Па-де-Кале, и что реки Темза, Маас, Шельда и Рейн, соединяясь, текли по течению Ла-Манша в виде широкой реки, которая в конце концов впадала в Атлантический океан.[ Около 8000 г. до н. э. северное побережье массива суши, Доггерленд, представляло собой береговую линию с лагунами, болотами, приливными берегами и пляжами. Возможно, в эпоху мезолита эта территория была богатейшей в Европе с точки зрения охоты, добычи птицы и рыболовства. 

Предполагается, что постепенный подъём уровня моря в результате таяния ледника (окончание последнего оледенения) привёл к затоплению Доггерленда Северным морем, что постепенно отрезало доисторическую Британию от европейского континента около 6500 г. до н. э. На месте будущей песчаной отмели, известной в настоящее время как Доггер-банка, согласно данной гипотезе, продолжал существовать остров по крайней мере до 5000 г. до н. э.

Согласно альтернативной, выдвинутой недавно гипотезе, большая часть данной земли была затоплена цунами около 8200 лет назад (6200 г. до н. э.), вызванным одним из крупнейших в истории оползней — дрейфом области подводного грунта от побережья Норвегии, известным какСтурегга. Согласно этой теории, цунами, вызванное оползнем, сыграло катастрофическую роль для мезолитического населения данной местности. В результате цунами, как представляется, Британия была окончательно отделена от континента, и, с культурной точки зрения,мезолит на ней пошёл своим путём. Одним из побочных результатов оползня стало глобальное похолодание 6200 лет до н. э. ввиду притока холодных вод от растаявших ледников.

Кем были доисторические представители гаплогруппы I2a? 

I. Где появились предки гаплогруппы I2a?

Как видно из приведенной выше цитаты из Википедии, в среде некоторых окологенетических кругов укрепилось неверное на наш взгляд мнение о том, что I2a cвязана с кругом культур балканского неолита и в том числе, c культурами близкими к трипольцам. Такой вариант возможен, однако окончательный вариант должны дать анализы Y-хромосом древнее ДНК останков представителей этих культур. Но, если I2 и присутствовали у трипольцев, их вряд ли можно считать коренным элементом (ядро которого составляли выходцы с Ближнего Востока), скорее всего они представляли остатки местного мезолитического элемента, инкорпорированного в состав этой культуры. Если говорить об исконной культуре древних I2a2, то это скорее всего были свидерцы, и их эпигоны.

В 2011 году мне  удалось немного подискутировать с администратором польского FTDNA проекта (Ларри Майкой) по вопросу о происхождении гаплогруппы I2a1b-M423 (и I2a в целом). До этого Майка относительно мало интересовался происхождением этой гаплогруппы (хотя, также как и я сам принадлежит к ней). Он предложил крайне интересную версию о месте происхождениия гаплогруппы I2a1. По его мнению, общий предок всех I2a1 (как I2a1*, I2a1a, I2a1b, I2a1c) c высокой степенью вероятности мог жить в районе Альпийских гор.

Он также согласился с предложенной мною маршрутом перехода клана I2a1 из Альпы в Карпаты. Правда, он не был согласен с моей датировкой. Я считаю, что предковая популяция I2a1 начала свое движение из Альп в сторону Карпат (из Западной Европы на север вслед за отступающим ледником), сразу после окончания ЛГМ (т.е. в мезолите где-то после 10 000 года до настоящего времени), Майка же считал что инициатором миграции могли быть кельты (то есть эта миграция произошла уже в бронзовом веке). Последний вариант хоть и интересный, но не объясняет времени и места разделения островного субклада I2a1b2 и динарского субклада I2a1b3, которая по молекулярной датировке не могла произойти позднее чем 10-8 тысяч лет тому назад.

С целью проверки версии Майки, я решил использовать алгоритм Мескита, который позволяет производить оценку наиболее вероятного (с точки зрения парсимонии) места «основания»  субклада, исходя из нынешней географической дистрибуции (географического распространения) двух смежных субкладов (в данном случае мы определяем место появления I2a1b1 на основании сопоставления географических координат таксонов-гаплотипов и топологии дерева I2a1b, которое укоренялось аутгрупп-корнем I2a1a).

Несмотря на то, что в настоящее время наибольшая плотность субклада I2a1a приходится на Сардинию, по хорошо аргументированному и эмпирически подтвержденному мнению Нордтведта,  самые старые  по возрасту кластеры I2a1a приходятся на северный регион Пиренейского полуострова, Альпы и частично южную Францию.
Поэтому в качестве координат аутгруппа-корня (гаплотипа I2a1a) были приняты координаты географического центра Пиренейских гор

C это целью я научилсь наносить в Меските филогенетические деревья прямиком на географическую проекцию Северной Европы, в 2D-3D проекции.

Для примера 2 карты, построенные мной в Меските-Картографере на основании структуры филогенетического дерева из 687 гаплотипов I2a1b-M423, выявленной путем нахождения 20 независимых совпадений 20 лучших (парсимонических) деревьев в TNT. Красным цветом обозначено реконструированное место происхождения — в данном случае это регион Альп.

I2a-Anc


Полученное дерево было выгружено из ТНТ в формате .tre и загружено в картографический пакет Мескита, где оно было спроецировано на карту Европы (проекция Меркатора). Нанесены номера ветвей (чем дальше от корня, тем болше номер корня -см.номера в овале) и парсимонически предпологаемые маршруты миграции представителей этой генетической ветви в Европе.

I2a-Tree

На примере второго «картографического» дерева I2a1b3-Din показана другая интересная функция картографического пакета Mesquite. 

А именно, наличие встроенного алгоритма для определения максимально вероятной (в терминах парсимонической комбинации географически близких ныне живущих таксонов   ) предковой локации субклада I2a2-Din.  На реконструированной карте Мескит довольно уверенно определяет место происхождения субклада где-то к северо-востоку от Карпат (обозначено большим красным кругом с красной точкой в центре).

I2a-Ances

Таким образом полученная нами траектория движения носителей I2a1b примерно соответствует предложенному нами маршруту. Когда именно произошла миграция, сказать трудно так как между временем появления I2a1b и I2a1b3 прошло несколько тысяч лет. Важно другое, мы показали что движение началось не с территории Балкан, а скорее французских или швейцарских альп на северо-восток.

Подтверждается ли эта версия материальными свидетельствами — древней ДНК и пр.?

Буквально до самого недавнего времени, предложенная нами гипотеза оставалась лишь статистической интерполяцией нуждающиеся в дополнительных подтверждениях.

Пару недель была, наконец-то опубликована работа  ‘профессиональных’ генетиков в которой показано как соотносятся большая часть из исследованных к настоящему времени ДНК древних образцов и ДНК современных популяций людей ( Ancient human genomes suggest three ancestral populations for present-day Europeans). Мое предположение о исходной точке происхождения и начала миграций I2a1b, которое озвучивал на протяжении последних лет, получило в работе материальное подтверждение.

Во-первых, по однородительским линиям древний ДНК-генофонд охотников-собирателей шведского и люксембургского мезолита оказалось представителями мтДНК-гаплогруппы U и Y-хромосомной гаплогруппы I, так что опять мы имеем дело с отсутствием R1a/R1b у ранних европейцев мезолита.

Во-вторых, данные исследования  показывают что люксембургский охотник-собиратель эпохи мезолита  (чьи останки были найдены во время исследования мезолитической стоянки Хеффинген-Лошбур, Люксембург, примерно 8000 лет до настоящего времени) приндлежал к гаплогруппе I2a1b* M423 + L178+. Согласно приведенным в таблице данным полиморфизмов Y-хромосомы, гаплогруппа это доисторического люксембургца является предковой по отношению как I2a1b2, так и I2a1b3

I2a1b L178 G A 15574052 12 +
I2a1b M423 G A 19096091 13 +
I2a1 P37.2 T C 14491684 7 +
I2a L460 A C 7879415 7 +
I2 M438 A G 16638804 14 +
I2 L68 C T 18700150 12 +
I P38 A C 14484379 2 +
I M170 A C 14847792 14 +
I M258 T C 15023364 5 +
I U179 G A 16354708 9 +
I L41 G A 19048602 3 + 

В-третьих,  данные исследования показывают также, что часть мезолитической популяции Мотала (Швеция, Эстгетерланд, примерно 8000 лет до настоящего времени) также принадлежала  I2a1b*(xI2a1b1, I2a1b3)

Зияющие высоты лже-академика Клесова. Анти-Клесов (часть 2)

Так получилось, что 100 запись в блоге посвящена личности известного шарлатана. Хотя в начале этой записи и не планировалось, я все же решил показать еще раз как работает мышление людей,  чья деятельность является ничем иным как умелой мимикрией или имитацией истинной науки.  На мой взгляд,  также не менее важно показать (на хорошо исследованном мною предмете исследования — происхождения I2a на Балканах), как подобные поверхностные рассуждения дилетантов вроде Клесова приводят к мифотворчеству.

Дед Толя Клесов — известный графоман. И, подобно другим горе-писателям графоманам, Клесов пытается количеством наукообразной писанины компенсировать качество своих заметок. Качество последних оставляет желать лучше, так как в силу a) невежественного непонимания основ генетики, и b) стремления к пафосным рассуждениям, текст очень сильно упрощается, зачастую превращается в манифест учения. Также очевидно, что Клесов хорошо усвоил требование Геббельса к нацистским пропагандистам: находить наиболее простые слова и мысли, максимально упрощать речь, произносимую «на площади». И многократно повторять одну и ту же мысль.  Все это приводит к идеологизации, а  значит и мифологизации того, о чем пишет Клесов.

…Впрочем Клесов этого и не стесняется. Чем больше шума, тем лучше. В конце сентября этого года он хвастается в своем дневнике. Несмотря на последующие попытки оправдаться отсылкой к искажению информации в  сломанном телефоне, и тем что его неверно поняли, видно что в конечном итоге он доволен жаренной сенсацией:


19 сентября этого года вдруг все основные сербские газеты как по команде опубликовали по сути один и тот же материал, но с разными заголовками, и с разными моими фотографиями. Некоторые поставили заголовки аршинными буквами, что я якобы доказал, что сербы – самый древний народ не только Балкан и бывшей Югославии, но и всей Европы. Вот, например, заголовок в самой читаемой сербской газете «Телеграф»: NAUČNO DOKAZANO: Srbi najstariji narod iz čijeg gena potiču Hrvati, Bosanci i Arijevci! Anatolij Aleksejevič Kljosov, profesor biologije Harvadskog univerziteta, u svom naučnom radu izneo je tvrdnje da je srpski gen star 12.000 godina i da potiče od Nojevog sina.  Пикантность здесь придает то, что последние слова в заголовке говорят о том, что «сербский ген», по якобы моим данным, произошел от сына библейского Ноя. В целом же заголовок переводится так, хотя многие уже, наверное, сами перевели, в ходе чтения:

 

Общие вопросы филогенетики

Согласно общепринятому определению, филогене́тика, или филогенети́ческая система́тика — область биологической систематики, которая занимается идентификацией и прояснением эволюционных взаимоотношений среди разных видов жизни на Земле, как современных, так и вымерших. Эволюционная теория утверждает, что сходство среди индивидуумов или видов часто указывает на общее происхождение или общего предка. Потому взаимоотношения, установленные филогенетической систематикой, часто описывают эволюционную историю видов и их филогенез, исторические взаимоотношения между ветвями организмов или их частей, например, их генов. Филогенетическая таксономия, являющаяся ответвлением, но не логическим продолжением филогенетической систематики, занимается классификацией групп организмов согласно степени их эволюционных отношений.

В понятийный аппарат ДНК-генеалогии филогенетика вошла в виде одного из своих направлений — кладистики. Характерные особенности кладистической практики состоят в использовании так называемого кладистического анализа (строгой схемы аргументации при реконструкции родственных отношений между таксонами), строгом понимании монофилии и требовании взаимно-однозначного соответствия между реконструированной филогенией и иерархической классификацией. Кладистический анализ — основа большинства принятых в настоящее время биологических классификаций, построенных с учётом родственных отношений между живыми организмами. Разумеется, кладистический анализ в ДНК-генеалогии не подразумевает анализ родственных отношений между таксонами-биологическими видами. Тем не менее, в силу схожести филогенетической схемы и привычной генеалогу схемы родственных отношений (генеалогического дерева), некоторые методы кладистики были взяты на вооружение и в ДНК-генеалогии. В-первую очередь, это касается филогений Y хромосомы и митохондриальной ДНК, восходящих к Y-хромосомному Адаму и митохондриальной Еве.

При этом нужно помнить, что генетические «Адам» и «Ева» -это своего рода фантомы, созданные масс-медиа. Под ними понимается скорее некая условная точка коалесценции всех существующих hic et nunc генетических линий; кроме этого, следует помнить они  в определенном смысле асинхроничны и смещаются по временной шкале по мере вымирания той или иной генетической линии. Можно конечно вычислять общего предка до первейшего организма, только встает вопрос в самоценности такого анализа. А так — «генетические Адам и Ева» — весьма хороший символ общего происхождения человечества, особенно для современной евроцентричной цивилизации, во многом построенной на библейско-христианском  символизме.

Теоретически можно стоить подобные филогении и по снипам в аутосомах. И хотя в последнее время много пишут  про «атавистические» снипы и малорекомбинантные локусы в аутосомах, они все же не дают столь же убедительной филогении, как Y и mtDNA. Но мне кажется, что для людей, которые верят в происхождение современного человечества из Костенок, не имеют значения ни гомозиготность, ни гетерозиготность, также как и рекомбинантность/нерекомбинантность локусов.

Эксперимент номер 1

В течении периода между 2008-2010 гг., я усиленно занимался проблематикой филогенетики в применении к ДНК-генеалогии. Например, еще в далеком 2009 году я построил по известной выборке гаплотипов из статьи Роевера 2008  года «быстрое» дерево с гаплотипами гаплогруппами I. Модальные гаплотипы не вводил, корень получен мурковской (здесь и далее речь идет о замечательной программе Валерия Запорожченко MURKA) опцией MIDPOINTGROUP. Гаплотипы идут в том же порядке, что и гаплотипы I в файле у Рувера (название области +порядковый номер  гаплотипа по области).  Было найдено всего около 60 деревьев, из них я выбрал около 15 вариантов. Соотношение субкладов абсолютно иное, нежели в статье известного шарлатана Клесова, например I2b всего 8 штук (вместо 22 у Клесова), правда возраст клада такой же как у Клесова -в пределах статистической погрешности 10 000 лет. I2a всего около 70 гаплотипов.

Penzen-9

14,21,15,10,15,16,13,12,31,15,10,12,14,20,14,21,11

Smolen-2

15,23,15,10,15,15,14,12,32,15,10,11,14,20,15,21,11

Orlov-3

15,23,15,10,15,15,14,12,31,16,10,11,14,20,15,22,11

Nowgorod-3

14,23,15,10,13,17,14,12,32,18,10,11,14,20,13,21,11

Brian-4

15,23,15,10,15,15,14,12,30,16,10,11,14,19,16,22,11

Brian-5

15,23,15,10,15,16,14,12,32,17,10,11,14,20,22,21,11

Penzen-16

15,23,16,9,15,16,14,12,30,15,10,11,14,20,23,21,11

Tambov-6

15,24,15,9,15,16,14,12,30,16,10,11,14,20,14,21,11

Поскольку разрешение файлов огромное 9543*7672, то я не могу их выложить. Добавил всего 5 основных модалов из двух десятков, и результат оказался намного лучше, поскольку дерево было перестроено с учетом модальных гаплотипов всех субкладов I. Структура построенного дерева проиллюстрировала известный парадокс — хотя сама гаплогруппа I считается «старой», все ее  густонаселенные ветви (или в терминах кладистики — клады ) — «молодые». Старых ветвей практически не осталось, что свидетельствует о древности I.

Возраст я не считал, хотя значение ро получилось равным 14 (а это достаточно много). И поскольку древо считалось быстро, значение 1 ро была взято равным 1000 годам. Возраст меня особо не интересовал, задача была другая — выявить в древе наличие трех ветвей.  Кроме того, в ходе анализа я пытался определить место, где произошло разделение ветвей. Если самые старые  ветвим I2 на Кавказе (допустим такой вариант), то разделение на I1 и I2 было именно там или раньше; но это не объясняет того, почему I1 в циркумкавказской зоне практически не видно.  Видимо, c этих позиций популяционные генетики и рассматрыва Балканы, как предпочтительное место начала экспансии расселения I в Европу. Однако тут возможна масса альтернативных объяснений. Например, протопопуляция могла разделиться на 2 группы — первая  ушла на Кавказ пошла, а вторая на Балканы. Или с Кавказа ушла часть людей, еще до разделения, и в ней произошло выделение линии I1.

Структура дерево выявила еще ряд актуальных проблемы, например гаплотипы I2b оказались гораздо ближе к корню по медианно сети, чем I1  и I2а. Этому имеется свое объяснение. В 2008 году уважаемый программист Вадим Урасин провел несколько недель в попытках доработать параметры median-joining таким образом,  чтобы он корректно распределял гаплотипы в соответствии со снипами. Одним из способов улучшение топологии было использование так называемх весов маркеров.  Однако, Поскольку расстояние между I2b*, I2b1 и I2b2больше, чем между I1 и I2a, все проги давали сбой.

В поисках решения проблемы я обратился к программе TNT, известной своей быстродействием.

Формат входного файла в TNT выглядит следующим образом

xread

‘optional title, starting and ending with quotes (ASCII 39)’

nchar ntax

Taxon0   1011110000

Taxon1   1111111000

Taxon2   1011110000

Taxon3   1111111000

;

Альтернативные «веса» маркеров, предложенные Урасином

DYS 393 0,00138 54

DYS 390 0,00235 50

DYS 19/394 0,00209 51

DYS 391 0,00164   53

DYS 385a 0,00252 49

DYS 385b 0,00372 46

DYS 426 0,00014 73

DYS 388 0,00103 56

DYS 439 0,00285 48

DYS 389-1 0,00194 51

DYS 392 0,00071 60

DYS 389-2 0,00397 45

DYS 458 0,00464 44

DYS 459a 0,00077 59

DYS 459b 0,00108 56

DYS 455 0,00028 67

DYS 454 0,00048 63

DYS 447 0,00345 47

DYS 437 0,00081 58

DYS 448 0,00150 53

DYS 449 0,00660 41

DYS 464a 0,00234 50

DYS 464b 0,00293 48

DYS 464c 0,00278 48

DYS 464d 0,00281 48

DYS 460 0,00251  49

GATA H4 0,00210  51

YCA IIa 0,00115  56

YCA IIb 0,00155  53

DYS 456 0,00376  46

DYS 607 0,00249  49

DYS 576 0,00593  42

DYS 570 0,00610  42

CDY a 0,00703    41

CDY b 0,00843    39

DYS 442 0,00299    48

DYS 438 0,00077  59

DYS 531 0,00063  61

DYS 578 0,00025  68

DYS 395S1a 0,00054 62

DYS 395S1b 0,00076 59

DYS 590 0,00017 71

DYS 537 0,00146 54

DYS 641 0,00051 62

DYS 472 0,000006 99

DYS 406S1 0,00198 51

DYS 511 0,00156 53

DYS 425 0,00132 54

DYS 413a 0,00287 48

DYS 413b 0,00244 49

DYS 557 0,00361 46

DYS 594 0,00067 60

DYS 436 0,00020 70

DYS 490 0,00032 66

DYS 534 0,00520 43

DYS 450 0,00029 67

DYS 444 0,00324 47

DYS 481 0,00478 44

DYS 520 0,00241 49

DYS 446 0,00361 46

DYS 617 0,00112 56

DYS 568 0,00087 58

DYS 487 0,00141 54

DYS 572 0,00132 54

DYS 640 0,00048 63

DYS 492 0,00052 62

DYS 565 0,00081 58

Программа TNT также принимает  файл в формате Нексус. Для преобразования ych -> Nexus был написан конвертер уважаемого А.Лифанова. Изначально автором Мурки планировался свой собственный конвертер RDF <-> Nexus, однако по ряду причин он так и не был реализован. В этой связи стоит отметить, что TNT единственная программа наряду с MURKA, которая дозволяет вычисления по произвольной матричной метрике. В поисках обходных путей и в связи с трудностями с поддержкой форматов, мне пришлось воспользоваться командой  prepare из дистрибутива MURKA (опции MX BINARIZE). С ее помощью, я сделал state matriх, немного отредактировал ее в родной формат .tnt, вставив файл снипы со значением 1 и 0, и загрузил ее в прогу. Затем возникал другая проблема, как сохранить в графическом формате филограммы, которые находит TNT. Я пробывал сохранять в .nex, tre и в метафайлы emf, однако они нигде не открываются. Я посмотрел формат .tre TNT, в отличие от читаемого Мегой файла с одним древом, в TNT-овском файле прописываются все древа.

Интересен тот факт, что формат в TNT, чем-то напоминает datamatrix в бинарном RDF, однако между ними нет совместимости.  Вадим У. показал скрипт вызывающий Мурку, но, к сожалению, частая смена Валерием Запорожченко параметров сделала свое нехорошее дело. В скрипте потерялась опция UBRSPH — она не делает ничего нового, просто в последних трех версиях вызов с ней эквивалентен тому что было раньше без нее. Валерий также рекомендовал использовать BNDREPEATS2 и даже BNDREPEATS3 вместо BNDREPEATS1, но это уже дело вкуса и не столь жестко — эффект заметен не вcегда.

Эксперимент номер 2

После печального эксерзиса с построением «быстрого» дерева гаплогруппы I я несколько поостыл к методу MJ, и интуитивно склонился к методу Вадима Урасина. Тогда мне казалось, что если оптимизировать метод Урасина, то его применение откроет новые перспективы. Возможно даже, что реконструируемые с его помощью филогении кладограммы можно будет исторически объективно верифицировать за счет привлечения исторических и археологических данных. В ожидании усовершенствований программы, я воспользовался известным в биоинформатике программным пактом Арлекин (главным образом встроенным анализом AMOVA). Также, как и в прошлый раз, z не ставил в данном случае перед собой задачу выявления возраста I*, за значение одного ро в годах я брал некое приемлемо большое число (2000 лет), поэтому узел с возрастом в «45000 лет» в данном случае соответствует узлу последнего общего предка I* и J*. Меня больше интересовала задача, поставленная ув. А.Штруновым.  Напомню,он попросил меня установить субкладную принадлежность 17 маркерных гаплотипов группы I с помощью филогенетических реконструкций. То есть, «разделить» ветви на дереве. Первая попытка была, как видно из вышенаписаного, неудачной. Поэтому я решил обкатать метод на более надежном 17 маркерном наборе модальных гаплотипов всей группы I. По способу, предложенному Урасином, ветви-клады «закреплял» введение в ych.файл SNP мутаций (через значений 1 и 0). Для большой надежности, использовал прием, который отлично себя показал на 67 маркерах, т.е укоренял через модал ближайшей к I гаплогруппы J.

Результаты подобного опыта лучше согласовались с данными номенклатуры субкладов I. Почти все субклады легли где им полагается (внутри родительских кладов), хоть и не в прогнозируемом номенклатурой порядке. Тем не менее, на 17 маркерах эксперимент не дал удовлетворительного результата даже после «читового» введения в ych. файл данных о снип-мутациях и применения «мощного» укоренения через предковый гаплотип соседней гаплогруппы J*. Из этого следуют следующие выводы:

1.База данных 17 микросателлитных YSTR гаплотипов, определенных по снипу, как I-M170, недостаточна для определения субкладовой принадлежности гаплотипов.

2. Без указания снипов и укоренения через ответвление другой гаплогруппы, выявленные топологии древа носят случайный характер.

3. Выделение ветвей I и I2a/I2b  в 17-маркерной филогении даже после описанной выше «оптимизации» происходит способом, противоречащей данным о снип-мутационном схеме гаплогрупп I.

4. Принадлежность гаплотипов I в 17 маркерной записи к субкладу невозможно выявить с помощью методов филогенетических реконструкций. Это касается не только медианных сетей и МP деревьев Нетворка/Мурки, но и филограмм, построенных по методу NJ , Фич-Марголиаса и т.д.

5. Следовательно, «выделение молодой ветви и старой ветви» » гаплогруппы I2″ на 17 (sic!) маркерных гаплотипах, произведенное псевдоученым Клесовым в своей псевдонаучной статье  о гаплотипах европейской части РФ, не является методологическим верным. В результате выявляются не реальные в филогенетическом смысле ветви, а некие фантомные объединения гаплотипов по некоторым мат.статистическим критериям.  Таким образом, уже тогда Клесов  показал свой дилетантизм на примере «разделения» I2a и I2b в своей статье о гаплотипах выборки Рувера. В свое оправдание, вместо четкого и грамотного ответа на вопрос, Клесов привел туманный и бессмысленный набор предложений общего характера: «мой подход — строить деревья гаплотипов, выделять и идентифицировать ветви, анализировать каждую ветвь отдельно, а затем сопоставлять базовые гаплотипы для всех ветвей и находить возрасть пра-предка. При этом получаются часто совершенно новые вещи. Техника счета — дело десятое, она уже отработана и выверена. Я просто выбираю нечетный индекс, как того требует программа. Я выбираю 9. Могу выбрать 7, 5, 3, другой — дерево перестроится, но останется по сути тем же.»  Топология в Phylip нужна только для определения «выдающихся групп». О родстве между гаплотипами о них судит нельзя. Кстати, именно поэтому академик Клесов использует Филип и Мегу для «причесывания» выборки. Несмотря на настойчивые советы перейти на Мурку, ну или хотя бы для начала — Fluxus Network, так  как в обеих программах используется концепция медианных сетей, — самозваный «академик» так и не смог перейти на следующий уровень.  Мой спор с Клесовым начался из-за проблем с филогенетическим древом, реконструированном на основании 17-маркерных гаплотипов. Выяснилось, что  «ветви» этого древа не соответствуют снип-разметке гаплогруппы I. В ответ на это Клесов посетовал, что я заранее загнал себя в тупик утверждением, что 17-маркерные гаплотипы ни при каких обстоятельствах не могут быть использованы. Действительно, в филогении — нет, не могут. Выше показывал примеры с цифрами и расчетами, почему это так. Для других целей — наверное можно хоть однолокусные брать. Смотря для чего. Например, в той же Меге можно  найти 1000 разных топологий деревьев по одной и той же выборке.  В MrBayes, с помощью байесовской  интерференции — 50000  равновозможных (equiprobable ) филограмм, то есть деревьев  17-маркерной выборки.  И каждая из них будет равноценной  филогенетическим построениям Клесоа в Меге, поскольку, также как и у Клесова она не отражает объективной информации о сниповых партициях древа I.

В Mesquite есть хорошая опция сравнения частотности между ветвями консенсусного дерева и ветвями всего множества филогенетических политомных филогенетических деревьев. Так вот, средняя частота повторения отдельных ветвей во всех деревьях не превышает 0.0001-0.00005 (то есть, в среднем частота совпадения не превышает 0.01-0.005 процента от объема деревьева). Это свидетельствует о случайности разбиения ветвей, и ненадежности филогении. Все, что можно определить по таким деревьям — это визуально продемонстрировать удаленность/близость гаплотипов по матричной дистанции от корня.  Кстати, совершенно неудивительно, что удаленность от корня значительна. Расчеты величины ро — среднего количества накопленных мутаций на каждый гаплотип — показывают, что в среднем на каждый гаплотип выборки по «мутационному» пути от «базового» гаплотипа накопилось 14-15 мутаций (из 17!). Поэтому и неудивительно, что гаплотипы сгруппировались подобным образом. Разбивать ветви и определять базовые гаплотипы по таким выборкам — то же самое, что строить медианные сети по раскладу карт Таро. Нам уже известно, что никакая программа не делает эту работу на 17 локусах хорошо. По прошествии 4 лет, Клесов так и не ответил на косвенный вопрос Валерия Запорожченко, заданный подчеркнуто мягко и ненавязчиво в ходе дискуссии: какова цель построения деревьев? Поиск предковых гаплотипов? Но при неправильном положении предков друг относительно друга это приведет к ошибке. Возраст всей I? Но зачем Вам для этого деревья? Может, просто кластеризация ветвей? Нельзя ли ясно указать, зачем запускалась программа? Фраза Клесова «программа рассматривает возможную последовательность перехода» имеет ясный смысл только если таких возможностей в принципе мало, ограниченное число. При гигантской гомоплазии 17 локусов вариант найденный Клесовым — один из миллиардов (и даже миллиардов миллиардов) потенциально возможных. Нет здесь «объективного отражения». На каком основании Клесов выбирает только один вариант, если возможна масса их, без дискуссии чем он лучше? Клесов сам говорил неоднократно, что применяемый им метод расчета возрастов зависим от разделения на ветви («считать чохом» vs «не считать чохом»).

6. Даже после построения дерева модалов I с использованием советов Урасина ( применение комбинированного метода, а такж вычисление стоимости байесовского древа ), cовершенно очевидна недостаточность 17 маркерных гаплотипов для построения филогении (в случае I гаплогрупп необходимо минимум 30-35 маркеров), о чем собственно писали Валерий З. и Вадим У.

Здесь нужно сделать важное замечание. Достаточность или недостаточность длины гаплотипов диктуется исключительно целями исследования. Ведь любой вменяемый человек понимает, что надежное и достоверное парсимонистское или байесовское разделение гаплотипов (без знания субклады и соответствующего снипа) в соответствии с истинным мутационным древом затруднительно и на выборке гаплотипов с бОльшей, нежели 67 маркеров, длиной гаплотипной записи. Однако если выборка сформирована по генеалогическому способу (как например в исследованиях по ирландским кланам) или в выборках однофамильцев (те же исследования ирландцев о корреляции фамилии/гаплогрупп, проект «Однофамильцы» и так далее), то 17 маркерных гаплотипов достотаточно для кластеризации и оценки статистического соответствия фамилий и гаплогруппы. Однако для генеалогического масштабирования/позиционирования ветвей в филогенетическом дереве и большего количества маркера недостаточно, так как выявляемые ветви носят случайный характер, особенно когда выборка «чоховая», то есть включает несколько кладов или субкладов гаплотипов общей гаплогруппы. Все что можно сделать — это кластеризовать в филогенетечиском древе/сети наиболее устойчивые гаплотпы (правда, это можно сделать и без построения сетей) и при этом помнить, что из-за мощной гомоплазии таких выборок (например в той же руверовской выборке I, где среднее количество накопленных мутаций от предкового гаплотипа составляет 14 мутаций из изначальных 17), в кластеры неизбежно попадут «посторонние» гаплотипы. Затем нужно выделять те ветви, которые особенно выделяются и по ним заново строить дерево, и в больших выборках нужно делать так так до самого мелкого уровня. В этом случае надо увеличивать не значение эпсилона (он нужен для оценки гомоплазии, то есть сколько параллелизмов в сети), а использовать опцию Post-processing>MP. Тогда можно в структуре сети выявить деревья — которые грубо говоря, представляют собой кратчайшее расстояние между узлами сети (то есть междк реальными гаплотипами, которые в исходном файле обозначены фамилиями или номерами, а также «реконструированными» гаплотипами «предков», они обозначены как mv). Есть еще один метод, обратный вышеописанному. Он называется  bootstrap analysis, только в нем не добавляют гаплотипы в выборку, а наоборот, изымают из выборки произвольные гаплотипы. Этот метод реализован, в частности, в одной из филоутилит в пакете Phylip.  С его помощью оценивают надежность той или иной ветви древа. В 2009-2010 годах я каждый день занимался подобным методом на практике с реальными гаплотипами.

Примечание.  Для понимание некоторых технических деталей необходимо вкратце объяснить суть методов программ. Например, в Phylip при построении деревьев используется один из трех дистантно-матричных методов: метод Фитча-Марголиаша, метод ближайшего соседа или метод с использованием группировки. Как правило, применяется метод Ф-М или метод «взвешенных»  минимальных корней. В отличие от метода ближайщего соседа, где в качестве метрики используются та самая матрица генетических расстояний (которую любители ДНК-генеалогии получают в YUtility) Этот метод удобен для кластеризации «близких» гаплотипов, так как в расчет принимаются линеарные генетические расстояния (дистанции), таким образом, что наиболее близким гаплотипам присваиваются более высокие «веса», тем самым понижается степень неаккуратности расчета измерения дистанций между более удаленными гаплотипами. Хотя, как это не странно, бывает и так, что не-взвешенное дерево ближе к верифицируемому с точки зрения генеалогии древу. Расчет ведется  от первого гаплотипа, которым в YUtility является условный предковый гаплотип — так называемый модальный гаплотип. Предполагается, что этот модальный гаплотип (или гаплотип с медианными значениями соответсвующих маркеров всех гаплотипов выборки) совпадает с гаплотипом «общего предка», хотя на практике это зачастую не так. Я как то специально проверял эти модальные гаплотипы в Мурке на предмет их совпадения с филогенетическим «мидпойнтом», и в половине случаев гаплотип мидпойнта и модальный гаплотип не совпадали.  Часто встречающийся у новичков конфуз с ветвьями дерева вызван тем, что новички путают понятия генетической дистанции и сходства гаплотипов. Дистанция считается в этом случае от модала, например гаплотип A ближе к модальному гаплотипу (то есть в нем накоплено меньше мутаций от предкового гаплотипа, и поэтому дистанция меньше),  гаплотип B  — мутаций больше и поэтому он дальше. Это вовсе не исключает вероятность того, что по числу совпадающих маркеров B ближе к A и, например, к C.  В этой связи необходимо напомнить определение гомоплазии: гомоплазия — однотипная изменчивость признаков и свойств у организмов различных таксономических групп при параллельных, но независимых эволюционных процессах. То есть тут идет речь о возможных параллелизмах, когда (в применении к Y-STR анализу на мельчайшем, близком к генеалогическому уровню филоанализу) в параллельных ветвях могут возникать сходные признаки ( в нашем случае — одинаковое число аллелей в локусных маркерах), при этом их генеалогическое родство по патрилинейной или если угодно -игрек-хромосомной линии — намного глубже.

 

Эксперимент номер 3

В том же 2009 году я открыл для себя новую замечательную программу — MrBayes -программу для анализа филогений с помощью байесовской инференции. Так как программа понимает формат Nexus, то я конвертнул поправленный  ych файл в формат nex, немножко поправил файл согласно примерам, и запустил марковскую цепочку по методу Монте-Карло. Рабочий цикл программы прошел нормально, но медленно — на 145 гаплотипов примерно 3500 циклов за 20 минут. На выходе после «прожига» деревьев были получены деревья в формате Newick. На графике соотношения RI (индексов ретенции) между выявленными в MrBayes 2100 (!) вероятными деревьями группы из 145 43-маркерных гаплотипов, cреднеарифметическое значение индекса составило: 0.17967889; медианное: 0.17454545  (n=2001 деревьев). Под индексом ретенции в кладистике понимается доля очевидной синаморфии значений (в нашем случае локусных значений), которая присутствует в качестве синаморфии в построенном дереве). Формула расчета: RI= (g-s)/(g-M), где g-верхний порог значения, принимаемого локусом в любом построенном дереве, s- минимальное количество шагов изменения значения локуса в дереве, M-число шагов которое требуется в конкретном дереве.

R моюму удивлению, полученные деревья относительно быстро загрузилась как в SplitsTree, так и в Меге и TreeView (причем, в Меге они грузились дольше всего). Есть такая фича во всех этих программах (а также Mesquite), которая позволяет строить по всем имеющимся вариантам «компромиссное» consensus-tree по двум разными методикам (в том числе и UPMGA).

MrBayes еще хорош тем, что высчитывает апостериорные вероятности каждой ветви каждого древа. Для 17 маркерной выборки вероятность «самого точного» дерева (то есть при SD < 0.001) не превышает 53%.

 

К концу 2009 года я начал склоняться в пользу более сложного трехступенчатого анализа:

1)Постройка всех возможных вариантов деревьев и оценка их вероятности с помощью байесовской инференции (программа Mr.Bayes). Затем сортировка наиболее вероятных деревьев и их визуализация в Меге, СплитсТри, ТриВью, Мескит.  Оценка каждого наиболее вероятного дерева, а также консенсусного дерева этих вариантов. Предварительная группировка и предпредварительная корректировка с использованием знаний о генеалогических группах, а также с данными о вероятности той или иной ветви. Дальше нужно смотреть мутировавшие позиции, и если подходить к вопросу методично, просчитывать, какое из двух деревьев более вероятно. Тут лучше всего использовать байесовский метод. То есть брать абсолютные скорости мутаций и перемножать их на скорости (точнее вероятности) не-мутаций.

2) MJ-анализ каждой группы отдельно, постройка сети с использованием маркерных «весов», затем нахождение субоптимальных и MP деревьев в медианной сети (Murka). Анализ полученных результатов с использованием гипотез о генеалогических группах, использование данных о партициях дерева  и т.д.(статистические данные по деревьям в MURKA)

3) Расчет с помощью Байеса по  данным о априорных вероятностях n-мутациях (n*число маркеров*вероятность мутации локуса*вероятность немутаций) и по данным о  взвешенных партициях (апостериорная вероятность ветви). Выбирается наиболее вероятный результат. Данные сверяются с генеалогическими (историческими, генеографическими и т.д.) данными.