О «ближневосточном компоненте» палеолитических охотников-собирателей Европы

Сергей Козлов

О «ближневосточном компоненте» палеолитических охотников-собирателей Европы

Описание
Рассмотрена статья Qiaomei Fu et al. «The genetic history of Ice Age Europe». Проведен анализ европейских палеогеномов возрастом от 37 до 8 тысяч лет из данной статьи и более ранних работ. Аутосомный компонент западных охотников-собирателей (WHG) — преимущественно результат генетического дрейфа, гипотеза авторов о его формировании в результате однократной миграции в Европу около 14 тысяч лет назад носителей ближневосточных аутосомных компонентов несостоятельна. Вместе с тем, обмен генофондом с ближневосточными популяциями несомненно происходил, однако для прояснения его истории необходимы палеогеномы с Ближнего Востока. Подтверждаются выводы из более старых работ о наличии ближневосточного («базального») компонента у образца Костенки-14 (человек с Маркиной Горы), отрицаемые в рассматриваемой статье. Вероятно, он связан с компонентом охотников-собирателей Кавказа (CHG). Опровергается вывод авторов о восточноазиатском влиянии на поздних WHG. Проведено моделирование ряда возможных событий смешения и построено дерево вероятных взаимосвязей аутосомных компонентов с размещением на нем имеющихся палеогеномов.

Обсуждение работы Qiaomei Fu et al на форуме «Молекулярная генеалогия».

Новые палеогеномы из статьи
В рассматриваемой статье впервые произведен временной срез геномов жителей Европы верхнего палеолита. Конечно, единичные геномы у нас были и раньше (Костенки-14, Oase1), однако не хватало системности для построения целостной картины изменений в генофонде европейцев на протяжении этого периода. Статья частично решает эту проблему — прочтено несколько десятков новых геномов. К сожалению, остался неохваченным период 19-28 тысяч лет назад (а с учетом лишь геномов приемлемого качества — 19-30 тлн), но и имеющиеся образцы позволяют сделать ряд интересных выводов.

Коротко о содержании рассматриваемой работы, критика
Авторы подтверждают выводы из более ранних работ об угасании вклада неандертальцев в генофонд современных европейцев с ходом времени (предположительно, на неандертальские участки ДНК действовал отрицательный отбор). Далее они касаются нескольких интересных мелочей (присутствие Y-гаплогруппы R1b в палеолитической Европе — образец Villabruna возрастом 14 тысяч лет, появление «мутации светлоглазости» почти одновременно в Европе и на Кавказе (разумеется, это не отменяет вероятности нахождения более древних образцов с этой мутацией впоследствии) и необычные для региона в наши дни митогаплогруппы). После этого авторы переходят к объединению образцов в кластеры и попытке реконструкции их взаимоотношений. По сути, здесь все просто — европейские палеогеномы из одной эпохи объединяются в один кластер. Классические европейские WHG выступают под псевдонимом «кластер Villabruna», их непосредственные предшественники — el Miron, и ряд геномов возрастом 30 тысяч лет (из них лишь один заслуживающего рассмотрения качества) — кластер Vestonice. Чуть более старые GoyetQ116-1 и костенковец не вошли ни в один кластер. Далее делается очень странный вывод, что с появлением кластера Villabruna (в дальнейшем я буду называть их «WHG» согласно общепринятой терминологии), произошло резкое изменение генофонда в результате вливания компонента, связанного с современными ближневосточными популяциями. Формально приводится и альтернативное объяснение — результат нормальной изменчивости среди охотников-собирателей, и группы с меньшей общностью с Ближним Востоком были замещены группами, изначально имевшими большую общность. Однако в abstract статьи попал лишь первый вариант.

Мое объяснение
Даже из диаграммы, которая должна иллюстрировать точку зрения авторов, следует прямо противоположный ей вывод — изменения, относимые к появлению классических WHG, начались задолго до этого и происходили постепенно. «Ближневосточное влияние» (зеленые ромбики) появляется в заметных масштабах уже в предшествующем кластере el Miron, на пять тысячелетий ранее. Но перед этим кластером находится разрыв в девять тысячелетий, где, вполне возможно, мы тоже могли бы увидеть это влияние. Однако на картинке разрыв закрыт и создается впечатление резкого перехода.
Исходное изображение:

ИсходнаяСхема
Отмасштабированная пропорционально реальной временной шкале картинка:
Безымянный-3
Как я покажу в дальнейшем, общность палеообразцов с классическими WHG и современными северными европейцами (которые являются преимущественно потомками WHG) с ходом времени росла постоянно — от костенковца и GoyetQ116-1 к el Miron, Villabruna и Loschbour. По моим предположениям, основной механизм здесь — дрейф генов. Не надо думать, что это был некий целенаправленный процесс — наоборот, дрейф генов во многом случаен (хотя и отбор наверняка сыграл свою роль), но именно то, что получилось в его результате, и стало европейскими охотниками-собирателями мезолита. Поэтому естественно, что чем ближе к нашему времени, тем выше сходство с итоговым результатом процесса.
Вместе с тем, с ходом времени мы наблюдаем и относительное повышение общности с ближневосточными популяциями, хотя и в заметно меньшем масштабе. Однако трудно сказать, кто, когда, сколько раз и на кого влиял. Допустим в качестве модели, что несущие компонент WHG группы повлияли на ближневосточников в относительно недавнем прошлом. Тогда повышение сходства палеогеномов с WHG автоматически будет немного повышать сходство и с ближневосточниками пропорционально доле WHG в их генофонде, даже если в ту эпоху на Ближнем Востоке о WHG и не слыхали. С другой стороны, небольшие равномерные вливания с Ближнего Востока в Европу могли дать такой же эффект. Или же третья группа, вроде CHG, могла повлиять как на WHG, так и на ближневосточников (необязательно одновременно). Словом, точку здесь поставит лишь хорошая выборка палеогеномов с Ближнего Востока -сравнение с современными популяциями всегда оставит место гаданиям.
Что касается восточноазиатского влияния на часть WHG (внимательные читатели критикуемой работы могли заметить, что оно «проявляется» и у одного из древнейших образцов — GoyetQ116-1), то оно объясняется ошибочностью принятия основой для сравнения образца Kostenki-14. Далее я еще коснусь этого.

Использованные для анализа методы и палеообразцы, причины их выбора
В этой заметке я не стал применять свой излюбленный метод — подсчет сумм общих (IBD) сегментов. Хотя качество некоторых образцов вполне позволяет его применить, трудно понять, как при этом надежно сравнить между собой образцы из эпох, разделенных десятками тысячелетий? Ведь сегменты со временем уменьшаются в размерах, при этом скорость процесса сильно зависит от популяционной истории — в одной выборке быстрее, в другой медленнее… Добавим к этому резко различающееся качество прочтения палеогеномов, и за корректность сравнения поручиться становится совершенно невозможно.
Поэтому я решил пойти путем подсчета доли общих снипов (IBS), как простого и объективного показателя. Чем больше значений снипов совпадает, тем выше генетическая близость. Я не согласен с мнением, что учитывать надо лишь производные (derived) аллели — ведь если оба варианта закрепились в популяции, то для дрейфа генов уже безразлично, какой из них предковый. Для того, чтобы поставить геномы разного качества в одинаковые условия, я случайным образом выбрал для каждого аллеля одно из прочтений и оставил лишь его, то есть создал искусственную гаплоидность, как часто делается с палеогеномами от лаборатории Райха. Обычно я ругаю этот подход, как разрушающий IBD-сегменты, но в данном случае он приносит пользу. Далее я ограничил набор снипов пересечением трех множеств — снипы, используемые мной для сравнения с современными выборками и снипы, прочитанные у образцов Villabruna и GoyetQ116-1. Более логично было бы выбрать в качестве базового образца WHG прочитанный наиболее качественно из всех Loschbour, однако носитель R1b Villabruna в любом случае будет вызывать интерес общественности и подозрения в отличиях от других WHG, поэтому решение было принято в его пользу. Что касается GoyetQ116-1, то из всех древних образцов он наиболее связан с «промежуточным» между палеолитическими европейцами и WHG el-Miron, за что и был выбран в качестве второй опоры. Итоговый набор составил около 107 тысяч снипов. Для сравнения Villabruna и Goyet с el Miron было проведено отдельное уменьшение набора до присутсвующих у всех троих 65 тысячи снипов.
Среди остальных использованных палеообразцов хорошо прочитанные Loschbour, Ust-Ishim, Kostenki, NE1, Kotias отмасштабировались практически без потерь в количестве снипов, Mota1 и Motala12 — с незначительными потерями. Несколько хуже отмасштабировались Vestonice16, «карел» c Оленьего острова I0061, «мальтинец» и один из наиболее ранних геномов неолитчических земледельцев Анатолии I0707, но они также были включены в сравнение, поскольку представляют явный интерес. Судя по сравнению результатов I0707 и его близкого аналога из Европы NE1, подсчеты сохранили корректность.

Таблица результатов и ее применение
Результаты сравнения сведены в таблицу, с которой желающие могут ознакомиться по ссылке. Кроме современных выборок, приведены и выборки из имеющихся палеогеномов (конец таблицы), хотя их качество очень разное. Впрочем, интересующие нас в первую очередь западные охотники-собиратели WHG и ранние неолитические земледельцы Анатолии AEF представлены вполне неплохо, хотя по Анатолии пока, к сожалению, охвачена лишь крайняя западная часть. Наиболее древние европейцы — Kostenki14, GoyetQ116-1, Vestonice16 объединены в выборку pre-WHG. Число в каждой ячейке — доля совпадающих аллелей для текущего образца с этой выборкой — допустим, 65 означает 65% общих снипов (на данном наборе снипов — число сильно зависит от набора).
Несмотря на все ухищрения, призванные поставить геномы в равные условия, прямое сравнение результатов оказалось невозможным — у некоторых образцов чуть больше совпадающих снипов со всеми выборками, у некоторых — чуть меньше. Разница невелика, но в этом методе играют роль даже доли процента. Возможно, причина — в разном качестве прочтения, возможно — индивидуальные особенности образцов или что-то еще. Однако решение проблемы существует. Поскольку увеличение или уменьшение доли совпадающих снипов примерно пропорционально для всех выборок, можно взять соотношение этой доли с выборкой, равно удаленной от всех («outgroup»). В качестве подобного ориентира я решил взять объединение всех четырех используемых мной выборок из Африки южнее Сахары — представителей пигмеев мбути и бьяка, кенийских банту, нигерийского племени йоруба. На графике ниже приведена доля общих снипов для каждого из палеогеномов с соответствующей выборкой (Balt, Druze, WHG и т.д.) после приведения доли общих снипов с африканцами к одинаковому с другими образцами значению путем домножения на коэффициент. Для проверки корректности метода на график помещены другие outgroups, которые в исследуемый период явно не могли участвовать в обмене генами ни с африканцами, ни с исследуемыми палеообразцами — выборка папуасов. Как интерпретировать их результат, я опишу чуть ниже.
График1
Палеогеномы (kya означает тысяч лет назад):
Ust-Ishim — усть-ишимский человек, наиболее древний приемлемо прочитанный геном человека современного типа.
Kostenki-14, GoyetQ116-1, Vestonice16 — древние геномы из Европы
el-Miron — предшественники WHG
Villabruna, Loschbour — WHG
Motala12 — охотник-собиратель из Швеции, представитель группы SHG (охотники-собиратели Скандинавии)
Karelian — образец с Оленьего Острова, так называемый EHG (восточный охотник-собиратель). Malta — древний «сибиряк» со стоянки Мальта, образец аутосомного компонента ANE — предковые северные евразийцы
EHG находятся в промежутке между WHG и ANE и, вероятно, являются их смесью.
I0707 — ранний неолитический земледелец с запада Анатолии
NE1 — ранний неолитический земледелец с территории Венгрии
Kotias — мезолитический охотник-собиратель с Кавказа

Ради интереса я также поместил на график результаты современного восточноевропейца с предками из трех восточнославянских народов (Modern EE).

Левая часть графика иллюстрирует изменения в генофонде европейцев с течением времени (усть-ишимский человек добавлен для сравнения, хотя он и не из Европы), правая — другие представляющие интерес геномы.
При сравнениях палеогеномов с палеовыборками сравнение «сам с собой» пропускалось.

Интерпретация сравнения с выборкой папуасов
Как мы видим, соотношение «родство с папуасами»/»родство с африканцами» для палеоевропейцев представляет собой почти горизонтальную линию. Это значит, что с какой скоростью европейцы «отдрейфовывали» от папуасов, примерно с такой же они отдалялись и от суб-сахарцев. Выглядит логично. Усть-ишимец выше всех, и это тоже логично — ведь он находится наиболее близко во времени к моменту расхождения папусов, восточноазиатов и WHG/ANE — значит, он и должен иметь относительно больше общего с папуасами. С другой стороны, для образца Kotias, имеющего много «базального» компонента, логично иметь заметно более низкое значение этого соотношения — момент расхождения «базальников» и предков остальных не-африканцев (включая папуасов) был очень давно. Ранние земледельцы, как смесь «базальников» и WHG, закономерно находятся в промежутке между WHG и Kotias. Даже неравномерности в графике охотников-собирателей находят свое объяснение — как я покажу позже, у костенковца вероятно небольшое влияние «базальников», и он проваливается на графике. Также я предполагаю небольшое базальное влияние у WHG и el Miron — соответственно, они находятся чуть ниже Goyet, мальтинца и оленеостровца. Итак, контрольная проверка показала применимость метода.

Важная ремарка — когда я в дальнейшем буду писать о росте доли общих снипов (график с течением времени идет вверх), надо понимать, что этот рост относительный. Есть некий базовый «уровень разбегания» — это скорость, с которой мы с каждым поколением отдаляемся от африканцев и папуасов из-за дрейфа генов и других факторов. Если в относительных значениях общность с друзами растет, это не значит, что она точно растет в абсолютных значениях — возможно, она тоже падает, но из-за обмена генами с нами падает медленнее, чем могла бы. А может, с друзами общность медленно растет, но с отстающими от них йеменцами медленно падает. Все зависит от соотношения скорости дрейфа генов, который нас растаскивает, и скорости обмена генами, который объединяет. В данном случае нас интересует, что удается увидеть наличие факта этого обмена.

Интерпретация графика
В первую очередь бросается в глаза пунктирная красная линия вверху — доля общих снипов с выборкой WHG. Как легко заметить, рост был почти непрерывен в течение всего времени, лишь, немного споткнувшись на образце Vestonice (возможно, поэтому в статье отнесли этот кластер к «тупиковой ветви». Впрочем, на сравнении с балтской выборкой такого не происходит, а современные выборки все же качеством на порядок выше — значит, доверия им больше). Ниже сплошной красной линией приведено сравнение с наиболее близкой к WHG выборкой наших современников — жителями восточного побережья Балтики (выборка Balt состоит из 11 литовских образцов, 6 латышских, 2 из Латгалии и одного с российско-латышской границы). Здесь картина аналогична — каждый следующий во времени образец ближе к балтам, чем предыдущий, включая даже Vestonice16. Очевидно, что объяснить это монотонное приближение единоразовой миграцией невозможно, а вот процессы генетического дрейфа укладываются в модель замечательно. Зеленые линии — аналогичная пара для неолитических земледельцев (пунктир) и считающихся (по результатам аутосомного анализа) наряду с армянами их наиболее сохранившимися представителями на Ближнем Востоке друзами Палестины. Здесь мы тоже видим рост, но более медленный по сравнению с ростом сходства с WHG. Если учесть, что порядка четверти генофонда AEF считается полученным от WHG, то примерно половину роста необходимо отнести на этот фактор. Оставшаяся половина и будет искомым обменом генами между «базальниками» и WHG. Для моделирования «базальников» зачастую применяют выборку из Йемена, как наиболее отдаленную от европейцев среди ближневосточников. Неизвестно, насколько это моделирование корректно, однако я включил их в сравнение (голубая линия). Родство с ними также растет, хотя и медленнее, чем с AEF или друзами. Однако, начав заметно ниже папуасов, ближе к нашему времени йеменцы успешно обгоняют их и становятся более близкими к WHG. Ведь обмен генами с йеменцами гораздо менее затруднен географически, чем с папуасами.

Несколько слов о правой половине графика
Представитель сестринской к WHG клады — ANE, мальтинец (24 тлн), обладает относительным сродством с WHG примерно на уровне европейских образцов 30-37 тысяч лет назад. Можно предположить, что момент расхождения был не слишком задолго до этого времени. При этом сродство с «балтской» выборкой относительно выше — поскольку в Восточной Европе присутствует не только WHG, но и доля ANE. У «карела» EHG связь с WHG закономерно выше (поскольку он и сам частично WHG), соответственно выросла и связь с ближневосточниками. То же самое, но в еще большей степени можно сказать про образец из Швеции Motala12 (скандинавские охотники-собиратели — SHG считаются WHG с примесью ANE). На паре AEF/NE1 можно пронаблюдать, как при продвижении в Европу у неолитчиков вырос вклад WHG, зато упал «ближневосточный» компонент. У «палеокавказца» Kotias по сравнению с ними резко падает связь с восточноевропейцами, и менее резко, но тоже падает — с ближневосточниками.

Определенный интерес представляет и сравнение с некоторыми другими современными выборками. Я не стал помещать их на основной график, чтобы избежать его перегруженности, но размещаю более полный вариант ниже.
График2
Сардинцы добавлены, как наиболее яркие современные представители неолитических земледельцев, удмурты — как связанные с EHG, корнцы — с более западным вариантом WHG, калаши — за «калашский» кластер, кеты и южноамериканские индейцы каритиана — за связь с ANE.

Карты для палеогеномов

Теперь перейдем к рассмотрению каждого из палеогеномов отдельно. Для начала несколько слов об усть-ишимце. Хотя он и наиболее близок к общему корню, но все же, судя по всему, в его времена расхождение неафриканского человечества на основные ветви уже состоялось. Ближайшими к усть-ишимцу выборками оказались меланезийцы и папуасы, далее идут жители юго-восточной Азии, тамилы и восточноазиаты.

Каждая карта нормируется отдельно — ярко-красным выделяется наиболее хорошо связанная с этим геномом выборка из представленных, ярко-зеленым — наименее связанная. Не представленные на карте выборки (четыре африканские, две америндские, папуасы и меланезийцы) в нормировании не участвуют, по сравнению с африканцами все неафриканцы были бы просто разными оттенками красного. Карты в этой статье построены согласно доле общих снипов (IBS), по тем же таблицам, что и предыдущий график. Это не IBD-анализ. В более хорошем качестве карты можно загрузить отсюда
UstIshim.png
Хотя европейцы и среднеазиаты чуть ближе к усть-ишимцу, чем североафриканцы и ближневосточники, разница сравнительно невелика. Частично удаление европейцев от усть-ишимца следует отнести на влияние «базальников», но думаю, WHG и сами по себе успели хорошо удалиться от восточной ветви человечества. Поэтому на роль представителя общей для всех базы усть-ишимец не годится.

GoyetQ116-1
По причинам, описанным мной в разделе «Использованные для анализа методы и палеообразцы», из наиболее древних европейских геномов на роль «базового» был выбран GoyetQ116-1. И, как показывает карта, уже 35 тысячелетий назад европейские аутосомы начали приобретать свои основные черты. На первом месте по схожести — уже упоминавшаяся выборка «Balt», она будет попадаться нам вновь и вновь. Родство с остальными европейцами выражено вполне отчетливо. Однако интересно обратить внимание на другие регионы. Во-первых, родство с североафриканскими и ближневосточными популяциями находится на том же уровне, что и родство с восточноазиатами. Видимо, мы поймали тот момент, когда протоевропейцы были равноудалены от этих двух стволов. В дальнейшем родство с восточноазиатами будет ослабевать, а с ближневосточниками — усиливаться. Как говорится, «география-это судьба».

GoyetQ116-1.png
Еще раз повторюсь, что речь идет о современных ближневосточниках. Насколько они репрезентативны по сравнению с населением региона 10, 20, 50 тысяч лет назад — совершенно непонятно.
Очень интересно «вторичное пятно» в Индии. Вероятно, оно было бы соединено яркой полосой с европейским ареалом, если бы не размывшие ее миграции «базальников» с юго-запада и восточноазиатов с северо-востока. При этом в юго-восточной Индии и Бирме ареал связи с прото-WHG перекрывается с ареалом хорошей связанности с усть-ишимцев. Не отсюда ли когда-то разошлись две наших ветки? Я не являюсь специалистом по Y-гаплогруппам, но кажется, с максимумом разнообразия макрогаплогруппы K, включающей в себя в качестве ветвей такие известные гаплогруппы, как N, O, R, Q, это соотносится хорошо (в таком случае, «базальников» можно связать с IJ). Разумеется, сюда также относится оговорка о возможной несхожести современного и древнего населения.

Vestonice16
Картина для Vestonice16 довольно схожа с картой GoyetQ116-1.

Vestonice16.pngПри сравнении видно, что связь с восточной (и в первую очередь Юго-Восточной) Азией несколько ослабла, а связь с западными выборками (как европейскими, так и ближневосточными) слегка усилилась. Однако разница невелика и из-за этого сравнительная карта выглядит некрасиво. Чтобы избежать загромождения излишними иллюстрациями, ее не привожу.

Kostenki14
Как и Вестонице, костенковец весьма схож с GoyetQ116-1. В данном случае мне хочется привести именно карту разницы со вторым палеогеномом, чтобы продемонстрировать его «южный» компонент. Зеленое — больше общего с костенковцем, красное — с Goyet.
GoyetQ116-1VsKostenki14Merged.png
Из-за схожести двух геномов карта очень зашумлена, однако противоположности проявляются хорошо. Ярко-зеленое прекрасно совпадает с областью распространения компонента кавказских охотников-собирателей CHG (ниже будет приведена карта и для них). Видны его максимумы на Кавказе и у калашей, на Балканах, и даже (хотя это может быть погрешностью) замечавшееся при анализе «ямных» геномов пятно в северо-западной Европе. Красное же в юго-восточной Азии — район максимальной «небазальности». Оттенки бурого и близкие к ним разглядывать нет смысла, также, как и отдельные «выбросы».
Как будет показано далее, костенковец наиболее успешно моделируется, как смесь 86% GoyetQ116-1 и 14% Kotias. Строго говоря, мы не можем утверждать, что GoyetQ116-1 представляет чистых прото-WHG, а костенковец является смесью с южанами. Не исключено, что «южный» компонент присутствует и у GoyetQ116-1, просто его меньше. В конце концов, смешение могло произойти еще по пути в Европу.

el Miron
Закончив с наиболее древними геномами, мы можем перейти к рассмотрению динамики европейского генофонда во времени (впрочем, до момента прибытия неолитических земледельцев она довольно однообразна). Поэтому ближайшие карты будут только сравнительными. Итак, красное — выборки, сходство с которыми у образца el Miron (19 тлн) усилилось по сравнению с образцом GoyetQ116-1 (35 тлн). зеленое — выборки, сходство с которыми ослабло. Бурое — возможно, слегка усилилось, возможно, ослабло, но не так сильно, как с зеленым. Об этом я написал в разделе «важная ремарка» после графика.

elMironVsGoyetQ116-1.png

Villabruna

VillabrunaVsElMiron.pngКак видите, прибытие Villabruna никакого переворота не произвело. Как и раньше, с ходом времени сходство с циркумбалтийцами усиливалось, с восточноазиатами — ослабевало, с ближневосточниками — то ли слегка усиливалось, то ли медленно ослабевало, но медленнее, чем с восточноазиатами.

Loschbour
Этот образец настолько схож с предыдущим (см график), что разностная карта показывает один шум. Поэтому я приведу конечный итог — вот к чему пришли WHG спустя 29 тысячелетий:
LoschbourVsGoyetQ116-1.png
А также сравнение — где произошли наибольшие изменения
Сравнение Loschbour и GoyetQ116-1

LoschbourVsGoyetQ116-1.png
Дальше всего «убежали» от протоевропейцев жители юго-восточной Азии, далее идут Индия, Восточная Сибирь и Северная Африка. За пределами основного региона меньше всего «скорость убегания» на Северном Кавказе, у ираноязычных памирцев, греков-киприотов и кетов (везде можно предположить контакты с носителями WHG).

Теперь перейдем к Кавказу и Анатолии. Уже упоминавшийся в пояснениях к карте для костенковца кавказский охотник-собиратель Kotias:

Kotias.png

Интересно попытаться расщепить этот компонент на составляющие. В значительной части он несомненно связан общим корнем с прото-WHG (хорошо выделяются оба значимых для этого компонента региона — Европа и Индия). Попробуем вычленить не-WHG часть путем сравнения с GoyetQ116-1.

KotiasVsGoyetQ116-1.png

В первую очередь закономерно выделяются зоны наибольшего распространения CHG — Кавказ и Афганистан (калаши)/Пакистан/Иран. Однако кроме этого, проявляется и связь с Ближним Востоком, Анатолией, Балканами — регионами распространения ранненеолитических земледельцев. Таким образом, можно предположить, что у CHG имеется связь с ближневосточным аутосомным компонентом (знаменитые «базальники»), который впоследствии стал основой генофонда неолитических земледельцев и через них повлиял на современных европейцев. Потому-то Европа и выглядит на этой карте в целом нейтрально — на юго-востоке персиливает влияние «базальников», на северо-востоке — WHG. И наоборот, Восточная Азия, куда базальники не добрались, оказалась ярко-зеленой — это говорит о том, что время их расхождения с восточноазиатами древнее, чем время расхождения восточноазиатов и WHG.

Тот же самый эффект, но с противоположной стороны мы можем наблюдать, сравнив Kotias и геном ранненеолитического земледельца из Анатолии:KotiasVsAEF.png

Поскольку теперь Kotias менее «базальный», на этот раз Восточная Азия оказалась красной. Хотя наиболее выражен «не-базальный» компонент Kotias в Индии. Поэтому я считаю, что компонент CHG следует считать смешанным между «ближневосточным» (предковым к AEF) и «индийским» (предковым к WHG) компонентом.

Раз уж я неоднократно упомянул AEF, приведу карту и для представителя этой выборки I0707.

AEF.png

Среди наших современников наиболее схожими с ним являются жители острова Сардиния, находящемся в западной части Средиземного Моря. Можно сказать, что компонент ранних земледельцев сохранился там, словно в заповеднике. В целом он лучше представлен в южной Европе, чем на Ближнем Востоке. Хотя не стоит забывать — для анализа у нас есть лишь палеогеномы с крайнего запада Анатолии, на границе с Европой. Вполне возможно, что ближневосточные геномы оказались бы ближе к современным выборкам с Ближнего Востока. Пока же мы можем сказать, что в регионе наиболее схожими с имеющимися образцами неолитчиков оказались армяне, друзы и греки-киприоты.

Наконец, последними я хочу привести две карты для образца возрастом в 24 тысячелетия со стоянки Мальта в Прибайкалье. На основе его анализа в свое время было выдвинуто предположении о существовании «популяции-призрака» — ANE, предковых северных евразийцев, которые повлияли на многих соседей, в том числе на американских индейцев, но сами к нашему времени исчезли. ANE считаются родственной к WHG веткой и не несут восточноазиатского или ближневосточного влияния. В схожести картин можно легко убедиться:

MaltaIBDext.png

Если WHG это западный вариант, то у ANE основная тяжесть приходится на выборки из Западной Сибири (кеты), Урала (манси) и недавных мигрантов из этого же региона (саами). Очевидно, в прошлом ареал ANE простирался заметно восточнее, но к нашим дням они оказались вытеснены мигрантами с юга, из Восточной Азии. Интересно сравнить, каковы же основные отличия ANE от прото-WHG:

MaltaVsGoyetQ116-1.png

Пятно в западной Сибири вполне ожидаемо. Меня более заинтересовало пятно вокруг выборки калашей в средней Азии. Если вспомнить о связи этого же региона с кавказскими охотниками-собирателями, то уместно предположить, что здесь мы нащупали корень не-ближневосточной части CHG. При анализе Admixture мальтинец показывал наличие около 30% CHG, поэтому я долго ломал голову, как связать этот факт с явной не-ближневосточностью мальтинца. Теперь все становится на свои места — взаимосвязь идет через «калашский» компонент.
Что касается отличий прото-WHG от ANE, то они чуть ближе к восточноазиатам (может, их точка отделения чуть юго-восточнее, чем у ANE?), и ближе к «базальникам», что вновь заставляет меня думать о «базальном» влиянии уже у GoyetQ116-1. В конце концов, если у двух других образцов оно есть, может быть и у этого. Но пока более «чистых» образцов у нас нет, сравнить не с кем. С другой стороны, мальтинский образец на одиннадцать тысячелетий моложе — возможно, за это время он сильнее отдрейфовал от остальных веток.

Численная оценка доли вклада каждого компонента в некоторые из адмиксов.
В процессе работы над сравнительными картами у меня возникла мысль, не попробовать ли сделать численную оценку на основе все тех же таблиц общности IBS с современными выборками. Действительно, если я предполагаю, что не-WHG компонент костенковца очень похож на результаты кавказского охотника-собирателя Kotias, то я могу проверить, насколько близка к костенковцу будет комбинация 1% Kotias + 99% GoyetQ116-1, 2% Kotias + 98% GoyetQ116-1 и так далее, проверив сумму среднеквадратичных отклонений по всем столбцам. Для того, чтобы исключить влияние уже упоминавшегося в начале статьи эффекта, для каждой тройки сравниваемых геномов производилось нормирование. Таким образом, суммы IBS с современными выборками по каждому геному совпадали.

Для проверки модели я решил использовать геном, смешанное происхождение которого достоверно известно. Как мы знаем, по мере продвижения в Европу и с ходом тысячелетий исходный генофонд неолитических земледельцев постепенно размывался благодаря влиянию местных охотников-собирателей. Следовательно, геном семитысячелетней давности земледельца из Венгрии NE1 должен хорошо моделироваться, как смесь земледельца из Анатолии AEF (возраст генома на тысячу лет больше) и WHG. Так и получается — если в роли представителя WHG выступает более ранний геном Villabruna, модель предсказывает соотношение 11% WHG на 89% AEF, для более позднего Loschbour соотношение почти такое же — 10% WHG на 90% AEF. Среднеквадратичное отклонение при этом меньше единицы — в дальнейшем будем считать такое значение признаком того, что смешение моделируется хорошо.
Ряд результатов для заинтересовавших меня вариантов моделирования приведен на изображениях ниже:
Оракул01.png
Кратко прокомментирую. При попытке смоделировать NE1, как смесь WHG и CHG отклонение резко возрастает, что говорит о неудачности такой модели по сравнению с предыдущим вариантом. Родственные WHG охотники-собиратели ANE могут частично служить заменой Villabruna, однако результат хуже. Таким образом, результаты моделирования полностью соответствуют здравому смыслу. Я решил попробовать сделать еще один шаг и ввести в модель искусственный образец «базальника», полученный вычитанием из геномов неолитических земледельцев 15-20 процентов вклада WHG. Конечно, точная доля компонента WHG в геномах неолитчиков нам неизвестна, однако это лучше, чем применять в качестве «базального» образца геном AEF.
Результат костенковца действительно лучше всего моделируется, как смесь 86% прото-WHG и 14% CHG (Kotias), что мы и наблюдали на сравнительной карте. Чуть хуже вариант 94% прото-WHG на 6% базальников. Для другого древнего образца из Европы, Vestonice16, картина противоположная — базальники лучше подходят в качестве второй стороны, чем кавказцы. Интересно, что наиболее старые образцы Y-гаплогруппы I пока что найдены именно у представителей кластера Вестонице — возможно, это не случайное совпадение и вливание «базального» компонента связано с приходом носителей этой гаплогруппы.
«Опорный» прото-WHG GoyetQ116-1 не моделируется, как смесь кого-либо из двух других представителей группы и южан. Однако он может быть относительно неплохо смоделирован, как 88% костенковца и 12% мальтинца. Вероятно, это связано с отсутствием «базального» компонента у образца со стоянки Мальта.

Оракул02.png
Носитель R1b Villabruna может быть смоделирован, как смесь одного из своих предшественников и базальников, однако отклонение при этом слишком велико, чтобы считать моделирование успешным.
CHG Kotias плохо моделируется, как смесь каких-либо двух других образцов. Наиболее удачный вариант — 48% Мальта и 52% базальники (что еще раз говорит о его промежуточном положении между двумя кладами).
«Оленеостровец» EHG наиболее хорошо моделируется, как  смесь 51% SHG (Motala12) и 49% ANE (мальтинец), отклонение великовато.

Оракул03.png
«Скандинав» Motala12 хорошо моделируется, как смесь 72% WHG и 28% EHG
Промежуточный между прото- и классическими WHG образец el Miron оптимально моделируется именно как смесь первых (GoyetQ116-1) и вторых (Villabruna). Однако при этом он оказывается ближе к более древним родственникам, хотя расстояние по времени до них гораздо больше. Возможно, это объясняется ускорением дрейфа в эпоху 19-14 тлн, но мне кажется более правдоподобным другое объяснение — WHG это потомки сестринской к el Miron ветви, поэтому часть дрейфа у них прошла отдельно.

Дерево вероятных взаимосвязей
Попытавшись максимально подробно и непротиворечиво свести вместе как данные, полученные в результате вышеописанных исследований, так и информацию из других работ, я изобразил дерево возможных взаимодействий палеообразцов и аутосомных компонентов. Схема достаточно условна, поэтому размещать на ней датировки далее 40 тысяч лет назад не имеет смысла. Гипотетический общий компонент «мальтинца» и охотников собирателей-кавказа я обозначил «Kalash», но надо понимать, что под этим вовсе не подразумеваются современные калаши — просто неким образом связанная с ними древняя предковая популяция. Серыми стрелками между «базальниками» и CHG, «базальниками» и WHG обозначено, что взаимодействия, по-видимому, были, но обозначить их одиночной линией на схеме тяжело. «Уральский» компонент — это часть генофонда народов Урала и западной Сибири, которую можно отнести к европейской ветви, для получения картины современного состояния необходимо объединить ее с восточноазиатским влиянием.

Дерево08.png

Думаю, что на самом деле все гораздо сложнее и запутаннее, чем изображено здесь )) Будем ждать новых расшифровок древних геномов для дальнейшего развития схемы.

Citizen scientists определили терминальный снип индейского мальчика

В феврале было опубликовано замечательное исследование Rasmussen et al., наглядно доказавшее взаимосвязь древней индейской популяции (вернее одного из ее представителей — мальчика, получившего «научное» имя Anzick1) с современными популяциями Америки и Евразии. Захоронение, обнаруженное в Западной Монтане, было отнесено археологами к культуре Кловис (Clovis) и соответствующим образом датировано (12,6 kya).

The genome of a Late Pleistocene human from a Clovis burial site in western Montana

Rasmussen et al., 2014
Nature 506, 225–229 (13 February 2014) doi:10.1038/nature13025
Received 03 November 2013 Accepted 14 January 2014 Published online 12 February 2014

Clovis, with its distinctive biface, blade and osseous technologies, is the oldest widespread archaeological complex defined in North America, dating from 11,100 to 10,700 14C years before present (BP) (13,000 to 12,600 calendar years BP)1, 2. Nearly 50 years of archaeological research point to the Clovis complex as having developed south of the North American ice sheets from an ancestral technology3. However, both the origins and the genetic legacy of the people who manufactured Clovis tools remain under debate. It is generally believed that these people ultimately derived from Asia and were directly related to contemporary Native Americans2. An alternative, Solutrean, hypothesis posits that the Clovis predecessors emigrated from southwestern Europe during the Last Glacial Maximum4. Here we report the genome sequence of a male infant (Anzick-1) recovered from the Anzick burial site in western Montana. The human bones date to 10,705 ± 35 14C years BP (approximately 12,707–12,556 calendar years BP) and were directly associated with Clovis tools. We sequenced the genome to an average depth of 14.4× and show that the gene flow from the Siberian Upper Palaeolithic Mal’ta population5 into Native American ancestors is also shared by the Anzick-1 individual and thus happened before 12,600 years BP. We also show that the Anzick-1 individual is more closely related to all indigenous American populations than to any other group. Our data are compatible with the hypothesis that Anzick-1 belonged to a population directly ancestral to many contemporary Native Americans. Finally, we find evidence of a deep divergence in Native American populations that predates the Anzick-1 individual.

http://www.nature.com/nature/journal/v506/n7487/full/nature13025.html

Приведу цитату из вышеуказанного исследования.

«Мы определили Y-гаплогруппу образца Anzick-1 как Q-L54* (хM3) и используя 15 ранее проанализированных последовательностями Y-хромосомы построили дерево, чтобы проиллюстрировать филогенетическое контекст, в рамках гаплогруппы Q. Используя данные об одиночных нуклеотидных полиморфизмах (SNP), мы использовала данные Anzick-1, чтобы оценить время дивергенции между субкладами Q-L54* (хM3) и Q-M3, двух из главных вариаций Y-хромосомы,  характерных для Америки. Нами получено время дивергенции примерно 16 900 лет назад (95% доверительный интервал: 13 000 — 19700 лет назад». 

nature13025-sf2

При этом сравнение  генома Anzick-1 с 52 современными индейскими популяциями выявило большую близость  к ним, чем к современным популяциям Евразии. Причем он оказался ближе к популяциям Центральной Америки, чем Северной.

nature13025-f2

Но, несмотря на явно прорывный характер этой работы для филогении гаплогруппы Q, авторы не пошли дальше определения L54 в качестве терминального снипа.

Отметим, что L54  достаточно «широкий» снип c географической точки зрения. Он распространен по обе стороны Берингова пролива.В частности, в Евразии остался субклад L54+ L330+, представители которого зафиксированы в ряде популяций: от коренных народов Сибири до евреев-романиотов в Греции. 

Исследование проведенное российскими сitizen scientists из группы YFull, занимающейся интерпретацией данных полного сиквенса Y-хромосомы, позволило заглянуть глубже. Anzick1 принадлежит к субкладу L54+ Z780+. Причем данные полного сиквенса его Y-хромосомы, приведенные в дополнительном материале к исследованию Rasmussen et al. (2014), позволили уточнить филогению гаплогруппы Q в целом и даже выделить ещё один субклад L54+ Y2816+

1618571_414955885305304_560427902_n

Дайджест новостей генетики и ДНК-генеалогии за январь-февраль 2014 года (часть 2)

**

Разработчики pyGenClean разместили полезный инструмент для предварительной подготовки выборки популяций для GWAS и этно-популяционного анализа. С помощью можно значительно автоматизировать относительно сложный процесс нахождения генетических outliers (т.е посторонних образцов выделающихся на фоне гомогенной однородной структуры популяции), а также провести многомерное шкалирования имеющихся популяций.

**

Я закончил проект по изучению структуры аутосомного генофонда грузинских этнографических групп. Ниже приведены выполненные в проекте публикую графики c результатами многомерного скалирования (MDS) и  анализа главных компонент (PCA) в изученной выборке. Еще я понял свою главную ошибку во время работы с предыдущими графиками — она состоит в том, что я раньше не сохранял в R framework данные и историю проделанных над ними операций. R очень гибкая среда для статистического анализа, но в силу большого разнообразия существующих пакетов для визуализации данных для выполнения одних и тех же команд часто возникает путаница с выбором подходящей техники визуализации. Поэтому лучше всего не начинать каждый раз с нуля, а сохранять workflow для последующих экспериментов. 1488015_10202873063857417_243934024_n 1526938_10202873450227076_1155088601_n

**

В русскоязычном секторе Интернета увеличивается число простых людей (и не совсем простых людей, вроде Татьяны Толстой), которые не боятся рассказывать открыто о своих генетических рисках, хотя в силу своего непонимания того что именно означает указанная в отчете risk odd (вероятность риска) , многие их выводы выглядят наивными.
Впрочем, ничего нет нового под Луной. Многие из моих сверхоптимистеских собеседников предполагали, что именно благодаря 23andme у рядового обывателя появилась возможность  наблюдения за своими генотипами (или геномами , под которым мы — summa summarum — понимаем здесь всю совокупность прочитанных генотипов), и даже за динамикой экспрессии свого экзома.
Тем не менее, даже я помню, как задолго до начала моего увлечения генетикой, примерно в 2002 году я видел передачу про исландскую компанию Decodeme по Discovery Channel. После длинного интервью с тогдашним ведущим сотрудником этой компании (К.Стефансон), в котором он рассказал о тотальном (почти 80%) генотипировании всей исландской нации, создатели фильма взяли краткие интервью у простых исландцев. Мне запомнился один исландец-докер, который — не отрываясь от процесса разгрузки траулера с рыбой, — с улыбкой на лице сказал: «Я могу выпивать по 10 чашек кофе в течении одного часа. Cогласно исследованиям ученных из DeCODE Genetics, в гене метаболизма кофеина у меня аллельный вариант, повышаюший скорость метаболизма кофеина».
Вывод — 23andme не были первыми, их заслуга в другом — в том что они вывели персональную геномику (в ее упрощенной форме) на новый, международно доступный уровень.

**
Компания Nanoporetech выпустила на рынок портативное устройство MinION, предназначенное для анализа молекул (в том числе и молекул ДНК), его можно применять для анализа структуры протеина и секвенрования ДНК. Устройство можно подключить к обычному компьютеру через USB-порт.
**

Уважаемый Pavel Bernshtam предложил реалистичную перспективу на стартапы. Кроме всего прочего, между строк замечаний Бернштама можно прочитать имплицитное неявное объяснение феномена значительной молодости самых известных стартаперов (им нечего терять и их руки-головы не связаны-загружены семейными обязанностями прокормки супруги и спиногрызов).
Я стою на перепутье выбора между развитием идеи этно-популяционного ДНК-калькулятора в форме стартапа, либо форме краудсорзинга, либо некоммерческая инструментализация разработки в криминалистике (в виде патента на методику нового вида криминалистической ДНК-экспертизы, которая со временем заменит надоевший всем фбр-овский CODIS):

«Хорошо, если просили про стартапы. Для стартапа нужно несколько вещей. Самое простое — идея. Идея сама по себе не стоит ничего. 0. Самая классная идея — НИЧЕГО. Идея начинает хоть что то стоить (тоже немного) если на ее основе написан бизнес план. Обоснованный бизнес план. Бизнес план, который может убедить. Сколько юзеров придет к вам на сайт в первые полгода? миллион? А почему? Докажите. А сколько зарегестрируется? Почему?
Следущее, что нужно — человек, который может принести инвестиции. Для этого нужно — представительность, бизнес план, знакомства и уйма всего иного. Нужно найти выход на инвесторов (без выхода тоже можно, но разговаривать с тобой будут иначе), нужно что бы тебя порекомендовали, нужно уметь рассказывать и убеждать. Далее — деньги. Скорее всего у Вас не получится сделать прототип, достаточный для получения инвестиции вечером на коленке, параллельно с основной работой. Вам надо будет уволиться и писать код.»

**
Как Вы помните, на Gedmatch.com были размещены разработанные мною этно-популяционные калькуляторы MDLP на платформе DIY Dodecad. Они позволяют довольно-точно определять этническое и популяционное происхождение исходя только из сравнительноого анализа частот полиморфизмов ДНК протестированного человека с частотами полиморфизмов ДНК в референсных популяциях. Несмотря на простоту использования (загрузил свое raw data, нажал на кнопку — получил результат), основные пользователи этого инструмента — американцы — имеют траблз с пониманием и интерпретацией результатов. Вот например, из свежего, присланного мне в январе. Ко мне уже обращаются как к доктору, который должен выдать свой авторитетный этнодиагноз:

» I had my test at 23and me and it has me as 100 European.
My mom says its a lie as my dad was an inuit from Alaska .My kit is ******
Could you please debunk inuit story»

Papa was a rolling stone (c)

«My results are for North-Amerind, (North American Indian) .. I suspect 4 generations back

Chr 1 1.7%
Chr 7 3.3%
Chr 18 2.5%

Is this a definite result for American Indian Heritage?»

На такие письма я вообще больше не отвечаю. Весьма странно что у столь многих американцев в последнее время появился фетиш происхождения от американских индейцев. Раньше это было не так заметно.

**

Повторное ресеквенирование «древнего» генома останков жителя мезолитической Иберии из La Brana 1 (того самого, которого исследовали в позапрошлом году на аутосомы и митохондриальный геном) показало, что этот человек имел очень необычную для Европы Y-хромосомную гаплогруппы — С6. Странности заметны на и уровне фенотипа: согласно анализу комплекса снипов, определяющих на уровне генотипа цвет кожи и глаз, он был темнокожим человеком с голубыми глазами (!).  У древнего европейца, жившего в пещере Ла-Бранья-Аринтеро (La Braña-Arintero, León) на севере Испании примерно 7 тысяч лет назад, были голубые глаза и очень смуглая кожа. Так художник представил себе то, как выглядел житель испанской пещеры 7 тысяч лет назад. (Ниже рисунок, опубликованный в Эль Паис.)

Палеогенетики успешно прочитали ДНК из костей древнего европейца, жившего в одной из пещер на севере Испании примерно 7 тысяч лет назад, и выяснили, что у него были голубые глаза и очень смуглая кожа, говорится в статье, опубликованной в журнале Nature. «Главным сюрпризом для нас стало то, что этот человек обладал типично «африканскими» версиями генов, которые управляют пигментацией кожи, что вероятно делало его очень смуглым или даже темнокожим, хотя мы и не можем точно определить ее тон. Еще более удивительным стало то, что этот «испанец» обладал теми вариациями генов, которые делают глаза европейцев голубыми, что делает этот геном уникальных, так как по всем остальным признакам он происходит из Северной Европы», — заявил Карлес Лалуэса-Фокс из Института эволюционной биологии в Барселоне (Испания). Что касается редкой гаплогруппы (C6, или по мнению некоторых исследователей просто C), то оказывается, что еще в 2013 году несколько любителей-непрофессионалов предсказывали вероятность присутствия С у части жителей палеолитической и мезолитиской Европы — по их мнению, мужское население палеолитической Европы могло принадлежать к линиям — C-V20 (в ISOGG С6), F и IJ.

«Ранние представители современного человека в Европе (EEMH), широко известные как кроманьонцы, мигрировали с Ближнего Востока в Европу несколькими волнами. Задумывашись над тем, какие гаплогруппы Y-ДНК могут быть связаны с ними, и в каком порядке они мигрировали в Европу, я придумал следующую хронологии для верхнего палеолита.

1) Гаплогруппа С6 (или С *, которая развилась в C6 в Европе)

2) Гаплогруппа F

3) Гаплогруппа IJ (которая развилась в Европе в гаплогруппу I) «

Заслуживает внимание и мастерское использование в данном исследовании методов секвенирования нового поколения — в частности, после того как генетики собрали геном древнего европейца из прочитанных мелких сегментов ДНК («ридов») по методу отображения ридов на референсный геном человека,  осталось приличное количество неиспользованных ридов. Генетики использовали «сухой остаток» для проведения метагеномического анализа. Как известно, метагеномика работает с набором всех ДНК находящихся в среде; следовательно генетики сделали удачное предположение о том, что «риды» без привязки к человеческому геному принадлежали геномам бактерии. BLAST-анализ ридов в Генбанке позволил установить те виды бактерий, секвенсы геномов которых были наиболее близки к изучаемым ридам.


В конце января были опубликованы две замечательные статьи на русском языке, посвященные бурно развивающейся области исследований — молекулярной патологии: «Молекулярная патология и роль врача-патологоанатома»  и «Наследственно обусловленный рак молочной железы и яичников«.


The Coop Lab продолжает размещать материалы о статистических рассхождениях в характере наследования генетического материала у ближайших родственников. Традиционно считается, что сибсы (сиблинги) одного пола похожи друг на друга в той или иной степени. Различие в фенотипических чертах объясняются разными факторами окружающей среды воздействующих в разной степени на их развитие. Тем не менее, как было показано в статье The Coop Lab,сибсы различаются также на уровне своего генома, за счет случайности сегрегации и рекомбинации.


Китайские генетики разработали  новый метод генной хирургии (точное геномое редактирование) и успешно применили его на макаках.


Ученные из университета Северной Аризоны «возродили» вирус древней чумы, пандемия которой пришлась на время правения византийского императора Юстиниана (Юстинианова чума). В лаборатории был прочтена последовательность ДНК бактерии-возбудителя чумы, которая содержалась в останках жертв этой пандемии. Очевидно, здесь также применялись методы метагеномики.


В сетевой версии журнала «Наука и жизнь» размещена статья о характере генетической интрогрессии (межвидовым обменом чужеродной генетической изменчивостью) произошедшей между неандертальцами и предками анатомически современного человека много десятков тысяч лет назад, и приведшей к частичной гибридизации двух видов, чьи эволюционные пути разошлись около полумиллиона лет тому назад:
«Оказалось, что практически все неандертальские гены локализованы в Х хромосоме, а значит, передались нам по женской линии. Ученые пришли к выводу, что мальчики, рождавшиеся в результате смешения кровей, были в большинстве своем бесплодны. «Когда неандертальцы и люди скрещивались, это было на краю биологической совместимости, ведь два генома не встречались друг с другом примерно полмиллиона лет», — комментирует результаты исследования один из его авторов Дэвид Рейч, генетик из Медицинской школы Гарварда (США).»

Я еще в 2010 году говорил, что если смешивание с неандертальцами происходило, то скорее всего гены были привнесены от связей между мужчинами homo sapiens sapiens и женщинами-неандертальцами. Не откажу себе в удовольствии процитировать свое сообщение на форуме Молгена.

«Re: Люди носят гены неандертальцев
Ответ #23 : 10 Май 2010, 19:40:25  Самое неубедительное в обеих работах это
1)отбор снипов для анализа (перекрестное сравнение снипов орангутанга, человека и шимпанзе — выбрали те, которые у человека являются, как считается, потомковыми).
2) по отобранным снипами произвели выравнивание (alignment) секвенсов шимпанзе, человека и неандертальца фазирование предкового генотипа общего предка человека, неандертальца и современного человека (т.е говоря проще, реконструировали (предсказали) гипотетический генотип по методу Байесовской апостериорной вероятности)
3) затем разбили фрагменты генома неандертала по снипами по признаку совпадения или несовпадения с предковыми значения гипотетического секвенса общего предка шимпанзе и гомо, на три группы -гомозиготные с предковым значением снипа, гомозиготные с потомковым значением и просто гетерозиготы. Про исключение более половины мутаций (пусть и синонимических), я вообще молчу. Но кто может гарантировать, что предковый генотип реконструирован верно, и, что самое главное — где доказательство того, что у неандертала должно быть именно предковое значение снипа, а не мутировавшее параллельно с человеком.
Наконец, на приведенном выше графике, разброс участков генома совпадающих у человека и неандертальца по X хромосоме, находится в меньшем диапозоне SD (стандартного отклонения), эти участки небольшие, но по структуре более дивергентные.
Из чего следует 2 вывода:
a) основное генное вливание шло через X хромосому и b) поскольку около 2/3 генетической информации X хромосомы аккумулируется в женских линиях, то направление вливания шло через самок неандертальцев и мужчин-сапиенсов, что несколько противроечит картине изображенной в первой статье.»

Любопытно, что при ресеквенировании геномов неандертальцев и секвенировании геномов новых неандертальцев (из пещеры Окладникова) применили новый метод секвенирования. В частности, они секвенировали митохондриальную ДНК из кости неандертальца и отделили ее от ДНК современного человека, что позволило доказать родство между жившими в Сибири и в Европе неандертальцами.Метод определения посторонних наслоений ДНК основан на анализе ее естественных мутаций. Так, у 30–40% образцов, возраст которых насчитывает несколько тысяч лет, цитозин превращается в тимин, а гуанин — в аденин. Ученые разработали систему, моделирующую процессы естественного изменения ДНК и сравнивающую полученный результат с данными образца.

Аналогичная методика была применена и в отношении менее древних образцов ДНК. Насчет мезолитических образцов из работы Лазаридиса, я не читал ту часть сапплемента где описывается техническая сторона опыта. Но в другой работе упомянутого в статье Скоглунда (Skoglund et al .2012) — в неолитическах образцах результаты поссмертной гидролитической деаминации (cytosine —> thymine or guanine —> adenine) были удалены. Но у неандера разумеется из было горадо больше и пришлось придумывать методику реконструкции первоначальных нуклеотидов.Кроме того, в статье Lazardis et.al.2013 (точнее в сапплементе) содержится указание на использование урацил-ДНК-гликосилазы и эндонуклеозы при подготовке библиотек для сиквенирования.Использование этого метода значительно (!) уменьшает включение деаминированных остатков C/G→T/A (здесь подробности).


Уважаемый «любитель» Владимир Таганкин на основе большого эмпирического материала (десятки тысяч гаплотипов) провел серьезное исследование дисперсии значений локусов Y-STR. Это исследование  по своему качеству превосходит многие статьи профессиональных популяционных генетиков.


В статье доктора Линча известный «феномен раздутости нефункциональной части человеческого генома» объясняется сочетанием ряда генетических факторов. Мутации, увеличивающие размер генома (дупликации), с гораздо меньшей вероятностью вредят организму, чем мутации, при которых часть генома теряется (делеции). Поэтому с увеличением частоты мутаций геном начинает непроизвольно расти. То есть причинно-следственная цепочка тут следующая:

малый размер популяции > увеличение генетического дрейфа > нарушение аккуратности репликации генома (увеличение частоты мутаций) > увеличение размера генома.

Как мне кажется, это объяснение можно применить к анализу всех мутаций, в том числе и STR (коротких тандемных потворов).


В январе и начале февраля было опубликовано несколько статей, в которых затрагивается тематика ДНК-криминалистика. Так в ходе проведенного Федеральным Бюро Расследований США аудита национальной базы данных ДНК, было обнаружено 166 ДНК-профиля, которые содержали ошибки. Часть этих ошибок появилась в результате ошибок клерков, другая часть связана с ошибками при интерпретации данных допущенных сотрудниками лабораторий. Проведенная тогда же проверка профилей ДНК в базе данных города Нью-Йорке дала аналогичные результаты. Неприятный факт обнаружения ошибок в STR-профилях ДНК поднимает старые вопрос о необходимости замены существующей системы CODIS. В более ранней работе, в которой рассматривалась роль и место устаревающей, но по-прежнему существующей системы CODIS в системе быстро развивающегося комплекса знаний о геноме человека, авторы сделали интересный вывод: несмотря на то, что маркеры CODIS часто лежат в пределах геномных и генных доменов, связанных с риском развития определенных заболеваний или отвечающих за определенные функции генома, не было найдено никаких  убедительных доказательств того, что «короткие тандемные повторы», используемые в качестве маркеров CODIS, могут помочь установить физические черты человека.  Наконец, в совсем новой работе по ДНК-криминалистике («Recent Advances in Forensic DNA analysis«), наряду с обсуждением сугубо технических моментов сбора и подготовки биологического материала к анализу, затрагивается и вопрос о возможных альтернативах STR (коротких тандемных повторов), т.е того типа маркеров которые лежат в основе системы CODIS. Одной из логичных альтернатив являются однонуклеотидные полиморфизмы (снипы). Одним из преимуществ снипов над STR является тот факт, что в сильнодеградированные фрагменты ДНК могут быть проанализированы только с помощью снипов. Будучи биаллельным маркером, снип может быть включен в ДНК-профиль, однако информативность одичного снипа гораздо ниже информативности STR-локусов, в силу чего  процесс установления личности при работе со смесью разнородных ДНК усложняется. Хотя единчный снип менее информативен ( в силу биаллельности), чем STR, но этот недостаток можно легко избежать за счет увеличения  количества SNP(снип)-маркеров, используемых при анализе. Разный уровень гетерозиготности  является одной из наиболее ценных особенностей снипов. Другой положительной чертой снипов является то, что при определении снипов нет нужды на разделение сегментов по их размеру, что делает мультиплексирование и автоматизации более доступны, чем  в анализе коротких тандемных повторов. Кроме того,  низкая скорость мутации снипов значительно улучшает их стабильность в качестве генетических маркеров.

 

Еще раз о эволюции «динарской клады» гаплогруппы I2a1b и славянизации Балкан

Как известно моим постоянным читателям, я уже на протяжении почти 5 лет пытаюсь опровергнуть устоявшееся в популяционное генетике представление о том, что частотный пик распространения на Балканах гаплотипов так называемой динарской клады гаплогруппы I2a1b можно объяснить  непрерывной генетической приемственностью населения этого региона со времен палеолита. Даже само кодовое название «ветви» — «динарская» — носит условный характер. Вопреки популярной точки зрения,  на самом деле название восходит не к трудам Нордтведту (который его просто популяризировал), а к известной cтарой статье Barac et al.2003. Авторы описали Dinaric Modal Haplotype в его 5-маркерной форме «(DMH: 16–24–11–11–13) by DYS19–390–391–392–393, respectively». Позднее он был расширен до 17, 37,67 и 111 маркеров и обнаружен не только на Балканах, но и по всей Восточной Европе

К сожалению, большинство из моих убедительных аргументов остаются без должного внимания со стороны профильных популяционных генетиков.  На дворе уже 2014 год и что мы видим в свежих работах по популяционной генетике населения Восточной Европы? Собственно говоря, ничего нового. В статье В.С. Панкратова, О.Г. Давыденко «Структура генофондов населения двух регионов Белорусского Полесья» 2013, стр.46 читаем: «Различие частот гаплогруппы I2a2 между популяциями «Вичина» и Западного Полесья не является достоверным, соответственно, она могла попасть в «Вичин» из других регионов Западного Полесья, при этом не происходило событий, приводящих к сильному генетическому дрейфу. Напомним, что для данной гаплогруппы характерна более высокая частота в Полесье, чем в других частях Беларуси, что предположительно является результатом мигра- ции ее носителей из потенциального балканского ледникового рефугиума на территорию юга современной Беларуси. Таким образом, заселение «Вичина» носителями Y-хромосомы I2a2 произошло либо так же, как и заселение других регионов Западного Полесья (в результате миграции с Балкан), либо позже в результате миграции с прилежащих территорий).»  Что характерно — здесь эта гаплогруппа (а речь идет конечно же о печально известной динарской субкладе этой гаплогруппы) названа I2a2 по старой терминологии, а в таблице частот уже по более новой I2a1. Это обстоятельство указывает на то, что статья писалась (или дописывалась) в разные времена. Похоже это общее место всех работ в области популяционой генетики,  так или иначе затрагивающих проблематику балканского палеолитического рефугиума, уже никогда не устранить. И это несмотря на то, что открытие новых снипов и соответствующие изменения в филогенетическом дереве гаплогруппы I2a-P37.2  дают надежные доказательства верности моей первоначальной гипотезы. Вот так, например, выглядит разметка филогенетического древа I2a-P37.2 по состоянию на начало 2014 года.

Еще более глубокая структура субкладов I2a1b приведена в черновой рабочей схеме компании Yfull.

I2_M423_20140203

Несмотря на интуитивно понятную структуру организации информации в филогенетических деревьях (кладограммах), они не могут быть использованы в качестве окончательного аргумента при строгом логическом доказательстве какой бы то ни было гипотезы.
Так уж повелось, что при аргументировании своей позиции в попгенетике надо оперировать языком сухой статистики и математики. Выводы и модели могут быть верными, частично неверными или даже полностью неправильными. Но если они выражены в формально-математическом виде, они имеют полное легитимное право на принятие к обсуждению в ситуации рациональной и конструктивной дискуссии. Поэтому статья (с рабочим названием » ‘Динарская субклада’ I2a1b: маркер славянской экспансии на Балканы?»)  должна  включать в себя, к примеру,  графическое отображение графа филогенетической сети гаплотипов динарской клады, но традиционными методами эту задачу решить крайне сложно. Я наткнулся на интересную альтернативу для тех случаев, когда вместо филогенетической схемы гаплотипов нужно строить гаплотипные сети (haplotype networks), но из-за больших объемов данных построить их в стандартной попгенетической программе Fluxus-Network в течении разумного времени не получается.

Вместо классического, но медленного FN можно использовать бесплатное программное обеспечение Arlequin > HapStar > Graphviz/Gephi/R-Graphviz. Первая попытка визуализации в Gephi:

1526576_10202941657572217_2008628619_n
Поскольку с эстетитческой точки зрения эта попытка была не очень удачной, то я решил повторить эксперимент с визуализацией MST динарского кластера гаплогруппы I2a — на этот раз в цветном исполнении.  В самом центре белоруские гаплотипы, окруженные украинскими гаплотипами. Ветвь Вереничей (Belarus19) в кластере гаплогруппы I2a: Belarus32->Bulgaria68->Poland365->Belarus 19, и очень близко к центру.

1048962_10202961233661607_1211213762_oЗатем я  частично переработал граф сети гаплотипов динарского кластера гаплогруппы I2a1b. Алгоритм Force Atlas 2, хотя и позволяет разглядеть мелкие детали размещения отдельных гаплотипов, — в конечном итоге дает уникальную структуру графа, и эта структура существенным образом отличается от привычной структуры сети гаплотипов в работах попгенетиков. Исходя из этого, я решил ограничиться применением Force Atlas, а затем сгруппировал перекрывающиеся узлы графа в одну группу. Благодаря этому незамысловатому трюку, на выходе я получил гораздо более приемлимый с точки зрения академического стандарта графический вариант. Это, конечно же, не штейнеровское MP-дерево гаплотипов в Fluxus Network, однако и оно дает неплохое представление о характере развития динарского кластера.

Задача: как вы думаете, где находится визуальный центр равновесия графа?

Подсказка: Иногда люди ошибочно полагают, что предковые гаплотипы — это гаплотипы в самом большом кластере. Например, в данном случае — в оранжевом метаузле. Однако это предположение работает только в том случае, если в популяции не было быстрого роста и экспансии. В противном случае может статься так, что носитель маргинального гаплотипа способен, в силу случайных и неслучайных причин вызвать эффект основателя, породив множество потомков. В таких случаях мы можем наблюдать картину характерную для данного графа. И это далеко не единственный случай

1555325_10202973979300240_689832560_n

Еще немного покопался в графе (MST) гаплотипов динарского кластера I2a1b. На полпути зум в Gephi сломался, и процесс «причесывания» начального графа пришлось заканчивать уже в Adobe Illustrator и Adobe Photoshop. Но надеюсь, что теперь-то граф представлен в удобоваримом формате:


1536644_10202976299438242_1824667689_nВ процессе подготовки материала к своей статье о динарской субкладе I2a1b, я сделал график многомерного шкалирования по вычисленной в Арлекине матрице Fst-расстояний между 42 популяционными группировками гаплотипов динарской субклады.

1656113_10203040706128369_1678657762_n

Примечательно что скорректированный коэффициент детерминации R2 в данном случае негативный (что редкость), впрочем этого можно было ожидать так как сам коэффициент детерминации R2 достаточно близок к нулю (R2=0.015), то есть данная модель — разбивка носителей по этногеографическим группам — объясняет 1.5% всей статистической вариативности всей выборки. Кроме того, p-value=1, а это означает, что мы должны принять нулевую гипотезу (отсутствие корреляции). Это близко к полученным значениям AMOVA, согласно которым на генетическое разнообразие между этническими группами приходится только 1% всего генетической разнообразия выборки. 98% приходится на разнообразие между отдельными гаплотипами. Говоря простыми словами, в выборке динариков-I2a1b отсутствует значимая кластеризация по этническому признаку.

Более надежное доказательство вышеозвученного вывода было получено при выполнения теста Мантеля, в котором определялась наличие и надежность корреляции между матрицнй географических расстояний и матрицы попарных Fst между группами популяций. Значения p-value c двухсторонним критерием (two-tailed p value) значительно больше 0.05, что означает  только одного — значимой корреляции не наблюдается, несмотря даже на приличный размер выборки — 774 гаплотипа.

Разумеется, если бы моя статья сопровождалось только схемами и результатами вычислений, то тогда это было бы статья стандартного формата популяционной генетики. Однако, как мне представляется, гораздо интереснее рассмотреть вопрос эволюции и миграции носителей «динарской клады» I2a1b в интердисциплинарном ключе. В этой связи необходимо посмотреть на эту проблему глазами историка, тем более что время экспансии  «динарцев» отлично накладывается на временной интервал экспансии славян на Балканы.

Как я уже отмечал ранее, в журнале Studia Slavica et Balcanica Petropolitana cодержится немало интересных статьей, в которых освещается современное состояние вопроса о так называемой славянизации Балкан во второй половине первого тысячелетия нашей эры.
По непонятной причине, в этом вопросе задают тон те слависты-историки, которые занимаются изучением проблем хорватского этногенеза. По этой причине в журнале представлены сразу 4 альтернативные взгляда на происхождение хорватов, которые представляют собой не столько развитие традиционных конкурирующих теорий автохтонности хорватов (Иван Лучич, Фердо Шишич, Франьо Рачки и пр.) versus миграционной модели (кульминировавшей в дискурссе иллиризма в середине 19 века), сколько новый тренд постмодернистского переосмысления многих традиционных понятий обеих теорий и исторических источников в виде идеологических конструктов и дискурссивных формантов.

  1. Алимов Д. Е. В поисках «племени»: этногенетическая модель «Венской школы» и проблема появления хорватской этничности.
    Алимов отвергает примордиалистский подход к хорватской этничности, в которой далмацкие хорваты виделись осколками первичной хорватской этничности. Термин «хорват» гентилистский, а не этнический: в Аварском каганате этот термин обозначал одну из (много) этно-социальных групп gentes разного происхождения, объединенных не родовыми связями, а принадлежностью к общей воинской группе.Может ли хорватский гентилизм служить свидетельством неславянского характера хорватской этничности или его следует понимать как закономерный социальный продукт миграции со свойственным этому процессу выдвижением на передний
    план — в том числе и в процессах групповой идентификации — воинского дружинного элемента? В свое время Х. Л овмяньский, размышляя над путями формирования так называемых «больших племен» в славянском мире, предположил, что в условиях славянских миграций и колонизации новых пространств закрепить название старого «большого племени» на новом месте, образовав новое «большое племя» со старым названием, могли только хорошо организованные воинские группы [34, Подобным же образом рассуждает и М. Анчич, полагая, что под хорватами и сербами Константина Багрянородного следует разуметь правящие слои соответствующих политий, состоявшие из знатных родов. Во время распада Аварского каганата разные группы хорватов укрылись кто в горах Карпат, кто в Судетах, кто в Восточных Альпах, кто на Динарском нагорье. Поскольку обозначение хорват обозначал лишь принадлежность к определенной социальной группе аварского каганата, то между карпатскими, силезскими, альпийскими и далматскиим славянами нет родства. То есть хорватская идентичность есть продукт трансформации соционима в этноним.
  2. Известная работа Флорина Курты «Создание Славян».
    Если выразить смысл этой работы одним предложением, то автор отрицает самое существование славян до их встречи с византийцев. Само слово славяне и понятие славянства есть продукт византийского имперского дискурса, и первоначально включал в себя не только славян в собственном смысле этого слова, но и германцев, иранцев, фракийцев и так далее.Заключительный раздел труда Ф. Курты суммирует выводы исследования. Особенно важным представляется вывод о том, что раннеславянская этничность не основывалась на языковой общности. (При этом, автор совершенно справедливо замечает, что сам этноним словене появляется гораздо позднее и лишь на периферии славянского ареала.) «Создание славян, — пишет Ф. Курта, — явилось не столько результатом этногенеза, сколько итогом инвенции, воображения и систематизации византийских авторов. … Это была… Самобытность сформированная в тени Юстиниановых крепостей… Имеются существенные основания утверждать, что эта самобытность была значительно более сложной, чем дублет «cклавены — анты» навязанный византийской историографией. … Первое отчетливое утверждение «мы — славяне» происходит из Повести временных лет XII в. Этой летописью завершается процесс создания славян…» (с. 349-350).
  3. Мягкий вариант синтеза «готской теории» и «автохтонтизма» в статьях Мужича. На основании источников, содержащих информацию о переселениях на современную хорватскую территорию, автор приходит к выводу, что именем Sclavi(ni) в принципе назывались полиэтничные переселенцы на Балканах. Суммируя результаты антропологических и генетических исследований, автор заключает, что современные хорваты по преимуществу являются потомками автохтонного населения Балкан. Автор доказывает, что хорватский народ возник как новая этническая общность на Балканах этническим соединением и социальным взаимодействием пришедших с севера воинских контингентов «гото-склавинов» и проживавших здесь различных популяций более многочисленных автохтонов.
  4. Постмодерниcтский-постколониальный этнодискурс австралийского исследователя Дэниела Дзино — книга «Becoming Slav, becoming Croat: identity transformations in post-Roman and early medieval Dalmatia» (Leiden; Boston: Brill, 2010). В книге на методологической платформе постмодернизма и конструктивистского подхода к этничности рассматриваются этносоциальные процессы, протекавшие на территории Далмации (Хорватия) в период поздней античности и раннего Средневековья.

<

p>Попробуем подвести промежуточные выводы этих моделей. Ведущие хорватские историки-слависты, а также некоторые российские «хорватоведы» рассматривают процесс генеза славян в виде некоего подобия черного ящика. Напомню: черный ящик — это система, в которой внешнему наблюдению доступны лишь входные и выходные величины, а ее внутреннее устройство и протекающие в ней процессы не известны. В этом смысле, Аварский кагант действительно хорошо подходит на роль «черного ящика». Большинство исторических сведений об Аварском каганате касается лишь его внешней политики (прежде всего, военных действий). Что касается внутреннего устройства этой кочевой империи, то оно по-прежнему остается terra incognita для историков в силу скудности, фрагментарности и противоречивости имеющихся источников о государственно-административном устройстве этого государства. Поэтому приходится либо интерпролировать имеющиеся сведения о социально-политической структуре других кочевых империй (тюрков, гуннов, монголов), либо просто фантазировать.
Согласно мнению Курты и его сторонников, процесс этногенеза славян протекал следующим образом. Где-то в середине 6 века нашей эры некие ещенеславянские сообщества людей попадают в «черный ящик» Аварского каганата. Спустя несколько поколений «инкубации» славянства из черного ящика Аварского каганата выходит некая, как говорили марксисты, «новая сообщность людей». Эта «новая сообщность», nihilnominus Sclavi («ничтожные именем склавины», как выразился один франкский летописец) внезапно (!) появляется в поле зрения византийцев, «выходя из-за тени построенных Юстинианом на Дунае крепостей» (Ф.Курта). Именно им византийцы и дают имя «славян», имя которых потомки разнесут по всей восточной Европе.

Я конечно же понимаю, что перед хорватскими историками перед самым кануном вступления Хорватии в ЕС, был поставлен политический заказ воскресить старые идеи неславянского происхождения хорватов времен младонационалистического иллирического романтизма в новом, постмодернистском исполнении. Перефразируя вышеупомянутого Д.Дзино, суть этого идеологического заказа можно выразить следующим девизом: «Перестанем быть славянами -станем европейцами!». Но зачем так ненавидеть свои корни, cвое происхождение и свои истоки — это мне непонятно.

Этот конструктивистский подход к вопросу этнической идентичности, согласно которому Аварский каганат выступил в роле катализатора этноформирующей реакции, в результате которой миру была явлена славянская идентичность, мне представляется сомнительным. Здесь уместно вспомнить этническую ситуацию в более поздних империях, например в империи Габсбургов, СССР, ту же Югославию времен Броза Тита. Пример СССР особенно поучителен, особенно если мы учтем тот факт, что СССР существовал примерно столько же лет, сколько и власть Аварского каганата на территории современной Хорватии (не больше 70-80 лет). Хорошо известно, что одной из основной задач национальной политики CCCР было создание новой общности людей — «homines sovetici» («советские люди»). Однако как показала история, в процессе крушения империи (также как и в Югославии) этноцентробежные силы не только не исчезли, но скорее даже усилились. Нет никакого основания полагать, что во времена падения Аварского каганата все могло выглядеть иначе.

При сопоставлени этих моделей мы неизбежно сталкиваемся с закономерным вопросом: а что генетика или ДНК-генеалогия могут прояснить в хитросплетениях исторических фактов?  К счастью, многие историки начинают всерьез интересоваться методами популяционной генетики и ДНК-генетика применительно к вопросам этногенеза и миграции отдельных исторических этносообществ. К несчастью, нейтральные выводы генетики зачастую искажаются или подгоняются историками под те априорные модели, которых эти историки придерживаются. Вот, в свете этой переводной статьи хорвата Ивана Мужича, становится ясно, каким образом происходят злостные манипуляции с интерпретацией данных популяционно-генетического анализа. Этот автор придерживается комбинированной модели происхождения хорват (смешивание автохтонов и готов), поэтому он интерпретирует выкладки популяционной генетики по структуре Y-хромосомного генофонда хорват исключительно в свете предпосылки антропологической и генетической приемственности населения Балкан со времен палеолита.

1743460_10203015436016632_1110433635_n
Такие манипуляции нуждаются в опровержении — и именно эту задачу я считаю главной в своем исследовании.

Открытая полемика с историком Носевичем по вопросу о происхождении динарской субклады I2a -часть 3. Интермеццо.

На форуме AFB разместили важную новость которая касается пресловутого «динарского» кластера I2a1b1-L621 (снип включает в себя также и кластер Disles).

Речь идет о результатах теста Geno 2.0 одного поляка из южной Польши.

29.03.2013 известный активист Берни Куллен отрапортовал в Rootsweb-группе Y-DNA-HAPLOGROUP-I:

Я получил результаты Geno 2.0 одного поляка (родом из южной Польши). Он сегодня присоединился к
Проекту I2a на FTDNA, но поскольку он еще не тестировался в FTDNA, его результаты еще не появились на странице нашего проекта.

Но он прислал мне CSV файл со своими результатами, и я сравнил его результаты с результатами 5 других представителей «динарского» кластера I-L621/L147 и одним представителем кластера I-L621 L147-«Disles».

Его результат идентичен результатов других «динариков», с двумя важными исключениями:

у него предковое значение аллели (А) в снипе CTS10228
у него предковое значение аллели (T) в снипе CTS5966

По трем другим снипам CTS10936, CTS11768, CTS4002, его результаты идентичны результатам других динариков:

Примечательно, что у представителя кластера Disles во всех 5 снипах предковые аллели.

Более того, у этого поляка установлено:
1) предковое значение аллеля в снипе, обнаруженном в кластере Disles
2) предковое значение аллеля в снипе, обнаруженном у одного «греческого» динарика,
3) предковое значение аллеля снипа, найденного у одного представителя еврейского субкластера динарского кластера.

Таким образом, поляк принадлежит к ветви динариков, которая наиболее близка к терминальной точки соединяющей генетические линии кластеров Disles и Dinaric.

Что из всего следует?

На мой взгляд эти результаты являются еще одним надежным аргументом в пользу моей версии происхождения динарского кластера (которую я впервые озвучил еще в 2009 году). В свете новых фактов она представляется более предпочтительной, чем классическая балканская версия традиционной попгенетики и «карпийская» гипотеза Носевича.

Открытая полемика с историком Носевичем по вопросу о происхождении динарской субклады I2a

Ув. Вячеслав Носевич! Вы высказали обоснованную критику моих взглядов на происхождение динарского кластера I2a. Считаю  нужным высказать свои встречные возражения. Мои соображения основаны не на голых спекуляциях, а строгих математических формальных методах. Собственно именно наиболее вероятная, парсимоническая трактовка полученных результатов филогенетического и статистического анализа молекулярного разнообразия гаплотипов I2a2 свидетельствует о экспансии этой субклады с территории Карпато-полесского региона. Во-первых, нужно сразу оговорится что коль речь идет о славянах из Восточной Европы, то речь идет не просто о I2a, а о I2a2 — поскольку эта группа практически экслюзивна представлена у славян и их ассимилированных потомков. Далее — о статистическом анализе Остался мой вопрос незамеченым. Так вот, сравнение результатов теста AMOVA по 2 группировкам -лингвистической (популяции объединены в группы по принадлежности к той или иной языковой группе) и антропологической (популяции объединены по принципу генетической близости антропологических признаков)- показывает, что вероятность корреляции разнообразия отдельных этногрупп I2a2 с лингвистическими барьерами выше, чем с антропологическими. Хотя в обоих группировках 98% разнообразия приходится на вариации внутри популяций, однако при анализе статистической значимости вероятность верности нулевой гипотезы (о наличии вариации внутри популяций) равна только 0.005 (0.5%). Поэтому, с точки зрения статистики случайных чисел, следует признать этот результат статистически незначимым, т.е случайным. В процент разнообразия между этногруппами популяции выше именно в лингвистической группировке примерно в два раза -0.20% против 0.10% в антропологической группировке. При этом, в антропологической вероятность верности нулевой гипотезы, т.е. того, что группы этнопопуляций являются разнообразными в плане полиморфизмов Y-STR гаплотипов I2a2a, составляет примерно 14%. В то же время, как вероятность верности нулевой гипотезы о существенном разнообразии Y-STR гаплотипов I2a2a между группами популяций, разбитых по лингвистической близости, примерно в два раза выше и составляет 28%. Следуя полученным стат.результатам, необходимо признать, что I2a2a не являются автохтонами Балкан и Динарских Альп, в противном случае наблюдалась более существенная корреляция между популяцией I2a2a и антротипом. Дуализм антропологических параметров популяций Динарских Альп и языковой принадлежности — хорошо известный исследователям факт. Поскольку популяции I2a2a лучше коррелируют с языком, а не с антротипом, то можно сделать два вывода: 1) экспансия субклада произошла недавно, т.к. не утерялась связь представителей генетической линии с языком 2) поскольку славянские языки были явно привнесены на Балканы, то нужно признать, что I2a2a были в числе генетических линий, представители которых привнесли славянские языки на Балканы. Я проанализировал молекулярное и стандартное разнообразия, а также генетическую дистанцию гаплотипов представителей субклада I2a2-Dinaric. В ходе анализа мною проанализировано 624 «коммерческих» гаплотипа (17-67 маркеров) этого субклада (плюс некоторое количество гаплотипов из научных выборок), разбитых на этнопулы (согласно задекларированной национальности носителя гаплотипа). Комплексный анализ трех параметров позволяет, наряду с филогенетическим анализом, определить место вероятное происхождения субклада, а также предположить характер и степень влияния популяционных эфектов. Вот, к примеру, еврейский кластер с максимальной дистанцией и самым низким разнообразием указывает на недавнее происхождение кластера как следствие чистого эфекта отца-основателя. Боснийско-герцеговинский кластер (второй по величине интерпопуляционной дистанции), но с более высоким уровнем разнообразия указывает на более удаленный эфект основателся популяции. В то время, как те же хорватский кластерI2a2-Din с низким уровнем разнообразия, но с незначительной дистанцией от других популяций -следствие кумулятивного результата пресловутых популяционных эфектов основателя и бутылочного горлышка.

Ответ В.Носевича:

«Вадим, спасибо за ссылки! Это обсуждение я раньше не видел. Теперь Ваша позиция мне ясна, и я могу ее прокомментировать. Прежде всего хочу сказать, что отчасти Ваши претензии порождены недоразумением. Вам показалось, что я — сторонник происхождения динарского кластера из «ледникового убежища». Но перечитайте внимательнее мой текст — я этого вовсе не утверждаю, пишу только о неолитических культурах на местном мезолитическом субстрате. Почему мезолитическом? Да потому, что неолит анатолийского происхождения не мог содержать I2a. Уже установлено, что его представители имели G2a и E1b-V13, продолжают дискутироваться J2 и R1b, но никак не I2a. Чтобы избежать дальнейших недоразумений, и учитывая то, что Вы сделали эту дискуссию общедоступной, я постараюсь оговаривать даже очевидные вещи. Заранее прошу прощения, если что-то покажется тривиальным. Только не называйте меня профессором — я уж больше 20 лет простой кандидат наук, и им, наверное, умру. Во всяком случае, не испытываю потребности тратить время на защиту докторской или на доказывание кому-то, что достоин присвоения ученого звания. Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a. Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2. Ее более поздним ответвлением, видимо, являются мутации L147.4 и L343. Произошли они до формирования динарского кластера или после — пока неясно, поскольку определены они у считанного числа индивидов. Но L147.2 выявлена, помимо славян, у как минимум одного англичанина (его Kit Number в соответствующем FTDNA-проекте — 14703), двух немев (162426 и 164573), одного итальянца (93943) и одного еврея из Литвы (211949), а L147.4 и L343 — только у славян: двух поляков (209633 и 76814) и боснийца (154978). При этом никого с L147.2+ на L147.4 и L343 не тестировали. За последнее время, может, что-то изменилось, с весны не заглядывал на их сайт. Я целиком согласен, что ветвь эта — очень молодая, и потому никак не могла сформироваться в динарском «ледниковом убежище». Говорить уверенно про 2-3 тысячи лет я бы не рискнул, но что не ледниковая эпоха, и даже не мезолит — это точно. Это не значит, что на Балканах, или где-то еще в Европе, в палеолите и мезолите не могло быть любой концентрации предковой M423. Но это значит, что прародитель всех миллионов нынешних «динарцев» тогда в каждом поколении был представлен строго одним индивидом, притом мутациям L147.2, L147.4, L343, а может даже и L621/S392 еще предстояло появиться у его весьма отдаленных потомков. Не будет гадать, где именно вилась эта ниточка на протяжении тысячелетий. Важно, что однажды она начала разрастаться. В большинстве случаев такие вещи связаны с неолитической революцией. Именно тогда сформировались зародыши современных огромных кластеров. В эпохи энеолита – бронзы они сильно перемешались, и все последующие случаи быстрого разрастания популяций приводили к росту не одной линии, а своеобразного ассорти из нескольких коррелирующих. Именно так случилось у славян: доминирует у них вовсе не одна R1a1, как по старинке думают многие, а целый «ассорти» из нескольких параллельных ветвей: M458 (на уровне от 5 до 10 %), ее дочерняя L260/S222 (от 2-3 до 10 %, а у поляков – более 13), примерно пять ветвей S466/Z280 (от 1 до 10 % каждая). В сумме это и дает знаменитые 50 и более % R1a1. Сопоставимая с ними по возрасту I2a3а-L147.2 на этом фоне – безусловный лидер, самая массовая славянская гаплогруппа, представленная в большинстве популяций на уровне порядка 10-20%, а у сербов и хорватов — выше 30%. Нас обоих интересует, когда и каким образом она влилась в славянский генофонд – ведь у предков славян в бронзовом веке, похоже, ее не было совсем (иначе она была бы не только у славян, но и у их ближайших родственников балтов). В Вашем статистическом анализе сделана попытка прояснить этот вопрос. Примем пока, что методологически там все верно и результаты заслуживают полного доверия. Суть их вы выразили картинкой со стрелками. Непонятно только одно: почему Вы называете прародину карпато-ПОЛЕССКОЙ, если у Вас четко видны стрелки, ведущие с Карпат в сторону Полесья. Если же убрать слово «полесская», то не так уж велика становится разница с моей карпато-балканской (особенно учитывая зигзаг в Словению). Вот динарским называть этот кластер действительно не стоит. В дальнейшем, чтобы не было путаницы с географическим понятием «карпатский», буду пользоваться термином «карпийский». Звучит, по-моему, не хуже, чем «арийский» smile На этом, к сожалению, трогательное единодушие кончается. Справедливо обвиняя оппонентов в недооценке разнообразия гаплотипов, Вы недооцениваете их апелляцию к относительной частоте гаплогрупп. Поясню это буквально на пальцах. Представим себе две чаши, в которых перемешаны в разной пропорции черные и белые шарики. Будем с закрытыми глазами черпать по жмене шариков из каждой чаши и высыпать в третью (это у меня такая модель смешения популяций). Суть в том, что, если шариков достаточно много и они действительно хорошо перемешаны, то Вы никогда не получите в третьей чаше концентрацию шариков одного цвета выше, чем в одной из исходных – все значения будут только промежуточными. Думаю, Вы поняли аналогию: исходная праславянская популяция с концентрацией карпийцев ниже 30 % может дать частоты, характерные для сербов и хорватов, только смешиваясь с субстратом, у которого эта концентрация гораздо выше. Это правило может нарушаться, если шарики плохо перемешаны. На одном краю чаши лежат почти одни черные, и если зачерпнуть оттуда, в третьей чаше черных окажется больше, чем в среднем в каждой из исходных. Применительно к популяциям это означает, что одна из исходных была гетерогенной. Говоря словами незабвенного Владимира Вольфовича, в числе русских там числятся и сыновья «журналистов». Притом их не просто много, а они компактно сконцентрированы в зоне будущего контакта с другой популяцией. Возможна ли такая ситуация в пражской культуре? Учитывая степень ее археологической однородности – маловероятно, но чем черт не шутит. В предыдущем посте я перечислил возможных кандидатов на роль «сыновей журналистов». Методом исключения к карпийскому кластеру могли принадлежать только потомки даков или чернолесского субстрата лесостепных скифов. Мы приходим к тому же, что Вам не понравилось в моей статье – у фракийцев концентрация карпийского кластера была порядка 40 %, и к славянам он попал именно от них. Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы. Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье. Если есть возражения – пишите, обсудим. Если хотите – могу пройтись и по методологии Вашего статанализа, там тоже не все просто. ********* А что касается разрастания, то Вы применяете тот тип моделирования (по методу Монте-Карло), с которого я начинал еще в 80-е. Поэтому я хорошо представляю, насколько он чувствителен к исходным посылкам. К тому же в стохастическом процессе бессмысленно говорить о темпах экспансии конкретной субклады — существует лишь распределение вероятностей от полного вымирания до предельной экспансии (вариант хромосомного Адама). Место реальной клады в этом распределении вычислить нельзя в принципе. Можно лишь показать, что данный темп экспансии при принятых допущениях возможен или исключен, только и всего.»

Ответ оппоненту и критика версии происхождения гаплогруппы I2 в изложении академической популяционной генетики:

«Вам показалось, что я — сторонник происхождения динарского кластера из «ледникового убежища». Но перечитайте внимательнее мой текст — я этого вовсе не утверждаю, пишу только о неолитических культурах на местном мезолитическом субстрате. Почему мезолитическом? Да потому, что неолит анатолийского происхождения не мог содержать I2a. Уже установлено, что его представители имели G2a и E1b-V13, продолжают дискутироваться J2 и R1b, но никак не I2a.”

По этому пункту вряд ли можно что-то возразить. Однако в целях научной педантичности необходимо сделать пару поправок. Во-первых, вопрос о том, могла ли быть I2a привнесена в Европу в ходе неолитической демагрофической революции никогда и ни кем всерьез не ставился. Статья о I2 в русской Википедии была написана любителями, и в плане содержащейся в ней информации значительно устарела. Поэтому Вы правильно сделали, что даже не стали обсуждать содержащиеся в этой статьей ложные и трудноверифицируемые выводы о том, что “носители культуры Балканского неолита (в том числе и Трипольской культуры). Последний тезис подтверждается тем фактом, что как балканский неолит является развитием ближневосточного, так и балканская гаплогруппа I родственна ближневосточной гаплогруппе J, хотя данные об их расхождении разнятся.” Тут следует сделать небольшой экскурс в прошлое. В самом начале систематического изучения вариативности человеческой Y-хромосомы в контексте масштабных популяционных передвижениях, в работах таких маститых ученых с мировым именем, как Андерхилл (2007) и Роотси(2004) была выдвинут простая, но по тем временам крайне убедительная гипотеза “трех рефугиумов”. Это теперь не вызывает никакого сомнения, что эта нашумевшая гипотеза “трех гаплогруппных рефугиумов” была частично сознательной уловкой с целью адаптации нового знания под уже устоявшиеся взгляды последователей отца-основателя популяционной генетики Л.Кавалли-Сфорца. А тогда эта новая теория была воспринята как догма, и как не прискорбно многие из популяционных генетиков продолжают ей следовать. Согласно этой теории, предки современных носителей гаплогруппы I пережили неблагоприятный период последнего ледникового периода в динарско-балканском рефугиуме. А аргументировали свое заключение отцы игрек-хромосомоведения крайне простым силлогизмом – присутствие I на Балканах во времена столь глубокой древности якобы маркировано уже тем фактом, что I и сейчас очень много. Разумеется, о дальнейшей детализации гаплогрупп и разбиении на субклады на момент написания статьи не могло быть и речи (красноречивым фактом служит хотя бы то, что гаплогруппа I2a не детализировалась ниже уровня снипа P37.2). C появилась целая группа деклассированных антропологов-подпевал, которые стали петь дифирамбы гению попгенетиков – вот мол, какой убедительный аргумент в пользу антропологической приемственности населения Балкан дали нам в руки генетики. Авторитет вышеупомянутого коллектива авторов был столь велик, что это удивительное в своей примитивности умозаключение на протяжении последущих 8-10 лет перекочевывал из одной статьи в другую, пока окончательно не оформился в виде неоспоримого догмата. Казалось бы — любое научное знание принципиально не является окончательным, а есть лишь промежуточная интерпретация истины, подразумевающая последующую замену на лучшую интерпретацию. Однако прочитав последную статью хорватских ученных о гаплогруппной вариативности населения Хорватии, я – к своему глубокому прискорбию – еще раз убедился, что мои наихудшие опасения насчет феноменальной косности научного мышления оправдались. В самых дурных традициях квазиакадемического стиля, идеологически анагажированные хорватские генетики продолжают разглагольствовать о “палеолитической балканской гаплогруппе I”. А из научно-популярной заметке (по своей сути, кратком реферате статьи) в сплитской газете благодарный хорватский обыватель узнает о том, что хорваты – это древнейший автохтонный народ Европы. Так-то!

Вячеслав Леонидович, Будем считать предыдущее сообщение пролегоменами к критике научных представлений о субкладе I2a, и поэтому перейдем к фактологической составляющей Ваших утверждений:

Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a.»

Во избежание возможных смысловых экивоков, сразу же предлагаю отказаться от дальнейшей «динаризации» субклады, которую мы будем обсуждать. «Динарский кластер» — это собрикет, придуманный Кеном Нордведтом для обозначения той ветви I2, которая в дальнейшем получит официальное ISOGG название I2a1b3 (L621/S392, что идентично в старой версии I2a2a). Динарский кластер целиком входит в состав этого субклада, являя собой монофилетический таксон. В профессиональной литературе этим термином никто не пользовался и никогда не будет пользоваться. Это хорошо, поскольку у непосвященного в таинства молекулярной антропологии этот собрикет может вызвать ложные аллюзии с «динарским антропологическим типом».

«Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2.»

В этом предложении сразу две фактологические ошибки. Мутация M423 маркирует не I2a1b3, а ее родительскую группу I2a1b. Строго говоря, последняя делится на четыре ветви: a) гипотетический корень I2a1b* b) упомянутая в статье 2002 года I2a1b1 M359.2/P41.2 (хотя до сих пор НИКТО не видел ни одного реального гаплотипа этой группы) c) I2a1b2 L161.1/S185 d) I2a1b3 L621/S392 Две последние ветви I2a1b2 и I2a1b3 имеют строго определенный эксклюзивный ареал распространения, практически не пересекающийся друг с другом. I2a1b2 представлена, в основной своей массе, на Британских островах (отсюда и название «I2a-Isles», данное все тем же «крестным отцом» Нордведтом. Я не буду пока останавливаться на этой ветви и перейду к непосредственно интересующей нас I2a1b3 L621/S392. Здесь следует указать на Вашу вторую ошибку -| Как показало WTY-тестирование, мутация L621/S392 определяет СВОДНУЮ группу, состоящего как из ДИНАРСКОГО кластера, так и кластера DISLES (не знаю как перевести это на русский) — промежуточного между ДИНАРСКИМ и ОСТРОВНЫМ кластерами.

Ее более поздним ответвлением, видимо, являются >мутации L147.4 и L343.»

Это умозрительно. Во-первых, снип L147 [+] встречается в разных группах. Об этом я уже раньше упоминал, причем в IJ он встречается в разных субгаплогруппах аж 3 раз. Такие вотильные снипы не могут быть основанием для надежной филогении. Ergo, мы не можем говорить о том что этот снип разбивает ветвь на надежные в плане исторической интерполяции ветви. Почему существуют такие снипы, никто не смог внятно объяснить ни с позиций генетики, ни молекулярной биологии. То же самое касается L343, которые был выявлен также и у некоторых членов гаплогруппы I1.

Произошли они до формирования динарского >кластера или после — пока неясно, поскольку >определены они у считанного числа индивидов. Но >L147.2 выявлена, помимо славян, у как минимум >одного англичанина (его Kit Number в >соответствующем FTDNA-проекте — 14703), двух >немев (162426 и 164573), одного итальянца (93943) >и одного еврея из Литвы (211949), а L147.4 и L343 — >только у славян: двух поляков (209633 и 76814) и >боснийца (154978). При этом никого с L147.2+ на >L147.4 и L343 не тестировали.

Cм.выше.

Я целиком согласен, что ветвь эта — очень молодая, >и потому никак не могла сформироваться в >динарском «ледниковом убежище».

Говорить уверенно про 2-3 тысячи лет я бы не рискнул, но что не ледниковая эпоха, и даже не мезолит — это точно. Это не значит, что на Балканах, или где-то еще в Европе, в палеолите и мезолите не могло быть любой концентрации предковой M423. Но это значит, что прародитель всех миллионов нынешних «динарцев» тогда в каждом поколении был представлен строго одним индивидом, притом мутациям L147.2, L147.4, L343, а может даже и L621/S392 еще предстояло появиться у его весьма отдаленных потомков. Не будет гадать, где именно вилась эта ниточка на протяжении тысячелетий. Важно, что однажды она начала разрастаться. В большинстве случаев такие вещи связаны с неолитической революцией. Именно тогда сформировались зародыши современных огромных кластеров. В эпохи энеолита – бронзы они сильно перемешались, и все последующие случаи быстрого разрастания популяций приводили к росту не одной линии, а своеобразного ассорти из нескольких коррелирующих. » Не совсем так. Вы пишите, что в большінстве cлучаев экспансия гаплогрупп связана с неолитической революцией. Это не совсем верно. Поскольку размер эффективной популяции для Y-хромосомы в тысячи раз меньше аналогичной для аутосомных хромосом. Это означает что рост численности Y-хромосомной гаплогруппы или кластера может происходит относительно быстро и так же стремительно снижаться. Особенно если речь идет об относительно закрытом сообществе. Этот вопрос был неплохо изучен в известной статье «Y-хромосома как сигнатура гегемонии».

Уважаемый Вячеслав Леонидович! Еще раз прокомментирую Ваш комментарий:

«Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a. Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2»

Про M423 я уже писал ранее в предыдущих комментариях. Что касается L621, то я не вижу особой филогентической полезности мутации для I2a1b3. Она (мутация) не разбивает кладу на субклады, соответствующие выявленным ранее кластерам Din-N или Din-S этой клады.Польза этой мутации может быть только в том, что он может заменить нынешную мутацию L69.2, которая была найдена и в других группах (о чем и свидетельствует цифра два после точки). Примерно год назад я обсуждал результаты теста WTY Y-хромосомы одного из представителей I2a1b3 — пана Станислава Плевако.Не вдаваясь в технические сложности, тест WTY можно описать как прочитку значительной части игрек-хромосомы. Когда я поинтересовался результатами, он сказал что сравнение результата Добсона (из «южно-динарского» кластера) и результата Плевако ( из «северо -динарского» кластера) не выявило ни одной разницы на больше 900 локусов и 215.000 нуклеотидов проведенного сиквенса игрек-хромосомы. Отрицательный результат по этому снипу у другого участника WTY Roy Hale из братской клады I2a2b Isles (L161) сузил снип L621 до 3 кластеров: южно-динарского, северно-динарского и кластера Disles («динарцы на Британских островах»). Поэтому можно считать L621 эквивалентом L69.2 — мутации, которая не отвечает критериям включения кладообразующих мутаций в официальное филогенетическое дерево ISOGG. Чуть позже результаты еще двух I2a1b3 — Пейовича из Черногории и Любинецкого из Польши (76814 Poland – Lubiniecki — I2a2 (M423+, L161-)) подтвердили верность предыдущего умозаключения. Далее Вы пишите:

Сопоставимая с ними по возрасту I2a3а-L147.2 на этом фоне – безусловный лидер, самая массовая славянская гаплогруппа, представленная в большинстве популяций на уровне порядка 10-20%, а у сербов и хорватов — выше 30%. Нас обоих интересует, когда и каким образом она влилась в славянский генофонд – ведь у предков славян в бронзовом веке, похоже, ее не было совсем (иначе она была бы не только у славян, но и у их ближайших родственников балтов)<…>На этом, к сожалению, трогательное единодушие кончается. Справедливо обвиняя оппонентов в недооценке разнообразия гаплотипов, Вы недооцениваете их апелляцию к относительной частоте гаплогрупп.»

Вы повторяете одну из главных ошибок новичков в молекулярной генеалогии, а именно основываете свои выводы на данных о частотах распространения гаплогрупп. Все делали эту ошибку, и я в том числе. Однако, как показал еще Животовский в своей известной работе: «географическое происхождение гаплогрупп Y-хромосомы можно установить по следующему эмпирическому критерию: в том месте или популяции, где возникла данная гаплогруппа, ее частота и STR-дисперсия (или возраст STR-изменчивости) максимальны по сравнению с другими популяциями (Sengupta et al., 2006). При их несовпадении (когда максимум частоты гаплогруппы приходится на один географический регион, а максимум дисперсии – на другой), место возникновения гаплогруппы становится неопределенным, но при необходимости сделать предварительное заключение предпочтение следует отдавать дисперсии как статистически и эволюционно более устойчивому показателю.» Случай с I2a1b3 -это как раз тот самый случай, когда один из пиков-максимумов приходится на Боснию-Герцеговину, а максимум дисперсии на Карпатский регион (см.мои расчеты). Следуя правилу правой руки в изложении Животовского, следует предпочесть последний вариант, так как частоты гаплогрупп больше подвергнуты флуктуациям. Далее, вторая ошибка новичков, которая встречается в Ваших тезисах, это игнорирование масштабов (Masstabe) регионов, сравниваемых по частотам гаплогрупп. Хорошо, давайте возьмем нижний порог частот по допустим, что в среднем в Польше 56% R1a1 и 10% I2a1b (хотя в зависимости от региона Польши и характера выборки статистика сильно плавает). По состоянию на 2000 год в Польше проживало 38 559 110, пусть из них половина мужчин 19279555, то 10% I2a1b это 2 млн.человек. В Хорватии население 4.496.000 или 2.24 млн мужчин, из них пусть 32% (716 800 человек будет I2a1b1). Аналогично, у сербов в среднем должно быть около 1 млн человек субклады I2a1b1. Наконец, в БиГ с пресловутым пиком I2a1b1 по разным оценкам до 60% должно проживать около 1.5 млн представителей I2a2. Вы наверное удивитесь, но я видел десятки людей приходящих на зарубежные форумы с такими же представлениями о I2a1b1. Даже ссылки давались на те же самые карты, соотношение R1a1/I2a (который один из «мудрецов» на DNAforums обозначил как коэффициент славянскости). Правда, практически все они были убеждены в конце концов в моей правоте. Какими способами можно определить гипотетический расклад гаплогруппа у исторических и доисторических народов? Существует три апробированных способа. I.Первый способ — самый надежный, так как базируется на материальных доказательствах (то есть древней ДНК, извлеченнной из археологических специменов). Какое новое знание — о распределении гаплогрупп на Балканах в течении последних нескольких тысяч лет — может дать этот метод? Исходя из данных о «ископаемых» Y-гаплогруппах в неолите (включая генотипирование знаменитой мумии Отци), можно уверено предположить, что они были представлены гаплогруппами G2a, E1b, J2b, J2a, R1b1b2 — то есть теми гаплогруппами, которые связываются с цивилизациями «старой Европы» (с) Гимбутас и более широко с неолитической демографической революцией и миграциями времен бронзового века в Европе.Я же полагаю, что «иллирийцы» тех времен были prima facie представителями субклад J2a1, J2b,E1b1b1a (особенно E1b1b1a2 (E-V13)), субклад G2a (особенно G2a3a), субкладов R1b1b2 (особенно R1b1b2a1a2d) и так далее. Ядро гаплогрупп балканских гаплогрупп времен бронзы по мере убывания могло выглядеть следущим образом:E1b1b1a2, J2b2, J2b1, G2a3, R1b1b2a1a,J2a4, J2b1. Последние работы по анализу древнего ДНК извлеченных из останков в неолитических захоронениях только подтвердили эту гипотезу — там в основном были E1b1b и G2a. То, что сейчас у югославов эти группы в меньшинстве явно объясняется мощным «бутылочным горлышком» времен аварского каганата. II. Второй способ — состоит в интерполяции состава и распространения гаплогрупп в изолированной «потомковой популяции» на распространение гаплогрупп в предковой популяции. Этот способ был использован в недавней статье о гаплогруппах арберешей — потомков албанцев, мигрировавшей в средние века в Италию, где они образовали изолированную группу. Чтобы освежить Вашу память, напомню, что албанцы считаются прямыми потомками иллирийцев. На основании анализа выборки было показано, что вышеупомянутые неолитические балканские гаплогруппы у арберешей по своему распределению соответсвуют современному раскладу этих гаплогрупп на Балканах. В то время как %I2a у арберешей гораздо ниже как среднего % I2a у албанских популяций, так и средней частоты распространения I2a на Балканах. О чем это говорит? О том, что I2а — (относительно) недавние пришельцы на Балканах. Далее, оценка возраста «югославских кластеров» показывает, что они все не «старше» 1400-1500 лет до настоящего времени, что означает бурную экспансию субклада в 5-6 веках н.э. III Третий cпособ -наиболее уязвимый, т.к. строится на филогенетической и статистической обработке массива гаплотипов, оценки возраста БОПа, оценки молекулярного разнообразия, оценки структуры и качества филогенетического дерева и т.д. Я построил десятки тысяч деревей субклада I2a2, а также оценил молекулярное разнообразие субклада I2a2, который оказался близким к % разнообразия из статьи Перчич. Структура дерева, в котором «северные» I2a2-Din находятся ближе к корню, чем «югославы», — а также более высокое молекулярное разнообразие I2a2-Din на севере Восточной Европы достаточно точно свидетельствуют о том, что прародина I2a2 находилась именно в это месте.

Ответ Вячеслава Носевича:

Я не буду в очередной раз комментировать Ваши опровержения моих якобы ошибок, которые происходят от недопонимания того, что я пытался сказать. Это не затрагивает сути обсуждаемой темы. А в ней я вижу два важных аспекта, свою позицию по которым хочу прояснить.Первый аспект связан с определением возраста клады по разнообразию гаплотипов. Почему он оказался столь ненадежным, что Диенекес, например, вообще в нем разочаровался? Дело не в математике как таковой, и не в скорости мутаций. Дело в особенностях ветвящегося случайного процесса, который это разнообразие порождает. Его простота обманчива. На начальной стадии роста клады он легко моделируется по методу Монте-Карло. Клада растет практически независимо от динамики популяции в целом, а если популяция невелика и относительно стабильна (в каменном веке они почти все были такими), то рано или поздно численность «удачливой» клады приближается к эффективной численности популяции. Это – предельный случай генетического дрейфа, когда клада заполняет чуть ли не всю популяцию (реальные примеры описаны у малых народов Сибири, в горных долинах Дагестана, частично этому соответствует и понравившаяся Вам статья про О’Нейлов). Гаплотипы при этом образуют четкий «стар-кластер», в котором модальным является исходных гаплотип разросшейся клады. Соответственно и ее гаплогруппа абсолютно доминирует. Зная скорость мутаций в локусах и измерив частоту гаплотипов, мы можем точно определить возраст клады.А дальше – самое важное. Рост численности разросшейся клады и популяции в целом перестает быть независимым – это очевидно. Что произойдет, если популяция вдруг начнет расти, и даже распадется на несколько дочерних, относительно изолированных? Разросшейся кладе расти уже некуда, начинается рост дочерних. А поскольку наиболее велика частота гаплотипов, близких к исходному (это ощущается тем сильнее, чем меньшее число локусов мы учитываем), то большинство этих дочерних клад имеют именно такие гаплотипы основателей. Все они порождают новые стар-кластеры, которые почти целиком перекрываются и внешне сливаются в один. Число маргинальных гаплотипов становится аномально низким, а близких к исходному – аномально высоким по сравнению с предсказанием модели, предполагающий стабильную численность популяции или равномерный рост.Все. Теперь сколько бы мы ни измеряли частоту гаплотипов и в какие статпакеты ее ни засовывали, получаемый возраст будет фиктивным (заниженным). А если рост популяций будет пульсирующим (по циклу разрастание – остановка=дрейф – разрастание), то в большинстве из них будет тысячелетиями воспроизводиться исходный стар-кластер, и лишь в некоторых его основой могут стать маргинальные гаплотипы, сильно удалившиеся от исходного.Хотите реальные подтверждения? Самое яркое – гаплогруппа R1b1. Кластеры U106 и P312, разошедшиеся порядка 10 тыс. лет назад, до сих пор практически неразличимы по частоте гаплотипов, а модальные крайне близки что по 67 локусам, что по 102. Столь же близок модальный у предковой L11*, от которой они отпочковались еще раньше. А вот одна из дочерних клад, ирландская М222 (по-моему, именно на нее наткнулись исследователи О’Нейлов) образовалась вокруг одного из маргинальных гаплотипов. По любому методу расчетов точка ее ответвления окажется старше, чем точка расхождения U106 и P312, хотя реально она примерно вдвое их моложе!Аналогичный случай – с индийской R1a1-Z93 и европейской R1a1-Z83. Разошлись они, по моим оценкам, примерно 9 тыс. лет назад, а столь «обожаемый» Вами Клёсов вычислил вдвое меньший возраст. А на примере с E1-V13 погорел Диенекес (как и тот же Клёсов), когда ее возраст в ископаемой ДНК тоже оказался вдвое старше расчетного.Если есть мнение на этот счет – высказывайте. А про второй аспект напишу в следующий раз.

А что тут комментировать? Описанные Вами феномены хорошо известны всем исследователям — как профессиональным попгенетикам, так и любителям. Вы еще забыли добавить сюда полный раздрай в плане определения скоростей мутаций (об этом писал еще почти 10 лет назад Животовский в своих основопологающих статьях о микросателлитной изменчивости и эволюционных скоростях мутаций). Но все это относится к вопросам определения TMRCA и опосредованно к определению дисперсии.
Филогенетический анализ основан на других принципах, и по этому Ваше глубокое замечание интересно, но имеет отдаленное отношение к предмету дискуссии.

Теперь, уважаемый Вячеслав Леонидович, перейдем к анализу НАИБОЛЕЕ важного (как мне представляется) аспекта Вашей теории:

Непонятно только одно: почему Вы называете прародину карпато-ПОЛЕССКОЙ, если у Вас четко видны стрелки, ведущие с Карпат в сторону Полесья. Если же убрать слово «полесская», то не так уж велика становится разница с моей карпато-балканской (особенно учитывая зигзаг в Словению). Вот динарским называть этот кластер действительно не стоит. В дальнейшем, чтобы не было путаницы с географическим понятием «карпатский», буду пользоваться термином «карпийский» <…> Думаю, Вы поняли аналогию: исходная праславянская популяция с концентрацией карпийцев ниже 30 % может дать частоты, характерные для сербов и хорватов, только смешиваясь с субстратом, у которого эта концентрация гораздо выше. <…> Возможна ли такая ситуация в пражской культуре? Учитывая степень ее археологической однородности – маловероятно, но чем черт не шутит. В предыдущем посте я перечислил возможных кандидатов на роль «сыновей журналистов». Методом исключения к карпийскому кластеру могли принадлежать только потомки даков или чернолесского субстрата лесостепных скифов. Мы приходим к тому же, что Вам не понравилось в моей статье – у фракийцев концентрация карпийского кластера была порядка 40 %, и к славянам он попал именно от них.Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы. Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье.»

На мой любительский взгляд «карпийская часть» Ваших рассуждений представляет собой наиболее уязвимую часть Вашей внешне стройной концепции. Я намерено выношу за скобки нашей дискусии Ваши примеры с «журналистами» и «шариками». Я также не буду обсуждать здесь корреляции с археологическими культурами, языками, а также теорию балто-славянской общности. Во-первых, я считаю себя недостаточно компетентным в этих вопросах, а во-вторых — это займет слишком много места. Скажу лишь что проблема грамотной аппроксимации результатов генетических исследований и всего огромного массива наработок лингвистики, этнографии и археологии по вопросу этногенеза славян — это дело будущего и потребует много лет вдумчивого системного анализа. Что касается присутствия в названии слово «полесский», то оно носит арбитрарный характер, и вовсе не означат что предковая популяция I2a1b3 «существовала» изначально в Полесье. По моим скромным представлениями она вышла на популяционный уровень где-то между Карпатами и Полесьем. Отсюда и двойное название. Я лишь останавлюсь на тех моментах, которые мне представляются наиболее спорными:

  • 1) тезис о (гаплогруппной) однородности протославян — мне кажется что это очень слабый тезис, так как последние исследования генофонда неолитических культур Европы показали, что они были далеко неоднородны. Элементарная логика подсказывает, что в бронзовом веке и позднее степень смешения должна была только увеличится. Поэтому возможны альтернативные точки зрения. Например, задумывались ли Вы о том, что «ассимиляция» или «слияние» общностей представителей кладов R1a и I2a1b3 могла произойти еще до времени возникновения «славянской» общности.
  • интерполяция современных частот гаплогрупп — манипуляции с современными частотами в целях реконструкции гипотетических частот распространения в генофонде древних народов также вызывают закономерные вопросы. По-крайней мере, подобные эксперименты возможны только исходя из генетических данных полученных в результате анализа останков из захоронений соотвествующих культур или народностей. В противном случае расчеты совершено произвольны, и им нельзя доверять. Вот наглядный пример. В 2011 году вышла интересная статья «Linking Italy and the Balkans. A Y-chromosome perspective from the Arbereshe of Calabria.» Boattini A, Luiselli D, Sazzini M, Useli A, Tagarelli G, Pettener D. В работе исследовалась популяция арберешей в Калабрии. По мнению авторов игрек-хромосомный генофонд арберешей должен отражать состояние игрек-хромосомного предкового генофонда алабанцев 500 лет назад. В числе прочего авторы приходят к интересным выводам: » Intra-haplogroup analyses suggest that this area may have experienced important changes in the last five centuries, resulting in a marked increase in the frequency of haplogroups I2a and J2.» Предложенная в статье интерпретация популяции Arbereshe как архетипа (proxy) первоначального албанского населения приводит нас к выводу, что ветвь I2a1b3 встречался в южной части Балканского полуострова 500 лет назад гораздо реже, чем сейчас. Как Вы видите — в ходе дальнейших миграций %-ная доля нескольких групп не только не уменшился, а наоборот, увеличился.
  • тезис о связи доисторических носителей I2a1b3 с фрако-дакийцами — также представляется мне совершено надуманным. Признаюсь, Вы не первый кто постулировал такой тезис — еще 2 года назад я встречал подобные рассуждения на международных форумах и обычно такие идеи озвучивали румыны и некоторые болгары. Говорили о положительной корреляции ареала I2a1b с фракийским племенами, в том числе костобоками и карпами. Были и альтернативные суждения о связи с миграциями бастарнами и пр. Слабость таких рассуждений очевидна — даже если мы будем исходить из реконструкции предковых частот, то будем вынуждены признать, что I2a1b вряд ли могла присутствовать в столь значительных количествах у фракийцев, так как у болгаров и румын как частоты распространения, так и уровень дисперсии гаплотипов I2a1b значительно ниже чем у тех же словаков и западных украинцев.

Вячеслав Носевич:

«задумывались ли Вы о том, что «ассимиляция» или «слияние» общностей представителей кладов R1a и I2a1b3 могла произойти еще до времени возникновения «славянской» общности.» Не только задумывался, но и описал 3 года назад как один из возможных вариантов проникновения I2a1b: венетский клад слился с уже трижды ассимилированными до того потомками чернолесцев (первый раз — они стали скифами, второй — милоградцами-неврами, третий — бастарнами). Собственно, с Вашего несогласия с этим пунктом и началась наша дискуссия. И теперь вы предъявляете его мне как опровержение меня… Но меня пока еще не убедили, что этот компонент складывающегося славянства достаточен для объяснения наличия I2a1 у румын и хорватов. Вот если разберемся с дисперсией в сербохорватской и белорусо-украино-польской частях кластера, может, куда-то и продвинемся. А пока у меня ощущения, что дискуссия начала ходить кругами.

Уважаемый Вячеслав Леонидович! Вы пишете:

«Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы.» Это весьма сильное заявление и нуждается в подробном анализе. Я воспользуюсь свомими заметками и заметками некоторых активистов форума Молген, в частности уважаемого Вячеслава Малиновского. В известной статье Перичич опубликованны данные только по I-37 в целом , причем в качестве исследованных регионов у Перичич были указаны материковая Хорватия и четыре острова, а не Долмация в целом. Если же вы говорите, что все хорваты к примеру это «почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы, то по идее у них должны быть примерно тот же расклад по гаплогруппам что и например у болгар. Например, y герцеговинских хорват 71,1% I2a2, в отличии от местных сербов -31% и босняков 43,5%. И пресловутой R1b там у хорватов 2%, а у сербов 6%, а вот Е у сербов как и везде за 20%, а у хорватов 9%(больше чем в других хорватских регионах, но все-таки в 2 раза меньше чем у сербов). У болгар: 16% E1b1b 1% G2a 3% I1 20% I2a 1% I2b 20% J2 1% Q 18% R1a 18% R1b 1% T Кроме того, болгары в отличие большинство других балканцев (в первую очередь хорватов) преимуществено I2a1b3-«cеверные динарки». В этом смысле они гораздо ближе полякам и украинцам.

Далее, Вы пишете, что:

«Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье.»

Это интересное, но весьма спорное утверждение, так как оно предполагает некое автохтонное присутствие I2a1b3 на территории Сербии и Хорватии к приходу славян. Тут сразу возникает ряд несостыковок. Если под автохтоностью I2a2 на Балканах подразумевается размещение «прародины» этой гаплогруппы на Балканах, то я категорически несогласен. В противном случае, я вполне согласен рассматривать югославских I2a2 как автохтонов Балкан, с той лишь оговоркой, что эти «автохтоны» появились на Балканах не ранее 6-7 веков н.э., вскоре после того как авары «зачистили» местное автохтонное население. Лично для меня совершенно очевидно, что по Y-гаплогруппному составу население Далмации,Иллирика времен римского господства коренным образом отличается от населения этих же земель после славянского завоевания. Между прочим, вот Вам интересный факт для размышления. Историкам хорошо известен период римской истории, который носит название период иллирийских императоров. Формально он начинается от смерти Галлиена (268 г. н. э.) до начала правления Диоклетиана и предшествует периоду домината. На самом деле же сам Диоклетиан, а также пришедшая к власти династия Флавиев, так же как и ряд позднейших императоров были выходцами из Иллирика, Паннонии, Далмации, Сирмии, Мезии( это нын.Хорватия,Босния,Сербия,Болгария). Очевидно, что кроме императоров и солдат, эти провинции поставляли в Рим и гражданскую администрацию, и самое главное — огромную массу обслуживающего персонала). Известно также, что иллирийские императоры (правившие Римом в 3-4 веках), подобно современным албанцам, черногорцам и т.д, практиковали клановую систему. Известно множество случаев, когда после головокружительной карьеры и прихода к власти после военных переворотов, эти парни из балканских деревушок перевозили в Италию своих родственников целыми кланами и деревнями. А теперь внимание, вопрос знатокам — ежели мы допускаем, что локальный пик частотного распределения гаплогруппы I2a2 на Балканах существовал в неизменном состоянии испокон веков (хотя бы со времен LGM), то логично было бы допустить наличие подобных локальных пиков частотности I2a2 и в самой Италии. Почему же мы его не видим? (про сардинскую группу I2a1 просьба в ответе не упоминать, так как это отдельная песня). С одной стороны имеем Боснию-Герцеговину с максимальным пиком % гаплогруппы I2a1b3. C другой стороны, по историческим источникам выходит, что эти страны запустели под (например под, аварским правлением и были заселены вновь прибывшими с Карпат славянами. С другой стороны — по мнению попгенетиков, I2a1b3 все время проживали на этой территории со времен последнего ледникового максимума. По моему мнению, последние явно ошибаются.

Комментарий Вячеслава Малиновского:

Еще один момент. По сути мы обсуждаем возможность того, что славяне переселившись на Подунавье (Балканы здесь не так важны, поскольку исходной точкой расселения славян по Восточной Европе указано Подунавье), в течении 100-200 лет обновили свой генофонд где-то наполовину. Мы не берем пиковые показатели I2a2 для Боснии, а рассматриваем таковые для Болгарии и Румынии, Венгрию тоже не вижу ставить в этот ряд — по генофонду это практически родные братья словаков и чехов. Итак даже отбросив R1a1 в Румынии и Болгарии (считая что якобы все клады этой гаплогруппы были принесены славянами, хотя это конечно же не так), получим I2a2 в этих странах на уровне 30-40%, остальных гаплогрупп 60-70%. Теперь риторический вопрос — ассимилировав в рекордные сроки придунайское население, славяне ведь не могли принимать в свою среду мужчин исключительно с гаплогруппой I2a2? Следовательно кроме нее славяне должны были «взять» и другие местные гаплогруппы, в ДВА раза больше чем I2a2. Получаем, что у славян Восточной Европы кроме 15-20% I2a2 должны наличествовать еще 30-40% иных «балканских» гаплогрупп. Где они?

Вячеслав Носевич:

Вячеславу Малиновскому: Хороший вопрос. Попробую перефразировать его: славяне в ареале пражской культуры имеют соотношение гаплогрупп I2a1 и R1a1 примерно в соотношении 1 к 2. Если они принесли I2a в Хорватию и Сербию, то вместе с их 33-36% должно было появиться и вдвое больше (т.е. 66-72%) R1a1. Где они? А теперь отвечу по существу. Одна из популяций, поглощенных славянами в Балкано-Карпатском регионе или ранее, еще до распространения пражской культуры (как Вы помните, это один из рассматриваемых мной вариантов), причем поглощенная полностью, без остатка, имела очень высокую концентрацию I2a1, а остальное составляли понемножку G, E, J и, возможно, R1a и R1b. Концентрация этих остальных гаплогрупп была, скажем так, типичной для региона, и на уровень у славян этот приток не повлиял. А вот аномально высокое значение I2a1 соответственно повысило его у славян.

Комментарий Вячеслава Малиновского:

Балкано-Карпатский регион это название, территориально охватывающее чуть не треть Европы. Предположение с какой-то стопроцентно поглощенной популяцией выглядит более чем натянуто, потому что мы должны придти к выводу, что эта самая популяция населяла не все Подунавье-Балканы, а всего лишь какой-то достаточно ограниченный ареал, из которого собственно как из единого центра и начались разнонаправленные славянские миграции. ТО есть и славяне здесь предстают каким-то одним централизованным, достаточно немногочисленным племенем, живущим уже не родо-племенным обществом, так как I2a2 оказалась сразу во всей славянской популяции. Где этот регион из которого начались славянские миграции? Насколько помню нулевая фаза Пражской культуры это как раз Полесье, так какие же Балканы.Если они принесли I2a в Хорватию и Сербию, то вместе с их 33-36% должно было появиться и вдвое больше (т.е. 66-72%) R1a1.» Почему? Я ведь не говорю о славянстве как генетически едином целом. Это родо-племенное общество, в каждой из групп которого свой гаплогруппный состав, что мы видим у современных народов, еще сохранивших память о своей родовой структуре. Что до R1a1 то считаю совершенно неправильно всех их относить к славянам. Например если вы наложите карту М-458 на карту пшеворской культуры, то увидите что основной массив гаплотипов находится как раз в ее ареале. И если посмотреть гаплогруппный состав чехов например, то утверждения что славяне продвинулись на земли практически полностью оставленные германцами, выглядят мягко говоря преувеличенными. То есть процент славянских мигрантов и их племенной состав в каждом регионе был различен и в одном случае местное население имеет «балканские» гаплогруппы, в другом «кельто-германские». Разный процент той же I2a2 (от 10 до 30%) говорит всего лишь об участии разных племенных группировок славян в миграциях. Что до Хорватии, то Вадим ведь указывал, что запредельные пики это показатели герцеговинских хорватов, на с-в Хорватии ситуация совсем иная. Какова величина популяции герцеговинских хорватов? Скорее всего это лишь эффект основателя.

Вячеслав Носевич:

Насчет пиков как следствие эффекта основателя — соглашусь. Но общее плато, над которым поднимаются эти пики, на Балканах выше, чем на славянской прародине. Не могли славяне принести большую концентрацию «черных шариков», чем имели изначально. В палеолите такое возможно, а в средневековье, когда перемещаются массы в сотни тысяч и миллионы людей — уже нет.Я ведь не говорю о славянстве как генетически едином целом.» Если Вы читали все комменты, то именно этот вариант я рассматривал как случай с плохо перемешанными шариками. Но род, несущий высокую частоту I2a, не мог быть исконно славянским — это я и имел в виду под «журналистами» (правильно было бы — «юристами», подзабыл я высказывание Вольфовича…)

Комментарий Вячеслава Малиновского:

Но общее плато, над которым поднимаются эти пики, на Балканах выше, чем на славянской прародине.» А что вы надеялись увидеть на территории к примеру Украины, практически по новой заселенной в 17 веке? Вот и видим пики в местах убежищ — в полесье, волынском и белорусском.Но род, несущий высокую частоту I2a, не мог быть исконно славянским» Конечно не мог, праславянский язык это какая-то из клад R1a1, но с ними точно еще не скоро получится разобраться. I2a к тому времени скорее всего уже не раз сменили язык, но я веду речь о том, что к моменту начала миграций они уже входили в славянскую общность и на данный момент это самый удобный славянский маркер — нет ни малейшего локального всплеска, который бы не объяснялся «славянским следом»-«Не могли славяне принести большую концентрацию «черных шариков», чем имели изначально. В палеолите такое возможно, а в средневековье, когда перемещаются массы в сотни тысяч и миллионы людей — уже нет.» Почему? О каких сотнях тысяч мы говорим? Пару-тройка сотен тысяч мужчин это популяция герцеговинских хорватов в 21 веке, если говорим о 6-7 веках, то там речь шла о сотнях, если не десятках. Это мог быть всего лишь один из славянских родов с высокой долей I2a.

Ув. Вячеслав Носевич, Вы наверняка спросите, а каково мое личное мнение на счет происхождения I2a1b3. Чтобы ответить на этот вопрос, необходимо начать издалека. По моему скромному разумению маршрут путешествия I2a1 начинается где-то в Альпах (примерно 12 000 -10 000 лет назад).Скорее всего, ко времени отступления ледников, «популяции» I2a1*, I2a1a, I2a1b и I2a1c уже разделились. Одни пошли на юг, положив начало иберийско-сардинским I2a1a, другие -I2a1b — на север, где в свою очередь разделились на предковую линию I2a1b3 и предковую линию I2a1b2 (последние, видимо, оказались изолированными вместе с частью I2a2, I2a1a на Британских островах после затопления Доггерленда). Предковая линия I2a1b3 же двигались постепено на северо-восток за отступающим ледником. Спустя много тысяч лет значительная часть субклада I2a1b3 «вернулась на юг» уже в составе славянских племен, поселившихся на Балканах между 6-8 в.н.э. Таким образом, значительное количество I2a1b3 совершило движение по часовой стрелке — в конечном итоге вернувшись в места, близкие к точке первоначального исхода их предков. Примерно полтора года назад удалось немного подискутировать с администратором польского FTDNA проекта (Лоуренсом Майкой) по вопросу о происхождении гаплогруппы I2a1b (и I2a1 в целом). Майка предложил крайне интересную версию места происхождениия гаплогруппы I2a1b. По его мнению, общий предок I2a1b (как I2a1b2, так и I2a1b3) c выской степенью вероятности мог жить в районе Альпийских гор. Он также согласился с предложенным мною маршрутом перехода клана предков I2a1b3 из Альп в Карпаты. Правда, он не согласен с моей датировкой. Я считаю, что предковая популяция I2a1b3 начала свое движение из Альп в сторону Карпат сразу после окончания ЛГМ (т.е. в мезолите), а Майка считает что инициатором миграции могли быть кельты (т.е эта миграция произошла уже в бронзовом веке). Последний вариант хоть и интересный, но не объясняет времени и места разделения островного субклада I2a1b2 и динарского субклада I2a1b3, которая по молекулярной датировке не могла произойти позднее чем 10-8 тысяч лет тому назад. С целью проверки версии Майки, я решил использовать алгоритм Мескита, который позволяет производить оценку наиболее вероятного (с точки зрения парсимонии) места «основания» субклада, исходя из нынешней географической дистрибуции (географического распространения) двух смежных субкладов (в данном случае мы определяем место появления I2a1b1 на основании сопоставления географических координат таксонов-гаплотипов и топологии дерева I2a1b2, которое укоренялось аутгрупп-корнем I2a1a). Несмотря на то, что наибольшая плотность субклада I2a1a приходится на Сардинию, cледут опираясь на хорошо аргументированный и эмпирически подтвержденный аргументНордтведта признать, что самые старые по возрасту кластеры I2a1а приходятся на северный регион Пиренейского полуострова, и частично южную Францию. Поэтому в качестве координат аутгруппа-корня (гаплотипа I2a1а) были приняты координаты географического центра Пиренейских гор Построенные таким образом в Меските филогенетические деревья прямиком были спроицированны на географическую карту Северной Европы, в 2D и 3D проекциях. Если хотите, то ямогу 3 карты, построенные мной в Меските-Картографере на основании структуры филогенетического дерева из 687 гаплотипов I2a1b3, выявленной путем нахождения 20 независимых совпадений 20 парсимонически лучших (наиболее оптимальных) деревьев в TNT. Это дерево было выгружено из ТНТ в формате .tre и загружено в картографический пакет Мескита, где оно было спроецировано на карту Европы (проекция Меркатора). Нанесены номера ветвей (чем дальше от корня, тем болше номер корня -см.номера в овале) и парсимонически предпологаемые маршруты миграции представителей этой генетической ветви в Европе. На примере второго «картографического» дерева I2a1b3 показана другая интересная функция картографического пакета Mesquite. А именно, наличие встроенного алгоритма для определения максимально вероятной (в терминах парсимонической комбинации географически близких ныне живущих таксонов 🙂 предковой локации субклада I2a1b3. На реконструированной карте Мескит довольно уверенно определяет место происхождения субклада где-то к северо-востоку от Карпат (обозначено большим красным кругом с красной точкой в центре).

Впрочем, на этот счет существует альтернативная точка зрения. Ув. Вячеслав Малиновский в комментариях к карте Нордведта пишет: «Исходный регион миграции I2a2-Dinaric-M423 не совсем верно очерчен (где-то к востоку от Варшавы), но направление верное — с севера на юг. Принимая во внимание приблизительный возраст субклада I2a1b3 (ок.2500-2000 лет) и разветвление дерева на уровне 1500-1700 лет (чему соответствует демографический процесс расселения), единственней миграцией такого массового масштаба можно считать именно славянскую колонизацию Балкан. Насчет возраста I2a1b3 все гуру единодушно сходятся к 2700-2500 годам. Даже сверхсекптичный Диенек Понтик считает, что I2a1b3 слишком молодая ветвь, чтобы быть кандидатом на неолитическое население Балкан. Ну как же не видите? Как верно заметил Вадим, точку возникновения L-147 по-хорошему нужно сместить несколько восточнее, в треугольник Ю.Польша-Прикарпатье-Полесье. Вот там где-то 2500 лет назад и возник I2a1b3, а далее его миграции штрихованными линиями, и по направлениям и по времени полностью совпадающие со славянскими миграциями.
У I2a1b3 нет каких-то региональных ветвей, примерный возраст тех что постарше где-то 1500 лет, на них вперемешку русские, украинцы, поляки, сербы, восточные немцы. Что коррелирует со сведениями о разнонаправленных миграциях каждого из племен. К примеру хорваты частично остались на Волыни, частично пошли на Эльбу, частично переселились на Балканы. Первоначально I2 были носителями каких-то палео-европейских языков, вполне вероятно что в неолите если не все, то часть из них перешли на языки неолитических переселенцев из Малой Азии. Но например I2a1b3 не были у трипольцев коренным элементом (их ядро составляли выходцы с Ближнего Востока), а скорее потомками местного мезолитического элемента, инкорпорированного в состав этой культуры. Если говорить об исконной культуре древних I2a1b3, то это скорее всего были свидерцы, и их эпигоны.
К моменту начала протославянского этногенеза субклад I2a1b3 целиком находился в ареале Лужицкой культуре — одной из культур полей погребений, относившейся к кельто-германо-италийской лингвистической общности.
Отмечается что на этапе своего вычленения из общей балто-славянской лингвистической общности славянский язык испытал влияние какого-то кентумного языка, но скорее всего не собственно кельтским, ни германским этот язык не был.
Я не вижу другого варианта, кроме как взаимодействие балто-славян Поморской культуры(скорее всего антов нашей классификации, позднее населения восточного ареала Пшеворской культуры)) с населением Лужицкой культуры. Далее это население частично участвовало в миграциях на восток, поучаствовав в сложении тамошних культур.»

Комментарий Вячеслава Малиновского:

Уточню — касательно свидерцев и прочих «неолитов — мезолитов» Юго-Восточной и Центральной Европы, говорить наверное можно о I2*, что подразумевает как предковые клады, так наверное и нынешнюю I2c, «размазанную» тонким слоем по всей Европе с локальным всплеском в Закавказье. Куда по моему разумению она с Балкан попасть не могла иначе, кроме как с предками армян (одними из, которые были родственны фригийцам). Что до «антов» в цитате выше, то они не имеет никакого отношения к историческим антам, это всего лишь условное и часто вводящее в заблуждение название одной из ветвей R1a1 когда-то принятое на Молгене — давно пора сменить название, но ничего «навека» никому в голову что-то не приходит.

Вячеслав Носевич:

дополнение к сказанному мной ранее: пример с R1b1 вообще-то еще более впечатляющ. Я выбрал из баз FTDNA все гаплотипы на 67 и более локусов, определенные как L150+ L51-, L23+ L51- и M269+ L150-, а заодно все с М269+ U106- P312-. Все эти ветви последовательно отпочковывались на отрезке примерно от 20 до 10 тыс. лет назад. Так вот, их сегодняшние гаплотипы по-прежнему близки до полного смешения, а модальные различаются друг от друга на считанных локусах. Например, на 17-локусном наборе Y-Filer модальные гаплотипы кластеров M269+L23- и L23+L51- не совпадают на 1 шаг по 4 локусам, тогда как Z196 и DF19 не совпадают по 5, хотя разошлись тысяч на 10 лет позже! И главное, что никаким поправочным коэффициентом этот эффект компенсировать невозможно.
Почему в такой ситуации я все же уверен, что карпийский кластер – молодой (хотя, возможно, и не столь молодой, как кажется)? Ситуация с определением возраста по гаплотипам все же не совсем безнадежна. Описанный мной эффект препятствует расхождению модальных гаплотипов и снижает число маргинальных, но не запрещает маргинальным расходиться все дальше. Если бы у нас были надежные выборки, порядка сотен длинных гаплотипов в каждой ветви, тестированных по всем Y-снипам, мы увидели бы, что САМЫЕ УДАЛЕННЫЕ ОТ МОДАЛЬНОГО различаются тем сильнее, чем древнее кластер. Проблема лишь в том, что такие выборки появятся очень нескоро. Но очень грубые прикидки можно сделать даже по имеющимся данным.
Результат будет надежнее, если учитывать не только генетические расстояния, но и мутабельность локусов. Ясно, что различие на 3 повтора в DYS392 значит гораздо больше, чем такое же расстояние в DYS439. Поэтому я умножаю расстояния на поправочные коэффициенты, пропорциональные известной скорости мутаций в каждом локусе. При таком подходе три самые удаленные из известных 67-локусных гаплотипов карпийского («динарского») кластера отстоят от модального на 22.9, 19.5 и 18.5 «калиброванных» шагов. В западнославянском кластере R1a1-L260 самые удаленные отстоят на 19.5, 19.4 и 18.5, а в его предковом М458+ L260- – на 36.8, 35.1 и 33.5. Рискнем предположить, что карпийский кластер близок по возрасту к R1a1-L260 (но все же чуть старше его) и существенно моложе R1a1-М458.Здесь уместно упомянуть обещанный второй аспект. Он касается репрезентативности выборок и длины использованных гаплотипов. Оценка репрезентативности – это азы матстатистики, на эту тему есть уйма учебников. Общеизвестно, что при социологических опросах применяются выборки порядка 1500 человек. Для мужской Y-хромосомы разброс значений сопоставим с разбросом общественного мнения, а эффективный размер ниже, поэтому можно примириться с национальными выборками порядка сотен, но уж никак не десятков индивидов. В этой связи посмотрите на размеры национальных выборок, использованные в Вашем анализе, и сделайте выводы…
Размер тоже имеет значение (в смысле, длина гаплотипа). Клесов не раз с гордостью подчеркивал, что его метод одинаково работает на гаплотипах любой длины. Но это не достоинство, а наоборот. Адекватный метод ОБЯЗАН на длинных гаплотипах давать более точные результаты, чем на коротких (если требуется дополнительная аргументация – поясню). В этой связи использованный Вами «компот» из гаплотипов разной длины меня, мягко говоря, не впечатляет. Немножко напоминает среднюю температуру по больнице…
Посмотрим, что дает предложенный мной метод при уменьшении числа локусов. Тот же карпийский кластер в варианте Y-Filer (17 локусов) дает максимальные расстояния в 7.3, 6.7 и 6.5 шагов, причем это НЕ ТЕ гаплотипы, которые показали наибольшее удаление на 67 локусах (для них результаты соответственно – 5.4, 2.7 и 4.7). Самые удаленные гаплотипы кластера R1a1-L260 теперь дают удаление 5.6, 5.1 и 5.0, причем лишь один из них – тот же, что и на 67 локусах. Два других теперь дали значения 3.5 и 0.3 (!). При этом на 17 локусах западнославянский кластер R1a1-L260 выглядит ощутимо моложе карпийского, что вряд ли верно.
Мораль: даже одна и та же хромосома может дать очень разный вклад в суммарную статистику в зависимости от того, какие ее локусы учитываются. Именно поэтому так важна величина выборки, при которой эти случайные броски компенсируются законом больших чисел.
Урезание именно до 17 локусов было предпринято мной, чтобы расширить выборку за счет гаплотипов из YHRD и других источников с аналогичным набором локусов. В частности, у нас есть данные из (Mirabal et al., 2010 Human Y-chromosome short tandem repeats…) с 404 черногорскими гаплотипами и 179 сербскими, из (Ljubković et al., 2008 Y-chromosomal Short Tandem Repeat Haplotypes in Southern Croatian Male Population…) с 166 хорватскими, а в YHRD представлены 1320 хорватских, 1270 польских, 1377 российских, 1774 германских, по 200 словацких и русинских (фактически – закарпатско-украинских) с территории Сербии, по 100 албанских и македонских, 191 греческий, 154 румынских, а недавно добавились 154 западноукраинских из Львовской области и 486 австрийских. Для полноты картины стоит привлечь 1262 итальянских и 194 литовских. По Беларуси у меня есть данные по 1097 коренным уроженцам из базы Центра судебной медицины. Всего около 10 тысяч — это уже серьезный массив данных! Правда, ни один из этих гаплотипов не тестировался на L147.2 и даже на L621, равно как и на L260. По счастью, карпийские гаплотипы на 17 локусах довольно четко отделяются от других гаплогрупп (погрешность в их выявлении я оцениваю на уровне порядка 1-2%, главным образом за счет пресловутого кластера Disles). Гаплотипы западнославянского кластера R1a1 отделяются от общеславянского М458+L260- чуть менее надежно, но все же с приемлемой точностью.сего в указанных источниках мне удалось выявить предположительно 1363 карпийских 17-локусных гаплотипов. Еще несколько остаются под вопросом. В частности, в Хорватии и Сербии выявлены 3 гаплотипа, профиль которых из всех известных мне модальных ближе всего к карпийскому, за исключением локуса Gata-H4, в котором вместо 11 повторов, характерных для I2a1b, имеется 9. Не имея снипов, трудно сказать, идет ли речь о специфической мутации в карпийской ветви, или о совершенно иной гаплогруппе. Я решил их не учитывать.
Если интересны суммарные результаты, то они такие (в порядке убывания частоты):
n N % популяция
65 179 36,3 Сербия
497 1486 33,4 Хорватия
120 404 29,7 Черногория
34 154 22,1 Украина (Львов)
151 693 21,8 Беларусь (центр — юг)
33 154 21,4 Румыния
21 100 21,0 Македония
38 200 19,0 Русины из Сербии (Нови Сад)
29 200 14,5 Словаки из Сербии (Нови Сад)
21 191 11,0 Греция (север)
40 405 9,9 Беларусь (запад — север)
9 100 9,0 Албания
121 1377 8,8 Россия
109 1270 8,6 Польша
24 486 4,9 Австрия
6 194 3,1 Литва
37 1774 2,1 Германия
4 1262 0,3 Италия
1359 10629

Как решается вопрос о генетическом разнообразии по моей методике? Если рассмотреть наиболее удаленные гаплотипы, то, даже отбразывая несколько сомнительных на удалении в 14-15 “калиброванных” шагов, 2 гаплотипа (из свердловской выборки русских и из южной Хорватии) удалены от модального более чем на 10 шагов. На удалении от 9 до 10 шагов находятся 9 гаплотипов (4 хорватских, 1 сербский, 1 македонский, 1 русинский, 1 свердловский и 1 белорусский). В интервал от 8 до 9 шагов попадают 12 гаплотипов (4 хорватских, 2 черногорских, 1 сербский, по 1 словацкому, германскому, австрийскому, польскому, свердловскому), от 7 до 8 шагов – 30 гаплотипов (из них 14 хорватских и 2 черногорских, а белорусских всего 3). В целом среди наиболее удаленных гаплотипов доля балканских примерно такая же, как и во всей выборке (55% против 56), тогда как доля белорусско-украинско-словацких – явно ниже (15% среди удаленных и 21 – во всей выборке). При всех неточностях и условностях такой методики, говорить о более высоком разнообразии гаплотипов в ареале пражской культуры по сравнению с Балканами нет никаких оснований. Скорее – наоборот.Теперь по поводу оценки возраста. Самым надежным репером является примерная синхронность с западнославянским кластером R1a1-L260. Эта синхронность подтверждается и по выборке из YHRD (вкупе с белорусскими и некоторыми другими данными). Предположительно к этому кластеру можно отнести чуть более 300 гаплотипов, из которых 166 – польских и 33 – германских. Наиболее удаленные 8 гаплотипов попадают в тот же интервал, что и в карпийском кластере: от 7.3 до 10.3 шагов.
Распределение западнославянского кластера позволяет привязать его возраст к событиям, фиксируемым археологически. Верхняя граница – это формирование суковско-дзедзицкой культуры (некоторые считают ее частью пражской), т.е. 1500 — 1400 лет назад. Но, учитывая возможное наличие этого кластера в России и Хорватии, скорее – раньше. Нижняя граница вряд ли может быть древнее формирования лужицкой культуры, т. е. 3600 – 3000 лет назад. Думаю, что в нижнюю половину этого интервала укладывается и возраст карпийского кластера. Я бы оценил его в 3000 лет плюс-минус пятьсот. Вокруг Карпат — это время протофракийской каннелированной и штампованной керамики, культурных общностей гава-голиграды и белогрудовка-чернолесье. На западе Балкан – культура глазинац, мимо которой прокатывается 3,3 – 3,2 тыс лет назад волна будущих «народов моря» (чака – медиана). Зарождение карпийского кластера можно связывать с любой из них – практически на равных основаниях. Учитывая господство в это время обряда трупосожжения, ископаемая ДНК тут вряд ли поможет.
Тем более от рассуждений о более ранней истории I2a1, равно как и от комментариев по поводу Ваших предположений на этот счет, предпочту воздержаться.

Почему Вы оперируете только 17 маркернымі гаплотипами, когда известны 37, 64,111 маркерные гаплотипы I2a1b3?Это не есть математическое доказательство. Предлагаю Вам повторить Ваше упражение с 1363 17-локусными гаплотипами — но на этот раз Вы должны расчитать интер — и интракладовые дисперсии «карпийских» гаплотипов по странам. Тогда мы сравним с моей статистикой дисперсии 37-64 локусных гаплотипов.
Рекомендую использовать для этих целей http://cmpg.unibe.ch/software/arlequin3/.

Вячеслав Носевич:

Насчет «Арлекина» — если честно, то мне лень возиться. Достаточно уже повозился. пока вытаскивал гаплотипы из YHRD (сервис там еще тот…) Если хотите — пришлю все 1363 Вам, а Вы считайте как хотите и чем хотите. Только мне потом расскажите, что получилось.

Комментарий Вячеслава Малиновского:

«Если бы у нас были надежные выборки, порядка сотен длинных гаплотипов в каждой ветви, тестированных по всем Y-снипам, мы увидели бы, что САМЫЕ УДАЛЕННЫЕ ОТ МОДАЛЬНОГО различаются тем сильнее, чем древнее кластер. Проблема лишь в том, что такие выборки появятся очень нескоро.» Если вы еще раз посмотрите что же писал Вадим, то увидите, что речь шла именно о выборках из сотен длинных гаплотипов, на основании которых и строились филогенетические деревья.