О неолитических тирольцах и шведах: опыт палеогентического анализа — часть 1

В мае прошлого года я провел три бессонные ночи, пытаясь извлечь SNP-ы из BAM файлов, любезно предоставленных профессором Уппсальского университета Понтусом Скоглундом — автором нашумевшего исследования древнего ДНК насельников шведского неолита.  Как мне представлялось, задача должна была оказаться несложной, особенно после того как в марте прошлого года я успешно произвел «выделение» геномных вариантов из аналогичных файлов содержащих информацию о геноме Эци.  Полученные на выходе файлы я намеривался соединить с имеющейся у меня базой данных SNP-ов современных евразийских популяций, а затем проанализировать в программе smartpca, входящей в пакет Eigenstrat.

Однако на поверку на эту процедуру пришлось потрать намного больше времени, в первую очередь из-за определенных трудностей с использованием vcftools, и определением надежных SNP-ов в сгенерированных в samtools pileup файлах.
Трудно описать мою радость, когда мне удалось взломать эти ‘крепкие геномные орешки’. После успешного определения SNP-ов, я произвел PCA-анализ с целью определения позиции неолитических фермеров (Gok4), охотников-собирателей (Ajv52, Ajv70) и Ötzi (Эци) на карте генетического вариативности населения западной части Евразии.

Мои эксперименты с Eigenstrat  частично подтвердили результаты аналогичныхз опытов Диэнека.

Как видно на приведенном графике, доисторические шведы Ajvs (принадлежавших к готландской культуре ямочной керамики (Pitted Ware culture (около 3200 — 2300 гг. до н. э.)) оказались на периферии современных северо-восточных европейских популяций.
Затем, по просьбе ряда посетителей форума ABF, я сделал PCA-график, на котором показаны обозначения популяций.

Как и прогнозировалось ранее, Ajv52 и Ajv70 оказались в окружении плотного кольца из балтийских популяций. В эту группу вошли литовцы, белорусы, поляки, шведы, украинцы, русские (из Северной и Центральной России) и мокша-эрзя. Однако, похоже,  в силу своего расположения на графике они также отдаленно связаны с современнами финнами и немцами

Генографическое размещение другого образца древнего ДНК — Gök4 (культура воронковидных кубков, КВК (англ. Funnel Beaker culture, нем. Trichterbecherkultur, TRB) — мегалитическая культура (4000 — 2700 гг. до н. э.)) — также оказалось весьма предсказуемым. Этот образце попал в один кластер с  тирольским Эци, популяциями средиземноморского региона (Vasconia, Iberia, Италия) и рядом западно-европейских популяций ( в том числе и из Франции).

Результаты аналогичны результатам из оригинальной статьи.

F1.large

Воодушевившись столь замечательными результатами, я решил выполнить элементарный анализ IBS. Для расчетов использовалась примерно такая же метрика, что и при вычисление геномного сходства (genome-wide similarity) в клиентской базе данных 23andme . На первый взгляд результаты кажутся несколько иными, чем те, что приведены в работе Skoglund et al.2012 (результаты приведены ниже):

Neolithic farmer Hunter-gatherers Long Lat chr.
Cyprus Cyp 68.20% 68.21% 33 35 8
Greece Gre 67.94% 68.51% 22 39 16
France Fra 67.89% 68.80% 2 46 178
Netherlands Net 67.88% 68.79% 5 52 34
Romania Rom 67.84% 68.62% 25 46 28
Italy Ita 67.81% 68.43% 12 42 438
Germany Ger 67.80% 68.80% 10 51 142
Croatia Cro 67.76% 68.67% 15 45 16
Portugal Por 67.75% 68.59% -8 39 256
Belgium Bel 67.73% 68.78% 4 50 86
Spain Spa 67.72% 68.59% -4 40 272
Poland Pol 67.71% 68.98% 20 52 44
Austria Aus 67.69% 68.65% 13 47 28
United Kingdom UK 67.68% 68.79% -2 53 400
Serbia Ser 67.67% 68.62% 20 44 88
Macedonia Mac 67.62% 68.58% 22 41 8
Sweden Swe 67.61% 68.84% 15 62 20
Ireland Ire 67.61% 68.71% -8 53 122
Hungary Hun 67.60% 68.58% 20 47 38
Russian Rus 67.56% 68.72% 37 55 12
Turkey Tur 67.55% 67.98% 35 39 8
FIN FIN 67.47% 68.77% 25 61 80
LSFIN LSFIN 67.44% 68.79% 26 64 162
Bosnia Bos 67.39% 68.81% 17 44 18
Scotland Sco 67.35% 68.81% -4 56 10

Различие с моими результатами может быть объяснены как различным числом используемых  SNP-ов (в исследовании Скоглунда их больше), так и отличием методологических подходов. Я использовал очень простой алгоритм в программе Plink для расчета IBS-матрицы, в то время как Скоглунд с соавторами использовал более сложный подход при расчете средней частоты аллелей.

Во всяком случае, с учетом вышесказанного, я все же хотел бы поделиться результатами IBS-анализа (ниже приведены только популяции с максимальным % общих аллелей, процентное соотношение выражено в виде дроби):

AJV70:

GOK4 0.85
AJV52 0.833333
Ötzi 0.7992
UKR 0.587516
BLR 0.586873
HNG 0.583655
RMN 0.583549
LTH 0.583012
LTH 0.583012
CEU 0.580438
FIN 0.580438

AJV52:

AJV70 0.833333
Ötzi 0.823864
GOK4 0.8
UKR 0.602506
HNG 0.596811
LTH 0.594533
RMN 0.593394
LTV 0.592818
CEU 0.592255
GER 0.592255
MR 0.591463

Ötzi

AJV52 0.823864
GOK4 0.813602
AJV70 0.7992
HNG 0.725414
NITAL 0.724004
NITAL 0,71989
LTH 0.718232
WUKR 0.718232
IBR 0.718162
RMN 0,71768
BLR 0.717367

GOK4

AJV70 0,85
Ötzi 0.813602
AJV52 0,8
НИУ 0.611345
NITAL 0.602941
CEU 0,60084
CEU 0,59979
NITAL 0.598739
RMN 0.598739
GBRORK 0.598309
RUS 0.595789

С другой стороны, если мы оставим в таблице только популяции Северной и Восточной Европы, результаты будут почти точно соответствовать таблице Скоглунда, и оба Ajvs будут наиболее близки к полякам.

Я должен подчеркнуть, что на самом деле мне удалось обнаружить SNP-ы и в образцах Ire8 и Ste7 (52322 SNP-а + инделов у Ire8 и 13175 вариантов у Ste7). Однако после слияния этих данных с общей базой данных, оказалось что большинство из генотипированных SNP-ов оказались либо новельными вариантами  либо находились за пределами современной генетической вариативности. Пересечение снипов Ste7 и Ire8 SNP  с моим основным наборов снипов дало 0, т. е. не существует никаких общих SNP-ов между моим текущим набором и набором данных у указанных выше образцов. Поэтому мне не оставалось ничего другого, как удалить Ste7/Ire8 из  конечной выборки.

Генетические компоненты в геномном калькуляторе MDLP-World22: взгляд со стороны. Анализ Евгения Марчева.

В качестве краткого вступления.

В первую очередь позвольте мне представиться терпеливому и мудрому читателю моего блога — Евгению Марчеву и выразить ему свое почтение и большое удовольствие, которое мне доставляет обращение к нему. Я вполне знаком с его характером, так как, судя по предмету и стилю моего блога, можно поручиться, что он один из миллионов. Подобный критически настроенный читатель готов столкнуться с утверждениями, от которых он будет склонен первоначально отступить; но в конце концов он ждет, чтобы его убедили в истинности каких-либо из них. Он также догадывается, что размышления над предметом и попытка изложить размышления в письменном виде заняло не скажу сколько времени, но уж определенно больше, чем четверть часа, и, следовательно, фундаментальные возражения, столь очевидные, что могли бы ненароком поразить каждого, пришли автору на ум неожиданно, хотя ответы на них не из тех, полное значение которых можно оценить сразу.

От себя замечу, что при воздвижении здания нового популярного геномного знания, которое выдержало бы испытание временем, мне следует позаботиться не столько о том, чтобы разместить каждый элемент в онои с отменной аккуратностью, сколько о том, чтобы заложить как можно более глубокое и твердое основание. Это возможно лишь в том случае, когда между мной и   читателями блога/пользователями моих геномных инструментов установлен контакт по принципу обратной критической связи.  Наличие подобного рода диалога следует признать одним из тех достоинств,  которое выгодно отличает контекст персональных геномных консультаций от  контекста популяционных исследований, в котором обследуемые не только не могут высказать критические замечания по улучшению качества результатов исследования, но даже не знают, что именно изучали ученные в их ДНК.  Немаловажным представляется и то, что перманентный и  незамедлительный отклик критического сообщества весьма благоприятным способом сказывается на качестве получаемого нового знания.

Итак, представляю читателю самостоятельный анализ Е.Марчева, предметом разбора которого являются рассчитанные  в моем проекте аллельные частоты отдельных предковых компонентов.

I. Теория

Решил немного проанализировать данные из этой таблицы применительно к европейцам с уклоном на север, центр и восток Европы.

У европейцев 7 наиболее частых компонентов:

West Asian, North-European-Mesolithic, Atlantic_Mediterranean_Neolithic, Samoedic, Indo-Iranian, North-East-European и Near_East. 

Разберем вкратце каждый из них.

Итак, первый West Asian. Наибольший процент на Западном Кавказе- абхазы (64, 9%), имеретинцы (63,7), лазы (56,6), аварцы (56,8), лезгины (55,4).
На интересуемой нас территории этот компонент чаще встречается у казанских татар (9,9 %), южных немцев (8,4), украинцев (от 6,6 до 7,7 %), южных русских (6,2%). На западе высок процент у итальянцев (21,5 % у центральных итальянцев), французов (6,7 %).

Второй компонент North-European-Mesolithic. Условно его можно назвать саамско-финским.
Саамы (76,4 %), Финны (от 30,1 до 37,3 %), вепсы (24,1), карелы (23,2), ижорцы (22, 7).
Част этот компонент у северных русских (10,5 %), норвежцев (9,8 %), шведов (7,8 %), эстонцев (7,1 %).

Третий- Atlantic_Mediterranean_Neolithic. Юго-западно-европейский или просто западно-европейский.
Больше всего у сардинцев (68,1 %), басков (59,2 %), иберийцев (48,8), корсиканцев (47,8), португальцев (46,6), северных итальянцев (44,3), французов (43,5 %).
Вообще, данный компонент достаточно выражен у всех западноевропейцев- более 30 %.
У восточноевропейцев ниже- чехи (27,8), поляки (18,4), украинцы ( от 17 до 21%), русские (от 11 у северных до 17,3 у южных), у коми (8,9 %), манси (8,8 %).

Следующий Samoedic. Уральский.
Значительно присутствует у селькупов (68,1%), хантов (64,6), ненцы (37,1), манси (30,9 %- ожидал больше), удмурты (29,6), марийцы (27, 8), шорцы (22,0 %), башкиры (21,7%), чуваши и хакассы по 17,6 %, коми- 16,4 %, казанских татар (11,9 %).
У западноевропейцев этот компонент практически не встречается. Есть у русских (от 1,0% у центральных до 4,7 % у северных), у карел (1,6%), словаков (1,4%), западных украинцев (1,7 %).

Пятый. Indo-Iranian.
Очень интересный. Чрезвычайно большой процент больше у калашей- 84,4 %. Вроде и у соседей должно быть прилично, ан нет: буриши (8,7 %), пуштуны (8,5 %), белуджи (6,9 %). Почему так- не знаю.
Что у европейцев? Встречается у норвежцев (3,8%), валлийцев (3,4), бритишей (2,8), французов (2,1). В Восточной Европе как правило до 1%.

Следующий North-East-European занимает значительное место у европейцев, почти у всех.
Больше всего у балтов и славян. Литовцы (81,9), латыши (79,5), белорусы (76,4), эстонцы (75,2), поляки (70,2), русские (67- 70,4), украинцы (62,1- 67,1), сорбы (65,9), карелы (60,2), вепсы (62,5).
Но много и у других: чехи (57,4), северные немцы (54,6), южные- 42,6, у британцев от 46 до 49, норвежцы- 48,1, шведы- 53,7! Низок у саамов- 15,5%.
У южан сравнительно меньше- французы (38,4), центр. итальянцы (18,9%).

И последний- седьмой. Near_East. Условно «семитский» (по имени Сима) или арабский, кому как угодно.
Евреи Йемена (60,9 %), Сауд. аравия (59,5), бедуины (56,7), евреи Эфиопии (52,5), египтяне (43,8).
В Европе:
Относительно много у итальянцев (центр- 17,4), португальцев (11,9).
У южных немцев (3,5), украинцы (от 2,3 у восточных до 3,8 % у западных), чехи (3,0), белорусы (3,4), словаки (3,2), у русских от 1,0 до 1,5%, у литовцев- 1,4%, у поляков- 1,3 %. У других почти нет.

И две диаграммы для наглядности:

II. Практический пример

Рассмотрим частный случай на примере ув. exorcio. Происхождение- северный русский/немец.

Основные компоненты (8):

West-Asian 4.12%- промежуточное значение
North-European-Mesolithic 6.87%- промежуточное значение
Arctic-Amerind 0.99%- градиент к сев. русским
Atlantic_Mediterranean_Neolithic 22.20%- градиент к немцам
Samoedic 2.77%- градиент к русским
East-Siberean 1.49%- градиент к русским
North-East-European 57.77%- промежут.
Near_East 1.15%- промежут.

Хорошо видно, что градиент в сторону северо-восточных популяций (русские, финны) за счет трех компонентов- Arctic-Amerind, Samoedic, East-Siberean, а в сторону немцев за счет Atlantic_Mediterranean_Neolithic.*

В конечном результате в пространстве PCA генетического разнообразия, excorcio находится рядом с чехами, то есть между немцами и восточными славянами.

———————

* Комментарий уважаемого А.Бурнашева: Я хочу заметить, что с математической точки зрения калькуляторы Веренича и Понтикоса не страдают специфическим дефектом калькулятора Веселовского (Поляко) — у них все компоненты независимы.В то же время, в EU-test Поляко появляется один зависимый компонент (т.е. принадлежность к нему куска генома вычисляется на основе других компонент), а в J-test таких зависимых уже 2 (очевидно, ashkenazi компонент тоже вычисляется как суперпозиция).При проведении PCA анализа это все видно.

Открытая полемика с историком Носевичем по вопросу о происхождении динарской субклады I2a -часть 2

Комментарий Вячеслава Носевича:

По поводу моей статьи: по последним данным, выпуск альманаха, в котором она должна быть опубликована, ожидается примерно в мае. Учитывая интерес к дискуссии, подумываю о том, чтобы не дожидаться бумажной публикации. Если соберусь, выставлю кусок из нее, относящийся к «динарскому» кластеру, в своей ленте на фейсбуке.

Распространение славянской подветви гаплогруппы I2a1 лучше прослеживается не по бинарным маркерам, а по характерным для нее гаплотипам. В подветви I2a1b они высоко специфичны, позволяя с высокой надежностью выявить ее представителей. В базе данных компании FamilyTreeDNA (FTDNA), осуществляющей коммерческое тестирование для интересующихся ДНК-генеалогией, представлены все выявленные в ходе такого тестирования гаплотипы. Интересующая нас подветвь там определена как «динарский кластер» [Y-Haplogroup I2a Project: http://www.familytreedna.com/public/I2aHapGroup/default.aspx]. Он распадается на две ветви – южную, собственно динарскую, и северную, представленную во всех славянских популяциях (ее правильнее было бы именовать «карпатской»).

Частоту обеих ветвех в разных популяциях по этой базе определить невозможно, поскольку представленные в ней выборки сформированы по случайному принципу (совпадение желания и возможности заказать тест ДНК), очень разнятся по размерам и непредставительны для популяций в целом.

Методически корректные выборки можно найти в международной референтной базе данных Y-гаплотипов (YHRD), созданной и поддерживаемой в криминалистических целях, а также в аналогичной по назначению референтной базе данных ДНК-маркеров населения Республики Беларусь, которую создал Центр судебных экспертиз и криминалистики Министерства юстиции Республики Беларусь[Референтная база данных частот встречаемости гаплотипов Y-STR локусов в Беларуси: http://dnkexpertiza.org/index1.html]. Гаплотипы по некоторым выборкам, не включенным в YHRD, можно найти в научных публикациях[Ljubković J., Stipisić A., Sutlović D. et al. Y-chromosomal Short Tandem Repeat Haplotypes in Southern Croatian Male Population Defined by 17 Loci // Croat Med J. 2008. Vol. 49. P. 201–206; Mirabal S., Varljen T., Gayden T. et al. Human Y-chromosome short tandem repeats: A tale of acculturation and migrations as mechanisms for the diffusion of agriculture in the Balkan Peninsula // American Journal of Physical Anthropology, 2010. Vol. 142(3). P. 380–390.]. Все эти выборки представлены сравнительно малым, в сравнении с FTDNA, числом локусов: в коммерческих тестах используются наборы в 37, 67 и даже 111 локусов, а в криминалистических – в лучшем случае 17-локусный набор, известный как стандарт Y-Filer. Но даже этот набор позволяет уверенно распознатьгаплотипы, характерные для динарского кластера. Им присущи сравнительно небольшие генетические расстояния от модального для этого кластера гаплотипа, который в формате Y-Filer приведен в таблице 1.

Гаплотипы, суммарно отличающиеся от этого профиля не более чем на 9–10 шагов (мутаций в числе повторов), в подавляющем большинстве случаев принадлежат к интересующей нас ветви I2a1. Возможная ошибка в их определении не превышает 1–2 %, что подтверждается в тех (увы, немногочисленных) случаях, когда выборки одновременно тестировались и по бинарным маркерам.

Южная ветвь динарского кластера по 67 и тем более 111 локусам выделяется неплохо, но в 17-локусном наборе Y-Filerее отличительной особенностью является лишь пониженное число повторов в локусе DYS-448: 19 (изредка даже 18) вместо 20. Разумеется, различение двух субкластеров всего по одному локусу возможно только в первом приближении, но общая картина ясна даже при такой грубой оценке. Частоты гаплотипов, предположительно принадлежащих к данному кластеру, по всем опубликованным выборкам формата Y-Filerпредставлены в таблице 2

Из таблицы видно, что динарский кластер гаплогруппы I2a1 имеет максимум в балкано-карпатском регионе, а среди западных и восточных славян – в ареале лука-райковецкой культуры. И в Польше, и в России его частота падает, а в Литве и Германии он представлен на уровне, который вполне может быть объяснен славянской примесью. Это значит, что и у бастарнов, и у венетов, принесших праславянский язык из лужицко-поморского ареала, этот кластер еще отсутствовал – равно как и у древних балтов до начала их интенсивных контактов со славянами. В генофонд современных славян он попал в результате ассимиляции значительной группы автохтонного населения. Из всех неславянских народов гаплогруппа I2a1 имеет высокую частоту только у румын, представляющих собой результат смешения ранних славян (носителей пражской и ипотешти-чурелской культур) с валахами – потомками фракийского населения, роменизированного в эпоху Римской империи. При этом частота у румын и в ареале формирования славянского этноса (Львовская область, юг Беларуси) примерно одинакова. Следовательно, у валахов она изначально была не ниже, чем у ранних славян.

Показательно распространение южного субкластера. Для славянских популяций он в целом нехарактерен. Даже те немногие гаплотипы с DYS448=19, что имеются в восточнославянских и польских выборках, по остальным локусам довольно далеки от модальных значений и, вероятно, отражают самостоятельные мутации. В то же время южнославянские гаплотипы часто имеют профиль, очень близкий к модальному. Большинство их носителей явно являются потомками одного индивида, имевшего 19 повторов в локусе DYS448. Этот индивид жил позднее, чем родоначальник всего динарского кластера, но ненамного – в целом разброс гаплотипов в южном субкластере довольно велик, генетические дистанции в 6–7 шагов от предкового гапллотипа в нем нередки.

Похоже, и предковый кластер с 20 повторами, и дочерний субкластер с 19 повторами, к концу бронзового – началу железного века были распространены в основном к югу от Карпат, притом дочерний возник в южной части ареала и не успел распространиться на всю Карпатскую котловину до появления славян. После эвакуации Дакии в 271 г. н. э. он был присущ, видимо, только подданным Византии, которые практически не пересекали Дунай. Тем временем более старый и обширный субкластер с DYS448=20 проник к северу от Карпат, где и влился в состав формирующегося славянства.

Когда и где предки славян включили в свой состав группу, имевшую высокую долю «динарских» гаплотипов? Это не могло быть ранее IIв. до н.э. – времени сложения зарубинецкой культуры. Но это не могло быть и позже рубежа VII– VIIIвв., когда в процессе возвратной миграциина север сложилась лука-райковецкая культура. Иначе никак не объяснить современную частоту I2a1 у русских и поляков, сформировавшихся на тех территориях, где эта гаплогруппа изначально отсутствовала.

http://vln.by/node/247

Vadim Viarenič-Stachowski: Статья интересная, но неубедительная

Alaksiej Dziermant:

Да, интересно, по пока Вадим действительно выглядит убедительнее. Ждем продолжение статьи, чтобы прочитать про другие гаплогруппы, особенно про отличия R1a1 у славян и балтов.Вячеслав, простите, но вот это я воспринимать серьезно не могу, тем более, что на этом основании делаются далеко идущие выводы: «Исходный для славян лука-райковецкой культуры профиль Y-гаплогрупп частично реконструируется таким образом: около 20 % или чуть более I2a1b3, порядка 2–3 % R1a1a1b1a1a-L260, около 10 % R1a1a1b1a1 (с мутацией М458, но без L260), порядка  30–40 % разных ветвей R1a1a1b1a2 и порядка 4 % N1c1b. «

Вячеслав Носевич:

Воспринимайте несерьезно! 🙂 А если можете — предложите иную реконструкцию, которая лучше объясняет современные частоты с учетом всех исторически зафиксированных смешений

Честно говоря, тем дальше знакомлюсь с темой, тем более убеждаюсь, что пока это не более, чем область спекуляций, соответственно теряется интерес.
Вся наука — это сплошная область спекуляций (именуемых также рабочими гипотезами). Но есть гипотезы проверяемые (собственно научные), а есть непроверяемые. Я даю четкие предсказания: что получится, если протестировать ту или иную современную или ископаемую выборку по тем или иным снипам. Одно предсказание уже подтвердилось. Остальные или подтвердятся, или нет. Это и есть наука! Вадим, засунув с статпакет гаплотипы десятка хорватов и десятка белорусов, тоже делает неявное предсказание: вариативность останется такой же, если гаплотипов будут тысячи. Я же утверждаю, что оно окажется совсем другим — разнообразие I2a у хорватов (и особенно у румын) в итоге получится выше. Посмотрим, кто окажется «убедительнее».  Насчет «теряется интерес» — это же самый передовой фронт, где добывается новое знание. Данные еще недостаточно, но смутные контуры уже различаются. И каждый наперебой предлагает свою версию того, что он, как ему кажется, различает. А потом данных становится больше, и описать увиденное может уже любой дурак. Но весь кайф в том, чтобы предвосхитить новое знание! По моему, это как раз захватывающе интересно.
Пока нет четкой методологии сопоставления данных разных наук это действительно область для вольных спекуляций, поскольку она новая и еще мало вписана в общую систему этногенетических исследований. Но мне более всего интересна эта методология.А начал бы построение новой методологии с деконструкции самих представлений об этничности, поскольку все эти выводы типа «культура луки-райковецкой принадлежала ранним славянам» и т.д. лично я считаю принадлежащим уходящей эпохе.
Начнем с того, что Y-хромосомные линии малоперспективны в плане изучения ДРЕВНИХ этнических процессов. Сказанное не отменяет их важность при проверке соотношения биологического и официального родства. Достаточно упомянуть интересные исследования по ДНК современных мужских потомков Рюриковичей и Гедиминовичей.
Начать можно с чего угодно. Важно, чем закончим. Если вы видите фактические неточности или слабые места в моей аргументации — давайте обсудим. Только хотелось бы без эмоциональных оценок: убедительно — неубедительно, перспективно — неперспективно и т.п.
Vadim Viarenič-Stachowski Чуть позже напишу критический разбор и размешу  у себя в блоге
Вячеслав Леонидович, а когда, при каких обстоятельствах, с Вашей точки зрения, линия I-M423 попала к фракийцам?
«Здесь возможны два сценария. Носителями I2a1 могли быть представители одной из местных культур, принявших участие в сложении зарубинецкой культуры или одной из позднезарубинецких групп. »    Сомнительно. Показательно, что у исследованных азовских(крымских) греков  I2a1 отсутствует. При том что примерно 50% гаплотипов явно демонстрируют «готское» наследие — весь спектр I1, I2b, «северные» и центральноевропейские  клады R1a1  — M-458, «поморская». Понятно что массив, называемый «готским» включал в себя совершенно разные группы населения, в том числе и пшеворские и зарубинецкие.  I2a1 нет, следовательно они «вышли на арену» позже.Интересно сравнить карту распространения клады М-458 и пшеворской культуры. Как говорится найдите два отличия
Валерию Васильченко: В ответ на ваш вопрос я мало что могу добавить к тому, что сказал ранее: «ВОЗРАСТ КАРПИЙСКОГО КЛАСТЕРА. Я БЫ ОЦЕНИЛ ЕГО В 3000 ЛЕТ ПЛЮС-МИНУС ПЯТЬСОТ. ВОКРУГ КАРПАТ – ЭТО ВРЕМЯ ПРОТОФРАКИЙСКОЙ КАННЕЛИРОВАННОЙ И ШТАМПОВАННОЙ КЕРАМИКИ, КУЛЬТУРНЫХ ОБЩНОСТЕЙ ГАВА-ГОЛИГРАДЫ И БЕЛОГРУДОВКА-ЧЕРНОЛЕСЬЕ. НА ЗАПАДЕ БАЛКАН – КУЛЬТУРА ГЛАЗИНАЦ, МИМО КОТОРОЙ ПРОКАТЫВАЕТСЯ 3,3 – 3,2 ТЫС ЛЕТ НАЗАД ВОЛНА БУДУЩИХ «НАРОДОВ МОРЯ» (ЧАКА – МЕДИАНА). ЗАРОЖДЕНИЕ КАРПИЙСКОГО КЛАСТЕРА МОЖНО СВЯЗЫВАТЬ С ЛЮБОЙ ИЗ НИХ – ПРАКТИЧЕСКИ НА РАВНЫХ ОСНОВАНИЯХ.» Если М-423 исходно локализовалась в Центральной Европе (что само по себе лишь гипотеза), то к фракийцам ее могла занести как раз миграция чака-медиана. А потом потомство одного суперудачливого протофракийца дало оба современных «динарских»кластера, северный и южный.
Вячеславу Малиновскому: То, что I2a1 была слабо представлена у готов — вполне возможно. Но это опровергает не мою версию, а скорее изложенную выше в дискуссии (о изначальной локализации I2a1 в лужицком ареале). Даже если эта гаплогруппа в Поднепровье была действительно представлена фракийско-скифско-зарубинецкой линией развития, к готам она могла и не попасть. У них, помимо скандинавского компонента, доминировал постлужицкий. Но я сам склонен думать, что к славянам I2a1 попала в основном от карпов, а не от скифов.

Vyacheslav Malinowsky

Честно говоря я совсем не понимаю ваше игнорирование волынско-полесского региона с частотами I2a1 25-35% и всем остальным джентельменским набором, не понимаю каким образом он связан с карпами, скифами или еще кем-то в этом роде. Удивляет описание «карпийского кластера» — то есть локализован он был вокруг Карпат, которые сами по себе являются практически лучшим природным убежищем, но вот в самих Карпатах ничего эдакого не наблюдается — ни какого-то большого разноообразия ни повышенных частот, ни «старых» гаплотипов.. Но все это присутсвует по вашим словам на Балканах( ъотя тоже не понятно, на чем базируется эта ваша уверенность).

Вячеслав Носевич:

Вячеслав, о каком игнорировании идет речь? По Волыни я не знаю ни одного опубликованного гаплотипа из научных выборок, по Полесью есть выборки на уровне нескольких десятков индивидов, с частотой I2a1 на уровнях от 14 до 28%. То, как «пляшут» эти частоты, показывает, что достоверная картина появится только на уровнях порядка 1500 — 2000 протестированных из этого региона. Вот если они появятся, и при этом частота окажется выше 22%, характерных для окрестных территорий, тогда и будем думать. Пока же я пишу о той картине, которая складывается из имеющихся данных.

Vyacheslav Malinowsky

А где в Полесье 14%? Насколько видел от 22.5% на востоке от 27,3% на западе. Не видно никакой «пляски гаплотипов», всего лишь подтверждается то о чем давно говорили — население  Полесья и Волыни практически единый этнический массив. До революции в общем-то никто и не претендовал что полещуки являются белорусами http://dic.academic.ru/pictures/wiki/files/66/Belarusians_1903.jpgПо Волыни. В сети ходили карты из неопубликованных еще работ, будем надеяться в этом году таки будет публикация.

Valery  Vassilchenko

Вячеслав Леонидович, в этом случае, как мне кажется, следовало бы ожидать совсем иной дистрибуции I-M423 по сравнению с имеющейся. Эта линия должна была бы, наверное, присутствовать по всему Средиземноморью. Получается, что ни миграции фракийцев в Малую Азию, ни перемещения населения в римское время почти не затронули носителей I-M423.

Wladzislaw Viarowkin-Šeliuta

> До революции в общем-то никто и не претендовал что полещуки являются белорусами
Ещё как претендовали. Полешуки ближе к украинцам лингвистически, этнографически — явно белорусы. Ещё Роман Скирмунт об этом писал (по-польски, кстати).  И, конечно же, политические границы оказывают сильное влияние на формирование наций. А если учесть предположения акад. Зализняка об происхождении украинского языка как выделившегося из старобелорусского, то можно смело сказать, что полешуки имеют к украинцам такое же отношение, как и прочие белорусы. Родственное, но иное.

Vadim Viarenič-Stachowski: Нет, полешуки вообще никак не задумывались о том, беларусы они или украинцы. Сами себя называли тутэйшие.По данным переписи, проведенной властями 30 сентября 1921 года[1], население Полесского воеводства составляло 879 417 человек, плотность — 20,8 чел. на км², самая низкая среди 16 воеводств II Речи Посполитой. По данным переписи 1931 года, население выросло до 1 132 200 человек, плотность до 31 чел. на км². 48,4 % населения были безграмотными — наиболее высокий процент в республике (средний уровень по II Речи Посполитой в 1931 — 23,1 %).После включения Западного Полесья в состав Полесского воеводства II Речи Посполитой польские власти проводили политику «отрыва» местного населения от украинского и белорусского влияния. В результате во время переписи населения 1931 года в Полесском воеводстве 707 тысяч человек (64 % населения воеводства) назвали свой язык «местным» (полес. тутэйшы; польск. tutejszy). В принципе, термин «тутэйшие» соответствует термину «полещуки» — за исключением того, что, в отличие от экзоэтнонима «полещук», «тутэйши» является самоназванием, не являющимся, однако, этнонимом.
Национальность 1921 1931
Тутэйшие[2] 42 % 62.6 %
Поляки 25 % 15 %
Евреи 17 % 10 %
Украинцы[3] 8 % 5 %
Другие 8 % 7,4 %

Вячеслав Носевич:

Вячеславу Малиновскому: «А где в Полесье 14%?» В YHRD есть гаплотипы из данных Rebala et al., относящиеся к Пинскому р-ну. Там протестированы 42 человека, выставлены 13-локусные гаплотипы, но в белорусской базе 35 из них приведены с 17 локусами. Так вот, из всех 42 к I2a1 можно отнести только 7, что дает 16,7 %. Это при том, что в соседнем Ивановском районе — стандартные 22,9%. При столь малых выборках отдельный результат ничего не значит. Именно поэтому необходимо набирать большую статистику. Поэтому же я не рассматривал отдельно малые выборки по России, а просто объединил их с большой свердловской (просто выбрасывать было жалко :).Валерию Васильченко: Тему с I2a1 мы с вами уже обсуждали, я указывал присутствие «динарских» гаплотипов и в Малой Азии, и в Италии, и даже в Иберии. То, что часть из них могла быть занесена уже славянами, не отменяет того, что часть (а может, и все) отражают следы фракийцев. Особенно это касается Иберии — их присутствие там вообще необъяснимо, если исходить из того, что на Балканы их впервые принесли славяне. Но дело даже не в этом. Я показал, что к югу от Дуная доминирует южный динарский кластер (с DYS448<=19), который со славянами вообще не может быть связан. Разброс его гаплотипов исключает версию, что он начал экспансию после 6-го века н.э. Кстати, совсем свежая работа по болгарам подтвердила: у них DYS448<=19 примерно половина всех «динарских». Это- бесспорное фракийское наследие.

Vadim Viarenič-Stachowski  Гаплотипы древних фракийцев уже известны?

Вячеслав Носевич

Вадим, представьте себе — известны! Посмотрите модальный гаплотип «южного динарского» кластера, отберите те, что на 111 локусах отстоят от него не дальше чем на десяток шагов — в большинстве они отражают фракийское наследие.

Vadim Viarenič-Stachowski: Я смотрю на Ваши рассуждения сквозь щель в бритве Оккама, и не вижу перспективы. Рассматривать этнические привязки гаплогрупп в столь глубокмх интроспекциях бесперспективно.  Древнее ДНК — иное дело.

Вячеслав Носевич

Во времена Оккама пользовались цельнометаллическими бритвами, в них не было щелей.Т.е. вы отрицаете, что большинство южнодинарских гаплотипов с DYS448<=19 происходят от одного мужчины? А если нет, он должен был иметь какую-то этничность?

Valery  Vassilchenko

Вячеслав Леонидович, но это всё-таки немногочисленные, если не единичные случаи. Из общих соображений здесь проще предположить именно славянское влияние. Другое дело, если появятся какие-то конкретные данные, свидетельствующие против такого предположения. Это будет сильным аргументом в пользу Ваших построений. А что касается анализа гаплотипов — то здесь я могу выступать только в роли благодарного читателя Ваших дискуссий с уважаемым Вадимом.

Вячеслав Носевич:

Валерию: Как можно отличить славянские гаплотипы от фракийских? Пока я нашел только одну зацепку: соотношение DYS448 <=19 и >=20. Всюду, где можно говорить о фракийском субстрате, 19 повторов имеют порядка половины гаплотипов или больше. И вот что получается: в Якутии, Казахстане, на Аляске выявлены 5 характерных «динарских» гаплотипов. У всех в этом локусе — 20 повторов. Ясно, что русские «наследили». В Турции  из семи у трех — 19. С равной вероятностью могут быть как потомки фракийцев, так и южных славян. В Италии из четырех выявленных в YHRD — два по 20, два по 19. Из пяти в базе FTDNA — у трех  по 19. А вот в Испании, Перу, Бразилии — из 6 гаплотипов у четырех — 19 повторов! Если в Италии еще можно списать на хорватов, то у испанцев и португальцев они откуда?

Vadim Viarenič-Stachowski По 13 маркерам гаплотипы динариков мало отличаются от островного британского кластера. Кстати, Вы их тоже считаете потомками фракийцев?

Вячеслав Носевич:

Я потому 13-маркерные и игнорирую, хотя по ним тоже можно было бы кое-что показать. Чем длиннее, тем надежнее. Я бы с радостью работал с 111-маркерными, но где их взять по тысяче на каждую популяцию? 17 — это нижний предел, на котором хоть плюс-минус 50 % надежности.А еще лучше — выявить пару-тройку снипов, по которым различаются южный и северный кластеры, и посмотреть их распространение. Бог даст — доживем и до такого.

Vadim Viarenič-Stachowski Берите хотя бы 25-37 локусные, благо их достаточно.Насчет снипов — согласен.

Вячеслав Носевич:

«Берите хотя бы 25-37 локусные, благо их достаточно» Это по десятку-двум динарских гаплотипов на каждую популяцию? Достаточно — это на порядок больше. Плюс данные должны быть таковы. чтобы можно было оценить общую частоту в выборке (а по базам FTDNA это практически невозможно). В этом плане YHRD — хоть что-то, хотя и далеко от того, что хотелось бы.

Valery  Vassilchenko

Любопытно, что представители южного кластера немногочисленны в Греции и Албании.

Валерию «Присутствие I-M423 в Испании может быть объяснено и таким способом»: Таким — как раз не может! Даже если предположить, что бесправные рабы испанских мавров смогли наплодить столько потомков, что они попали в нынешние куцые выборки, эти «сакалиба» могли быть только из восточной Европы, т.е. с 20 повторами (как в Якутии). Я же именно про это и писал.
Vadim Viarenič-Stachowski Ладно.Присылайте мне свою выборку — я ее проанализирую.

Итак, в рамках спора с ув. Вячеславом Носевичем  я проанализировал гаплотипную структуру выборки. Выборка представляет собой компиляцию из 1378 -локусных Y-STR гаплотипов баз данных YHRD ,БД ЦСЭК, и статей Berger et al., 2005; Karachanak et al., 2013; Ljubković et al.2008;Roewer et al., 2008;Mirabal et al., 2010; Mielnik-Sikorska et al., 2013

Перед непосредственным началом изучения эволюционно-филогенетических особенностей гаплотипов, я оценил степень вероятности  принадлежности представленных гаплотипов к I2-P37.2, в тех случаях когда информация о снипе (гаплогруппе) отсутствовала. В качестве инструмента выверки использовался предиктор ув.Вадима Урасина (этот предиктор используется лабораторией популяционной генетики ГУ МГНЦ РАМН). Внутренние принципы работы предиктора просты: построено  филогенетическое дерево каждой гаплогруппы на основе тысяч гаплотипов из открытых источников и научных статей. При анализе опеределенного гаплотипа он сравнивается с каждой кладой, вычисляется  разница в гаплотипах и проверяется могли ли произойти эти мутации за то время,  которое прошло с зарождения клады.

После обработки результатов, мы отфильтровали гаплотипы, отнесенные предиктором к другим гаплогруппами, а также те гаплотипы, чья вероятность принадлежности к I2-З7.2 была ниже 80%. После фильтрации, число проверенных гаплотипов составило 578 индивидуальных гаплотипа. Что касается соотношения удаленных гаплотипов в популяциях, то наибольшое число гаплотипов было удалено из греческой, болгарской, албанской популяций (так как удаленные гаплотипы оказались принадлежащими к различным кладам J2 и E1b).

Затем я подготовил гаплотипы к предварительному анализу в филогенетической программе. Поскольку в силу низкого разрешения гаплотипов выборки, я отказался от использования эксплицитного нахождения оптимальных деревьев в продвинутом софте вроде phyloMurka (программа Валерия Запорожченко) и TNT.  Основных причины отказа две — по 17 локусам можно построить десятки тысяч оптимальных деревьев с одинаковой «стоимостью», что означало бы потребность мотивировать выбор в пользу той или иной конкретной топологии дерева.  Вторая проблема — это необходимость укоренения филогенетического дерева,  и в данном случае выбор укореняющего гаплотипа был бы затруднителен (я сознательно не использую модальные гаплотипы).  Стоит отметить еще один субъективный момент: мне, как поcт-структуралисту, предпочитаю сетевые ризоморфные динамические структуры строго иерархическим структурам вроде привычного всем генеалогического или филогенетического древ.

Следуя рекомендациям авторов, я удалил из выборки составной локус 389I/389II. Затем, в классической программе Fluxus Network «эволюционную» филогенетическую сеть  17-локусных гаплотипов динарской субклады I2a-37.2, в которой с помощью алгоритма Greedy PH и пошаговой комбинации методов Star Contraction/Reduced Median/Median-Joining было определено наиболее парсимоническое дерево (штейнеровское дерево). За счет применения метода Star Contraction (сжатия локальных филогенетических старкластеров в один предковый гаплотип) число гаплотипов было уменьшено до 387.

883881_10200740880394163_1467437958_o

 

Современная мифология: генетики нашли разных русских

В этой записи я хочу проиллюстрировать на примере последнего исследования генофонда русских популяций как ошибки в методологии и неверно проинтерпретированные результаты приводят к созданию новых ложных мифологем.

Речь идет о недавно опубликованном исследовании cпециалистов Института молекулярной генетики (ИМГ) Российской академии наук выполненном в сотрудничестве с зарубежными генетиками. Как сообщается в пресс-дайджесте, ученые обнаружили в генофонде народов Северной Европы новую ветвь, представленную популяциями народа коми, результаты этой работы опубликованы в журнале PLoS ONE:

«Выполненная работа фактически является первым исследованием, в котором проведен столь масштабный, полногеномный анализ генофондов популяций европейской части России», — заявила руководитель проекта, заведующая Отделом молекулярных основ генетики человека ИМГ профессор Светлана Лимборская.

По ее словам, главное в результатах работы — обнаружение новой ветви в генофонде севера Европы, которая представлена популяциями коми.

«Положение генофонда коми как новой генетической ветви связано, главным образом, с наличием у них предкового компонента, не описанного ранее в других уже исследованных популяциях — как Европы, так и Азии. Особенно велика его доля у ижемских коми, где он суммарно составляет более 80% проанализированного генофонда», — сказала Лимборская.

«Следующим важным фактом является демонстрация того, что русские популяции центра Восточно-европейской равнины генетически сходны между собой и с популяциями Восточной и Центральной Европы, и в тоже время довольно сильно отличаются от русских европейского севера (Архангельская область). Своеобразие северных русских, по-видимому, связано с вхождением и сохранением в их генофонде значительного числа генетических особенностей, свойственных финно-угорским народам, которые проживали ранее на этих территориях», — добавила она.

Я не буду комментировать последнее утверждение (различие русских севера и центра Восточно-европейской равнины), так как любой человек, имеющий хотя бы небольшое представление о работах геномных блоггеров, принимает это «открытие» в качестве банального и самоочевидного утверждения. Вместо этого, я остановлюсь на «главном открытии» популяционных генетиков:

«Положение генофонда коми как новой генетической ветви связано, главным образом, с наличием у них предкового компонента, не описанного ранее в других уже исследованных популяциях — как Европы, так и Азии. Особенно велика его доля у ижемских коми, где он суммарно составляет более 80% проанализированного генофонда», — сказала Лимборская.

Подтекст этого столь громкого заявления становится более очевидной, если мы примем во внимании результаты наших исследований генофонда популяций северо-западной Евразии. Эти изыскания мы представили на ряде российских и иностранных интернет-форумов.  В этой связи возникают интересные нюансы, связанные с первичностью описания  нового предкового компонента.  Впрочем, для начала нужно разобраться, на чем имено строятся заключения попгенетиков касаемо уникальности генофонда коми.

Для начала нужно ознакомится с тезисами, изложенными в самой работе.

Пожалуй, основным аргументом здесь являются результаты анализа адмикса популяций (вернее, кластеризации популяций по признаку K — числу предковых популяций) в программе Admixture:

Как следует из комментариев авторов работы, их выводы весьма отличны от того, что было объявлено в СМИ:

Хотя предковые компоненты Admixture зависят от включенных популяций, на результаты кластеризации могло оказать минимальное влияние генофонд ненцов. Здесь мы можем отослать к существующим данным, свидетельствующим либо об отсутствии или очень ограниченной степени генетических контактов между ненцами и популяциями, перечисленными выше (в том числе и коми) [15], [44], [45], а также к результатам наших анализов, которые свидетельствуют о генетической изоляции ижемских коми. Свидетельством последнего служат как попарные  сравнения параметра Fst которые были одинаковыми, как между группами ижемских и  прилужских коми, которые возникли в пределах одной и той же этнической территории,  так и с географически удаленными финнами из Хельсинки, а такж  крайне высокие показатели ROH (гомозиготных сегментов).

Еще одним свидетельством (эксплицитно неупомянутым авторами статьи)  изолированности ижемских коми служит их положение в пространстве первых двух главных компонент генетического разнообразия. Подобное положение характерно для групп, испытавших на себе действие пресловутого эффекта Валунда. К слову, подобный эфект хорошо заметен в еще более значимой степени у популяций саамов (смещенность аллелей в силу подразделенности популяций):

Следовательно, зашкаливающие значения одного компонента у ижемских коми есть прямое следствие эфекта смещения аллелей в силу изолированности группы.  Как показывает мой опыт работы с генотипами подобных групп (например с популяцией косоваров), в популяциях где распределение аллелей смещено за счет инбридинга, генетического дрейфа или эффекта Валунда, программа Admixture создает искусственные кластеры. Именно по этой причине, одной из предпосылок проведения грамотного анализа в Admixture  служит минимизация данных эффектов в обследуемой выборке. И именно по той же причине геномные блоггеры не принимают для анализа данные родственных лиц.

Подведем итог: высокий уровень красного компонента представляется нам следствием систематического смещения вследствие неправильного отбора, т.е. при создании выборки (sampling, или assembling bias), вследствие измерений (measurement bias), при воздействии вмешивающихся факторов (confounding bias).

Напоследок, пару слов о уникальности генофонда коми.

Весной прошлого года я изучал cнипы древних жителей Швеции (о результатах мне предстоит еще написать) в сравнении с современными популяциями. В ходе анализа,  я задействовал более подробную выборку популяций русского севера и Восточной Европы. Примечательно, что при K=3, один из предковых компонентов в генофонде представителей готландской культура ямочной керамики (Pitted Ware culture (около 3200 — 2300 гг. до н. э.) — культура охотников и собирателей эпохи неолита. Существовала на юге Скандинавии, в основном вдоль побережья Свеаланда, Гёталанда, Аландских островов, на северо-востоке Дании и на юге Норвегии) сближает их с современными саами. Другой пик компонента приходится на популяции коми.  Я назвал этот компонент компонентом Ajv-Saami (Ajv — название пещеры, где были найдены останки древних готландцев, чье ДНК позже исследовалось профессором Скоглундом из Уппсальского университета). Поэтому утверждение Лимборской о том, что компонент описан ею впервые, мягко говоря, некорректен. Компонент действительно уникален, но из современных популяций, он скорее более типичен для саамов, а не коми.  Согласно нашим предположениям, он может является реликтовым остатком генофонда мезолитического населения Европы.

admixture-3

Сванте Паабо: подсказки ДНК о нашем внутреннем неандертальце — лекция TED.com

Делясь результатами массивного, всемирного исследования, генетик Саванте Паабо предъявляет ДНК-доказательство о том, что ренние люди смешивались с Неандертальцами после выхода из Африки. (Да, у многих из нас есть Неандертальское ДНК). Он также показывает как мизерной кости пальца ребенка было достаточно для определения целого нового вида гуманоида.

Svante Pääbo explores human genetic evolution by analyzing DNA extracted from ancient sources, including mummies, an Ice Age hunter and the bone fragments of Neanderthals. Full bio »

Translated into Russian by Lola Bakhareva
Reviewed by Alexandra Belyakova-Bodina

Ученые вдвое «состарили» предка всех мужчин

http://ria.ru/science/20130306/926203809.html#ixzz2MtC5OCDc

МОСКВА, 6 мар — РИА Новости. Один коммерческий генетический тест, проведенный в США, привел к пересмотру истории человечества — в результате теста была обнаружена Y-хромосома, которая почти в два раза старше, чем самые древние представители человека современного вида, сообщает New Scientist со ссылкой на исследование, опубликованное в American Journal of Human Genetics.

Носителем уникальной хромосомы был живший в Южной Каролине и недавно умерший афроамериканец Альберт Перри (Albert Perry). Несколько лет назад одна из его родственниц передала образцы его тканей в компанию Family Tree DNA для генеалогических исследований. Известно, что все мужчины наследуют Y-хромосому по мужской линии, и общий для них всех предок, «генетический Адам», жил от 60 до 140 тысяч лет назад.

Однако Y-хромосома Перри оказалась уникальной: ее не удалось «вставить» в общее генеалогическое дерево, для нее не нашлось ни предков, ни потомков. Майкл Хаммер (Michael Hammer) из университета Аризоны узнал об этом случае и начал поиски по всем известным базам данных, которые привели к обескураживающему результату: Перри не был потомком «генетического Адама» по мужской линии, его Y-хромосома «рассталась» с остальным человечеством примерно 338 тысяч лет назад. При этом наиболее древние известные останки человека современного вида относятся к значительно более поздней эпохе — 195 тысяч лет назад.

В ходе дальнейших поисков Хаммеру и его коллегам удалось обнаружить «родственников» Y-хромосомы Перри в одной африканской базе данных. Сходные хромосомы были обнаружены у 11 мужчин, живущих в одной деревне в Камеруне.

По мнению ученых, «казус Перри» означает, что на заре своей истории люди современного вида скрещивались с другой неизвестной популяцией людей, которая затем полностью исчезла. Исследователи считают, что необходимо провести новые генетические исследования людей, живущих к югу от Сахары. Возможно, генетических археологов ждут новые сюрпризы, которые сделают раннюю историю человечества еще более запутанно

 

Элементы — новости науки: Наши предки заимствовали у неандертальцев и денисовцев важные гены для защиты от вирусов

Элементы — новости науки: Наши предки заимствовали у неандертальцев и денисовцев важные гены для защиты от вирусов.

Успехи палеогенетики позволили обнаружить в генофонде внеафриканского человечества заметную примесь неандертальских и денисовских генов. До сих пор, однако, не было известно, какие полезные признаки приобрели наши предки в результате гибридизации с архаичными человеческими популяциями. Новое исследование показало, что сапиенсы заимствовали у неандертальцев и денисовцев несколько широко распространенных за пределами Африки вариантов (аллелей) трех генов Главного комплекса гистосовместимости —HLA-AHLA-B и HLA-C, — от которых зависит устойчивость к вирусным инфекциям.

Гены и белки Главного комплекса гистосовместимости (ГКГ) класса I играют у позвоночных ключевую роль в борьбе с вирусными инфекциями, а также с переродившимися (например, раковыми) клетками собственного организма. У человека этих генов три, называются они HLA-AHLA-B иHLA-C и располагаются все вместе (единым кластером) на шестой хромосоме.

Белки ГКГ необходимы для того, чтобы специализированные клетки иммунной системы — T-лимфоциты и NK-лимфоциты — могли своевременно распознать присутствие в клетках организма чужеродных белков (например, вирусных). Все белки, имеющиеся в клетке, рано или поздно отправляются на переработку: специальные молекулярные «мясорубки» — протеасомы — режут их на короткие фрагменты (см.: Белки попадают в протеасому через «преддверие» уже развернутыми, «Элементы», 05.11.2010). Некоторые из этих фрагментов — пептиды длиной по 8–10 аминокислот — присоединяются к белкам ГКГ и вместе с ними транспортируются на поверхность клетки. Сидящие на поверхности клеток комплексы из белков ГКГ и прикрепленных к ним пептидов представляют собой что-то вроде «паспорта» клетки. Лимфоциты «ощупывают» их своими рецепторами, и если будет замечен чужеродный пептид, клетка может быть атакована и уничтожена.

Упрощенная схема участка шестой хромосомы, содержащего гены ГКГ класса I. Рисунок из обсуждаемой статьи в Science

Упрощенная схема участка шестой хромосомы, содержащего гены ГКГ класса I. Рисунок из обсуждаемой статьи в Science

Каждый белок ГКГ может прикрепить к себе не любой пептид, а только принадлежащий к определенному классу (с определенными аминокислотами, занимающими несколько «ключевых» позиций). Поэтому от набора генов ГКГ в геноме зависит, от каких вирусов организм будет хорошо защищен, а от каких — не очень. Поскольку вирусов много и они быстро эволюционируют, гены ГКГ находятся под действием так называемого балансирующего отбора, поддерживающего высокий уровень генетического полиморфизма. Действительно, гены ГКГ класса I чрезвычайно полиморфны: каждый из них присутствует в генофонде в виде сотен вариантов (аллелей). Хотя у одного человека в геноме может быть, конечно, только по два аллеля каждого из трех генов.

Полиморфизм генов ГКГ дополнительно поддерживается половым отбором, потому что многие позвоночные выбирают партнеров на основе индивидуального запаха, который во многом определяется набором пептидов ГКГ, причем предпочтение часто отдается запаху, несхожему со своим собственным (см.: Видообразование — личное дело каждого, «Элементы», 15.02.2006). Такой алгоритм выбора партнера дает преимущество редким аллелям ГКГ, и в том же направлении действует отбор, осуществляемый эпидемиями вирусных заболеваний.

Ранее было показано, что в генофонде современного внеафриканского человечества имеется примесь генов архаичных евразийских человеческих популяций — неандертальцев и денисовцев (см.: Геном неандертальцев прочтен: неандертальцы оставили след в генах современных людей, «Элементы», 10.05.2010; Прочтен ядерный геном человека из Денисовой пещеры, «Элементы», 23.12.2010). Логично предположить, что среди заимствованных генов были и какие-то аллели ГКГ. Вышедшие из Африки сапиенсы наверняка были хуже приспособлены к местным инфекциям, чем коренные обитатели Евразии, поэтому такое заимствование могло оказаться для них весьма полезным.

Большая международная группа генетиков решила проверить это предположение. О результатах проверки рассказано в статье, опубликованной в последнем выпуске журнала Science. Авторы сопоставили набор аллелей генов HLA-AHLA-B и HLA-С у трех неандертальцев из пещеры Виндия в Хорватии (у всех троих, кстати, набор аллелей ГКГ класса I оказался одинаковым, что свидетельствует об очень близком родстве) и у человека из Денисовой пещеры с разнообразием аллелей этих генов в современном человечестве. В ходе анализа использовалось несколько взаимодополняющих подходов и статистических методов. В частности, учитывались данные по так называемому «неравновесию по сцеплению» (linkage disequilibrium, LD) — этим неудобоваримым термином генетики обозначают повышенную, по сравнению с ожидаемой при случайном распределении, частоту совместной встречаемости двух генетических вариантов (например, определенного аллеля HLA-B с определенным аллелем HLA-C).

Еще раз о экзомном тестировании — пример отчета Exome 80x 23andme

Пару дней тому назад в своем блоге я изложил

Но поскольку одна картинка стоит тысячи слов, то с разрешения владельца, я размещаю в блоге пример отчета, выдаваемого клиентам 23andme после прохождения экзомного тестирования.  Как видно по нижеприведенным изображениям, этот отчет носит сугубо отвлеченной характер, а характер излагаемой информации предполагает наличие немалых познаний в современной геномике.

  554597_4120657144542_494648084_n 303382_4120657544552_2124700585_n 252231_4120657784558_1755564213_n 479720_4120658184568_761081981_n 285695_4120658504576_1081385431_n 527651_4120658824584_192594454_n 551743_4120659024589_475852363_n 599435_4120659384598_2023625463_n 527612_4120659544602_1322921037_n 250942_4120659744607_1560066672_n 542556_4120660024614_715032428_n 250944_4120660464625_514191875_n 224935_4120660584628_446354628_n

Открытая полемика с историком Носевичем по вопросу о происхождении динарской субклады I2a

Ув. Вячеслав Носевич! Вы высказали обоснованную критику моих взглядов на происхождение динарского кластера I2a. Считаю  нужным высказать свои встречные возражения. Мои соображения основаны не на голых спекуляциях, а строгих математических формальных методах. Собственно именно наиболее вероятная, парсимоническая трактовка полученных результатов филогенетического и статистического анализа молекулярного разнообразия гаплотипов I2a2 свидетельствует о экспансии этой субклады с территории Карпато-полесского региона. Во-первых, нужно сразу оговорится что коль речь идет о славянах из Восточной Европы, то речь идет не просто о I2a, а о I2a2 — поскольку эта группа практически экслюзивна представлена у славян и их ассимилированных потомков. Далее — о статистическом анализе Остался мой вопрос незамеченым. Так вот, сравнение результатов теста AMOVA по 2 группировкам -лингвистической (популяции объединены в группы по принадлежности к той или иной языковой группе) и антропологической (популяции объединены по принципу генетической близости антропологических признаков)- показывает, что вероятность корреляции разнообразия отдельных этногрупп I2a2 с лингвистическими барьерами выше, чем с антропологическими. Хотя в обоих группировках 98% разнообразия приходится на вариации внутри популяций, однако при анализе статистической значимости вероятность верности нулевой гипотезы (о наличии вариации внутри популяций) равна только 0.005 (0.5%). Поэтому, с точки зрения статистики случайных чисел, следует признать этот результат статистически незначимым, т.е случайным. В процент разнообразия между этногруппами популяции выше именно в лингвистической группировке примерно в два раза -0.20% против 0.10% в антропологической группировке. При этом, в антропологической вероятность верности нулевой гипотезы, т.е. того, что группы этнопопуляций являются разнообразными в плане полиморфизмов Y-STR гаплотипов I2a2a, составляет примерно 14%. В то же время, как вероятность верности нулевой гипотезы о существенном разнообразии Y-STR гаплотипов I2a2a между группами популяций, разбитых по лингвистической близости, примерно в два раза выше и составляет 28%. Следуя полученным стат.результатам, необходимо признать, что I2a2a не являются автохтонами Балкан и Динарских Альп, в противном случае наблюдалась более существенная корреляция между популяцией I2a2a и антротипом. Дуализм антропологических параметров популяций Динарских Альп и языковой принадлежности — хорошо известный исследователям факт. Поскольку популяции I2a2a лучше коррелируют с языком, а не с антротипом, то можно сделать два вывода: 1) экспансия субклада произошла недавно, т.к. не утерялась связь представителей генетической линии с языком 2) поскольку славянские языки были явно привнесены на Балканы, то нужно признать, что I2a2a были в числе генетических линий, представители которых привнесли славянские языки на Балканы. Я проанализировал молекулярное и стандартное разнообразия, а также генетическую дистанцию гаплотипов представителей субклада I2a2-Dinaric. В ходе анализа мною проанализировано 624 «коммерческих» гаплотипа (17-67 маркеров) этого субклада (плюс некоторое количество гаплотипов из научных выборок), разбитых на этнопулы (согласно задекларированной национальности носителя гаплотипа). Комплексный анализ трех параметров позволяет, наряду с филогенетическим анализом, определить место вероятное происхождения субклада, а также предположить характер и степень влияния популяционных эфектов. Вот, к примеру, еврейский кластер с максимальной дистанцией и самым низким разнообразием указывает на недавнее происхождение кластера как следствие чистого эфекта отца-основателя. Боснийско-герцеговинский кластер (второй по величине интерпопуляционной дистанции), но с более высоким уровнем разнообразия указывает на более удаленный эфект основателся популяции. В то время, как те же хорватский кластерI2a2-Din с низким уровнем разнообразия, но с незначительной дистанцией от других популяций -следствие кумулятивного результата пресловутых популяционных эфектов основателя и бутылочного горлышка.

Ответ В.Носевича:

«Вадим, спасибо за ссылки! Это обсуждение я раньше не видел. Теперь Ваша позиция мне ясна, и я могу ее прокомментировать. Прежде всего хочу сказать, что отчасти Ваши претензии порождены недоразумением. Вам показалось, что я — сторонник происхождения динарского кластера из «ледникового убежища». Но перечитайте внимательнее мой текст — я этого вовсе не утверждаю, пишу только о неолитических культурах на местном мезолитическом субстрате. Почему мезолитическом? Да потому, что неолит анатолийского происхождения не мог содержать I2a. Уже установлено, что его представители имели G2a и E1b-V13, продолжают дискутироваться J2 и R1b, но никак не I2a. Чтобы избежать дальнейших недоразумений, и учитывая то, что Вы сделали эту дискуссию общедоступной, я постараюсь оговаривать даже очевидные вещи. Заранее прошу прощения, если что-то покажется тривиальным. Только не называйте меня профессором — я уж больше 20 лет простой кандидат наук, и им, наверное, умру. Во всяком случае, не испытываю потребности тратить время на защиту докторской или на доказывание кому-то, что достоин присвоения ученого звания. Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a. Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2. Ее более поздним ответвлением, видимо, являются мутации L147.4 и L343. Произошли они до формирования динарского кластера или после — пока неясно, поскольку определены они у считанного числа индивидов. Но L147.2 выявлена, помимо славян, у как минимум одного англичанина (его Kit Number в соответствующем FTDNA-проекте — 14703), двух немев (162426 и 164573), одного итальянца (93943) и одного еврея из Литвы (211949), а L147.4 и L343 — только у славян: двух поляков (209633 и 76814) и боснийца (154978). При этом никого с L147.2+ на L147.4 и L343 не тестировали. За последнее время, может, что-то изменилось, с весны не заглядывал на их сайт. Я целиком согласен, что ветвь эта — очень молодая, и потому никак не могла сформироваться в динарском «ледниковом убежище». Говорить уверенно про 2-3 тысячи лет я бы не рискнул, но что не ледниковая эпоха, и даже не мезолит — это точно. Это не значит, что на Балканах, или где-то еще в Европе, в палеолите и мезолите не могло быть любой концентрации предковой M423. Но это значит, что прародитель всех миллионов нынешних «динарцев» тогда в каждом поколении был представлен строго одним индивидом, притом мутациям L147.2, L147.4, L343, а может даже и L621/S392 еще предстояло появиться у его весьма отдаленных потомков. Не будет гадать, где именно вилась эта ниточка на протяжении тысячелетий. Важно, что однажды она начала разрастаться. В большинстве случаев такие вещи связаны с неолитической революцией. Именно тогда сформировались зародыши современных огромных кластеров. В эпохи энеолита – бронзы они сильно перемешались, и все последующие случаи быстрого разрастания популяций приводили к росту не одной линии, а своеобразного ассорти из нескольких коррелирующих. Именно так случилось у славян: доминирует у них вовсе не одна R1a1, как по старинке думают многие, а целый «ассорти» из нескольких параллельных ветвей: M458 (на уровне от 5 до 10 %), ее дочерняя L260/S222 (от 2-3 до 10 %, а у поляков – более 13), примерно пять ветвей S466/Z280 (от 1 до 10 % каждая). В сумме это и дает знаменитые 50 и более % R1a1. Сопоставимая с ними по возрасту I2a3а-L147.2 на этом фоне – безусловный лидер, самая массовая славянская гаплогруппа, представленная в большинстве популяций на уровне порядка 10-20%, а у сербов и хорватов — выше 30%. Нас обоих интересует, когда и каким образом она влилась в славянский генофонд – ведь у предков славян в бронзовом веке, похоже, ее не было совсем (иначе она была бы не только у славян, но и у их ближайших родственников балтов). В Вашем статистическом анализе сделана попытка прояснить этот вопрос. Примем пока, что методологически там все верно и результаты заслуживают полного доверия. Суть их вы выразили картинкой со стрелками. Непонятно только одно: почему Вы называете прародину карпато-ПОЛЕССКОЙ, если у Вас четко видны стрелки, ведущие с Карпат в сторону Полесья. Если же убрать слово «полесская», то не так уж велика становится разница с моей карпато-балканской (особенно учитывая зигзаг в Словению). Вот динарским называть этот кластер действительно не стоит. В дальнейшем, чтобы не было путаницы с географическим понятием «карпатский», буду пользоваться термином «карпийский». Звучит, по-моему, не хуже, чем «арийский» smile На этом, к сожалению, трогательное единодушие кончается. Справедливо обвиняя оппонентов в недооценке разнообразия гаплотипов, Вы недооцениваете их апелляцию к относительной частоте гаплогрупп. Поясню это буквально на пальцах. Представим себе две чаши, в которых перемешаны в разной пропорции черные и белые шарики. Будем с закрытыми глазами черпать по жмене шариков из каждой чаши и высыпать в третью (это у меня такая модель смешения популяций). Суть в том, что, если шариков достаточно много и они действительно хорошо перемешаны, то Вы никогда не получите в третьей чаше концентрацию шариков одного цвета выше, чем в одной из исходных – все значения будут только промежуточными. Думаю, Вы поняли аналогию: исходная праславянская популяция с концентрацией карпийцев ниже 30 % может дать частоты, характерные для сербов и хорватов, только смешиваясь с субстратом, у которого эта концентрация гораздо выше. Это правило может нарушаться, если шарики плохо перемешаны. На одном краю чаши лежат почти одни черные, и если зачерпнуть оттуда, в третьей чаше черных окажется больше, чем в среднем в каждой из исходных. Применительно к популяциям это означает, что одна из исходных была гетерогенной. Говоря словами незабвенного Владимира Вольфовича, в числе русских там числятся и сыновья «журналистов». Притом их не просто много, а они компактно сконцентрированы в зоне будущего контакта с другой популяцией. Возможна ли такая ситуация в пражской культуре? Учитывая степень ее археологической однородности – маловероятно, но чем черт не шутит. В предыдущем посте я перечислил возможных кандидатов на роль «сыновей журналистов». Методом исключения к карпийскому кластеру могли принадлежать только потомки даков или чернолесского субстрата лесостепных скифов. Мы приходим к тому же, что Вам не понравилось в моей статье – у фракийцев концентрация карпийского кластера была порядка 40 %, и к славянам он попал именно от них. Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы. Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье. Если есть возражения – пишите, обсудим. Если хотите – могу пройтись и по методологии Вашего статанализа, там тоже не все просто. ********* А что касается разрастания, то Вы применяете тот тип моделирования (по методу Монте-Карло), с которого я начинал еще в 80-е. Поэтому я хорошо представляю, насколько он чувствителен к исходным посылкам. К тому же в стохастическом процессе бессмысленно говорить о темпах экспансии конкретной субклады — существует лишь распределение вероятностей от полного вымирания до предельной экспансии (вариант хромосомного Адама). Место реальной клады в этом распределении вычислить нельзя в принципе. Можно лишь показать, что данный темп экспансии при принятых допущениях возможен или исключен, только и всего.»

Ответ оппоненту и критика версии происхождения гаплогруппы I2 в изложении академической популяционной генетики:

«Вам показалось, что я — сторонник происхождения динарского кластера из «ледникового убежища». Но перечитайте внимательнее мой текст — я этого вовсе не утверждаю, пишу только о неолитических культурах на местном мезолитическом субстрате. Почему мезолитическом? Да потому, что неолит анатолийского происхождения не мог содержать I2a. Уже установлено, что его представители имели G2a и E1b-V13, продолжают дискутироваться J2 и R1b, но никак не I2a.”

По этому пункту вряд ли можно что-то возразить. Однако в целях научной педантичности необходимо сделать пару поправок. Во-первых, вопрос о том, могла ли быть I2a привнесена в Европу в ходе неолитической демагрофической революции никогда и ни кем всерьез не ставился. Статья о I2 в русской Википедии была написана любителями, и в плане содержащейся в ней информации значительно устарела. Поэтому Вы правильно сделали, что даже не стали обсуждать содержащиеся в этой статьей ложные и трудноверифицируемые выводы о том, что “носители культуры Балканского неолита (в том числе и Трипольской культуры). Последний тезис подтверждается тем фактом, что как балканский неолит является развитием ближневосточного, так и балканская гаплогруппа I родственна ближневосточной гаплогруппе J, хотя данные об их расхождении разнятся.” Тут следует сделать небольшой экскурс в прошлое. В самом начале систематического изучения вариативности человеческой Y-хромосомы в контексте масштабных популяционных передвижениях, в работах таких маститых ученых с мировым именем, как Андерхилл (2007) и Роотси(2004) была выдвинут простая, но по тем временам крайне убедительная гипотеза “трех рефугиумов”. Это теперь не вызывает никакого сомнения, что эта нашумевшая гипотеза “трех гаплогруппных рефугиумов” была частично сознательной уловкой с целью адаптации нового знания под уже устоявшиеся взгляды последователей отца-основателя популяционной генетики Л.Кавалли-Сфорца. А тогда эта новая теория была воспринята как догма, и как не прискорбно многие из популяционных генетиков продолжают ей следовать. Согласно этой теории, предки современных носителей гаплогруппы I пережили неблагоприятный период последнего ледникового периода в динарско-балканском рефугиуме. А аргументировали свое заключение отцы игрек-хромосомоведения крайне простым силлогизмом – присутствие I на Балканах во времена столь глубокой древности якобы маркировано уже тем фактом, что I и сейчас очень много. Разумеется, о дальнейшей детализации гаплогрупп и разбиении на субклады на момент написания статьи не могло быть и речи (красноречивым фактом служит хотя бы то, что гаплогруппа I2a не детализировалась ниже уровня снипа P37.2). C появилась целая группа деклассированных антропологов-подпевал, которые стали петь дифирамбы гению попгенетиков – вот мол, какой убедительный аргумент в пользу антропологической приемственности населения Балкан дали нам в руки генетики. Авторитет вышеупомянутого коллектива авторов был столь велик, что это удивительное в своей примитивности умозаключение на протяжении последущих 8-10 лет перекочевывал из одной статьи в другую, пока окончательно не оформился в виде неоспоримого догмата. Казалось бы — любое научное знание принципиально не является окончательным, а есть лишь промежуточная интерпретация истины, подразумевающая последующую замену на лучшую интерпретацию. Однако прочитав последную статью хорватских ученных о гаплогруппной вариативности населения Хорватии, я – к своему глубокому прискорбию – еще раз убедился, что мои наихудшие опасения насчет феноменальной косности научного мышления оправдались. В самых дурных традициях квазиакадемического стиля, идеологически анагажированные хорватские генетики продолжают разглагольствовать о “палеолитической балканской гаплогруппе I”. А из научно-популярной заметке (по своей сути, кратком реферате статьи) в сплитской газете благодарный хорватский обыватель узнает о том, что хорваты – это древнейший автохтонный народ Европы. Так-то!

Вячеслав Леонидович, Будем считать предыдущее сообщение пролегоменами к критике научных представлений о субкладе I2a, и поэтому перейдем к фактологической составляющей Ваших утверждений:

Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a.»

Во избежание возможных смысловых экивоков, сразу же предлагаю отказаться от дальнейшей «динаризации» субклады, которую мы будем обсуждать. «Динарский кластер» — это собрикет, придуманный Кеном Нордведтом для обозначения той ветви I2, которая в дальнейшем получит официальное ISOGG название I2a1b3 (L621/S392, что идентично в старой версии I2a2a). Динарский кластер целиком входит в состав этого субклада, являя собой монофилетический таксон. В профессиональной литературе этим термином никто не пользовался и никогда не будет пользоваться. Это хорошо, поскольку у непосвященного в таинства молекулярной антропологии этот собрикет может вызвать ложные аллюзии с «динарским антропологическим типом».

«Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2.»

В этом предложении сразу две фактологические ошибки. Мутация M423 маркирует не I2a1b3, а ее родительскую группу I2a1b. Строго говоря, последняя делится на четыре ветви: a) гипотетический корень I2a1b* b) упомянутая в статье 2002 года I2a1b1 M359.2/P41.2 (хотя до сих пор НИКТО не видел ни одного реального гаплотипа этой группы) c) I2a1b2 L161.1/S185 d) I2a1b3 L621/S392 Две последние ветви I2a1b2 и I2a1b3 имеют строго определенный эксклюзивный ареал распространения, практически не пересекающийся друг с другом. I2a1b2 представлена, в основной своей массе, на Британских островах (отсюда и название «I2a-Isles», данное все тем же «крестным отцом» Нордведтом. Я не буду пока останавливаться на этой ветви и перейду к непосредственно интересующей нас I2a1b3 L621/S392. Здесь следует указать на Вашу вторую ошибку -| Как показало WTY-тестирование, мутация L621/S392 определяет СВОДНУЮ группу, состоящего как из ДИНАРСКОГО кластера, так и кластера DISLES (не знаю как перевести это на русский) — промежуточного между ДИНАРСКИМ и ОСТРОВНЫМ кластерами.

Ее более поздним ответвлением, видимо, являются >мутации L147.4 и L343.»

Это умозрительно. Во-первых, снип L147 [+] встречается в разных группах. Об этом я уже раньше упоминал, причем в IJ он встречается в разных субгаплогруппах аж 3 раз. Такие вотильные снипы не могут быть основанием для надежной филогении. Ergo, мы не можем говорить о том что этот снип разбивает ветвь на надежные в плане исторической интерполяции ветви. Почему существуют такие снипы, никто не смог внятно объяснить ни с позиций генетики, ни молекулярной биологии. То же самое касается L343, которые был выявлен также и у некоторых членов гаплогруппы I1.

Произошли они до формирования динарского >кластера или после — пока неясно, поскольку >определены они у считанного числа индивидов. Но >L147.2 выявлена, помимо славян, у как минимум >одного англичанина (его Kit Number в >соответствующем FTDNA-проекте — 14703), двух >немев (162426 и 164573), одного итальянца (93943) >и одного еврея из Литвы (211949), а L147.4 и L343 — >только у славян: двух поляков (209633 и 76814) и >боснийца (154978). При этом никого с L147.2+ на >L147.4 и L343 не тестировали.

Cм.выше.

Я целиком согласен, что ветвь эта — очень молодая, >и потому никак не могла сформироваться в >динарском «ледниковом убежище».

Говорить уверенно про 2-3 тысячи лет я бы не рискнул, но что не ледниковая эпоха, и даже не мезолит — это точно. Это не значит, что на Балканах, или где-то еще в Европе, в палеолите и мезолите не могло быть любой концентрации предковой M423. Но это значит, что прародитель всех миллионов нынешних «динарцев» тогда в каждом поколении был представлен строго одним индивидом, притом мутациям L147.2, L147.4, L343, а может даже и L621/S392 еще предстояло появиться у его весьма отдаленных потомков. Не будет гадать, где именно вилась эта ниточка на протяжении тысячелетий. Важно, что однажды она начала разрастаться. В большинстве случаев такие вещи связаны с неолитической революцией. Именно тогда сформировались зародыши современных огромных кластеров. В эпохи энеолита – бронзы они сильно перемешались, и все последующие случаи быстрого разрастания популяций приводили к росту не одной линии, а своеобразного ассорти из нескольких коррелирующих. » Не совсем так. Вы пишите, что в большінстве cлучаев экспансия гаплогрупп связана с неолитической революцией. Это не совсем верно. Поскольку размер эффективной популяции для Y-хромосомы в тысячи раз меньше аналогичной для аутосомных хромосом. Это означает что рост численности Y-хромосомной гаплогруппы или кластера может происходит относительно быстро и так же стремительно снижаться. Особенно если речь идет об относительно закрытом сообществе. Этот вопрос был неплохо изучен в известной статье «Y-хромосома как сигнатура гегемонии».

Уважаемый Вячеслав Леонидович! Еще раз прокомментирую Ваш комментарий:

«Итак, мы будем обсуждать происхождение так называемого динарского кластера гаплогруппы I2a. Раньше его выделяли по мутации M423, но сегодня уже известно, что эта ветвь делится на дочерние, из которых нас интересует L621/S392 и ее подветвь L147.2»

Про M423 я уже писал ранее в предыдущих комментариях. Что касается L621, то я не вижу особой филогентической полезности мутации для I2a1b3. Она (мутация) не разбивает кладу на субклады, соответствующие выявленным ранее кластерам Din-N или Din-S этой клады.Польза этой мутации может быть только в том, что он может заменить нынешную мутацию L69.2, которая была найдена и в других группах (о чем и свидетельствует цифра два после точки). Примерно год назад я обсуждал результаты теста WTY Y-хромосомы одного из представителей I2a1b3 — пана Станислава Плевако.Не вдаваясь в технические сложности, тест WTY можно описать как прочитку значительной части игрек-хромосомы. Когда я поинтересовался результатами, он сказал что сравнение результата Добсона (из «южно-динарского» кластера) и результата Плевако ( из «северо -динарского» кластера) не выявило ни одной разницы на больше 900 локусов и 215.000 нуклеотидов проведенного сиквенса игрек-хромосомы. Отрицательный результат по этому снипу у другого участника WTY Roy Hale из братской клады I2a2b Isles (L161) сузил снип L621 до 3 кластеров: южно-динарского, северно-динарского и кластера Disles («динарцы на Британских островах»). Поэтому можно считать L621 эквивалентом L69.2 — мутации, которая не отвечает критериям включения кладообразующих мутаций в официальное филогенетическое дерево ISOGG. Чуть позже результаты еще двух I2a1b3 — Пейовича из Черногории и Любинецкого из Польши (76814 Poland – Lubiniecki — I2a2 (M423+, L161-)) подтвердили верность предыдущего умозаключения. Далее Вы пишите:

Сопоставимая с ними по возрасту I2a3а-L147.2 на этом фоне – безусловный лидер, самая массовая славянская гаплогруппа, представленная в большинстве популяций на уровне порядка 10-20%, а у сербов и хорватов — выше 30%. Нас обоих интересует, когда и каким образом она влилась в славянский генофонд – ведь у предков славян в бронзовом веке, похоже, ее не было совсем (иначе она была бы не только у славян, но и у их ближайших родственников балтов)<…>На этом, к сожалению, трогательное единодушие кончается. Справедливо обвиняя оппонентов в недооценке разнообразия гаплотипов, Вы недооцениваете их апелляцию к относительной частоте гаплогрупп.»

Вы повторяете одну из главных ошибок новичков в молекулярной генеалогии, а именно основываете свои выводы на данных о частотах распространения гаплогрупп. Все делали эту ошибку, и я в том числе. Однако, как показал еще Животовский в своей известной работе: «географическое происхождение гаплогрупп Y-хромосомы можно установить по следующему эмпирическому критерию: в том месте или популяции, где возникла данная гаплогруппа, ее частота и STR-дисперсия (или возраст STR-изменчивости) максимальны по сравнению с другими популяциями (Sengupta et al., 2006). При их несовпадении (когда максимум частоты гаплогруппы приходится на один географический регион, а максимум дисперсии – на другой), место возникновения гаплогруппы становится неопределенным, но при необходимости сделать предварительное заключение предпочтение следует отдавать дисперсии как статистически и эволюционно более устойчивому показателю.» Случай с I2a1b3 -это как раз тот самый случай, когда один из пиков-максимумов приходится на Боснию-Герцеговину, а максимум дисперсии на Карпатский регион (см.мои расчеты). Следуя правилу правой руки в изложении Животовского, следует предпочесть последний вариант, так как частоты гаплогрупп больше подвергнуты флуктуациям. Далее, вторая ошибка новичков, которая встречается в Ваших тезисах, это игнорирование масштабов (Masstabe) регионов, сравниваемых по частотам гаплогрупп. Хорошо, давайте возьмем нижний порог частот по допустим, что в среднем в Польше 56% R1a1 и 10% I2a1b (хотя в зависимости от региона Польши и характера выборки статистика сильно плавает). По состоянию на 2000 год в Польше проживало 38 559 110, пусть из них половина мужчин 19279555, то 10% I2a1b это 2 млн.человек. В Хорватии население 4.496.000 или 2.24 млн мужчин, из них пусть 32% (716 800 человек будет I2a1b1). Аналогично, у сербов в среднем должно быть около 1 млн человек субклады I2a1b1. Наконец, в БиГ с пресловутым пиком I2a1b1 по разным оценкам до 60% должно проживать около 1.5 млн представителей I2a2. Вы наверное удивитесь, но я видел десятки людей приходящих на зарубежные форумы с такими же представлениями о I2a1b1. Даже ссылки давались на те же самые карты, соотношение R1a1/I2a (который один из «мудрецов» на DNAforums обозначил как коэффициент славянскости). Правда, практически все они были убеждены в конце концов в моей правоте. Какими способами можно определить гипотетический расклад гаплогруппа у исторических и доисторических народов? Существует три апробированных способа. I.Первый способ — самый надежный, так как базируется на материальных доказательствах (то есть древней ДНК, извлеченнной из археологических специменов). Какое новое знание — о распределении гаплогрупп на Балканах в течении последних нескольких тысяч лет — может дать этот метод? Исходя из данных о «ископаемых» Y-гаплогруппах в неолите (включая генотипирование знаменитой мумии Отци), можно уверено предположить, что они были представлены гаплогруппами G2a, E1b, J2b, J2a, R1b1b2 — то есть теми гаплогруппами, которые связываются с цивилизациями «старой Европы» (с) Гимбутас и более широко с неолитической демографической революцией и миграциями времен бронзового века в Европе.Я же полагаю, что «иллирийцы» тех времен были prima facie представителями субклад J2a1, J2b,E1b1b1a (особенно E1b1b1a2 (E-V13)), субклад G2a (особенно G2a3a), субкладов R1b1b2 (особенно R1b1b2a1a2d) и так далее. Ядро гаплогрупп балканских гаплогрупп времен бронзы по мере убывания могло выглядеть следущим образом:E1b1b1a2, J2b2, J2b1, G2a3, R1b1b2a1a,J2a4, J2b1. Последние работы по анализу древнего ДНК извлеченных из останков в неолитических захоронениях только подтвердили эту гипотезу — там в основном были E1b1b и G2a. То, что сейчас у югославов эти группы в меньшинстве явно объясняется мощным «бутылочным горлышком» времен аварского каганата. II. Второй способ — состоит в интерполяции состава и распространения гаплогрупп в изолированной «потомковой популяции» на распространение гаплогрупп в предковой популяции. Этот способ был использован в недавней статье о гаплогруппах арберешей — потомков албанцев, мигрировавшей в средние века в Италию, где они образовали изолированную группу. Чтобы освежить Вашу память, напомню, что албанцы считаются прямыми потомками иллирийцев. На основании анализа выборки было показано, что вышеупомянутые неолитические балканские гаплогруппы у арберешей по своему распределению соответсвуют современному раскладу этих гаплогрупп на Балканах. В то время как %I2a у арберешей гораздо ниже как среднего % I2a у албанских популяций, так и средней частоты распространения I2a на Балканах. О чем это говорит? О том, что I2а — (относительно) недавние пришельцы на Балканах. Далее, оценка возраста «югославских кластеров» показывает, что они все не «старше» 1400-1500 лет до настоящего времени, что означает бурную экспансию субклада в 5-6 веках н.э. III Третий cпособ -наиболее уязвимый, т.к. строится на филогенетической и статистической обработке массива гаплотипов, оценки возраста БОПа, оценки молекулярного разнообразия, оценки структуры и качества филогенетического дерева и т.д. Я построил десятки тысяч деревей субклада I2a2, а также оценил молекулярное разнообразие субклада I2a2, который оказался близким к % разнообразия из статьи Перчич. Структура дерева, в котором «северные» I2a2-Din находятся ближе к корню, чем «югославы», — а также более высокое молекулярное разнообразие I2a2-Din на севере Восточной Европы достаточно точно свидетельствуют о том, что прародина I2a2 находилась именно в это месте.

Ответ Вячеслава Носевича:

Я не буду в очередной раз комментировать Ваши опровержения моих якобы ошибок, которые происходят от недопонимания того, что я пытался сказать. Это не затрагивает сути обсуждаемой темы. А в ней я вижу два важных аспекта, свою позицию по которым хочу прояснить.Первый аспект связан с определением возраста клады по разнообразию гаплотипов. Почему он оказался столь ненадежным, что Диенекес, например, вообще в нем разочаровался? Дело не в математике как таковой, и не в скорости мутаций. Дело в особенностях ветвящегося случайного процесса, который это разнообразие порождает. Его простота обманчива. На начальной стадии роста клады он легко моделируется по методу Монте-Карло. Клада растет практически независимо от динамики популяции в целом, а если популяция невелика и относительно стабильна (в каменном веке они почти все были такими), то рано или поздно численность «удачливой» клады приближается к эффективной численности популяции. Это – предельный случай генетического дрейфа, когда клада заполняет чуть ли не всю популяцию (реальные примеры описаны у малых народов Сибири, в горных долинах Дагестана, частично этому соответствует и понравившаяся Вам статья про О’Нейлов). Гаплотипы при этом образуют четкий «стар-кластер», в котором модальным является исходных гаплотип разросшейся клады. Соответственно и ее гаплогруппа абсолютно доминирует. Зная скорость мутаций в локусах и измерив частоту гаплотипов, мы можем точно определить возраст клады.А дальше – самое важное. Рост численности разросшейся клады и популяции в целом перестает быть независимым – это очевидно. Что произойдет, если популяция вдруг начнет расти, и даже распадется на несколько дочерних, относительно изолированных? Разросшейся кладе расти уже некуда, начинается рост дочерних. А поскольку наиболее велика частота гаплотипов, близких к исходному (это ощущается тем сильнее, чем меньшее число локусов мы учитываем), то большинство этих дочерних клад имеют именно такие гаплотипы основателей. Все они порождают новые стар-кластеры, которые почти целиком перекрываются и внешне сливаются в один. Число маргинальных гаплотипов становится аномально низким, а близких к исходному – аномально высоким по сравнению с предсказанием модели, предполагающий стабильную численность популяции или равномерный рост.Все. Теперь сколько бы мы ни измеряли частоту гаплотипов и в какие статпакеты ее ни засовывали, получаемый возраст будет фиктивным (заниженным). А если рост популяций будет пульсирующим (по циклу разрастание – остановка=дрейф – разрастание), то в большинстве из них будет тысячелетиями воспроизводиться исходный стар-кластер, и лишь в некоторых его основой могут стать маргинальные гаплотипы, сильно удалившиеся от исходного.Хотите реальные подтверждения? Самое яркое – гаплогруппа R1b1. Кластеры U106 и P312, разошедшиеся порядка 10 тыс. лет назад, до сих пор практически неразличимы по частоте гаплотипов, а модальные крайне близки что по 67 локусам, что по 102. Столь же близок модальный у предковой L11*, от которой они отпочковались еще раньше. А вот одна из дочерних клад, ирландская М222 (по-моему, именно на нее наткнулись исследователи О’Нейлов) образовалась вокруг одного из маргинальных гаплотипов. По любому методу расчетов точка ее ответвления окажется старше, чем точка расхождения U106 и P312, хотя реально она примерно вдвое их моложе!Аналогичный случай – с индийской R1a1-Z93 и европейской R1a1-Z83. Разошлись они, по моим оценкам, примерно 9 тыс. лет назад, а столь «обожаемый» Вами Клёсов вычислил вдвое меньший возраст. А на примере с E1-V13 погорел Диенекес (как и тот же Клёсов), когда ее возраст в ископаемой ДНК тоже оказался вдвое старше расчетного.Если есть мнение на этот счет – высказывайте. А про второй аспект напишу в следующий раз.

А что тут комментировать? Описанные Вами феномены хорошо известны всем исследователям — как профессиональным попгенетикам, так и любителям. Вы еще забыли добавить сюда полный раздрай в плане определения скоростей мутаций (об этом писал еще почти 10 лет назад Животовский в своих основопологающих статьях о микросателлитной изменчивости и эволюционных скоростях мутаций). Но все это относится к вопросам определения TMRCA и опосредованно к определению дисперсии.
Филогенетический анализ основан на других принципах, и по этому Ваше глубокое замечание интересно, но имеет отдаленное отношение к предмету дискуссии.

Теперь, уважаемый Вячеслав Леонидович, перейдем к анализу НАИБОЛЕЕ важного (как мне представляется) аспекта Вашей теории:

Непонятно только одно: почему Вы называете прародину карпато-ПОЛЕССКОЙ, если у Вас четко видны стрелки, ведущие с Карпат в сторону Полесья. Если же убрать слово «полесская», то не так уж велика становится разница с моей карпато-балканской (особенно учитывая зигзаг в Словению). Вот динарским называть этот кластер действительно не стоит. В дальнейшем, чтобы не было путаницы с географическим понятием «карпатский», буду пользоваться термином «карпийский» <…> Думаю, Вы поняли аналогию: исходная праславянская популяция с концентрацией карпийцев ниже 30 % может дать частоты, характерные для сербов и хорватов, только смешиваясь с субстратом, у которого эта концентрация гораздо выше. <…> Возможна ли такая ситуация в пражской культуре? Учитывая степень ее археологической однородности – маловероятно, но чем черт не шутит. В предыдущем посте я перечислил возможных кандидатов на роль «сыновей журналистов». Методом исключения к карпийскому кластеру могли принадлежать только потомки даков или чернолесского субстрата лесостепных скифов. Мы приходим к тому же, что Вам не понравилось в моей статье – у фракийцев концентрация карпийского кластера была порядка 40 %, и к славянам он попал именно от них.Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы. Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье.»

На мой любительский взгляд «карпийская часть» Ваших рассуждений представляет собой наиболее уязвимую часть Вашей внешне стройной концепции. Я намерено выношу за скобки нашей дискусии Ваши примеры с «журналистами» и «шариками». Я также не буду обсуждать здесь корреляции с археологическими культурами, языками, а также теорию балто-славянской общности. Во-первых, я считаю себя недостаточно компетентным в этих вопросах, а во-вторых — это займет слишком много места. Скажу лишь что проблема грамотной аппроксимации результатов генетических исследований и всего огромного массива наработок лингвистики, этнографии и археологии по вопросу этногенеза славян — это дело будущего и потребует много лет вдумчивого системного анализа. Что касается присутствия в названии слово «полесский», то оно носит арбитрарный характер, и вовсе не означат что предковая популяция I2a1b3 «существовала» изначально в Полесье. По моим скромным представлениями она вышла на популяционный уровень где-то между Карпатами и Полесьем. Отсюда и двойное название. Я лишь останавлюсь на тех моментах, которые мне представляются наиболее спорными:

  • 1) тезис о (гаплогруппной) однородности протославян — мне кажется что это очень слабый тезис, так как последние исследования генофонда неолитических культур Европы показали, что они были далеко неоднородны. Элементарная логика подсказывает, что в бронзовом веке и позднее степень смешения должна была только увеличится. Поэтому возможны альтернативные точки зрения. Например, задумывались ли Вы о том, что «ассимиляция» или «слияние» общностей представителей кладов R1a и I2a1b3 могла произойти еще до времени возникновения «славянской» общности.
  • интерполяция современных частот гаплогрупп — манипуляции с современными частотами в целях реконструкции гипотетических частот распространения в генофонде древних народов также вызывают закономерные вопросы. По-крайней мере, подобные эксперименты возможны только исходя из генетических данных полученных в результате анализа останков из захоронений соотвествующих культур или народностей. В противном случае расчеты совершено произвольны, и им нельзя доверять. Вот наглядный пример. В 2011 году вышла интересная статья «Linking Italy and the Balkans. A Y-chromosome perspective from the Arbereshe of Calabria.» Boattini A, Luiselli D, Sazzini M, Useli A, Tagarelli G, Pettener D. В работе исследовалась популяция арберешей в Калабрии. По мнению авторов игрек-хромосомный генофонд арберешей должен отражать состояние игрек-хромосомного предкового генофонда алабанцев 500 лет назад. В числе прочего авторы приходят к интересным выводам: » Intra-haplogroup analyses suggest that this area may have experienced important changes in the last five centuries, resulting in a marked increase in the frequency of haplogroups I2a and J2.» Предложенная в статье интерпретация популяции Arbereshe как архетипа (proxy) первоначального албанского населения приводит нас к выводу, что ветвь I2a1b3 встречался в южной части Балканского полуострова 500 лет назад гораздо реже, чем сейчас. Как Вы видите — в ходе дальнейших миграций %-ная доля нескольких групп не только не уменшился, а наоборот, увеличился.
  • тезис о связи доисторических носителей I2a1b3 с фрако-дакийцами — также представляется мне совершено надуманным. Признаюсь, Вы не первый кто постулировал такой тезис — еще 2 года назад я встречал подобные рассуждения на международных форумах и обычно такие идеи озвучивали румыны и некоторые болгары. Говорили о положительной корреляции ареала I2a1b с фракийским племенами, в том числе костобоками и карпами. Были и альтернативные суждения о связи с миграциями бастарнами и пр. Слабость таких рассуждений очевидна — даже если мы будем исходить из реконструкции предковых частот, то будем вынуждены признать, что I2a1b вряд ли могла присутствовать в столь значительных количествах у фракийцев, так как у болгаров и румын как частоты распространения, так и уровень дисперсии гаплотипов I2a1b значительно ниже чем у тех же словаков и западных украинцев.

Вячеслав Носевич:

«задумывались ли Вы о том, что «ассимиляция» или «слияние» общностей представителей кладов R1a и I2a1b3 могла произойти еще до времени возникновения «славянской» общности.» Не только задумывался, но и описал 3 года назад как один из возможных вариантов проникновения I2a1b: венетский клад слился с уже трижды ассимилированными до того потомками чернолесцев (первый раз — они стали скифами, второй — милоградцами-неврами, третий — бастарнами). Собственно, с Вашего несогласия с этим пунктом и началась наша дискуссия. И теперь вы предъявляете его мне как опровержение меня… Но меня пока еще не убедили, что этот компонент складывающегося славянства достаточен для объяснения наличия I2a1 у румын и хорватов. Вот если разберемся с дисперсией в сербохорватской и белорусо-украино-польской частях кластера, может, куда-то и продвинемся. А пока у меня ощущения, что дискуссия начала ходить кругами.

Уважаемый Вячеслав Леонидович! Вы пишете:

«Хорваты в этом случае – почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы.» Это весьма сильное заявление и нуждается в подробном анализе. Я воспользуюсь свомими заметками и заметками некоторых активистов форума Молген, в частности уважаемого Вячеслава Малиновского. В известной статье Перичич опубликованны данные только по I-37 в целом , причем в качестве исследованных регионов у Перичич были указаны материковая Хорватия и четыре острова, а не Долмация в целом. Если же вы говорите, что все хорваты к примеру это «почти сплошь ославяненные «журналисты», т.е. в данном случае — фракийцы, то по идее у них должны быть примерно тот же расклад по гаплогруппам что и например у болгар. Например, y герцеговинских хорват 71,1% I2a2, в отличии от местных сербов -31% и босняков 43,5%. И пресловутой R1b там у хорватов 2%, а у сербов 6%, а вот Е у сербов как и везде за 20%, а у хорватов 9%(больше чем в других хорватских регионах, но все-таки в 2 раза меньше чем у сербов). У болгар: 16% E1b1b 1% G2a 3% I1 20% I2a 1% I2b 20% J2 1% Q 18% R1a 18% R1b 1% T Кроме того, болгары в отличие большинство других балканцев (в первую очередь хорватов) преимуществено I2a1b3-«cеверные динарки». В этом смысле они гораздо ближе полякам и украинцам.

Далее, Вы пишете, что:

«Альтернативное объяснение – высокая концентрация карпийского кластера уже сложилась в Сербии и Хорватии к приходу славян, и они ее лишь понизили, но никак не повысили. С каким этносом и с какой культурой можно в таком случае связывать родину этого кластера – можно будет порассуждать отдельно. Но к этногенезу славян это прямого отношения не имеет. Ясно, что от этого же этноса она к славянам и попала – возможно, не до, а после их дунайского расселения. Эту версию я тоже упоминал в своей статье.»

Это интересное, но весьма спорное утверждение, так как оно предполагает некое автохтонное присутствие I2a1b3 на территории Сербии и Хорватии к приходу славян. Тут сразу возникает ряд несостыковок. Если под автохтоностью I2a2 на Балканах подразумевается размещение «прародины» этой гаплогруппы на Балканах, то я категорически несогласен. В противном случае, я вполне согласен рассматривать югославских I2a2 как автохтонов Балкан, с той лишь оговоркой, что эти «автохтоны» появились на Балканах не ранее 6-7 веков н.э., вскоре после того как авары «зачистили» местное автохтонное население. Лично для меня совершенно очевидно, что по Y-гаплогруппному составу население Далмации,Иллирика времен римского господства коренным образом отличается от населения этих же земель после славянского завоевания. Между прочим, вот Вам интересный факт для размышления. Историкам хорошо известен период римской истории, который носит название период иллирийских императоров. Формально он начинается от смерти Галлиена (268 г. н. э.) до начала правления Диоклетиана и предшествует периоду домината. На самом деле же сам Диоклетиан, а также пришедшая к власти династия Флавиев, так же как и ряд позднейших императоров были выходцами из Иллирика, Паннонии, Далмации, Сирмии, Мезии( это нын.Хорватия,Босния,Сербия,Болгария). Очевидно, что кроме императоров и солдат, эти провинции поставляли в Рим и гражданскую администрацию, и самое главное — огромную массу обслуживающего персонала). Известно также, что иллирийские императоры (правившие Римом в 3-4 веках), подобно современным албанцам, черногорцам и т.д, практиковали клановую систему. Известно множество случаев, когда после головокружительной карьеры и прихода к власти после военных переворотов, эти парни из балканских деревушок перевозили в Италию своих родственников целыми кланами и деревнями. А теперь внимание, вопрос знатокам — ежели мы допускаем, что локальный пик частотного распределения гаплогруппы I2a2 на Балканах существовал в неизменном состоянии испокон веков (хотя бы со времен LGM), то логично было бы допустить наличие подобных локальных пиков частотности I2a2 и в самой Италии. Почему же мы его не видим? (про сардинскую группу I2a1 просьба в ответе не упоминать, так как это отдельная песня). С одной стороны имеем Боснию-Герцеговину с максимальным пиком % гаплогруппы I2a1b3. C другой стороны, по историческим источникам выходит, что эти страны запустели под (например под, аварским правлением и были заселены вновь прибывшими с Карпат славянами. С другой стороны — по мнению попгенетиков, I2a1b3 все время проживали на этой территории со времен последнего ледникового максимума. По моему мнению, последние явно ошибаются.

Комментарий Вячеслава Малиновского:

Еще один момент. По сути мы обсуждаем возможность того, что славяне переселившись на Подунавье (Балканы здесь не так важны, поскольку исходной точкой расселения славян по Восточной Европе указано Подунавье), в течении 100-200 лет обновили свой генофонд где-то наполовину. Мы не берем пиковые показатели I2a2 для Боснии, а рассматриваем таковые для Болгарии и Румынии, Венгрию тоже не вижу ставить в этот ряд — по генофонду это практически родные братья словаков и чехов. Итак даже отбросив R1a1 в Румынии и Болгарии (считая что якобы все клады этой гаплогруппы были принесены славянами, хотя это конечно же не так), получим I2a2 в этих странах на уровне 30-40%, остальных гаплогрупп 60-70%. Теперь риторический вопрос — ассимилировав в рекордные сроки придунайское население, славяне ведь не могли принимать в свою среду мужчин исключительно с гаплогруппой I2a2? Следовательно кроме нее славяне должны были «взять» и другие местные гаплогруппы, в ДВА раза больше чем I2a2. Получаем, что у славян Восточной Европы кроме 15-20% I2a2 должны наличествовать еще 30-40% иных «балканских» гаплогрупп. Где они?

Вячеслав Носевич:

Вячеславу Малиновскому: Хороший вопрос. Попробую перефразировать его: славяне в ареале пражской культуры имеют соотношение гаплогрупп I2a1 и R1a1 примерно в соотношении 1 к 2. Если они принесли I2a в Хорватию и Сербию, то вместе с их 33-36% должно было появиться и вдвое больше (т.е. 66-72%) R1a1. Где они? А теперь отвечу по существу. Одна из популяций, поглощенных славянами в Балкано-Карпатском регионе или ранее, еще до распространения пражской культуры (как Вы помните, это один из рассматриваемых мной вариантов), причем поглощенная полностью, без остатка, имела очень высокую концентрацию I2a1, а остальное составляли понемножку G, E, J и, возможно, R1a и R1b. Концентрация этих остальных гаплогрупп была, скажем так, типичной для региона, и на уровень у славян этот приток не повлиял. А вот аномально высокое значение I2a1 соответственно повысило его у славян.

Комментарий Вячеслава Малиновского:

Балкано-Карпатский регион это название, территориально охватывающее чуть не треть Европы. Предположение с какой-то стопроцентно поглощенной популяцией выглядит более чем натянуто, потому что мы должны придти к выводу, что эта самая популяция населяла не все Подунавье-Балканы, а всего лишь какой-то достаточно ограниченный ареал, из которого собственно как из единого центра и начались разнонаправленные славянские миграции. ТО есть и славяне здесь предстают каким-то одним централизованным, достаточно немногочисленным племенем, живущим уже не родо-племенным обществом, так как I2a2 оказалась сразу во всей славянской популяции. Где этот регион из которого начались славянские миграции? Насколько помню нулевая фаза Пражской культуры это как раз Полесье, так какие же Балканы.Если они принесли I2a в Хорватию и Сербию, то вместе с их 33-36% должно было появиться и вдвое больше (т.е. 66-72%) R1a1.» Почему? Я ведь не говорю о славянстве как генетически едином целом. Это родо-племенное общество, в каждой из групп которого свой гаплогруппный состав, что мы видим у современных народов, еще сохранивших память о своей родовой структуре. Что до R1a1 то считаю совершенно неправильно всех их относить к славянам. Например если вы наложите карту М-458 на карту пшеворской культуры, то увидите что основной массив гаплотипов находится как раз в ее ареале. И если посмотреть гаплогруппный состав чехов например, то утверждения что славяне продвинулись на земли практически полностью оставленные германцами, выглядят мягко говоря преувеличенными. То есть процент славянских мигрантов и их племенной состав в каждом регионе был различен и в одном случае местное население имеет «балканские» гаплогруппы, в другом «кельто-германские». Разный процент той же I2a2 (от 10 до 30%) говорит всего лишь об участии разных племенных группировок славян в миграциях. Что до Хорватии, то Вадим ведь указывал, что запредельные пики это показатели герцеговинских хорватов, на с-в Хорватии ситуация совсем иная. Какова величина популяции герцеговинских хорватов? Скорее всего это лишь эффект основателя.

Вячеслав Носевич:

Насчет пиков как следствие эффекта основателя — соглашусь. Но общее плато, над которым поднимаются эти пики, на Балканах выше, чем на славянской прародине. Не могли славяне принести большую концентрацию «черных шариков», чем имели изначально. В палеолите такое возможно, а в средневековье, когда перемещаются массы в сотни тысяч и миллионы людей — уже нет.Я ведь не говорю о славянстве как генетически едином целом.» Если Вы читали все комменты, то именно этот вариант я рассматривал как случай с плохо перемешанными шариками. Но род, несущий высокую частоту I2a, не мог быть исконно славянским — это я и имел в виду под «журналистами» (правильно было бы — «юристами», подзабыл я высказывание Вольфовича…)

Комментарий Вячеслава Малиновского:

Но общее плато, над которым поднимаются эти пики, на Балканах выше, чем на славянской прародине.» А что вы надеялись увидеть на территории к примеру Украины, практически по новой заселенной в 17 веке? Вот и видим пики в местах убежищ — в полесье, волынском и белорусском.Но род, несущий высокую частоту I2a, не мог быть исконно славянским» Конечно не мог, праславянский язык это какая-то из клад R1a1, но с ними точно еще не скоро получится разобраться. I2a к тому времени скорее всего уже не раз сменили язык, но я веду речь о том, что к моменту начала миграций они уже входили в славянскую общность и на данный момент это самый удобный славянский маркер — нет ни малейшего локального всплеска, который бы не объяснялся «славянским следом»-«Не могли славяне принести большую концентрацию «черных шариков», чем имели изначально. В палеолите такое возможно, а в средневековье, когда перемещаются массы в сотни тысяч и миллионы людей — уже нет.» Почему? О каких сотнях тысяч мы говорим? Пару-тройка сотен тысяч мужчин это популяция герцеговинских хорватов в 21 веке, если говорим о 6-7 веках, то там речь шла о сотнях, если не десятках. Это мог быть всего лишь один из славянских родов с высокой долей I2a.

Ув. Вячеслав Носевич, Вы наверняка спросите, а каково мое личное мнение на счет происхождения I2a1b3. Чтобы ответить на этот вопрос, необходимо начать издалека. По моему скромному разумению маршрут путешествия I2a1 начинается где-то в Альпах (примерно 12 000 -10 000 лет назад).Скорее всего, ко времени отступления ледников, «популяции» I2a1*, I2a1a, I2a1b и I2a1c уже разделились. Одни пошли на юг, положив начало иберийско-сардинским I2a1a, другие -I2a1b — на север, где в свою очередь разделились на предковую линию I2a1b3 и предковую линию I2a1b2 (последние, видимо, оказались изолированными вместе с частью I2a2, I2a1a на Британских островах после затопления Доггерленда). Предковая линия I2a1b3 же двигались постепено на северо-восток за отступающим ледником. Спустя много тысяч лет значительная часть субклада I2a1b3 «вернулась на юг» уже в составе славянских племен, поселившихся на Балканах между 6-8 в.н.э. Таким образом, значительное количество I2a1b3 совершило движение по часовой стрелке — в конечном итоге вернувшись в места, близкие к точке первоначального исхода их предков. Примерно полтора года назад удалось немного подискутировать с администратором польского FTDNA проекта (Лоуренсом Майкой) по вопросу о происхождении гаплогруппы I2a1b (и I2a1 в целом). Майка предложил крайне интересную версию места происхождениия гаплогруппы I2a1b. По его мнению, общий предок I2a1b (как I2a1b2, так и I2a1b3) c выской степенью вероятности мог жить в районе Альпийских гор. Он также согласился с предложенным мною маршрутом перехода клана предков I2a1b3 из Альп в Карпаты. Правда, он не согласен с моей датировкой. Я считаю, что предковая популяция I2a1b3 начала свое движение из Альп в сторону Карпат сразу после окончания ЛГМ (т.е. в мезолите), а Майка считает что инициатором миграции могли быть кельты (т.е эта миграция произошла уже в бронзовом веке). Последний вариант хоть и интересный, но не объясняет времени и места разделения островного субклада I2a1b2 и динарского субклада I2a1b3, которая по молекулярной датировке не могла произойти позднее чем 10-8 тысяч лет тому назад. С целью проверки версии Майки, я решил использовать алгоритм Мескита, который позволяет производить оценку наиболее вероятного (с точки зрения парсимонии) места «основания» субклада, исходя из нынешней географической дистрибуции (географического распространения) двух смежных субкладов (в данном случае мы определяем место появления I2a1b1 на основании сопоставления географических координат таксонов-гаплотипов и топологии дерева I2a1b2, которое укоренялось аутгрупп-корнем I2a1a). Несмотря на то, что наибольшая плотность субклада I2a1a приходится на Сардинию, cледут опираясь на хорошо аргументированный и эмпирически подтвержденный аргументНордтведта признать, что самые старые по возрасту кластеры I2a1а приходятся на северный регион Пиренейского полуострова, и частично южную Францию. Поэтому в качестве координат аутгруппа-корня (гаплотипа I2a1а) были приняты координаты географического центра Пиренейских гор Построенные таким образом в Меските филогенетические деревья прямиком были спроицированны на географическую карту Северной Европы, в 2D и 3D проекциях. Если хотите, то ямогу 3 карты, построенные мной в Меските-Картографере на основании структуры филогенетического дерева из 687 гаплотипов I2a1b3, выявленной путем нахождения 20 независимых совпадений 20 парсимонически лучших (наиболее оптимальных) деревьев в TNT. Это дерево было выгружено из ТНТ в формате .tre и загружено в картографический пакет Мескита, где оно было спроецировано на карту Европы (проекция Меркатора). Нанесены номера ветвей (чем дальше от корня, тем болше номер корня -см.номера в овале) и парсимонически предпологаемые маршруты миграции представителей этой генетической ветви в Европе. На примере второго «картографического» дерева I2a1b3 показана другая интересная функция картографического пакета Mesquite. А именно, наличие встроенного алгоритма для определения максимально вероятной (в терминах парсимонической комбинации географически близких ныне живущих таксонов 🙂 предковой локации субклада I2a1b3. На реконструированной карте Мескит довольно уверенно определяет место происхождения субклада где-то к северо-востоку от Карпат (обозначено большим красным кругом с красной точкой в центре).

Впрочем, на этот счет существует альтернативная точка зрения. Ув. Вячеслав Малиновский в комментариях к карте Нордведта пишет: «Исходный регион миграции I2a2-Dinaric-M423 не совсем верно очерчен (где-то к востоку от Варшавы), но направление верное — с севера на юг. Принимая во внимание приблизительный возраст субклада I2a1b3 (ок.2500-2000 лет) и разветвление дерева на уровне 1500-1700 лет (чему соответствует демографический процесс расселения), единственней миграцией такого массового масштаба можно считать именно славянскую колонизацию Балкан. Насчет возраста I2a1b3 все гуру единодушно сходятся к 2700-2500 годам. Даже сверхсекптичный Диенек Понтик считает, что I2a1b3 слишком молодая ветвь, чтобы быть кандидатом на неолитическое население Балкан. Ну как же не видите? Как верно заметил Вадим, точку возникновения L-147 по-хорошему нужно сместить несколько восточнее, в треугольник Ю.Польша-Прикарпатье-Полесье. Вот там где-то 2500 лет назад и возник I2a1b3, а далее его миграции штрихованными линиями, и по направлениям и по времени полностью совпадающие со славянскими миграциями.
У I2a1b3 нет каких-то региональных ветвей, примерный возраст тех что постарше где-то 1500 лет, на них вперемешку русские, украинцы, поляки, сербы, восточные немцы. Что коррелирует со сведениями о разнонаправленных миграциях каждого из племен. К примеру хорваты частично остались на Волыни, частично пошли на Эльбу, частично переселились на Балканы. Первоначально I2 были носителями каких-то палео-европейских языков, вполне вероятно что в неолите если не все, то часть из них перешли на языки неолитических переселенцев из Малой Азии. Но например I2a1b3 не были у трипольцев коренным элементом (их ядро составляли выходцы с Ближнего Востока), а скорее потомками местного мезолитического элемента, инкорпорированного в состав этой культуры. Если говорить об исконной культуре древних I2a1b3, то это скорее всего были свидерцы, и их эпигоны.
К моменту начала протославянского этногенеза субклад I2a1b3 целиком находился в ареале Лужицкой культуре — одной из культур полей погребений, относившейся к кельто-германо-италийской лингвистической общности.
Отмечается что на этапе своего вычленения из общей балто-славянской лингвистической общности славянский язык испытал влияние какого-то кентумного языка, но скорее всего не собственно кельтским, ни германским этот язык не был.
Я не вижу другого варианта, кроме как взаимодействие балто-славян Поморской культуры(скорее всего антов нашей классификации, позднее населения восточного ареала Пшеворской культуры)) с населением Лужицкой культуры. Далее это население частично участвовало в миграциях на восток, поучаствовав в сложении тамошних культур.»

Комментарий Вячеслава Малиновского:

Уточню — касательно свидерцев и прочих «неолитов — мезолитов» Юго-Восточной и Центральной Европы, говорить наверное можно о I2*, что подразумевает как предковые клады, так наверное и нынешнюю I2c, «размазанную» тонким слоем по всей Европе с локальным всплеском в Закавказье. Куда по моему разумению она с Балкан попасть не могла иначе, кроме как с предками армян (одними из, которые были родственны фригийцам). Что до «антов» в цитате выше, то они не имеет никакого отношения к историческим антам, это всего лишь условное и часто вводящее в заблуждение название одной из ветвей R1a1 когда-то принятое на Молгене — давно пора сменить название, но ничего «навека» никому в голову что-то не приходит.

Вячеслав Носевич:

дополнение к сказанному мной ранее: пример с R1b1 вообще-то еще более впечатляющ. Я выбрал из баз FTDNA все гаплотипы на 67 и более локусов, определенные как L150+ L51-, L23+ L51- и M269+ L150-, а заодно все с М269+ U106- P312-. Все эти ветви последовательно отпочковывались на отрезке примерно от 20 до 10 тыс. лет назад. Так вот, их сегодняшние гаплотипы по-прежнему близки до полного смешения, а модальные различаются друг от друга на считанных локусах. Например, на 17-локусном наборе Y-Filer модальные гаплотипы кластеров M269+L23- и L23+L51- не совпадают на 1 шаг по 4 локусам, тогда как Z196 и DF19 не совпадают по 5, хотя разошлись тысяч на 10 лет позже! И главное, что никаким поправочным коэффициентом этот эффект компенсировать невозможно.
Почему в такой ситуации я все же уверен, что карпийский кластер – молодой (хотя, возможно, и не столь молодой, как кажется)? Ситуация с определением возраста по гаплотипам все же не совсем безнадежна. Описанный мной эффект препятствует расхождению модальных гаплотипов и снижает число маргинальных, но не запрещает маргинальным расходиться все дальше. Если бы у нас были надежные выборки, порядка сотен длинных гаплотипов в каждой ветви, тестированных по всем Y-снипам, мы увидели бы, что САМЫЕ УДАЛЕННЫЕ ОТ МОДАЛЬНОГО различаются тем сильнее, чем древнее кластер. Проблема лишь в том, что такие выборки появятся очень нескоро. Но очень грубые прикидки можно сделать даже по имеющимся данным.
Результат будет надежнее, если учитывать не только генетические расстояния, но и мутабельность локусов. Ясно, что различие на 3 повтора в DYS392 значит гораздо больше, чем такое же расстояние в DYS439. Поэтому я умножаю расстояния на поправочные коэффициенты, пропорциональные известной скорости мутаций в каждом локусе. При таком подходе три самые удаленные из известных 67-локусных гаплотипов карпийского («динарского») кластера отстоят от модального на 22.9, 19.5 и 18.5 «калиброванных» шагов. В западнославянском кластере R1a1-L260 самые удаленные отстоят на 19.5, 19.4 и 18.5, а в его предковом М458+ L260- – на 36.8, 35.1 и 33.5. Рискнем предположить, что карпийский кластер близок по возрасту к R1a1-L260 (но все же чуть старше его) и существенно моложе R1a1-М458.Здесь уместно упомянуть обещанный второй аспект. Он касается репрезентативности выборок и длины использованных гаплотипов. Оценка репрезентативности – это азы матстатистики, на эту тему есть уйма учебников. Общеизвестно, что при социологических опросах применяются выборки порядка 1500 человек. Для мужской Y-хромосомы разброс значений сопоставим с разбросом общественного мнения, а эффективный размер ниже, поэтому можно примириться с национальными выборками порядка сотен, но уж никак не десятков индивидов. В этой связи посмотрите на размеры национальных выборок, использованные в Вашем анализе, и сделайте выводы…
Размер тоже имеет значение (в смысле, длина гаплотипа). Клесов не раз с гордостью подчеркивал, что его метод одинаково работает на гаплотипах любой длины. Но это не достоинство, а наоборот. Адекватный метод ОБЯЗАН на длинных гаплотипах давать более точные результаты, чем на коротких (если требуется дополнительная аргументация – поясню). В этой связи использованный Вами «компот» из гаплотипов разной длины меня, мягко говоря, не впечатляет. Немножко напоминает среднюю температуру по больнице…
Посмотрим, что дает предложенный мной метод при уменьшении числа локусов. Тот же карпийский кластер в варианте Y-Filer (17 локусов) дает максимальные расстояния в 7.3, 6.7 и 6.5 шагов, причем это НЕ ТЕ гаплотипы, которые показали наибольшее удаление на 67 локусах (для них результаты соответственно – 5.4, 2.7 и 4.7). Самые удаленные гаплотипы кластера R1a1-L260 теперь дают удаление 5.6, 5.1 и 5.0, причем лишь один из них – тот же, что и на 67 локусах. Два других теперь дали значения 3.5 и 0.3 (!). При этом на 17 локусах западнославянский кластер R1a1-L260 выглядит ощутимо моложе карпийского, что вряд ли верно.
Мораль: даже одна и та же хромосома может дать очень разный вклад в суммарную статистику в зависимости от того, какие ее локусы учитываются. Именно поэтому так важна величина выборки, при которой эти случайные броски компенсируются законом больших чисел.
Урезание именно до 17 локусов было предпринято мной, чтобы расширить выборку за счет гаплотипов из YHRD и других источников с аналогичным набором локусов. В частности, у нас есть данные из (Mirabal et al., 2010 Human Y-chromosome short tandem repeats…) с 404 черногорскими гаплотипами и 179 сербскими, из (Ljubković et al., 2008 Y-chromosomal Short Tandem Repeat Haplotypes in Southern Croatian Male Population…) с 166 хорватскими, а в YHRD представлены 1320 хорватских, 1270 польских, 1377 российских, 1774 германских, по 200 словацких и русинских (фактически – закарпатско-украинских) с территории Сербии, по 100 албанских и македонских, 191 греческий, 154 румынских, а недавно добавились 154 западноукраинских из Львовской области и 486 австрийских. Для полноты картины стоит привлечь 1262 итальянских и 194 литовских. По Беларуси у меня есть данные по 1097 коренным уроженцам из базы Центра судебной медицины. Всего около 10 тысяч — это уже серьезный массив данных! Правда, ни один из этих гаплотипов не тестировался на L147.2 и даже на L621, равно как и на L260. По счастью, карпийские гаплотипы на 17 локусах довольно четко отделяются от других гаплогрупп (погрешность в их выявлении я оцениваю на уровне порядка 1-2%, главным образом за счет пресловутого кластера Disles). Гаплотипы западнославянского кластера R1a1 отделяются от общеславянского М458+L260- чуть менее надежно, но все же с приемлемой точностью.сего в указанных источниках мне удалось выявить предположительно 1363 карпийских 17-локусных гаплотипов. Еще несколько остаются под вопросом. В частности, в Хорватии и Сербии выявлены 3 гаплотипа, профиль которых из всех известных мне модальных ближе всего к карпийскому, за исключением локуса Gata-H4, в котором вместо 11 повторов, характерных для I2a1b, имеется 9. Не имея снипов, трудно сказать, идет ли речь о специфической мутации в карпийской ветви, или о совершенно иной гаплогруппе. Я решил их не учитывать.
Если интересны суммарные результаты, то они такие (в порядке убывания частоты):
n N % популяция
65 179 36,3 Сербия
497 1486 33,4 Хорватия
120 404 29,7 Черногория
34 154 22,1 Украина (Львов)
151 693 21,8 Беларусь (центр — юг)
33 154 21,4 Румыния
21 100 21,0 Македония
38 200 19,0 Русины из Сербии (Нови Сад)
29 200 14,5 Словаки из Сербии (Нови Сад)
21 191 11,0 Греция (север)
40 405 9,9 Беларусь (запад — север)
9 100 9,0 Албания
121 1377 8,8 Россия
109 1270 8,6 Польша
24 486 4,9 Австрия
6 194 3,1 Литва
37 1774 2,1 Германия
4 1262 0,3 Италия
1359 10629

Как решается вопрос о генетическом разнообразии по моей методике? Если рассмотреть наиболее удаленные гаплотипы, то, даже отбразывая несколько сомнительных на удалении в 14-15 “калиброванных” шагов, 2 гаплотипа (из свердловской выборки русских и из южной Хорватии) удалены от модального более чем на 10 шагов. На удалении от 9 до 10 шагов находятся 9 гаплотипов (4 хорватских, 1 сербский, 1 македонский, 1 русинский, 1 свердловский и 1 белорусский). В интервал от 8 до 9 шагов попадают 12 гаплотипов (4 хорватских, 2 черногорских, 1 сербский, по 1 словацкому, германскому, австрийскому, польскому, свердловскому), от 7 до 8 шагов – 30 гаплотипов (из них 14 хорватских и 2 черногорских, а белорусских всего 3). В целом среди наиболее удаленных гаплотипов доля балканских примерно такая же, как и во всей выборке (55% против 56), тогда как доля белорусско-украинско-словацких – явно ниже (15% среди удаленных и 21 – во всей выборке). При всех неточностях и условностях такой методики, говорить о более высоком разнообразии гаплотипов в ареале пражской культуры по сравнению с Балканами нет никаких оснований. Скорее – наоборот.Теперь по поводу оценки возраста. Самым надежным репером является примерная синхронность с западнославянским кластером R1a1-L260. Эта синхронность подтверждается и по выборке из YHRD (вкупе с белорусскими и некоторыми другими данными). Предположительно к этому кластеру можно отнести чуть более 300 гаплотипов, из которых 166 – польских и 33 – германских. Наиболее удаленные 8 гаплотипов попадают в тот же интервал, что и в карпийском кластере: от 7.3 до 10.3 шагов.
Распределение западнославянского кластера позволяет привязать его возраст к событиям, фиксируемым археологически. Верхняя граница – это формирование суковско-дзедзицкой культуры (некоторые считают ее частью пражской), т.е. 1500 — 1400 лет назад. Но, учитывая возможное наличие этого кластера в России и Хорватии, скорее – раньше. Нижняя граница вряд ли может быть древнее формирования лужицкой культуры, т. е. 3600 – 3000 лет назад. Думаю, что в нижнюю половину этого интервала укладывается и возраст карпийского кластера. Я бы оценил его в 3000 лет плюс-минус пятьсот. Вокруг Карпат — это время протофракийской каннелированной и штампованной керамики, культурных общностей гава-голиграды и белогрудовка-чернолесье. На западе Балкан – культура глазинац, мимо которой прокатывается 3,3 – 3,2 тыс лет назад волна будущих «народов моря» (чака – медиана). Зарождение карпийского кластера можно связывать с любой из них – практически на равных основаниях. Учитывая господство в это время обряда трупосожжения, ископаемая ДНК тут вряд ли поможет.
Тем более от рассуждений о более ранней истории I2a1, равно как и от комментариев по поводу Ваших предположений на этот счет, предпочту воздержаться.

Почему Вы оперируете только 17 маркернымі гаплотипами, когда известны 37, 64,111 маркерные гаплотипы I2a1b3?Это не есть математическое доказательство. Предлагаю Вам повторить Ваше упражение с 1363 17-локусными гаплотипами — но на этот раз Вы должны расчитать интер — и интракладовые дисперсии «карпийских» гаплотипов по странам. Тогда мы сравним с моей статистикой дисперсии 37-64 локусных гаплотипов.
Рекомендую использовать для этих целей http://cmpg.unibe.ch/software/arlequin3/.

Вячеслав Носевич:

Насчет «Арлекина» — если честно, то мне лень возиться. Достаточно уже повозился. пока вытаскивал гаплотипы из YHRD (сервис там еще тот…) Если хотите — пришлю все 1363 Вам, а Вы считайте как хотите и чем хотите. Только мне потом расскажите, что получилось.

Комментарий Вячеслава Малиновского:

«Если бы у нас были надежные выборки, порядка сотен длинных гаплотипов в каждой ветви, тестированных по всем Y-снипам, мы увидели бы, что САМЫЕ УДАЛЕННЫЕ ОТ МОДАЛЬНОГО различаются тем сильнее, чем древнее кластер. Проблема лишь в том, что такие выборки появятся очень нескоро.» Если вы еще раз посмотрите что же писал Вадим, то увидите, что речь шла именно о выборках из сотен длинных гаплотипов, на основании которых и строились филогенетические деревья.

В продолжении темы о найденным мною «гене Фейсбука»

Открыл на форуме 23andme тему, посвященную новооткрытому «гену Фейсбука» https://www.23andme.com/you/community/thread/14241/ Просьба к тем, кто имеет аккаунт в 23andme подержать своим участием

One of the biggest failures of the GWAS methodology is that is designed to detect the effects of causative genetic loci where the rarer allele still has a reasonable frequency in the population (greater than 5%). If there are genetic loci influencing the trait where the rare allele has a frequency under 5%, or even under 1%, the GWAS technique is unlikely to be able to detect these loci.

The latest addition to Gedmatch «Rare SNP search» was very helpful in circumventing the problem described above. Having found some rare alleles in Gedmatch databse, i have mentioned an interesting SNP in SLC6A3 gene: rs28363168 (chr5:1447389 A C). The A-genotype of this SNP is very rare (0.6121%), but seems to have an impact on the storage and release of dopamine. The gene SLC6A3 regulates the production of dopamine transporter, a membrane-spanning protein that pumps the neurotransmitter dopamine out of the synapse back into cytosol. From the previous studies we know that SLC6A3 gene is said to have «genetic associations» with the various cognitive and attention disorders (i.e., schizophrenia, depression, alcohol consumption. More interesting, however, is that polimorphisms in that gene increase the odds of having ADHD (Attention deficit hyperactivity disorder). The recent research has shown thta the use of social networking sites can cause personality and brain disorders in children, such as the inability to have real conversations, limited attention spans, a need for instant gratification, Attention-Deficit Hyperactivity Disorder (ADHD), and self-centered personalities.
That’s why i’ve dubbed the SLC6A3 gene «the Facebook gene».

rs28363168 is tested by 23andme. I’d like you post your rs28363168 genotype here. Any comments or questions are also highly appreciated

Удалось связаться с носителем сверхредкого гомозиготного варианта AA в снипе rs28363168 (который, как я и говорил ранее, может быть связан с повышенным риском развития ADHD).

В приватной беседе выяснилось, что несмотря на свой AA-вариант снипа, диагнога ADHD у этого индивида X (и его родственников) нет, хотя и присутствуют некоторые симптомы. Зато многие члены этого семейства страдают биполярным аффирмативным расстойством, а некоторые синдромом Аспергера. Это вполне объяснимо, так как вышеупомянутый снип находится в гене, «кодирующем» протеин-транспортер допамина. На эту тему есть хорошое исследование J Psychopharmacol. 2011 Jul;25(7):934-43. Epub 2011 Mar 18. Increased risk-taking behavior in dopamine transporter knockdown mice: further support for a mouse model of mania.

Reduced functioning of the dopamine transporter (DAT) has been linked to bipolar disorder (BD). Mice with reduced DAT functioning (knockdown, KD) exhibit a behavioral profile in the mouse Behavioral Pattern Monitor (BPM) consistent with patients with BD mania in the human BPM. Patients with BD also exhibit increased risk taking, which can be quantified using the Iowa Gambling Task (IGT). We hypothesized that DAT KD mice would exhibit increased risk-taking behavior in a novel mouse version of the IGT. DAT KD and wildtype (WT) littermates were trained in the mouse IGT. In session 1, KD mice initially made riskier choices, but later performed comparably to WT mice. Once trained to stable choice performance, DAT KD mice continued to exhibit a trend to choose the riskier options more than WT mice. Finally, we confirmed that these DAT KD mice also exhibited an exploratory profile in the BPM consistent with patients with BD mania, where risky choice behavior modestly correlated with specific exploration. These data demonstrate that DAT KD mice chose the riskier options more than WT mice, providing further support for the use of DAT KD mice as a model of BD mania.

Поскольку в ходе дискуссии был упомянут синдром Аспергера, то стоит подробнее остановиться на его описании. Люди с синдромом Аспергера часто выделяются весьма педантичной манерой разговора, использованием более формального и структурированного языка, чем того заслуживает ситуация. Пятилетний ребёнок с этим синдромом может регулярно говорить на языке, который бы подошёл университетскому учебнику, особенно в своей области интересов. Язык Аспергера, несмотря на старомодные слова и выражения, грамматически правилен.

Развитие речи у ребёнка бывает исключительно ранним, развиваясь медленно из-за типичной для аспергеров привязанности к структуре и неизменённости жизненных норм, или наоборот несколько поздним по сравнению с братьями и сёстрами, после чего развивается очень быстро, так что в возрасте 5-6 лет речь в любом случае выглядит как правильная, педантичная, не по годам развитая и чрезмерно похожая на взрослую. Часто ребёнок, запомнивший речевые штампы, может выглядеть понимающим разговор. Однако для него трудно или полностью невозможно быть настоящим собеседником. Специалисты по нарушениям речи обычно называют этот тип проблем термином семантическое прагматическое нарушение, означающим, что, несмотря на нормальные или хорошо выраженные навыки речи, существует неспособность использования языка для коммуникации в условиях реальной жизни. Тональность голоса может быть нарушенной (слишком сильный, сиплый, чрезмерно низкий), темп речи увеличенным или заниженным. Слова часто произносятся излишне ровно и монотонно.

Другим распространённым (хотя и не универсальным) симптомом является буквальное понимание. Эттвуд приводит пример девочки с синдромом Аспергера, которой однажды позвонили и спросили «Павел рядом?». Хотя требуемый Павел присутствовал в доме, его не было в комнате, и, оглянувшись, чтобы убедиться в этом, она ответила «нет» и повесила трубку. Звонящему человеку пришлось перезвонить и объяснить ей, что он хотел, чтобы она нашла Павла и попросила его взять трубку (Attwood, 78).

Люди с синдромом Аспергера не воспринимают те неписанные социальные законы, которые мы усваиваем по опыту. Это как раз те люди, которые, как в известном анекдоте, на вопрос «Как дела?» начинают действительно рассказывать, как у них дела. Либо, наоборот, зная, что ответ на вопрос для собеседника может показаться слишком длинным — молчат. А если им сказать «Звони в любое время», могут позвонить в три часа ночи с чистой совестью. Полное неумение понимать намеки и «читать между строк» осложняет отношения с окружающими, но необходимо помнить, что оборотная сторона этого — честность и прямолинейность. Многие люди с синдромом Аспергера вообще не умеют лгать, и опасаться интриг с их стороны тоже не приходится.

Многие люди с синдромом Аспергера также используют слова очень специфически, включая в речь свежепридуманные слова или скомбинированные из знаний разговорного языка с корнями древних, от которых он произошёл, а также необычные сочетания слов. Они могут развить редкий дар к юмору (особенно каламбуры; игра слов; строфы, в которых смысл приведён в жертву рифме; сатира) или написанию книг. (Другой потенциальный источник юмора появляется, когда они понимают, что их буквальные интерпретации забавляют окружающих.) Некоторые настолько хорошо владеют письменной речью, что удовлетворяют критериям гиперлексии (способность понимать письменную речь выше нормы, а способность понимать устную речь — ниже нормы).Возможные причины и происхождение синдрома Аспергера — это горячо обсуждаемая и спорная тема. Мнение большинства, на сегодня, состоит в том, что причины синдрома Аспергера — те же, что и у аутизма. Некоторые, однако, с этим не согласны, и аргументируют, что к синдрому Аспергера и аутизму приводят разные вещи. Всё это происходит на фоне продолжающихся более широких дебатов относительно того, является ли синдром Аспергера и другие состояния (такие как расстройство с дефицитом внимания и гиперактивностью — СДВГ (ADHD)) частью так называемого аутистического спектра.

Среди многих конкурирующих теорий относительно причины аутизма (и, следовательно, как многие уверены — синдрома Аспергера) — теория недосвязанности, разработанная исследователями познавания университета Carnegie Mellon и университета Питсбурга, теория предельного мужского мозга Симона Барон-Коэна (Simon Baron-Cohen), теория пред-работающего аутизма, теория социальной конструкции и генетика.

Возвращаясь к найденной мной ассоции полиморфизма (снипа) rs28363168 c cиндромом ADHD («ген Фейсбука»), необходимо упоминуть один красноречивый факт. К дискуссии на форумах 23andme (по приведенной выше ссылке) подключилась одна из форумных активисток little_bit, которая живо интересуется проблематикой аутизма (ASD/ADHD). Причина ее интереса к аутизму очевидна: ее сыну был поставлен диагноз ADHD/ASD и сейчас он проходит медикаментозный курс лечения лекарствами Strattera, Ritalin и Adderall. ) Так вот у ее сына в снипе rs28363168 тот же геноти АC, что и у меня. Этот гетерозиготный генотип встречается крайне редок, что  подтвердилось в ходе  статистического анализа  публичных данных, опубликованных известным порталом openSNP.
Причем при составлении генотипов ее муж (который также тестирован в 23andme) и сына cтановится очевидно, что сын унаследовал редкую аллель A от отца. Что еще интересней, муж, хотя и не был диагностирован синдромом Аспергера/ADHD в детстве, имеет все очевидные признаки этих расстройств )). Ну и генотип у него соответственно AC ).
Так что выводы моего исследования, как говорится, попали в яблочко:

When I put together my son’s rare snp analysis, rs28363168 in the SLC6A3 gene was probably my most exciting finds. I’m not going to say «smoking gun» quite yet, but close. My son got the rare A allele from his father who is diagnosed with ADHD, and successfully on meds for it. Most interestingly, he got it from his father, who is very classically ADHD/Asperger’s though not officially diagnosed due to his age. He is 81 and they just didn’t do those diagnosis’s back then. If you observe my father-in-laws life, as well as his father, the ADHD symptoms were very evident and unmistakable.My son is most similar to my father-in-law, such that he has the strong ADHD symptoms as well as Asperger’s, whereas my husband is not Asperger’s. I have diagnosed autistic relatives, and several suspected cases so it may just be a luck-of-the draw thing such that both my son and father-in-law got ADHD from their father’s side and ASD from their mother’s side?Anyway, here’s the snp at opensnp — one of the two AC’s has haunted the ASD/ADHD threads here with me for a long time, so yet one more piece of the puzzle. I know that he and my son both share the MAOA 3 repeat warrior version, which being on the X they get from their mother’s. MAO-A is an enzyme that degrades amine neurotransmitters, such as dopamine, norepinephrine, and serotonin and it’s prevalence is around 30% in Europeans. It makes me wonder if there could be a synergistic correlation between the variant and this snp, perhaps as a modifier to more severe ADHD or Aspergers? I know with my father-in-law, husband, and son…my husband has the least severe, and most easily treated case.

Интересно проанализировать распространение генотипов rs28363168 в метапопуляции европейцев.Данные взяты из базы данных dBSNP NCBI
Частоты генотипов CC, AC, AA вычисленны исходя из чисто «европейской» панели HapMap-CEU

Forward strand/ reverse strand %
GG/CC 93,8%
GT/AC 6,2%
TT/AA —

Alleles

G/C 96,9%
T/A 3,5%

Генотип GT/AC имеет частоту распространения 6,2%. Это примерно соответствует частоте распространенности ADHD в европейской популяции. Cм. нижеприведенные ссылки в статье «The size and burden of mental disorders and other disorders of the brain in Europe 2010», в которой частота встречаемости  ADHD  в европейских популяциях оценивается в 5%: «шn this study, 1 in 20 (5%) are thought to have ADHD but diagnosis rates vary depending:-Teachers reporting 18%-Parent reporting 8%-Self reporting 4%-Both parent and self 2%». Похожие выводы можно найти и в другом исследовании:

Males, of course, are much more likely to receive a diagnosis and age factors in as well. ADHD symptoms are estimated at 9.5-16.1% prevalence, but like ASD, it could be a spectrum, with many on the lesser end of the spectrum remaining undiagnosed due to coping skills.