О неолитических тирольцах и шведах: опыт палеогентического анализа — часть 1

В мае прошлого года я провел три бессонные ночи, пытаясь извлечь SNP-ы из BAM файлов, любезно предоставленных профессором Уппсальского университета Понтусом Скоглундом — автором нашумевшего исследования древнего ДНК насельников шведского неолита.  Как мне представлялось, задача должна была оказаться несложной, особенно после того как в марте прошлого года я успешно произвел «выделение» геномных вариантов из аналогичных файлов содержащих информацию о геноме Эци.  Полученные на выходе файлы я намеривался соединить с имеющейся у меня базой данных SNP-ов современных евразийских популяций, а затем проанализировать в программе smartpca, входящей в пакет Eigenstrat.

Однако на поверку на эту процедуру пришлось потрать намного больше времени, в первую очередь из-за определенных трудностей с использованием vcftools, и определением надежных SNP-ов в сгенерированных в samtools pileup файлах.
Трудно описать мою радость, когда мне удалось взломать эти ‘крепкие геномные орешки’. После успешного определения SNP-ов, я произвел PCA-анализ с целью определения позиции неолитических фермеров (Gok4), охотников-собирателей (Ajv52, Ajv70) и Ötzi (Эци) на карте генетического вариативности населения западной части Евразии.

Мои эксперименты с Eigenstrat  частично подтвердили результаты аналогичныхз опытов Диэнека.

Как видно на приведенном графике, доисторические шведы Ajvs (принадлежавших к готландской культуре ямочной керамики (Pitted Ware culture (около 3200 — 2300 гг. до н. э.)) оказались на периферии современных северо-восточных европейских популяций.
Затем, по просьбе ряда посетителей форума ABF, я сделал PCA-график, на котором показаны обозначения популяций.

Как и прогнозировалось ранее, Ajv52 и Ajv70 оказались в окружении плотного кольца из балтийских популяций. В эту группу вошли литовцы, белорусы, поляки, шведы, украинцы, русские (из Северной и Центральной России) и мокша-эрзя. Однако, похоже,  в силу своего расположения на графике они также отдаленно связаны с современнами финнами и немцами

Генографическое размещение другого образца древнего ДНК — Gök4 (культура воронковидных кубков, КВК (англ. Funnel Beaker culture, нем. Trichterbecherkultur, TRB) — мегалитическая культура (4000 — 2700 гг. до н. э.)) — также оказалось весьма предсказуемым. Этот образце попал в один кластер с  тирольским Эци, популяциями средиземноморского региона (Vasconia, Iberia, Италия) и рядом западно-европейских популяций ( в том числе и из Франции).

Результаты аналогичны результатам из оригинальной статьи.

F1.large

Воодушевившись столь замечательными результатами, я решил выполнить элементарный анализ IBS. Для расчетов использовалась примерно такая же метрика, что и при вычисление геномного сходства (genome-wide similarity) в клиентской базе данных 23andme . На первый взгляд результаты кажутся несколько иными, чем те, что приведены в работе Skoglund et al.2012 (результаты приведены ниже):

Neolithic farmer Hunter-gatherers Long Lat chr.
Cyprus Cyp 68.20% 68.21% 33 35 8
Greece Gre 67.94% 68.51% 22 39 16
France Fra 67.89% 68.80% 2 46 178
Netherlands Net 67.88% 68.79% 5 52 34
Romania Rom 67.84% 68.62% 25 46 28
Italy Ita 67.81% 68.43% 12 42 438
Germany Ger 67.80% 68.80% 10 51 142
Croatia Cro 67.76% 68.67% 15 45 16
Portugal Por 67.75% 68.59% -8 39 256
Belgium Bel 67.73% 68.78% 4 50 86
Spain Spa 67.72% 68.59% -4 40 272
Poland Pol 67.71% 68.98% 20 52 44
Austria Aus 67.69% 68.65% 13 47 28
United Kingdom UK 67.68% 68.79% -2 53 400
Serbia Ser 67.67% 68.62% 20 44 88
Macedonia Mac 67.62% 68.58% 22 41 8
Sweden Swe 67.61% 68.84% 15 62 20
Ireland Ire 67.61% 68.71% -8 53 122
Hungary Hun 67.60% 68.58% 20 47 38
Russian Rus 67.56% 68.72% 37 55 12
Turkey Tur 67.55% 67.98% 35 39 8
FIN FIN 67.47% 68.77% 25 61 80
LSFIN LSFIN 67.44% 68.79% 26 64 162
Bosnia Bos 67.39% 68.81% 17 44 18
Scotland Sco 67.35% 68.81% -4 56 10

Различие с моими результатами может быть объяснены как различным числом используемых  SNP-ов (в исследовании Скоглунда их больше), так и отличием методологических подходов. Я использовал очень простой алгоритм в программе Plink для расчета IBS-матрицы, в то время как Скоглунд с соавторами использовал более сложный подход при расчете средней частоты аллелей.

Во всяком случае, с учетом вышесказанного, я все же хотел бы поделиться результатами IBS-анализа (ниже приведены только популяции с максимальным % общих аллелей, процентное соотношение выражено в виде дроби):

AJV70:

GOK4 0.85
AJV52 0.833333
Ötzi 0.7992
UKR 0.587516
BLR 0.586873
HNG 0.583655
RMN 0.583549
LTH 0.583012
LTH 0.583012
CEU 0.580438
FIN 0.580438

AJV52:

AJV70 0.833333
Ötzi 0.823864
GOK4 0.8
UKR 0.602506
HNG 0.596811
LTH 0.594533
RMN 0.593394
LTV 0.592818
CEU 0.592255
GER 0.592255
MR 0.591463

Ötzi

AJV52 0.823864
GOK4 0.813602
AJV70 0.7992
HNG 0.725414
NITAL 0.724004
NITAL 0,71989
LTH 0.718232
WUKR 0.718232
IBR 0.718162
RMN 0,71768
BLR 0.717367

GOK4

AJV70 0,85
Ötzi 0.813602
AJV52 0,8
НИУ 0.611345
NITAL 0.602941
CEU 0,60084
CEU 0,59979
NITAL 0.598739
RMN 0.598739
GBRORK 0.598309
RUS 0.595789

С другой стороны, если мы оставим в таблице только популяции Северной и Восточной Европы, результаты будут почти точно соответствовать таблице Скоглунда, и оба Ajvs будут наиболее близки к полякам.

Я должен подчеркнуть, что на самом деле мне удалось обнаружить SNP-ы и в образцах Ire8 и Ste7 (52322 SNP-а + инделов у Ire8 и 13175 вариантов у Ste7). Однако после слияния этих данных с общей базой данных, оказалось что большинство из генотипированных SNP-ов оказались либо новельными вариантами  либо находились за пределами современной генетической вариативности. Пересечение снипов Ste7 и Ire8 SNP  с моим основным наборов снипов дало 0, т. е. не существует никаких общих SNP-ов между моим текущим набором и набором данных у указанных выше образцов. Поэтому мне не оставалось ничего другого, как удалить Ste7/Ire8 из  конечной выборки.

Реклама

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s