Протокол обработки древних геномов для получения данных о гаплогруппе образца

Я поработал тут над протоколом определения мужских Y-гаплогрупп в палеоДНК. В конце концов — через пару дней — я остановился над следующим варианте.
Протокол содержит две части — первая для геномов с высоким покрытием, вторая для геномов с низким качеством и малым покрытием.


1) Для геномов с высоким покрытием варианты Y определяются в программе GATK и выводятся в формат VCF
Файл VCF вводится в программу yHaplo (написанную Позником на основании алгоритма определения Y-гаплогруппы в 23andme)
2) Для геномов с низким покрытием используется программа samtools mpileup c параметрами -B -q30 -Q30 -C50. Файл пайлапа преобразуется в формат 23andme и вводится в ту же программу (yHaplo)


Я проверил работоспособность протокола на нескольких примерах, похоже все работает (варианты гаплогрупп в таблице совпадают с теми что были опубликованы в статьях)
Сначала геномы с высоким покрытием — 2 генома древних гладиаторов из Йорка

3DT26 J-CTS8938 J-M304 J
6DT3 R-L52 R-P311 R1b1a2a1a

Теперь геномы с низким покрытием — 2 древнеегиптских образца

ERR1654486 J-P58 J-P58 J1a2b
ERR1654487 E-V22 E-L677 E1b1b1a1b2

Теперь еще более экстремальный случай (качество и покрытие плохое) — геномы римского периода с территории Польши (предположительно готы из Вельбарской культуры)

kow45 I-L35 I-M436 I2a2
kow55 I-L80 I-M253 I1

Геном англосакса из Йорка

NO3423 I-DF29 I-DF29 I1a

Геном неолитического периода с территории Польши

pl-7 R-S24902 R-S24902 R1a1a1b1a2c

Читать далее Протокол обработки древних геномов для получения данных о гаплогруппе образца

Эпигенетика Y-хромосомы человека

О генетике (в том числе и о популяционной генетике)  Y-хромосомы написано немало статей — теперь пришла очередь эпигенетики. Полгода тому назад я постулировал наличие в Y-хромосоме гаплогруппно-специфичных сайтов метиляции, влияющих на экспрессию специфически мужских генов. Данная гипотеза позволила мне решить старую диллему — с одной стороны малая генетическая информативность Y-хромосомы (мало генов), c другой стороны слабая корреляция между поведением и гаплогруппой. И вот пару дней назад, китайские исследователи опубликовали статью на эту тему. Перефразируя расхожое, можно сказать: «О чем бы вы не подумали, китайцы уже написали про это статью».

Что поделать — таков закон больших чисел.

«According to the human reference sequence (hg19), the tested sites on the Y chromosome were distributed on 11 regions: TSS1500 (-1500 bp from the nearest TSS), TSS200 (-200 bp from the nearest TSS), 5’UTR, EXON1 (1st exon of genes), 3’UTR, Gene Body, CpG islands, NSHORE(-2 kb region flanking the CpG island), SSHORE (+2 kb region flanking the CpG island),NSHELF (-4 to -2 kb region flanking the CpG island), and SSHELF (+2 to +4 kb region flank-ing the CpG island) (S3 Table). The mean methylation level of all tested sites within eachregion was taken as this region’s methylation index.We found that the variation in gene body region was greater than in other regions by calcu-lating the standard deviation of each region among all samples (Fig 5A). Further, we assessed the overall methylation pattern of 53 tested genes. Result showed that the methylation patternof two genes was haplogroup O3a2b-specific (LOC100101116,TTTY1)(Fig 5C). However, wedid not find such a haplogroup-specific variation on the other 10 functional regions (Fig 5Band 5D,S5 Fig).Fig 5. The methylation pattern of functional regions on the Y chromosome.A) Box plots showing thestandard deviation of methylation level within each region. The median line indicates the average methylationlevel, the edges represent the 25th/75th percentile, and the whiskers represent the 2.5th/97.5th percentile. B−D). Heat map showing the methylation levels of 38 detected TSS1500 regions (B), 53 gene body regions(C), and 55 CpG island regions (D)»

 

Fig 5. The methylation pattern of functional regions on the Y chromosome. A) Box plots showing the standard deviation of methylation level within each region. The median line indicates the average methylation level, the edges represent the 25th/75th percentile, and the whiskers represent the 2.5th/97.5th percentile. B − D). Heat map showing the methylation levels of 38 detected TSS1500 regions (B), 53 gene body regions (C), and 55 CpG island regions (D). 

Я пролистал статью китайских генетиков про консервативность эпигенетичских паттернов на Y-хромосоме. К сожалению, авторы ограничиваются только важными для юго-восточной Азии ветвями гаплогруппы O2 и O3 (особо выделяются когорты потомков разных императоров), а интересно было бы сравнить эпигенетические паттерны у носителей этой гаплогруппы с таковыми у других евразийских, американских и африканских гаплогрупп и изучить животрепещущие вопросы:

  1.  Дает ли преимущество разница в профилях метиляции ДНК Y-хромосом?
  2. Если дает, то какого рода c учетом мужской специфики? Возможные варианты: разница в фертильности спермы, отличия в уровне выработки тестостерона — и влияние на сопутствующие мужские признаки телесной конституции и поведения?
  3.  Помогает ли понимание разницы метилирования ДНК мужской половой хромосоомы объяснить разницу в физических, гендерных, функциональных, эмоциональных и интеллектуальных чертах мужчин разных гаплогрупп?

Вот о чем надо было рассуждать, а не о эволюционной консервативности метиляции Y-хромосомы. Это и так понятно любому думающему человеку.