Популяции Нового Света: f_3 статистика и датировка событий креолизации/метисизации

Итак, теперь можно попытаться проанализировать результаты предыдущего опыта по изучению генетической структуры ряда американских популяций. MDS-анализ показал, что популяции выстраиваются вдоль одного из двух ребер умозрительного треугольника, вершиной которого является популяцию белых американцев из США (штат Юта). Одно из ребер является проекцией градации присутствия в генофонде чистого аборигенного америндского компонента – самыми близкими к белым американцам оказываются метисизированные группы алеутов и индейцев с северо-западного побережья США (индейцы Кольвилль и так далее),  и самой удаленной группой является популяция индейцев Surui из Бразилии. Второе ребро условного треугольника довольно только отражает градацию чистого африканского компонента.  Наиболее близкими к CEU здесь оказываются пуэрто-риканцы и жители островов Карибского моря, однако значительная часть этой группы оказывается смещенной в сторону от основного вектора за счет присутствия в генофонде следов нативного индейского населения Пуэрто-Рико.  Примечательно также расположение на плоте популяции The Lumbee Tribe. В первом цензе США 1790 года Lumbee записывались в разряд лично-свободных цветных людей. Однако уже в середине 19 века Lumbee упорно опровергали утверждения ряда ученых о происхождении Lumbee от беглых черных рабов: современные потомки этой небольшой группы продолжают считать себя потомками от смешанных браков индейцев Северной Каролины с  потомками «потерянных» белых колонистов Каролины начала 18 века.

Однако мой эксперимент разоблачает этот миф. Представители этой группы оказываются рядом с пуэрто-риканцами, благодаря чему можно сделать два убедительных предположения: a) Lumbee возникли в результате сложно процесса смешения всех трех рас  и b) соотношение генетических компонент трех рас в геноме Lumbee приблизительно равно аналогичному соотношению в геноме пуэрто-риканцев. Этот феномен объясняет почему многие из пуэрто-риканцев и афро-американцев, которые пользуются моим геномным калькуляторам для предсказания своего этнического происхождения,  нередко находят в своих результатах совпадение с геномом представителей племени Lumbee.

f3-статистика адмикса

Поскольку  в отличие от моих предыдущих экспериментов с европейскими популяциями данная выборка содержат априорно известные популяции метисов и мулатов, то в целях сопоставления результатов я решил применить новейшие методы анализа геномного адмикса – f3статистику и алгоритм ROLLOFF — для изучения демографической истории популяций Нового Света. В качестве примера я использовал геномные данные пуэрто-риканцев, в анализе использована метрика f3-статистики в версии программы Admixtools. Для иллюстрации достоверности сигнала я выбрал только те пары референсных популяций, чья интерполяция в геном таргетной популяции пуэрто-риканцев дают наибольшее отрицательное значение

parameter file: /storage/hpchome/vadim78/admixtools/examples/test.par

### THE INPUT PARAMETERS

##PARAMETER NAME: VALUE

genotypename: /storage/hpchome/vadim78/admixtools/bin/American.geno

snpname: /storage/hpchome/vadim78/admixtools/bin/American.snps

indivname: /storage/hpchome/vadim78/admixtools/bin/American.ind

popfilename: /storage/hpchome/vadim78/admixtools/examples/amer_qp3test

## qp3Pop version: 204

nplist: 528

number of blocks for block jackknife: 662

snps: 618523

Source1 Source2 Target f_3 std.err Z SNPs
Afro-American Kumiai PuertoRican -0.016575 0.000547 -30.303

601008

Afro-American Tsimsian PuertoRican -0.016280 0.000525 -31.011

601177

Afro-American Huichol PuertoRican -0.015848 0.000498 -31.799

601268

Afro-American Pima PuertoRican -0.014528 0.000455 -31.952

602781

Afro-American Navajo PuertoRican -0.013458 0.000409 -32.877

602871

Afro-American Mixtec PuertoRican -0.015951 0.000431 -36.975

602204

CEU Afro-American PuertoRican -0.017152 0.000232 -73.777

608991

Если сравнивать с результатами ADLER-тестов европейских популяций, то сразу обращает на себя внимание высокие значения Z-score, особенно в сравнении со старыми европейскими популяциями. Разница в амплитуде значений составляет примерно 10-15 раз.  Говоря простым языком, генетический сигнал смешения исходных популяций у пуэрто-риканцев намного сильнее, что свидетельствует о недавном адмиксе.

Интервал активной фазы смешения предковых популяций.

На следующем этапе нашего эксперимента, мы использовали программу ADLER и генетические дистанции снипов, полученные путем интерполяции известных значений генетических дистанций (сантиморганид) и физических дистанции снипов. Конечной целью этого этапа – дать оценку хронологического интервала событий адмикса. Для большего разнообразия я выбрал  латиноамериканских жителей Карибского бассейна.   Из нижеприведенных результатов следует, что у популяции латиноамериканских жителей присутствует сигнал адмикса как с североамериканскими, так и с центрально-американскими индейцами. Временной интервал адмикса в упрощенном виде составляет примерно 17-10 поколений тому назад  т.е примерно в интервале между 1490-1660 годами.

        |

|      ALDER,   v1.0

\..|./

\ \  /       Admixture

\ |/ /      Linkage

\| /       Disequilibrium for

|/        Evolutionary

|         Relationships

|

 

+—————————————————————————+

|  ALDER computes weighted LD decay curves, performs curve-fitting to      |

|  infer admixture dates, and uses the results to test for admixture.      |

|  For full details about options and parameters, please see the README    |

|  file included with this software.                                       |

+—————————————————————————+

 

warning: ignoring ‘jackknife’ parameter, which only applies to raw output

———- contents of parameter file: alder.par ———-

genotypename: /storage/hpchome/vadim78/admixtools/bin/American.geno

snpname: /storage/hpchome/vadim78/admixtools/bin/American.snps

indivname: /storage/hpchome/vadim78/admixtools/bin/American.ind

num_threads: 10

jackknife: YES

output: Caribbean

seed: 24

admixpop: Caribbean_Hispanic

refpops: Mexican;Colombian;Dominican;Ecuadorian;PuertoRican;Bolivian;Totonac;Aleut;Athabask;Navajo;Apache;Mixtec;Huichol;Cochimi;Cucupa;Kumiai;Luiseno;Costanoan;Lumbee;Tlingit;Haida;Eskimo;Miwok;Serrano;Colville;Inuit-West;Inuit-East;Tsimsian;Pima;Maya;Karitiana;Surui;Caribbean_Hispanic;Afro-American;CEU

———- parameter settings used (with defaults for unspecified) ———-

 

Input data files:

genotypename: /storage/hpchome/vadim78/admixtools/bin/American.geno

snpname: /storage/hpchome/vadim78/admixtools/bin/American.snps

indivname: /storage/hpchome/vadim78/admixtools/bin/American.ind

 

Admixed population:

admixpop: Caribbean_Hispanic

 

Reference populations/weights:

refpops: Mexican;Colombian;Dominican;Ecuadorian;PuertoRican;Bolivian;Totonac;Aleut;Athabask;Navajo;Apache;Mixtec;Huichol;Cochimi;Cucupa;Kumiai;Luiseno;Costanoan;Lumbee;Tlingit;Haida;Eskimo;Miwok;Serrano;Colville;Inuit-West;Inuit-East;Tsimsian;Pima;Maya;Karitiana;Surui;Caribbean_Hispanic;Afro-American;CEU

 

Raw weighted LD curve output:

raw_outname: (none)

 

Data filtering:

mincount: 4

 

Curve fitting:

binsize: 0.000500

mindis: -1.000000

maxdis: 0.500000

 

Поскольку нет смысла приводить весь лог эксперимента, я ограничусь лишь теми результатами, которые дали положительные результаты по обоим тестам

 

*** Admixture test summary ***

 

Weighted LD curves are fit starting at 1.2 cM

 

Does Caribbean_Hispanic have a 2-ref weighted LD curve with Mixtec and Tlingit?

2-ref decay z-score:    5.11

2-ref amp_exp z-score:  4.68

YES: curve is significant

 

Do 2-ref and 1-ref curves have consistent decay rates?

1-ref Mixtec — 2-ref z-score:                       0.02   (  0%)

1-ref Tlingit — 2-ref z-score:                      1.11   ( 21%)

1-ref Tlingit — 1-ref Mixtec z-score:               1.76   ( 21%)

YES: decay rates are consistent

 

Test SUCCEEDS (z=4.68, p=0.00054) for Caribbean_Hispanic with {Mixtec, Tlingit} weights

note: p-value is multiplied by 190 for multiple-hypothesis correction

 

DATA:  success 0.00054            Caribbean_Hispanic   Mixtec Tlingit  4.68      5.26      5.97      21%     12.14 +/- 2.37            0.00002098 +/- 0.00000448       12.18 +/- 2.32   0.00015501 +/- 0.00001668       15.03 +/- 1.95   0.00009072 +/- 0.00001520

*** Admixture test summary ***

 

Weighted LD curves are fit starting at 0.9 cM

 

Does Caribbean_Hispanic have a 2-ref weighted LD curve with Mixtec and Haida?

2-ref decay z-score:    7.24

2-ref amp_exp z-score:  4.87

YES: curve is significant

 

Do 2-ref and 1-ref curves have consistent decay rates?

1-ref Mixtec — 2-ref z-score:                      -0.19   ( -3%)

1-ref Haida — 2-ref z-score:                        0.78   ( 18%)

1-ref Haida — 1-ref Mixtec z-score:                 1.06   ( 21%)

YES: decay rates are consistent

 

Test SUCCEEDS (z=4.87, p=0.00021) for Caribbean_Hispanic with {Mixtec, Haida} weights

note: p-value is multiplied by 190 for multiple-hypothesis correction

 

DATA:  success 0.00021            Caribbean_Hispanic   Mixtec Haida  4.87      5.26      5.06      21%     12.61 +/- 1.74            0.00004084 +/- 0.00000838       12.18 +/- 2.32   0.00015501 +/- 0.00001668       15.07 +/- 2.88   0.00006966 +/- 0.00001376

 

*** Admixture test summary ***

 

Weighted LD curves are fit starting at 1.1 cM

 

Does Caribbean_Hispanic have a 2-ref weighted LD curve with Haida and Pima?

2-ref decay z-score:    4.23

2-ref amp_exp z-score:  4.18

YES: curve is significant

 

Do 2-ref and 1-ref curves have consistent decay rates?

1-ref Haida — 2-ref z-score:                        0.15   (  4%)

1-ref Pima — 2-ref z-score:                        -0.53   (-11%)

1-ref Pima — 1-ref Haida z-score:                  -0.72   (-15%)

YES: decay rates are consistent

 

Test SUCCEEDS (z=4.18, p=0.0055) for Caribbean_Hispanic with {Haida, Pima} weights

note: p-value is multiplied by 190 for multiple-hypothesis correction

 

DATA:  success 0.0055  Caribbean_Hispanic   Haida  Pima    4.18      5.06      5.02      15%     14.44 +/- 3.41   0.00004388 +/- 0.00001049       15.07 +/- 2.88   0.00006966 +/- 0.00001376       12.93 +/- 2.57   0.00014421 +/- 0.00001779

 

Advertisements

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s