Еще раз к проблеме генетической преемественности саамов и финнов

Одна из первых записей в этом дневнике была посвящена проблеме происхождения саамов. Поскольку все основные аргументы в споре генетиков, лингвистов и археологов были исчерпаны я решил не возвращаться к этой теме. Однако в середине мая со мной связался Андерс Полсен из генеографического проекта Fennoscandia . Нужно отметить необычайную активность Андерса, которая в последнее время особенно заметна на фоне бездеятельности остальных ведущих геномных блоггеров. В числе прочего следует упомянуть о ряде примечательных заметок Андерса, посвященных сравнительному анализу древнего ДНК останков из мезолитической испанской пещеры La Brana и  ДНК современных саамов. Эти заметки заслуживают дополнительного комментария. Анализом этно-популяционных компонентов ДНК  примерно год тому назад занимался Диенек Понтикос и автор этих строк. Понтикос отметил, в числе прочего, интересный момент:

В связи с небольшим числом извлеченных из останков снипов, я был вынужден создать композитный набор данных за счет слияния данных обеих генотипированных мезолитических индивидов; в моем калькуляторе K7b этот композитный индивид характеризуется наличием 9,3% африканских аллелей и 90,7% аллелей входящих в кластер Atlantic_Baltic, и этот расклад довольно точно соответствует положению этого композита на графике PCA … высокий процент компонента Atlantic_Baltic, согласуется с аналогичным высоким процентом Atlantic_Baltic, выявленным у  охотников-собирателей шведского неолита.

Поскольку география ареала распространения этого компонента, похоже, мало интересует Диенека, более он ничего не писал. Мой анализ показал несколько иную картину. Прежде всего, я использовал несколько иную группировку популяционных кластеров, определенных в ходе анализа чистот аллелей в разных популяциях. Во-вторых, в отличии Диенека, имеющего ограниченный сэмпл популяций балтийского и скандинавского регионов,  у меня была собрана солидная референсная группа эстонцев, шведов, латышей, финнов и саамов. Благодаря этому удалось показать, что ближе всего к La Brana находятся современные саамы, финны, латыши и эстонцы. Это геномная близость оказалась настолько явственной, что представляется возможным выделить компонент объединяющий все эти популяции и мезолитических испанцев в общий компонент, который я назвал палеоевропейским.

Эти выводы заинтересовали Андерса, поскольку в рамках своего проекта Фенноскандия, он уделяет особое внимание скандинавским популяциям, в том числе и саамам.  Месяц назад он написал мне письмо:

Я пытался  много раз проверить твои выводы (насчет близости саамов и мезолитических испанцев). Полученная в программе PLINK IBS матрица позволяет нам предположить, что  в абсолютном выражении, кратчайший путь от La Braña ведет к литовцам, и затем к  части финнов из северных регионов Финляндии. В программе Admixture, которая не учитывает перевес в пользу финнских и скандинавских образцов, финны и литовцы образовали  два разных кластера, а La Brana  попали в  общий кластер с финно-саамским компонентом, а не с литовцами. В другом запуске программы Admixture, я использовал равные по числу образцов выборки финнов и литовцев. В этом эксперимента я не обнаружил какого-либо расхождения между литовцами и финны, а La Brana попали целиком в этом общий финно-литовский компонент. Однако только что я завершил новый анализ структуры генофонда в программе fineStructure -Chromopainter. В размерности 4 «мирового» PCA La Brana  имеют одинаковую вариацию с двумя саамами и финном с небольшой примесью саамской крови.

В качестве ответа, я привел ряд своих собственных наблюдений насчет геномного сходства саамов.Я использовал совокупный набор данных для расчета матриц IBS и последующего импорта попарных IBS матриц в статистическое программное обеспечение R. Используя встроенные библиотеки программы R,  я вычислил средние значения наблюдений в наборе данных с попарными значениями IBS между образцами, включенными в анализ. Ниже приводится таблица с попарными значениями геномного сходства . Как видно,  в этот раз La Brana оказались гораздо более к балтийским популяциям:

Latvian Bra 0,5762
North-German Bra 0,5762
Estonian Bra 0,5761
Lithuanian Bra 0,5703
Russian Bra 0,5699
Czech Bra 0,5694
Swede Bra 0,5694
Russian_North Bra 0,5686
Pole Bra 0,5675
Orcadian Bra 0,5675
Bulgarian Bra 0,5671
South-Germanian Bra 0,5666
TN_Brahmin Bra 0,5661
Swiss Bra 0,5653
CEU Bra 0,5647
Center-Russian Bra 0,5643
Komi Bra 0,5641
Belorusian Bra 0,5638
Athabask Bra 0,5634
Mordovian Bra 0,5629
Kosovar Bra 0,5624
Corsican Bra 0,5622
French Bra 0,5614
Tsimsian Bra 0,5609
Croat Bra 0,5609
Nguni Bra 0,5606
Slovak Bra 0,5606
Hungarian Bra 0,5603
Yukagir Bra 0,5600
West-Ukrainian Bra 0,5596
NAN_Melanesian Bra 0,5595
Chuvash Bra 0,5593
Welsh Bra 0,5593
Colombian Bra 0,5592
Vepsa Bra 0,5591
Karelian Bra 0,5590
Miwok Bra 0,5589
North-Russian Bra 0,5587
Portugese Bra 0,5583
German Bra 0,5582
Macedonian Bra 0,5579
Finn Bra 0,5577
Russian_cossack Bra 0,5577
Colville Bra 0,5576
Russian_Center Bra 0,5576
Bosnian Bra 0,5571
Hakas Bra 0,5570
South-Russian Bra 0,5569
Lumbee Bra 0,5568
Sardinian Bra 0,5567
Selkup Bra 0,5567
Nenets Bra 0,5564
East-Ukrainian Bra 0,5563
Hausa Bra 0,5561
Tuva Bra 0,5558
Meghawal Bra 0,5556
Uzbeki_jew Bra 0,5556
Bashkir Bra 0,5555
Br Bra 0,5554
Inuit-West Bra 0,5552
Mexican Bra 0,5551
Tatar Bra 0,5550
Ukrainian Bra 0,5550
Naxi Bra 0,5548
Libyan-jew Bra 0,5548
British Bra 0,5548
North-Greek Bra 0,5546
French_Basque Bra 0,5545
Khant Bra 0,5544
Ashkenazi_Jew Bra 0,5543
Dharkar Bra 0,5543
Miaozu Bra 0,5542
Tatar_Lithuania Bra 0,5542
Daur Bra 0,5542
Spain Bra 0,5541
Saami Bra 0,5540
Romanian_Jew Bra 0,5540
Brahmin Bra 0,5537
Lezgin Bra 0,5536
Slovenian Bra 0,5536
Udmurd Bra 0,5534
Mongola Bra 0,5533
Sotho Bra 0,5533
Tuscan Bra 0,5533
Altaic Bra 0,5532
Burusho Bra 0,5529
North_Italian Bra 0,5525
Nogay Bra 0,5525
Azeri_Jew Bra 0,5525
Balkar Bra 0,5523
Adygei Bra 0,5522
Kol Bra 0,5520
Montenegrin Bra 0,5520
Gagauz Bra 0,5518
Hakkipikki Bra 0,5518
South-Greek Bra 0,5517
Han Bra 0,5516
Indian_muslim Bra 0,5516
Iberian Bra 0,5515
Georgian_Imereti Bra 0,5515
Greek_Azov Bra 0,5515
She Bra 0,5514
Yakut Bra 0,5513
GreeceThessaly2 Bra 0,5512
Serb Bra 0,5512
North-Ossetian Bra 0,5511
Lak Bra 0,5511
Chechen Bra 0,5511
Dusadh Bra 0,5511
Brahmin_UttarPradesh Bra 0,5510
Tlingit Bra 0,5507
Kalmyk Bra 0,5506
Toscanian Bra 0,5505
IndCan Bra 0,5505
Greek Bra 0,5504
Indian Bra 0,5504
Egyptan Bra 0,5503
Bengali Bra 0,5503
Haida Bra 0,5503
Ashkenazi Bra 0,5503
Kazakh Bra 0,5502
Mansi Bra 0,5502
Burmese Bra 0,5499
Georgian_Jew Bra 0,5499
Tunisian_Jew Bra 0,5496
Mongol Bra 0,5496
Kusunda Bra 0,5496
Turk Bra 0,5495
Karitiana Bra 0,5495
Uttar_Pradesh_scheduled_caste Bra 0,5494
Romanian Bra 0,5494
Kyrgyz Bra 0,5493
Uzbek Bra 0,5491
Roma Bra 0,5491
Ecuadorian Bra 0,5491
Xibo Bra 0,5490
Armenian Bra 0,5490
North_Greek Bra 0,5489
Tujia Bra 0,5489
Caribbean_Hispanic Bra 0,5489
Gond Bra 0,5488
Tatar_Crim Bra 0,5487
Turkmen Bra 0,5487
Iraqi-jew Bra 0,5486
Kurumba Bra 0,5486
Tu Bra 0,5486
Sindhi Bra 0,5484
Kshatriya Bra 0,5483
Oroqen Bra 0,5481
Aleut Bra 0,5478
Brg Bra 0,5478
Druze Bra 0,5478
Tadjik Bra 0,5477
Yizu Bra 0,5477
Kanjar Bra 0,5477
Naga Bra 0,5476
Irani-jew Bra 0,5476
Abhasian Bra 0,5475
Brahui Bra 0,5474
Georgian Bra 0,5472
Dai Bra 0,5471
Evenk Bra 0,5470
Tamil_Brahmin Bra 0,5470
Libyan Bra 0,5469
Cypriot Bra 0,5469
Mari Bra 0,5468
Kumyk Bra 0,5468
Hazara Bra 0,5467
Moroccan Bra 0,5467
Syrian Bra 0,5467
Inkeri Bra 0,5464
Azeri Bra 0,5464
Iraq_jew Bra 0,5464
Indian_Jew Bra 0,5464
Saudian Bra 0,5464
Lambadi Bra 0,5463
Cretan Bra 0,5462
Jordanian Bra 0,5461
Parsi Bra 0,5460
Ket Bra 0,5460
PuertoRican Bra 0,5460
Sephard Bra 0,5459
Chenchus Bra 0,5458
Nyshi Bra 0,5458
Chukchi Bra 0,5455
Shor Bra 0,5455
Velama Bra 0,5455
Lahu Bra 0,5454
Hezhen Bra 0,5454
Bedouin Bra 0,5454
Mozabite Bra 0,5452
Italian_Jew Bra 0,5452
Tamil_Nadu Bra 0,5450
Tharus Bra 0,5449
Chamar Bra 0,5448
Irani Bra 0,5448
Kinh Bra 0,5447
Yemen_jew Bra 0,5446
Center-Italian Bra 0,5445
Tunisian-jew Bra 0,5444
Lebanese Bra 0,5444
Balochi Bra 0,5443
Pygmy Bra 0,5442
Dolgan Bra 0,5442
Serrano Bra 0,5442
Palestinian Bra 0,5441
Brahmin-TNBRAS Bra 0,5441
Makrani Bra 0,5440
Piramalai_Kallar Bra 0,5439
Kalash Bra 0,5439
Algerian Bra 0,5438
Lemba Bra 0,5435
Yemeni Bra 0,5435
Fulani Bra 0,5433
South-Han Bra 0,5432
Uzbekistan_Jew Bra 0,5432
Center-Greek Bra 0,5432
Karakalpak Bra 0,5431
Costanoan Bra 0,5425
Morocco_Jew Bra 0,5422
Gujarati Bra 0,5420
Algerian-jew Bra 0,5418
Tswana Bra 0,5415
Iranian_Jew Bra 0,5413
Yemen_Jew Bra 0,5413
France_Jew Bra 0,5412
Iran_jew Bra 0,5409
Kurd_Jew Bra 0,5407
Egyptian Bra 0,5407
Afar Bra 0,5406
Iraqi Bra 0,5402
Chamat Bra 0,5397
North-Han Bra 0,5392
Khazar_jew Bra 0,5391
!Kung Bra 0,5390
Maya Bra 0,5387
Saudi Bra 0,5379
Tunisian Bra 0,5377
Sicilian Bra 0,5377
Georgian_Laz Bra 0,5373
Indan_muslim Bra 0,5370
Saharan Bra 0,5369
Meena Bra 0,5366
Azeri_jew Bra 0,5364
Ethiopian_Jew Bra 0,5362
Dogon Bra 0,5360
Indian_jew Bra 0,5357
Kongo Bra 0,5347
Algerian_Jew Bra 0,5337
Tat Bra 0,5335
Syrian_Jew Bra 0,5334
Madiga Bra 0,5331
Papuan Bra 0,5322
San Bra 0,5309
Somali Bra 0,5306
Dominican Bra 0,5296
Australian Bra 0,5296
Wolyata Bra 0,5285
Libyan_Jew Bra 0,5280
Bamoun Bra 0,5279
Brong Bra 0,5271
Bambaran Bra 0,5271
Afro-American Bra 0,5271
Tygray Bra 0,5269
Koryak Bra 0,5264
Sandawe Bra 0,5262
Ethiopian Bra 0,5259
Bulala Bra 0,5248
Mada Bra 0,5248
Amhara Bra 0,5246
Kaba Bra 0,5240
Hadza Bra 0,5224
Biaka_Pygmies Bra 0,5211
Oromo Bra 0,5201
Bantu Bra 0,5195
Yoruba Bra 0,5171
Mandenka Bra 0,5169
Igbo Bra 0,5157
African-Caribbean Bra 0,5154
Luhya Bra 0,5152
Yourba Bra 0,5127
Esomali Bra 0,5116
Ari Bra 0,5110
Fang Bra 0,5086
Anuak Bra 0,5077
Sudanese Bra 0,5021
Gumuz Bra 0,4993

Руководствуясь моими замечаниями, Андерс написал новую заметку в свой блог, и эта заметка настолько важна, что я решил ее перевести на русский целиком:

» Те, кто читал мой блог, или участвовал в  проекте Fennoscandia, уже привыкли к появлению на графике  PCA (анализа главных компонентов европейского генетического разнообразия) в программе Chromopainter-finesStructure  типичных фигур с формой напоминающей  символы  «>» или «<«. Обычно кластер располагается близко к корню в то время как популяции Центральной и Восточной Европе популяции оказываются на одной ветке или ребре этой V-образной фигуры, в то время как скандинавы, финны и саамы  — на другой.  Пример этой структуры приведен ниже:

Наверное, многие из моих читателей задавались вопросом, почему распределение популяций на графике PCA имеет именно эту геометрическую форму, а также вопросом касаемо того, сколько лет прошло с момента начала дивергенции двух вышеупомянутых группы популяций.  Чтобы ответить на этот вопрос я произвел анализ данных  по древней ДНК La Braña и MDS анализ  в программе PLINK.  Исходное число точечных мутаций -снипов было уменьшено до 69 000. В анализе я использовал всех участников проекта и референсных популяций. Как мы видим, нет * абсолютно * никаких сомнений, с кем именно кластеризуются древние La Braña в проекции двух основных компонентов генетического разнообразия.


Подобное расположение древних иберийских  La Braña, означает вероятно, что древние La Braña характеризовались определенными генетическими вариациями, вариациями которые напоминали генетические  вариации финнов и саамов  (и сегодня встречаются только в Фенноскандии). В западной и южной Европе эти генетические вариации отсутствуют. Кроме того, существуют вероятно компоненты, которые отделяют La Braña от финнов, и приближают их  к саамам.

Набор данных по La Braña включает в себя 183 000 снипа (эти снипы перекрываются набором данных из проекта 1000G) и мой текущий стандартный набор данных 289 000 снипа.   Интерсекция обеих наборов данных   дает в конечном итоге всего 4 000 снипа. Это явно небольшое количество полиморфизмов, недостаточное для полноценного анализа. Вместо этого я попытался посмотреть, если  другой способ решения этой проблемы, который позволяют произвести анализ с использованием всех 183 000 снипов La Braña. Тот факт, что оба набора данных в этом эксперименте — 183 000 снипа Lа Braña  и 288  000 cнипа  — полностью перекрываются снипами проекта 1000 геномов,  позволяет нам найти решение проблемы  путем импутации SNP-гаплотипов. Эта процедура определения снипов широко используется в генетических исследованиях  в тех случаях, когда объединенный набор данных был генотипирован на различных платформах с использованием общей референсной панели.

Импутация снипов была проnзведена в программе BEAGLE. После этого я сравнил  первоначальный набор данных с «импутированным» набором данных на предмет различий между. Поскольку большинство SNP-ов в данном анализе было определенно в ходе импутирования, то я заметил определенный » искусственный дрейф», состоящий в том, что индивиды с импутированными  снипами становятся более похожи друг на други, чем те же индивиды, но с первоначальными неимпутированными снипами 1000G Поэтому я исключил всех индивидов, чей набор данных содержал импутированные снипы (за исключением La Braña), предполагая что минимизаций фактора неопределенности приведет к тому, что неизбежные незначительные ошибки не будут столь значительно влиять на достоверность результатов. Все генотипы индивидов La Braña представляют собой реальные  генотипы (без использования импутации).

Как мы видим ниже, структура популяций определенная в программе Chromopainter-fineStructure, представляется релевантной как в мировом, так и  в паневропейском масштабе. Это доказывает надежность проведенной операции импутирования снипов,  поэтому эту методологию можно использовать для дальнейшего анализа.

На приведенных выше графиках видно, что отдельные компоненты аутосомных генетических вариаций La Braña сильно отделяет эту группу от остальной части современных европейцев, так же как и  в предыдущем посте с использованием неимпутированных гаплотипов. Причина этого феномена ясна: у индивидов La Braña африканское происхождение выражено более ярко, чем у остальных европейцев. Принадлежность к  восточно-азиатскому, сибирскому и индейскому кластеру, кажется, характерна для сегодняшних финнов.

В этой связи возникает закономерный вопрос: какая из современных нам популяций является самой близкой к La Brana?  При проведении простой IBS-кластеризации в PLINK, мною были получены величины Эвклидовой дистанции между геномными образцами. В режиме диплоидных данных наиболее близкими к La Brana оказываются литовцы и саамы, в  режиме гаплоидном режиме список возглавляют литовцы.


Однако по своему собственному опыту, я могу сказать что нельзя полностью доверять простым сравнениям IBS, поскольку на сходство могут повлиять очень многие факторы. С целью получения большей информации, я произвел новый анализ в  Chromopainter-fineStructure, — на этот раз с использованием только европейских популяций.

Как мы видим из вышеприведенной heatmap, cуществует определенная генетическая связь между литовцами, финнами и басками. В более отдаленной степени, в эту цепочку включаются и саамы.  Наличие большой асимметрии между полученными от других популяций хромосомными сегментами и хромосомными сегментами отданными в другие популяции в ходе процесса обмена генами, а также самый раннее ответвление    La Brana от остальной европейской панели, объясняется очевидно 10%  примеси африканских аллелей обнаруженных ранее.

Однако в анализ главных компонент PCA мы можем выделить влияние разных компонентов в генетическом наборе данных La Brana. В проекции 1 измерения PCA X-ASIS, мы наблюдаем значительную дисперсии отдельных популяций — La Braña находятся в крайне левом углу,  а литовцы — в дальнем правом. В перспективе 1 измерения    (размерности) главных компонентов генетического разнообразия нет никаких сомнений, что саамы находятся ближе всего к La Brana. В перспективе второго измерения 2,  дисперсия смещает La Brana к литовцам. Заметим, что здесь саамы и баски образуют противоположенные кластеры, которые отражают известную генетическую дихотомию-разделение Северо-Восточной  и Юго-Западной Европы.

В проекциях 1 и 3 измерения (Y-ось) мы видим, что La Braña наиболее близки к финнам и в некоторой степени также к пресловутым вологодским русским. В размерности 3 мы также видим, что баски и литовцы расходятся в противоположных направлениях, а  саамы появляется в качестве  промежуточное звена между ними.

Выводы: La Braña, судя по всему, отражают один из основных компонентов, которые в  самой значительной степени присутствуют среди современных популяциях у саамов, но практически отсутствует у остальных европейцев.  У саамы наблюдается и  второй значительный генетический компонент, который, кажется, отражает характерный градиент по направлению север-юг характерный  для  большой части финнов. Однако расположение La Braña в пространстве этого второго компонента нарушает общий тренд — они смещаются гораздо «южнее» от нижней части кластера литовцев в направлении кластера басков. Это означает, что у La Braña наблюдается значительный вклад южно-европейских предков. Оба доминирующих компонента в размерностях 1 и 2 на графики PCA достигают своего пика в северной части Европы (у саамов), причем второй компонент (который отсутствует у  La Braña) может указывать на аутентичный «северный» компонент, cвязанный с позднейшими миграциями. Интерпретация третьего компонента вызывает затруднения. Здесь присутствуют и финны, и русские из Вологда, в то время  как La Braña смещается ближе к литовцам, а  саамы —  в сторону кластера басков.

Заключение: Мезолитические жители Иберийского полуострова — La Brаna — характеризовались генетическими вариациями, которые в настоящее время встречаются среди саамов, и в то же время указывают на принадлежность к более южным популяциям, вроде литовцев и басков. Можно предположить, что оба компонента отражают «северный» и «южный» вклад в их родословную.

Наши наблюдения, по крайней мере частично, согласуются с  выводами Вадима Веренича впервые обнаружившим  связь между мезолитическими охотниками-собирателями Иберийского полуострова и саамами. Behind the Curtains: MDLP World 22 showcase

Advertisements

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s