Дилемма Платона в свете генетических алгоритмов

В истории хорошо известно описание демографической политики идеального государства в описании философа Платона. В своей краткой форме, описание можно свести к евгенической программе, формулировка которой содержится в трактате «Государство». На некоторых празднествах невест и женихов будут соединять, как их учат верить, якобы по жребию в таком количестве, которое необходимо для сохранения постоянной численности населения; но на самом деле правители города будут производить манипуляцию с жребиями, исходя из евгенических принципов. Они будут устраивать так, чтобы лучшие производители имели больше всего детей. Все дети будут после рождения отбираться у своих родителей, и будут приняты серьезные меры предосторожности, чтобы родители не знали, которые дети являются их детьми, а дети не должны знать, кто их родители. Детей с физическими недостатками и детей худших родителей «станут скрывать как следует в тайном и неизвестном месте».В конце 20 века биологические идеи, отдаленно напоминающие воззрения Платона, получили свою формальную реализацию в виде так называемых генетических алгоритмов. Краткое описание основных положений теории генетических алгоритмов приведено по материалам сайта «Искусственный интеллект», а также с использованием монографии Панченко «Введение в генетические алгоритмы».

Селекция – это выбор тех хромосом, которые будут участвовать в создании потомков для следующей популяции, т.е. для очередного поколения. Такой выбор производится согласно принципу естественного отбора, по которому наибольшие шансы на участие в создании новых особей имеют хромосомы с наибольшими значениями функции приспособленности. Существуют различные методы селекции.

Рассмотрим их.

Основанный на принципе колеса рулетки (жребии) метод селекции считается для генетических алгоритмов основным методом отбора особей для родительской популяции с целью последующего их преобразования генетическими операторами, такими как скрещивание и мутация. Несмотря на случайный характер процедуры селекции, родительские особи выбираются пропорционально значениям их функций приспособленности: каждой хромосоме сопоставлен сектор колеса рулетки, величина которого устанавливается пропорциональной значению функции приспособленности данной хромосомы, поэтому, чем больше значение функции приспособленности, тем больше сектор на колесе рулетки. Отсюда вытекает, что чем больше сектор на колесе рулетки, тем выше шанс, что будет выбрана именно эта хромосома. Слабая сторона этого метода заключается в том, что особи с очень малым значением функции приспособленности слишком быстро исключаются из популяции, что может привести к преждевременной сходимости генетического алгоритма. Кроме того, особенности алгоритма не исключают варианты, в которых потомство субоптимальных особей достигает оптимума в следующиъ поколениях. В связи с вышесказанным, созданы и используются альтернативные алгоритмы селекции.

Турнирная селекция

При турнирной селекции все особи популяции разбиваются на подгруппы с последующим выбором в каждой из них особи с наилучшей приспособленностью. Различаются два способа такого выбора: детерминированный выбор и случайный выбор. Детерминированный выбор осуществляется с вероятностью, равной             1            , а случайный выбор – с вероятностью, меньшей 1. Подгруппы могут иметь произвольный размер, но чаще всего популяция разделяется на подгруппы по 2-3 особи в каждой.

Турнирный метод пригоден для решения задач как максимизации, так и минимизации функции. Помимо того, он может быть легко распространен на задачи, связанные с многокритериальной оптимизацией, т.е. на случай одновременной оптимизации нескольких функций. В турнирном методе допускается изменение размера подгрупп, на которые подразделяется популяция. Исследования подтверждают, что турнирный метод действует эффективнее, чем метод рулетки.

На рисунке ниже представлена схема, которая иллюстрирует метод турнирной селекции для подгрупп, состоящих из двух особей. Такую схему легко обобщить на подгруппы большего размера.

 

Ранговая селекция

При ранговой селекции особи популяции ранжируются по значениям их функции приспособленности. Это можно представить себе как отсортированный список особей, упорядоченных по направлению от наиболее приспособленных к наименее приспособленным (или наоборот), в котором каждой особи приписывается число, определяющее ее место в списке и называемое рангом. Количество копий каждой особи, введенных в родительскую популяцию, рассчитывается по априорно заданной функции в зависимости от ранга особи. Пример такой функции может быть следующий график.

 

Достоинство рангового метода заключается в возможности его применения как для максимизации, так и для минимизации функции.

Существуют различные варианты алгоритмов селекции. Представленные выше методы (рулетки, турнирный и ранговый) применяются чаще всего, но существуют так называемые особые процедуры селекции: элитарная стратегия и генетический алгоритм с частичной заменой популяции.

Элитарная стратегия заключается в защите наилучших хромосом на последующих итерациях. В классическом генетическом алгоритме самые приспособленные особи не всегда переходят в следующее поколение. Это означает, что новая популяция не всегда содержит хромосому с наибольшим значением функции приспособленности из предыдущей популяции. Элитарная стратегия применяется для предотвращения потери такой особи. Эта особь гарантированно включается в новую популяцию.

Генетический алгоритм с частичной заменой популяции, иначе называемый генетическим алгоритмом с зафиксированным состоянием, характеризуется тем, что часть популяции переходит в следующее поколение без каких-либо изменений. Это означает, что входящие в эту часть хромосомы не подвергаются операциям скрещивания и мутации. Часто в конкретных реализациях алгоритма данного типа на каждой итерации заменяются только одна или две особи вместо скрещивания и мутации в масштабе всей популяции.

 

Лекция Гельфанда о геномике (Постнаука)

    Появились технологии, которые позволяют очень быстро и дешево определять последовательность нуклеотидов в геноме. То, что неправильно называют расшифровкой генома, на самом деле не расшифровка, потому что смысл последовательности мы не понимаем. Но у ДНК в пробирке или в клетке мы можем теперь довольно быстро определить последовательность генома и, соответственно, после этого изучать ее какими-то вычислительными средствами на компьютере. Несколько лет назад в Альпах нашли труп человека — охотника лет сорока, которого убили. У него в лопатке застрял наконечник острия копья. Это детектив пятитысячелетней давности. Было много археологических исследований: обувь и одежда были заморожены в очень хорошем состоянии. Также определили его геном. Потом нашли современных людей в Австрии, которые являются его родственниками (то есть это люди с теми же самыми вариантами). Ясно, что популяция людей, которая жила в Альпах пять тысяч лет назад, никуда не делась. Они внесли свой вклад в геномы современных австрийцев.

Молекулярная патология

Программные положения

«Традиционная патология занимается морфологическими проявлениями болезней. В дополнение к этому, молекулярная патология включает в себя приборы молекулярной биологии для того, чтобы изолировать и идентифицировать возбудители инфекционных заболеваний, понять роль дифференциальной экспрессии генов в этиологии болезни, предоставить более точные средства для диагностики заболеваний и обеспечить более индивидуализированный подход к терапии.

Многие болезни вызываются наследственными генными мутациями, например, муковисцидоз, мышечная дистрофия и лизосомные болезни накопления (в группу лизосомных болезней накопления (ЛБН) входят 50 — 70 различных редких генетических заболеваний). Другие изменения генов определяют бóльшую предрасположенность организма к заболеваниям, например, раку или болезням сердца.

Ключевыми методами молекулярной патологии для идентификации взаимосвязи между изменениями генов и заболеваниями являются выделение и культивирование клеток, иммуногистохимия, метод FISH и методы лабораторной молекулярной биологии (идентификация генных мутаций, определение профиля экспрессии, анализ белков, блоттинг, микрочипы).

Считается, что развитие злокачественных заболеваний проходит через определенные стадии, такие как гиперплазия, дисплазия, преинвазивный рак, инвазивная карцинома и метастазы, каждая из которых может быть связана с мутациями и изменениями экспрессии подгруппы генов. Лазерная микродиссекция с успехом применяется для выделения отдельных клеток или популяций клеток из ткани (замороженных, зафиксированных срезов тканей и монослоев культур клеток) для последующего генетического анализа, который обеспечивает возможность непосредственного сравнения нуклеиновых кислот клеток на различных стадиях развития болезни.

Влияние изменений генов на функцию белков и на заболевание можно исследовать с помощью различных методов наблюдения. Особенно важными являются такие методы, как наблюдение белок-белковых взаимодействий с помощью метода получения изображений в заданный промежуток времени, микроскопии TIRF и конфокальной флуоресцентной микроскопии, например трехмерный рендеринг и FRET/BRET. Они позволяют проводить пространственный и временной анализ динамических событий, включая, например, рецепторные взаимодействия и другие сигнальные события.»

Новые работы по молекулярной генетике Y-хромосомы

Начало января 2014 года не было богато новыми публикациями на тему популяционной и эволюционной генетики человека. В числе немногих публикаций, стоит отметить 2 статьи, в которых затрагиваются вопросы реконструкции Y-филогенетического древа, оценки скорости мутации и влияния естественного отбора на молекулярно-биологические особенности Y-хромосомы.

Стоит отметить, что по понятным причинам Y-хромосому вряд ли можно отнести к популярным объектам исследования генетиков. Одной из причиной отсутствия мотивации изучения Y-хромосомы является крайне низкая плотность распределения генов на этой хромосоме.

По состоянию на 2012 год известно несколько десятков генов на Y-хромосоме в отношении которых имеется корреляция с наследуемыми признаками или риском заболеваний. В английской Википедии приведен ряд самых важных сцепленных с Y-хромосомой генов:

ASMTY (acetylserotonin methyltransferase),
TSPY (testis-specific protein),
IL3RAY (interleukin-3 receptor),
SRY (sex-determining region),
TDF (testis determining factor),
ZFY (zinc finger protein),
PRKY (protein kinase, Y-linked),
AMGL (amelogenin),
CSF2RY (granulocyte-macrophage, colony-stimulating factor receptor, alpha subunit on the Y chromosome),
ANT3Y (adenine nucleotide translocator-3 on the Y),
SOX21 (known to cause baldness),
AZF2 (azoospermia factor 2),
BPY2 (basic protein on the Y chromosome),
AZF1 (azoospermia factor 1),
DAZ (Spermatogenes is deleted in azoospermia),
RBM1 (RNA binding motif protein, Y chromosome, family 1, member A1),
RBM2 (RNA binding motif protein 2), and
UTY (ubiquitously transcribed TPR gene on Y chromosome).
USP9Y
AMELY

Принимая во внимание эти обстоятельства, любая из публикаций на тему Y-хромосомы заслуживает пристольного внимание, особенно в тех случаях когда она содержит новые фактологические данные, полезные для антропологических и генеалогических реконструкций.

Итак, в первой работе «New chronology of Y chromosome phylogeny» (Scozzari et al. 2013), авторы возвращаются к старой проблеме определения топологической структуры Y-хромосомного филогенетического дерева человечества и датировки возраста каждой из Y-хромосомных гаплогрупп. Путем интерполяции скоростей SNP-мутаций в аутосомах, авторы приходят к выводу, что частота мутаций в Y-хромосоме равна 0,64 х 10e-9 . Эта величина лежит в промежутке между двумя другими, недавно опубликованными значениями скорости мутаций. Вместе с тем,  полученная методом интерполяции величина скорости мутации ниже, чем значение полученное путем прямого измерения этой величины. Используя предложенную величину скорости мутаций, авторы определили приблизительное время дивергенции самых древних ветвей на Y-хромосомном древе человечества.

Вторая статья, в силу специфичности своего материала, будет интересна прежде всего специалистам в области эволюционной биологии или медицинской генетики. В статье «Natural selection on human Y chromosomes» Jangravi et al. (2013) идет речь о новом интересном проекте в рамаках проекта по изучению Human Proteome (Y-HPP). Объектом изучения в этом проекте является Y -хромосома, вернее MSY — male-specific region of Y. Этот замечательный проект планируется запустить в течение ближайших 10 лет, и как утверждается в статье «конечная цель проекта состоит в подробном отображении и аннотации всех протеинов, кодируемых генами в сиквенсе MSY».  Вместе с тем, наряду с описанием планов проекта, обсуждаемая статья содержит в себе превосходный  реферативный сводный обзор всех предыдущих работ на тему Y-хромосомы. В этом смысле, статья представляет собой a must read для любого человека, желающего  систематизировать и расширить свои знания в области структуры и функции Y-хромосомы.
Как известно, специфически мужская (нерекомбинантная) часть Y хромосомы (MSY) состоит из трех  доменов-регионов, первоначально описанных в статье Skaletsky et al. (2003 ) :

  •    X- вырожденый регион (остатки предковых половых хромосом )
  •     X- транспонированный регион ( результат переноса части генов с X хромосомы на Y хромосому после разделения линий шимпанзе и человека )
  •    Регион ампликонов (дупликаций) ( повторящаяся область — результат переноса генов с аутосомных хромосом).

В дополнение к этим регионам в специфически мужской части Y хромосомы, на ней имеются два псевдоаутосомных региона, последовательность нуклеотидов к котором являются гомологичным аналогичным участкам на Х-хромосоме.

Интересные факты

Доказано существование 60 уникальных генов ( локусов ) на специфически мужской части (MSY) Y -хромосомы, но надежное доказательство производства протеиновго продукта имеется только для  20 из этих генов. Это означает, что  хотя последовательность ДНК указывает на наличиие функционирующего генного продукта, и у исследователей есть образцы транскриптов для большинства из них, эспериментальные анализы не смогли показать наличие произведенного геном функционального белка.

  1. Из всех протеинов MSY, примерно у 16,0 % отсутствует известная молекулярная функция.
  2. Субклеточная локализация 25,0% протеинов остается неизвестной.
  3. Примерно 15% всех женщин с XY (sex-reversal), имеют мутации в гене SRY.
  4. Ген SRY вызывает дифференциацию первичных клеток Сертоли, стимулируя формирование яичка и подавляя гены, которые способствуют образованию женской половой железы, начиная  примерно с 7 недели развития плода.
  5. 5.  Сертоли-клеточный синдром. 

В основе заболевания — аплазия зародышевой ткани яичка, что приводит к бесплодию. При биопсии яичек обнаруживают умеренное уменьшение размеров извитых канальцев семенников и отсутствие зародышевых клеток. Семенные канальцы выстланы только клетками Сертоли. В эякуляте таких больных сперматозоиды не обнаруживаются. С точки зрения генетики синдром является результатом мутаций в локусах DDX3Y и USP9Y .DDX3Y (АТФ- зависимая РНК- хеликаза ) и USP9Y ( кодирует протеазу с специфической активностью к убиквитину и участвует в регуляции метаболизма белка ( обмене белков) ).

6.  Каждый шестой образец рака простаты показал, по крайней мере, потерю некоторых  генов в MSY регионе Y хромосомы. Уменьшение  ( <20 ) числа копий гена TSPY связано с увеличением риска развития рака простаты.

В работе приводится ссылка на  базу данных белковых взаимодействий Y- сцепленных генов. Эта база данных доступна в разделе PPI .  К сожалению,  большинство пост-трансляционных (эпигенетических) модификаций (то есть тех изменений, внесенных в белок, который мы не можем в настоящее время предсказать исходя из  ДНК-последовательности гена ) до сих пор плохо изучены. Для Y -сцепленного гена DDX3Y по крайней мере, были обнаружены примерно 67 посттрансляционные модификации, исходя из пять разных типов пост-трансляционного воздействия (фосфорилирования, дезаминирования , ацетилирования, убиквитинирования и метилирования).

Созданный в рамках проекта по изучения протеома человека, проект PPI интересен свой структурой. В отдельных его разделах можно найти подробную информацию о генных продуктах,  информацию о экспресии и онтологии гена. Лично мне были интересны некоторые типы интеракций продуктов генов Y-хромосомы, в частности протеина SP1 (Co-Immunoprecipitation), который участвует в синергической активации гена MAO (расположенного на X хромосоме). Расположенный на X-хромосоме ген, кодирующий МАО-А  оказался первым кандидатом в «гены агрессии «. В 1993 г. Х.Г. Бруннер с коллегами  описали семью, в которой пятеро мужчин характеризовались некоторым снижением интеллекта и агрессивностью. У всех этих мужчин была обнаружена точковая мутация (замена одного из нуклеотидных оснований на другое) в гене МАОА. Эта мутация вела к дефициту МАО и тем самым к возрастанию уровня серотонина, что противоречило общепринятым представлениям о снижении уровня серотонина при импульсивной агрессии (подробности здесь).

Наконец, в отдельном меню приведены систематизированные (по генам) данные о связи отдельных заболеваний или синдромов с определенными типами экспресии генов или микроделеций. Любопытно, что спектр изученных Y-хромосомных ассоциаций с заболеваний пока изучен слабо — в основном это нарушения мужской фертильности, рак простаты, реверсии пола, аутизм.

Три предковые группы европейцев

Получивший широкой резонанс в среде профильных профессиональных популяционных генетиков и простых любителей препринт статьи Lazaridis et al. 2013 содержит огромное количество важных наблюдений и заключений насчет происхождения и эволюции структуры генофонда современных европейцев. Объективности ради стоит отметить, что наверное не менее половины выводов вышеупомянутой статьи были озвучены ранее персональными геномными блоггерами в ходе более ранних самостоятельных экспериментов и анализов древней ДНК.  Но важность статьи Lazaridis et al. 2013, конечно же, в другом. В ней приводятся новые данные ( результаты изучения древнего ДНК) ряда доисторических популяций групп людей Европы. В частности, были приведены результаты изучения древнего ДНК мезолитических европейских охотников-собирателей из Люксембурга, чьи мтДНК были опубликована несколько лет назад; результаты генотипирования неолитического образца ДНК неолитического земледельца из Германии: наконец, препринт статьи содержал данные сразу по  нескольким мезолитическим охотникам-собирателей из Швеции.

По раскладу своих предковых компонентов, люксембургский образец похож на образцы  La Brana (иберийский палеолит). В свою очередь,  ДНК шведов периода мезолита похожа на ДНК шведских неолитических охотников-собирателей. Аналогично, структура предковых компонентов у неолитического земледельца напоминает распределение компонентов у тирольского ледового человека Этци, шведского неолитического земледельца культуры воронковидных кубков и современного населения Сардинии. Недавно опубликованный  верхнепалеолитический образец жителя стоянки Мальта (Прибайкалья), авторы относят к  отдельному генетическому супер-компоненту, который  в статье именуется  «компонентом древнего северо-евразийского населения», Согласно наиболее вероятной из обсуждаемых в статье моделей, носители этого компонента смешались с западными евразийцами  еще до того, как носители мезолитического европейского компонента смешались с неолитическими земледельцами с ближнего Востока.

Как я отмечал ранее, очевидность результатов вряд ли нуждается в отдельных комментариях.  Положение индивидов по степени их сходства (выраженного посредством параметра z D-статистики)  относительно условной оси на одном конце которых находятся южные европейцы, на другом — северные европейцы. Шведские сэмплы древнего ДНК времен мезолита и пост-мезолитической (переходной к неолиту) культуры ямочной керамики Готланда сдвигаются в сторону северных европейцев (представлены референсной популяцией литовцев).  Примечательно, что в ту же стороны сдвигаются и представители иберийско-испанского мезолита (образцы La Brana 1 и La Brana 2).
Образцы древнего ДНК представителей культуры воронковидных кубков, Эци Тирольца закономерно смещаются к другому полюса спектра — южным европейцам (которые представлены сардинцами).

PCA график дает отличное представление о соотношении различных компонентов:

europe

 

 

 

model

Таким образом, костяк европейского генофонда образован за счет сочетания трех компонентов:

мезолитические охотники-собирателей Европы (WHG) + древние северо-евразийские популяции между Уралом, Центральной Азией и Сибирью (AHE) + неолитический компонент (генетически связанный с ближневосточными земледельцами EEF).

 

Поскольку в нашем случае мы имеем три исходных компонента, то любая европейская популяция может быть представлена в виде тримодального распределения этих компонентов. Визуализация этого распределения достигается путем отображения популяций внутри треугольника (каждый из углов которого представляет собой отдельный чистый предковый компонент). Таким образом мы можем отображать не только группы людей (т.е популяции), но и отдельных современных индивидов с генотипированными снипами. При визуальном изучении расположения популяций внутри треугольника, мы можем отметить cмещение спектра разнообразия в сторону предкового компонента неолитических земледельцев (EEF). Это наблюдение еще раз подтверждает насколько важным событием для эволюции и развития европейского генофонда являлась  неолитическая революция. Она принесла с собой не только технологические изменения, но и перемены в генофонде тогдашних европейцев. Однако если быть более точным, то нет никаких сомнений в том что компонент EEF аккумулирует в себя не только генофонд первых европейских земледельцев, но и остаточный момент от смешения этого компонента с представителями четвертого компонента («базальных евразийцев»).

admixture

Выявленные предковые компоненты отличаются значительной дискретностью, и в своем чистом виде практически не перекрываются. Именно по этой причине именно эти компоненты (а не общепринятые ныне в аутосомных исследованиях попгенетиков  этногеографические компоненты) могут использоваться в качестве неколлинеарных факторов в анализе эволюции генофонда отдельных народов.

  1. Компонент западноевропейских охотников-собирателей мезолита ( WHG ): метапопуляция этого компонента включает в себя образец Loschbour (мезолитический Люксембург, 8000 лет до настоящего времени) и два мезолитических образца древнего ДНК людей из пещеры La Brana в Испании. Тем не менее, в настоящий момент своего пика WHG (почти 50%) достигает среди эстонцев и литовцев , на востоке Балтийского региона. В этом смысле эти популяции являются наследниками древнейших жителей мезолита Европы. К этой группе примыкает группа шведских неолитических популяций  (скандинавские охотники-собиратели (SHG ) : эта мета- субпопуляция состоиь из шведских мезолитических и неолитических образцов ДНК из Моталы и Готланда , соответственно. Судя по всему, здесь мы имеем дело с  более восточным вариантом WHG , с небольшой примесью генов от древних северо-евразийских популяций.

Удельная доля компонента WHG в генофонде популяций по мере убывания  (градиент убывания в направлении с северо-запада на юго-восток Европы).

Эстонцы 0,495
Литовцы 0,464
Исландцы 0.456
Беларусы 0,431
Норвежцы 0,428
Испанцы 0,068
Греки 0,058

Мальтийцы 0
Ашкенази 0
Сицилийцы 0

  1. Компонент ранних европейских земледельцев (EEF) : по всей видимости, это гибридный компонент являющийся  результатом смешивания части загадочных «базальных евразийцев» и носителей компонента WHG где-то в Европе, возможно, на Балканах. Метапопуляция EEF в чистом виде представлена у представителя линейно-ленточной керамики  (Штутгарт, Германия), Этци Тирольского человека, и неолитического земледельца культуры воронковидных кубков. В наше время пик это компонента  приходится на Сардинию, Сицилийцев, ашкеназов и жителей Мальты (примерно 80-90%).

Удельная доля компонента EEF в генофонде популяций по мере убывания  (градиент убывания частоты направлен в сторону обратную WHG, т.е с юго-востока Европы на северо-запад, однако градиент выражен гораздо менее четко).

Мальтийцы 0,932
Ашкеназим 0,931
Сицилийцы 0,903
Сардинцы 0,817
Испанцы 0,809
Норвежцы 0,411
Исландцы 0,394
Шотландцы 0,39
Литовцы 0,364
Эстонцы 0,322
3. Компонент древних северо-евразийцев ( ANE ): метапопуляция компонента включает в себя   24000 летний верхне-палеолитический образец охотника-собирателя из южно-центральной Сибири, принадлежащий к Y- ДНК гаплогруппе R *, (MA -1), а также  верхнепалеолитический образец из центральной Сибири (Афонтова Гора -2) ( AG2 ). Этот компонент мог вероятно присутствовать в Южной Скандинавии по крайней мере со времен мезолита, но Западной Европы  достиг уже в конце эпохи неолита. В современной Европе самый высокий процент это компонента наблюдается у эстонцев (на уровне чуть более 18%), и  достигает такого же уровня среди шотландцев.

Эстонцы 0,183
Шотландцы 0,182
Венгры 0,179
Литовцы 0,172
Чехи 0,167
Итальянцы из Бергамо 0,108
Сицилийцы 0,097
Ашкеназим 0,069
Мальтийцы 0,068
Сардинцы 0,008

Сводная таблица по раскладу компонент у отдельных популяций  и их формальной статистической значимости (f3-статистика):

q1is

Эпилог

В апреле и мае 2012 года (задолго до появления статьи Lazaridis et al. 2013), в ходе изучения структуры кластеров компонентов в древних ДНК (чьи SNP-данные были тогда у меня в наличии). В ходе анализа Admixture  K=3 программа дала интересное распределение по современным популяциям и древним образцам. Как видно из географического распространения, кластер-метопапуляции готландских охотников-собирателей/ мезолита и современных саамов в значительной части перекрывается с ареалом современного пика компонентов мезолитических охотников-собирателей. Неолитический (средиземноморский) компонент совпадает с ареалом компонента EEF. Наконец, контуры ареал компонента который я ошибочно обозначил как Corded Ware Indo-European, практически перекрываются контурами ареала ANE (пик которого, как отмечалось выше, приходится на популяции шотландцев и эстонцев).

admixture-3

K3-Admixture

 

.

Итоги года в плане генетических исследований

Предыдущий год можно смело обозначить как год исследования древнего ДНК. По количеству, качеству обследованных образцов  ДНК древних исторических и доисторических людей, а самое главное — по далеко идущим выводам в интерпретации данных древнего митохондриального, Y-хромосмы и аутосомных маркеров — исследования опубликованные в прошлом году позволили нам по-новому взглянуть на многие  проблемы происхождения европейцев, и человечества в целом.

Стоит отметить, что большинство этих открытий были бы невозможны без использования новой технологии прочтения и секвенирования древнего ДНК,предложенной в начале 2013 году Маттиасом Майером в институте Макса Планка (Германия).

Ис­ко­па­е­мые кос­ти обыч­но силь­но заг­ряз­не­ны сов­ре­мен­ной ДНК, в ос­нов­ном бак­те­ри­аль­ной, так что до­ля под­лин­ной древ­ней ДНК сос­тав­ля­ет все­го нес­коль­ко про­цен­тов. В фа­лан­ге из Де­ни­со­вой пе­ще­ры со­дер­жа­ние древ­ней ДНК иск­лю­чи­тель­но вы­со­кое (70%), од­на­ко в рас­по­ря­же­нии ис­сле­до­ва­те­лей был лишь кро­шеч­ный фраг­мент этой кос­точ­ки, по­э­то­му бы­ло очень важ­но ни­че­го не по­те­рять.

До сих пор па­ле­о­ге­не­ти­ки поль­зо­ва­лись тех­но­ло­ги­я­ми сек­ве­ни­ро­ва­ния, раз­ра­бо­тан­ны­ми для сов­ре­мен­ных ор­га­низ­мов. Эти ме­то­ды ори­ен­ти­ро­ва­ны на ра­бо­ту с мо­ле­ку­ла­ми ДНК в их «стан­да­рт­ной» кон­фи­гу­ра­ции, то есть в фор­ме двой­ной спи­ра­ли. Од­на­ко мно­гие фраг­мен­ты древ­ней ДНК, вы­де­лен­ные из ис­ко­па­е­мых кос­тей, час­тич­но или пол­ностью рас­па­да­ют­ся на оди­ноч­ные ни­ти, или од­на из ни­тей двой­ной спи­ра­ли ока­зы­ва­ет­ся пов­реж­де­на. До сих пор в хо­де па­ле­о­ге­не­ти­чес­ких ис­сле­до­ва­ний та­кие фраг­мен­ты те­ря­лись. Раз­ра­бо­тан­ная Мейе­ром ме­то­ди­ка поз­во­ля­ет их пой­мать и от­сек­ве­ни­ро­вать на­ря­ду с обыч­ны­ми, двух­ни­те­вы­ми фраг­мен­та­ми. Для это­го к 3’-кон­цам од­но­це­по­чеч­ных фраг­мен­тов древ­ней ДНК при­со­е­ди­ня­ют би­о­ти­ни­ли­ро­ван­ные (то есть свя­зан­ные с би­о­ти­ном, см. biotinylation) оли­го­нук­ле­о­ти­ды – «адап­те­ры». Адап­тер за­тем ис­поль­зу­ет­ся в ка­че­ст­ве прай­ме­ра (зат­рав­ки) для син­те­за не­дос­та­ю­щей комп­ле­мен­тар­ной це­пи ДНК на мат­ри­це ис­ход­но­го од­но­це­по­чеч­но­го фраг­мен­та, ко­то­рый в ито­ге ста­но­вит­ся двух­це­по­чеч­ным, пос­ле че­го его мож­но сек­ве­ни­ро­вать стан­да­рт­ны­ми ме­то­да­ми (под­роб­ное опи­са­ние ме­то­ди­ки при­ве­де­но в до­пол­ни­тель­ных ма­те­ри­а­лах). Но­вая ме­то­ди­ка поз­во­ли­ла на по­ря­док уве­ли­чить ко­ли­че­ст­во древ­ней ДНК, дос­туп­ной для сек­ве­ни­ро­ва­ния, что и обес­пе­чи­ло ус­пех предп­ри­я­тия.

Именно благодаря этой технологии был секвенирован геном денисовского человека, а затем был получен более качественный геном неандертальца. Затем метод был успешно применен в секвенирования целого ряда генома древних людей (далее краткий дайджежст находок в изложение Диенека):

  1. Геном 400 000 летнего человека гейдельбергского из Иберии имел мтДНК похожее на мтДНК алтайских денисовских людей (средний палеолит). Это открытие важнo возрастом образца, который открывает новые перспективы для изучения древней  ДНК , а также потому что это представляет собой недостающее звено в вопросе происхождения денисовцев.
  2. Было обнаружено, что неандертальцы населяли ту же пещеру , где был найден палец денисовского человека. У денисовцев была обнаружена неандертальская примесь , а также примесь от ранее неизвестного представителя  «ультра- архаической» группы ;  имеющаяся у всех евразийцев имеют неандертальскую примесь наиболее близко к неандертальскому образцу (пещера Мезмайская, Кавказ). Восточные евразийцы также характеризуются небольшой денисовской примесью, в то время как у австралийских аборигенов и субсахарских африканцев уровень денисовской примеси (адмикса) значительно выше. Наконец,  небольшая часть неандертальских генов могла быть получена западными  евразийцами еще в голоцене .
  3. Примерно 24000 летний образец древнего ДНК с верхнепалеолитической сибирской стоянки Мальта (Прибайкалье) связан с коренными американцами , которые с точки зрения эволюционной структуры своего аутосомного генофонда представляют собой сочетание доминирующей у верхнопалеолитических сибиряков компоненты и восточно-азиатской компоненты . Другой важный момент — житель стоянки Мальта был генетически связан с западными, а не восточными евразийцами . Он принадлежал к  Y- гаплогруппе R * и MT- гаплогруппе U * .
  4. С другой стороны , примерно 40 000 летний образец из Китая является типичным восточным евразийцем .
  5. Наиболее важное (на мой взгляд) открытие, подтверждающее мое более ранее предположение — европейцы с точки зрения структуры аутосомного генофонда представляют собой смесь неолитических фермеров, мезолитических охотников-собирателей и вышеупомянутых палеолитических сибиряков (обозначенных в статье как » древние северные евразийцы»). Ранние земледельцы  линейно-ленточной культуры из Центральной Европы похожи на более поздних жителей неолитических жителей Европы — Этци (Тирольского человека) , шведских неолитических земледельцев , и, вероятно,  иберийских земледельцев. У них также был  обнаружен загадочный  » базальный евразийский » компонент, чья  ‘родословная’ прослеживается  к уровню самого древнего расхождения дерева евразийских популяций. У мезолитических европейцев видимо преобладала Y- гаплогруппа I.
  6. Древнее мтДНК свидетельствует о существенных пертурбациях генофонда европейцев   во времена позднего неолита и раннего бронзового века в Германии:  европейские популяции того времени являются в историческом плане первыми популяциями, в которых распределение частот митохондриальных гаплогрупп близко к распределению частот в современных европейских популяционных групп. Потомки мезолитических охотников-собирателей Европы не исчезают в Германии после появления линейно-ленточной керамики. МтДНК гаплогруппа H , наиболее распространенная у современных европейцев выдвинулась в середине -конце неолита.
  7. Население западной Сибири эпохи бронзового века, так же как и ранее, представляла собой смесь  западных и восточных евразийских популяций.
  8. Обнаружены косвенные свидетельства интересных популяционных событий в Европейской степи.
  9. Современные Тосканцы , вероятно, не происходят от древних этрусков.
  10. Минойцы были довольно типичными европейцами, следов влияния популяций северной Африки ( у них было открыто небольшое количетсво мтДНК U, хотя, может быть, это наследие мезолитических греков) .
  11. Много образцов мтДНК гаплогруппа U было найдено в популяциях весьма древних европейцев, наряду с этим была найдены мтДНК гаплогруппы М + N (возрастом ~ 77 000 лет).
  12. У мезолитических западноевропейцев были голубые глаза, у неолитических европейцев были коричневые,  цвет кожи европейских степных популяций  был более «темный» , чем у современных европейцев . У древних мезолитических европейцев были темно-коричневые или черные волосы.