Демография миграций в эпоху неолита и бронзового века

C ресурса Генофонд.ру (автор: Надежда Маркина)

 

Статья американских и шведских исследователей (Goldberg  et al.),опубликованная на сайте препринтов, вновь обращается к дискуссионной проблеме миграций в эпоху неолита и бронзового века.  В работе исследуется вопрос о доле мужского и женского населения  в составе мигрирующих групп, которые сформировали  генофонд  Центральной Европы. Авторы проверяют исходную гипотезу, что миграции из Анатолии в раннем неолите и миграции из понто-каспийских степей в течение позднего неолита и бронзового века были преимущественно мужскими.

Для ответа на это т вопрос авторы опираются не на Y-хромосому, передающуюся по отцовской линии,  и не на митохондриальную ДНК, передающуюся по материнской, как традиционно поступают генетики, а  Х-хромосому. Они вычисляют отношение эффективного размера популяции по Х-хромосоме к эффективному размеру популяции по аутосомам (неполовым хромосомам). Поскольку мужчины имеют одну Х-хромосому, а женщины – две, то в популяции с одинаковым соотношением мужчин и женщин отношение Х-хромосомы к аутосомам должно быть ¾. Отклонение от этой цифры говорит о разной демографической истории по мужской и женской линиям. Такова логика, лежащая в основе метода исследования, подробнее с ним можно познакомиться в тексте статьи.

Авторы изучили опубликованные образцы древней ДНК раннего и позднего неолита и бронзового века, проанализировав более 1,2 млн SNP, в том числе без малого 50 тысяч SNP на Х-хромосоме. Исследуемые образцы относились к популяциям охотников-собирателей, земледельцев Анатолии и понто-каспийских степей.

 

new-1

Схематическая демографическая история земледельцев Центральной Европы в течение неолита и бронзового века.

 

В противоположность существующему мнению, результаты не подтвердили, что миграции в неолите из Анатолии в Европу были преимущественно мужскими. Анализ  показал примерно одинаковое соотношение мужского и женского населения среди мигрантов. А вот миграция из понто-каспийских степей в Центральную Европу в  течение позднего неолита и бронзового века , действительно, была преимущественно мужской: по подсчетам  среди мигрантов на 5-14 мужчин приходилась одна женщина. Авторы показали, что эта миграция была растянута по времени на несколько поколений. В соответствии со своим мужским характером, именно она принесла в Европу технологические инновации.

 

new-2

Доли мужского (синие стрелки) и женского (розовые стрелки) населения в составе неолитической и степной миграций.

 

Об особенностях наследования X-хромосомы: функциональная избыточность гена ITM2A приводит к низкому росту

В феврале этого года в журнале Plos Genetics была опубликованна статья «Chromosome X-Wide Association Study Identifies Loci for Fasting Insulin and Height and Evidence for Incomplete Dosage Compensation» , в которой содержится исследования влияние феномена «неполной компенсации дозы генов»* X-хромосомы на рост регуляцию инсулина в организме человека. Удивительно, но число работ по генетике X-хромосомы, несмотря на свою важность в развитии ряда болезней обусловленных наличием Х-сцепленного рецессивного гена на X-хромосома,  гораздо меньше аналогичных работ по аутосомах. С одной стороны, известно около 300 генов, локализованных в хромосоме X, вызывающих наследственные болезни (гены, локализованные в хромосоме X, называют X-сцепленными). К ним относятся гены гемофилии А, миопатии Дюшенна, Х-сцепленного ихтиоза, пигментной дистрофии сетчатки, ангидротической формы эктодермальной дисплазии, синдрома ломкой хромосомы X с умственной отсталостью, гидроцефалии, синдромов Коффина — Лоури, Пейна, Опитца, одной из форм мукополисахаридоза, X-сцепленной невральной амиотрофии, недостаточности глюко-зо-6-фосфатдегидрогеназы и многих других заболеваний.

С другой стороны, к настоящему времени ученым известны сотни генов, связанных с чертами внешности, однако при их изучении Х-хромосома, как правило, оставалась за бортом. Я могу объяснить этот феномен только тем, что в открытых источниках данных (по наиболее известным референсным популяциям) содержится крайне мало генотипов X-хромосомы . Именно по этой технической причине, X-хромосома не используется в  этно-популяционных калькуляторах на Gedmatch.com.

Суть исследования, проведенного исследователи из Хельсинкского университета сводится к  выяснению  генетических причин отличий в здоровье мужчин и женщин. Прежде чем мы перейдем к краткому изложению материала, напомним, что у человека пол гетерогаметен. Женщины имеют во всех клетках две хромосомы X, а мужчины — одну X и одну У хромосомы. Хромосома Y не гомологична хромосоме X, в ней содержится небольшое число генов. Мужчины являются гемизиготами по хромосоме X и всем содержащимся в ней генам. Наследование половых хромосом происходит как наследование простых менделевских признаков ( см. нижеприведенную решетку Пеннета):

Из таблицы видно, что при случайном объединении гамет должно образовываться равное количество зигот женского и мужского пола. (Источник: MedUniver.com)

 

В исследовании, результаты которого авторы описали в журнале PLOS Genetics , они нашли ген ITM2A, расположенный на Х-хромосоме, варианты которого определяют больший или меньший рост. Это объясняется тем, что ген участвует в развитии хрящевой ткани. Чем дольше развивается хрящевая ткань, тем человек вырастает более высоким.

Вариант гена, который приводит к его усиленной работе, как показали ученые, сопровождается низкорослостью. Это довольно интересное заключение, особенно если принять во внимание бытовавшее ранее мнение о том, что иногда как раз добавочная Х-хромосома является причиной высокого роста девушек. Данное исследования опровергает это мнение, о чем упоминается в интервью исследователей средствам СМИ:

Двойная доза Х-хромосомных генов у женщин может вызывать проблемы в течение развития, — объясняет профессор Сэмюли Рипатти, руководитель исследования. — Чтобы избежать этого, в женских клетках действует механизм, который заставляет вторую Х-хромосому замолчать. Но рядом с геном ITM2A мы нашли участок, который позволяет этому гену избежать подавления работы. Когда мы его нашли, это нас особенно вдохновило».

Это позволяет Х-хромосомному гену ITM2A продолжать в женских клетках работать в двойном объеме, а женщины из-за этого перестают расти.

 

 


*Механизм регуляции экспрессии генов, сцепленных с полом; при механизме определения пола XX-XY у самок К.д. связана с инактивацией одной из Х-хромосом X-inactivation (при полисомии polysomy по Х-хромосоме — всех Х-хромосом кроме одной), образующей интерфазное тельце Барра (sex chromatin); к К.д. относят и более сложные внутригеномные взаимоотношния, связанные с регуляционно-репрессорными механизмами (см. autosomal dosage compensation).

Новости от сибирских генетиков

Как сообщают СМИ,  новосибирские учёные научились разрезать ДНК человека с помощью особого фермента

Составлять «экономный» геномный портрет человека научились учёные Новосибирского предприятия SibEnzyme с помощью особого метода подготовки ДНК. Об этом ИТАР-ТАСС в рамках Первого международного форума технологического развития «Технопром» рассказал гендиректор предприятия Евгений Дубинин.

«С помощью современной методики геномного секвенирования можно получить персональный генетический «паспорт». Изучив его, врач заранее выявляет предрасположенность человека к генетическим заболеваниям, возможные способы лечения и наиболее эффективные лекарства. Стоимость создания геномного портрета в настоящее время высока, она не позволяет внедрить эту технологию в массовую медицину», — отметил Дубинин.

Он заявил, что можно вдвое удешевлять этот процесс, заранее расщепляя ДНК с помощью особого фермента. В геноме человека за кодирование информации отвечает только 5-7% его последовательностей. Фермент разрезает ДНК на фрагменты определенной длины в строго определенных местах. Для анализа выбирают только несколько фрагментов, исключив ненужные, и именно эта «ферментная» подготовка ДНК удешевляет исследование. Дубинин подчеркнул, что, несмотря на то что рынок геномного секвенирования находится на начальном этапе формирования, в ближайшее время его ждет интенсивный рост. По оценкам экспертов, его прогнозируемый объём в течение пяти-десяти лет — 100 миллиардов долларов.

В другом сибирского городе — Томске — также находится примечательная лаборатория Томский НИИ медицинской генетики (возглавляемая известным генетиком В.Степановым), одного из ведущих медико-генетических учреждений России. НИИ был основан в 1982 году и является первым специализированным институтом в области медицинской генетики на территории Сибири и Дальнего Востока. Сегодня деятельность института включает осуществление специализированной медико-генетической помощи населению, научные исследования и профессиональное образование в области медицинской генетики.

В лаборатории работает множество замечательных ученных, из которых для ДНК-генеалогии наиболее важен Владимир Харьков.

Har-kov

Благодаря его научному рвению была не только определена структура мужского генофонда многих сибирских народов, но и раскрыта недавняя серия тягчайших преступлений на сексуальной почве (в ходе анализа Y-хромосомы, Владимир установил не только национальность маньяка-насильника, но и место вероятного происхождения/жительства с точностью до села). Ув. Валерий Запорожченко поделился подробностями этой истории, озвученной на одной из последних конференций.

Не так давно к Владимиру Харькову из Томского института медгенетики обратились следователи СК по Новосибирской области. Искали они маньяка насиловавшего девочек-дошкольниц. Насилуя, он никого не убивал, иногда просто мастурбировал на глазах детей, и как правило оставлял на месте преступления биологический материал — сперму. Девочки описали его как описывают кавказцев. Следователи ловили местных выходцев с Кавказа всех подряд, типировали, но тщетно, профили не совпадали. Судебные генетики не справились, пришлось обратиться к эволюционистам. Владимир довольно быстро понял, что владелец спермы не кавказец, а выходец из Бурятии, причем выборки собранные лабораторией позволили точно идентифицировать не только национальность извращенца, но даже определить происхождение мужской линии с точностью до двух соседних районов. Получив ориентировку, следователи первым делом изучили местные «висяки», и обнаружили, что незадолго до первого новосибирского эпизода было несколько преступлений аналогичного почерка в Улан-Удэ. Пришлось перетрясти всю базу прописки — кто из указанных районов ее сменил на новосибирскую в последние годы. И что же, работа была вознаграждена — появился подозреваемый, идеально соответствующий ориентировке. Его тормознули на дороге под видом гибдд. Скрутили. Отпирался. Наперли. Признался! Впрочем, даже если бы не признался, его приперли по образцу ДНК который оказался идентичен полученному из спермы. Кстати, преступник бурят только по отцу, от которого и получил выдавшую его У-хромосому.

Таким образом была еще раз продемонстрирована плодотворность и перспективность изучения игрек-хромосомы в ДНК-криминалистике.

Кроме того, Владимир не чурается общения в Интернете с любителями ДНК-генеалогии, и некоторое время даже участвовал в работе форума Молген.

О понятиях ДНК-генеалогии и популяционный генетики (продолжение)

Несколько месяцев тому назад я писал в этом блоге о некоторых основных понятий ДНК-генеалогии и популяционной генетике (нужно помнить о том, что хотя множество терминов ДНК-генеалогии и перекрывается в основной своей части множеством терминов ДНК-генеалогии, все же отношения между двумя типами терминов далеки от строгой семантической эквивалентности, или говоря языком математической логики, от конгруэнции).

К моему удивлению, несмотря на огромные объемы написанного на тему разъяснительного и пояснительного материала, споры и непонимание  продолжают сопровождать даже столь краеугольные понятия, как гаплотип.
Обиднее всего, что объеме или экстенсионале этого ключевого понятия,  продолжают путаться не только новички, но и маститые корифеи ДНК-генеалогии, многие из которых пришли в ДНК-генеалогию задолго до меня.
Например, один из уважаемых мною деятелей пишет:

Гаплотип все-таки характеризует гаплоидные наборы аллелей, т.е. только Y-хромосому, и мтДНК. Аутосомные наборы являются парными, т.е. диплоидными. Термин «диплотип» я не встречал. Скорее, для аутосом уместен термин «диплоидный набор аллелей». Здесь нет разницы, какие аллели рассматриваются: STR-повторы или однонуклеотидные аллели. В отношении гаплотипов я придерживаюсь мнения, что в широком смысле под гаплотипом надо понимать всю совокупность аллелей Y-хромосомы или мтДНК каждого отдельного лица. У каждого человека — свой гаплотип и свой диплоидный набор. Просто из-за сложностей и ограничений в определении всей цепочки, например, Y-хромосомы мы видим только очень маленькую часть всего гаплотипа.

Написанное выше не является точным определением понятия гаплотип.

Как известно из энциклопедии, гаплотип (сокр. от «гаплоидный генотип») совокупность аллелей на локусах одной хромосомы, обычно наследуемых вместе. Если же при кроссинговере комбинация аллелей меняется (что происходит очень редко), говорят о возникновении нового рекомбинантного гаплотипа.  Применение этого термина для описания совокупности аллелей на Y-хромосомы и совокупности аллелей в митохондриальном геноме совершено мотивированно хотя бы уже в силу того, что аллели на локусах нерекомбинантной части Y-хромосомы  и митохондриона наследуются в  гаплоидной форме, то есть только от одного родителя. В то время как генотип определенных (prima facie аутосомных генов) диплоидной особи состоит из двух гаплотипов, расположенных на двух хромосомах, полученных от матери и отца соответственно.

Полагаю, что вышеприведенная информация не нуждается в пояснении, хотя бы уже в силу своей интуитивной ясности и общеизвестности. Гораздо важнее то, что я напишу сейчас. На самом деле, приведенный выше термин «диплоидный набор аллелей» — не совсем удачен, так как вызывает у новичка ложные ассоциации.  С другой стороны, термин-сокращение диплотип ( сокр. от диплоидный генотип) практически не прижился  не только в русскоязычной, но и в англоязычной терминологии. Это подтверждает анализ литературы в Google Books Ngram Viewer.

Untitled 

Вместе с тем не стоит путать понятия «диплоидный генотип (набор аллелей)» с понятием  «генотипом» в собственном смысле этого слова. Ибо диплотип определяется как пара гаплотипов (разумеется, у диплоидного организма каковым и является человек) с известной фазой, в то время как в генотипе фаза неизвестна.


Здесь мы должны вспомнить о понятии фазы в генетике, и о процессе фазирования, о котором я уже неоднократно упоминал в своем блоге.
Вопреки распространенному ложному мнению, фазирование это отнюдь не абстрактно-отвлеченное, лишенное практического биологического смысла, упражнение в математической эквилибристике. Напротив, задача фазирования (или если хотите, установление фазы) генотипа крайне проста — определить какой гаплотип был унаследован от отца, а какой от матери, ибо и мужская гамета-сперматозоид, и женская гамета-яйцеклетка несут гаплоидный набор аллелей или гаплотип. И только при оплодотворении (образовании зиготы) слияние двух гаплотипов образует диплоидный генотип/диплотип (в случае с неполовыми хромосомами).

Разумеется, сразу же встает вопрос, а как практически использовать эти новые знание для определения своего диплотипа на примере данных 23andme, то есть как определить какая часть досталась в виде аутосомного гаплотипа от отца, а какая — от матери.

При ответе на ответ вопрос будет полезно рассмотреть следующие ложное суждение, принадлежащего на этот раз новичку.

«совокупность снипов с 23эндМи» является гаплотипом. Однако это SNP-гаплотип, а не STR-гаплотип. Ценность второго в том, что он имеет большую информационную насыщенность для анализа на более коротких генеалогических дистанциях.

 

Это абсолютно неверное предположение (если только автор не имеет ввиду исключительно Y хромосомные SNP-ы). Если речь идет о всех снипах 23andme, то с автором нельзя согласиться.  Дело в том, что процедура типирования снипов в чипсетах построена таким образом, что по получаемым в виде «совокупности снипов» данным невозможно сказать, какой именно из аллельных вариантов входит в состав материнского, а какой отцовского гаплотипа.  Об этом я уже писал несколько раз в блоге, поэтому не буду повторяться еще раз.  Именно по этой причине, без возможности определить фазу генотипа, нельзя утверждать о том, что данные «совокупности снипов» (выдаваемые клиенту в виде RawData, т.е перечня снипов с аллельными вариантами клиента) представляют собой диплотип. А поскольку диплотип есть пару гаплотипов с известной фазой, то тем паче «совокупность аллелей»от 23andme не может быть гаплотипом

Итак, из сказанного постулируется очевидный вывод о том, что приведенные выше цитаты с умозаключениями как чайника, так и корифея представляются неточными.

Хотя, конечно же, причина сей весьма досадной терминологическая оказии совершенно очевидна.
Терминология ДНК-генеалогия (по крайней мере в том виде, в котором она получила свое развитие в русскоязычных около-научных кругах) существенна упрощена в сравнении с генетикой, и самый термин гаплотип используется в ней только  in sensu strictissimo (в самом узком смысле), применительно только к так называемым Y (хромосомным )-STR гаплотипам. Именно этот тип гаплотип обычно и подразумевают ДНК-генеалоги, говоря о гаплотипе в своем узком кругу.  Но нужно помнить что семантическое поле понятия гораздо шире, и охватывает в себя различные классы референциального употребления. Так, в зависимости от контекста, это понятие  может обозначать не только Y-STR, но и многое другое — от аутосомных STR и митохондриального гаплотипа до целых хромосом и даже генома. Бывают и совсем уникальные варианты применения термина гаплотип, когда он описывают гетерогенную систему генетических маркеров, одна часть которых была определена классическим серологическим способом, а другая — новейшими методами ДНК-диагностирования (наилучший пример таких систем —  HLA гаплотип):

Гены HLA находятся на 6-й хромосоме . Совокупность генов HLA, лежащих на одной хромосоме, называют гаплотипом HLA а на обеих хромосомах — генотипом HLA .

Поскольку наследование гаплотипов HLA подчиняется законам Менделя, вероятность совпадения генотипов HLA у братьев и сестер составляет 25%. Однако следует учитывать, чтокроссинговер (обмен гомологичных хромосом участками во время мейоза) с однопроцентной вероятностью приводит к образованию нового гаплотипа HLA.

Отдельный кластер генов MHC обозначается как «гаплотип» и обычно наследуется весь целиком как отдельный менделевский признак; гены, входящие в его состав, выявляются при кроссинговере. Гены HLA наследуются кодоминантно и передаются потомству двумя блоками — по одному от каждого родителя ( рис. 17.1 ). Такой блок носит название гаплотипа HLA. Частота рекомбинаций внутри гаплотипа HLA составляет около 1%, в материнской хромосоме она несколько выше. Ребенок наследует по два аллеля каждого гена HLA: один из материнского гаплотипа, другой — из отцовского. Если удается выявить лишь одну аллельную форму какого-нибудь антигена HLA, это означает, что носитель гомозиготен по данному аллелю или в типирующем наборе нет сыворотки для определения другой аллельной формы антигена. Гаплотип HLA можно установить лишь при анализе наследования генов HLA в семье.

О понятии гаплоблок в генетике

Многие люди, которые прочли мои сообщения на Молгене на тему гаплоблоков, как правило задают мне по прочтению два вопроса.

Первый вопрос — доказано ли наличие нерекомбинатных участков в аутосомной ДНК и Х-ДНК?

Второй вопрос — можно ли считать эти участки гаплоблоками?

Чтобы ответить на оба эти вопроса, необходимо для начала уточнить определение гаплоблока.

Во-первых, понятие гаплоблок не стоит путать с понятием «гаплотип«, так как один гаплоблок может включать в себя несколько гаплотипов. Во-вторых, понятие гаплоблок (или в более распространенном варианте – гаплотипный блок) синонимично понятию блок неравновесия по сцеплению (LD-блок)/блок гаплотипов.

Неравновесное сцепление участков хромосомы означает, что во время мейоза вероятность рекомбинации данных участков чрезвычайно мала и данные участки хромосомы наследуются единым блоком. Благодаря усилиям генетиков в начале этого века была составлены разные варианты генетических карт человеческого генома (карты Rutgers, Decodeme, HapMap) и эти карты позволяют определить блоки неравновесия по сцеплению за счет вычисленной частоты рекомбинации между определенными генетическим маркерами (прежде всего SNP-ами).

Почему скорость рекмбинации неодинакова в разных сегментах аутосомных и X-хромосом?

  Если сравнивать величину генетическую дистанции в сантиморганах между 2 локусами и физическую дистанцию между теми же 2 генетическими локусами, то в ходе исследованиий было показано в среднем по человеческому геному 1сM примерно равен 1 000 000 базовых пар (по другим оценкам, 750 000 базовых пар). Это, образно говоря, есть ни что иное, как средняя температура по больнице. На самом деле, в человеческом геноме есть регионы с быстрой рекомбинацией, средней рекомбинацией и регионы так называемого «позитивного отбора», где рекомбинация практически не происходит (классический пример — геномный регион HLA-MHC на 6 хромосоме). В качестве отступления отмечу, что именно по причине неравномерности скоростей рекомбинации, я считаю, что между величиной дистанции в сентиморганах и генеалогической дистанцией нет прямой корреляции. Хотя, если не учитывать эту неравномерность скоростей, то тогда действительно, чем больше величина сM (т.е чем больше величина рекомбинации) участков половинного или полного совпадения, тем ближе друг к другу сравниваемые индивиды. Потому, чем больше рекомбинация, тем меньше шансов того, что эти участки совпадения (которые, при фазировании, должны образовывать гаплоблоки) будут передоваться в неизмененном состоянии от отцов к детям. К сожалению, cудя по всему, алгоритмы предсказания степени родства по аутосомам в 23andme и FTDNA не учитывают этого этих факторов, что радикально влияет на точность предикта:

 Я думаю, что это классический результат генного дрейфа, обусловленного во-первых изоляцией предковых популяций. Поскольку некоторые популяции в буквальном смысле этого слова, варились в собственном «генетическом пуле»; на протяжении многих столетий (что привело к образованию устойчивых гаплоблоков), алгоритм вычисления степени генетического родства в 23andme (которому, разумеется, ничего неизвестно о генетических особенностях предковых популяций сравниваемых индивидов) воспринимает нашее далекое родство как относительно недавное.

Ответ на вопрос

В силу выше сказанного,  на первый взгляд так называемые нерекомбинатные (или вернее, малорекомбинантные) участки Х-ДНК/аутосомной ДНК можно считать гаплоблоками. Однако подобная точка зренія при более тщательном рассмотрении вызывает ряд проблем. Приведу практический пример.

Несколько лет тому назад небольшая группа активистов с ныне канувшего в  Google-кэш форума dna-forums.org занималась экспериментальными любительскими исследованиями гаплоблоков X-хромосомы. Этот полулюбительский проект поиска X-хромосомных обнаружил несколько десятков гаплоблоков, которые я пытался представить в виде квази-филогенетического дерева.Как я уже говорил, эти участки с ограниченной рекомбинацией также определены в том же проекте ХапМап. И, разумеется, генетики (медицинские и популяционные) уже определили и описали множество устойчивых гаплоблоков. В теме по X-хромосомным филогениям на форуем Молген я уже приводил примеры таких блоков на. Исходя из специфики наследования этой хромосомы, большинство из найденных путем простого визуального сравнения гаплоблоки оказались очень небольшими по размеру. Поэтому вряд ли можно вести речь о какой-то конкретной этнической привязке конкретных гаплоблоков — разве что в плане разделения гаплоблоков по глубокому происхождению на африканские, европейские и азиатские. Истинный возраст совпадающего гаплоблока (или даже интервал) предсказать затруднительно. Кроме того, наличие хотспотов рекомбинации и неравномерная плотность выявленных снипов существенно затрудняет поиск устойчивых гаплоблоков (которые и опредляется в результате фазирования). А неравномерная плотность и что еще хуже отсутствие многих HapMap снипов в чипсетах, используемых FTDNA и 23andme (кстати, чипсет Decodeme — в отличие от чипсетов FTDNA и 23andme- наиболее близок к 1,5-млн чипсету HapMap) приводит к появлению  ложных сегментов. Если не ошибаюсь, Leon Kull, который занимался слияниям наборов снипов FTDNA и 23ия, приводил примеры, когда после слияния данных HIR (выявленные в отдельности по результатам снип-тестирования  FTDNA и в 23ия)  просто «ломались», поскольку внутри участка который воспринимался, к примеру в 23ия, как  непрерывная последовательность региона половинного совпадения (HIR-сегмент) вклинивался снип, нарушавший последовательность.

Другая проблема, связанная с практическим изучением гаплоблоков, носит сугубо методлогический характер. Дело в том, что термин гаплоблок в популяционной генетике заимствован сравнительно недавно и взят из терминологии смежного направления — медицинской генетики. Кстати, по иронии судьбы в медицинской генетике традиционная генеалогия играет зачастую гораздо большую роль, чем в популяционной генетике. Ведь в выборки попгенетиков попадают обычно unrelated individuals, в то время как я видел немало работ по медицинской генетике, где приводятся генеалогические таблицы тестируемых индивидов, страдающих тем или иным недугом. Оно и понятно -одна из целей медгенов как раз и является выявление наследуемых гаплоблоков (или даже просто отдельных аллелей) ассоциируемых с тем или иным заболеванием. Не смотря на это и попгенетики все активнее используют понятие LD-гаплоблок в последних работах. В связи с этим у многих любителей возникает закономерное предположение — если найдены аутосомные “гаплоблоки”,то значит должна быть и аутосомные гаплогруппы (по аналоги с Y-ДНК и мито-ДНК). К сожалению, это не совсем так, — в отличие от древа Y и древа митогаплогрупп, древо гаплоблоков практически никогда не будут иметь филогенетически однозначного решения в плане кладистики. Впрочем, это отдельный вопрос,которого я пока не буду касаться.

Важность гаплоблоков в популяционном анализе.

Когда я начал свой любительский проект по анализу аутосомного ДНК различных популяций и отдельных лиц, то следуя примеру других геномных блоггеров я начал с элментарной обработки данных в незаменимой программе Plink — я занимался нахождением IBS матрицы, расчетами статистических параметров гомозиготности (группировкой по совпадающим сегментам, кластеризацией и так далее), структуризацией и выявлением IBD-сегментов и их кластеризацией. Однако со временем я, так же как и большинство BGA блоггеров, осознал необходимость работы с фазированными данными, — с генотипами приведенными в гаплоидную фазу, то есть с гаплоблоками. Кроме того, в новой парадигме стал использоватся новый рекомбинаторный параметр  (который ранее не учитывался в классическом Admixture-анализе) и структура сцепления снип-маркеров. Основным преимуществом фазированных генотипов является более высокая степень вероятности общего происхождения гаплоблоков, которые в случае с идентичными по происхождению сегментами предполагают единую генеалогию. Техническое определение понятия фазирования генотипа в контексте биоинформатики — это выявление или выведение (инференция) гаплотипной фазы массива генотипных данных. Говоря простым языком, это трансформация мультиаллельных блоков в гаплоблоки (гаплотипы). Преимуществом фазированных генотипов является более высокая степень вероятности общего происхождения гаплоблоков , которые — в силу определения понятия гаплоблок -предполагают единое генеалогическое происхождения Разница очевидна. Например, полгода тому назад я изучал этнические гаплоблоки участка условно-половинного совпадения на 1 хромосоме в данных проекта Eurogenes.  К своему разочарованияю, никаких гаплоблоков среди нефазированных генотипов в этом регионе не обнаружилось. Спустя некоторое время автор проекта Eurogenes -Дэвид Веселовски разослал участникам проекта. По сути, Дэвид приступил тогда к новой фазе анализа, о необходимости которой я говорил ранее -а именно к фазированию диплоидных данных в гаплоблоки и дальнейшее выявление общих по происхождению гаплоблоков. Так вот, новый анализ фазированных генотипов (гаплоблоков) в том же проекте показывал, что у лиц с повышенным процентом “северо-западного европейского компонента” (в том числе и лица из кластер номер 5 в другом проекте Dodecad) — имеют значительное количество гаплоблоков, общих по происхождению с северными русскими, чувашами, алтайцами, тувинцами и монголами. То же самое по хромосоме 3, показаны самые большие совпадающие гаплоблоки. Особенно примечательно большое количество совпадаюших гаплоблков с чувашами,венграми.

PS.

С оттенком плохоскрываемого злорадства, должен отметить, что столь любимая Клесовым и Рожанским лографмическая формула (модифицированная формула превращения) веществ гораздо лучше подходит (хотя и в очень обобщенном виде) для моделирования процесса рекомбинаторного “распада” гаплоблоков в аутосомах. Там действительно, гаплоблоки распадаются с учетом частоты рекомбинации. Поэтому-то тот же гуру биоинформатики Монтгомери Слаткин и вводит логарифмы в формулу для оценки возраста IBD-гаплоблока.