Анализ древней ДНК – проблемы, их преодоление и результаты

На портале Генофонд.ру размещен реферат важной статьи, подводящей промежуточные итоги изучения древней ДНК. Я позволю себе удовольствие процитировать себе некоторые места этого замечательного обзора, написанного ув. Надеждой Марковой

Термин «древняя ДНК» возник в научной литературе в 1980-х годах в связи с появлением новой области исследований, которая получила название «молекулярная палеонтология». С развитием сначала методов ДНК-амплификации (полимеразной цепной реакции), а потом методов секвенирования нового поколения эта область получила мощный толчок к развитию и сегодня стала основным средством реконструкции эволюции живых организмов, и в том числе реконструкции истории человека.

Революция в эволюционной генетике

Исследование древней ДНК совершило революцию в эволюционной генетике, так как появилась возможность напрямую исследовать прошлое, законсервированное в «капсуле времени» ДНК, пишут авторы статьи. Работы последних десятилетий показали, что древняя ДНК может сохраняться в костях, зубах, мумифицированных и замороженных тканях, и может быть извлечена из этих древних образцов. Впервые древняя ДНК была извлечена в 1984 г. (Higuchi et al.) из высохшей мышцы вымершего родственника зебры. Но ее анализ целиком зависел от развития технологий, поэтому стал возможен с появлением ДНК-амплификации (метод полимеразно-цепной реакции – ПЦР), и вышел на новый уровень с появлением методов секвенирования нового поколения. На рисунке авторы представили основные вехи в истории изучения древней ДНК.

О методологии исследования палео-ДНК

Методы палеогенетики оказались незаменимы, чтобы разобраться в  ключевых этапах человеческой цивилизации. Например, понять, как именно происходила смена обществ охотников-собирателей на первых земледельцев, как распространялось по Европе сельское хозяйство – имела ли место передача технологий от одних популяций другим или же происходила смена самих популяций («циркуляция идей или людей»). Анализ древней ДНК показал, что между периодами 8 и 5 тысяч лет назад Европа не была генетически однородной: первые земледельцы с Ближнего Востока мигрировали в Западную Европу и  смешивались там с местными охотниками-собирателями. В Восточную Европу около  6-5 тыс. лет назад туда пришли группы людей из Анатолии, которые смешавшись с охотниками-собирателями, дали начало популяциям скотоводов, наиболее успешная из которых известна по ямной культуре.  Полагают, что именно миграции ямников из понто-каспийских степей на запад и на восток около 4,5 тыс. лет назад можно связать с распространением технологий и, возможно, языков индоевропейской семьи.

Древняя ДНК может помочь и в изучении развития признаков, характерных только для Homosapiens, таких как речь, подчеркивают авторы статьи. Изучение генетических вариаций, связанных с языком, дает информацию о том, когда мог возникнуть сложный  язык, присущий человеку. Так, было показано, что определенный вариант гена FOXP2 (именно его в первую очередь связывают с развитием речи)  имелся уже у неандертальцев. Вероятно, считают специалисты, этот вариант возник у общих предков неандертальцев и современного человека.

Древняя ДНК помогает в изучении адаптации человека к разным условиям среды. При анализе древних геномов в них были выявлены сигналы отбора, связанных с изменением диеты, чувствительностью к ультрафиолету  и пр. Так, становится ясно, как распространялись по Европе такие черты, как светлая кожа и толерантность  к лактозе (способность переваривать молоко во взрослом возрасте).

Трудности в изучении палео-ДНК и их преодоление

Одна из основных проблем, с которыми сталкиваются исследователи древней ДНК, это ее деградация, которая неизбежно происходит со временем.  Обычно ДНК из древних образцов сильно фрагментирована, загрязнена микробной ДНК и химически модифицирована. Причем степень деградации  в больше степени зависит от условий, в которых находился древних образец (температура, влажность), чем от его возраста. Последние исследования показали, что теоретический предел возраста образца, из которого можно извлечь ДНК, составляет 1-1,5 млн лет. Авторы описывают методы, которыми можно преодолеть трудности, связанные с особенностями древней ДНК.

Фрагментация ДНК может быть частично преодолена с помощью современных протоколов, позволяющих извлекать и анализировать очень короткие фрагменты, длиной 50-70 нуклеотидов. К тому же, методы секвенирования нового поколения ориентированы на анализ коротких фрагментов, длина которых составляет 50-100 нуклеотидов.

Большую проблему составляет контаминация древней ДНК современной ДНК. Преодолеть ее нужно путем строгого соблюдения протоколов, учитывающих правила сбора образов, обработки рабочих помещений, применение методов ДНК-аутентификации, независимой перепроверки результатов и пр. Развиваются также методы механической и химической деконтаминации – авторы их описывают.

Еще одна важная проблема – посмертное изменение ДНК из-за гидролиза и окисления, вызывающее деаминацию нуклеотидов, которая ведет к ложным результатам ПЦР. Авторы описывают несколько молекулярно-генетических и биоинформатичесих подходов для преодоления этой проблемы, с ними можно ознакомиться в тексте статьи.

Инструменты анализа

С увеличением числа образцов древней ДНК ученые получают возможность исследовать древнюю генетическую изменчивость на популяционном уровне и сравнивать ее с современной. Различные методы (PCA, STRUCTURE, ADMIXTURE, SPAMIX, SPA, ADMIXTOOLS, GPS, LAMP, HAPMIX,  reAdmix, MUTLIMIX, mSpectrum, SABER и др.), которые были разработаны для анализа современных популяций, применяются и к древним популяциям. В комбинации с антропологическими данными и историческими  сведениями они позволяют реконструировать пути миграций, определять состав предков той или иной популяции, выяснять географическое  происхождение гаплотипов.

Эпигенетика и палео-ДНК

Фенотипическое проявление генотипической изменчивости зависит не только от изменчивости тех или иных аллелей в геноме, но и от степени экспрессии генов, а она во многом определяется химическими модификациями, не затрагивающими последовательность нуклеотидов в ДНК, то есть эпигенетическими. Это метилирование ДНК, модификация белков-гистонов, спектр некодирующей РНК. Последние исследования показали, что некоторые эпигенетические модификации сохраняются и postmortem. Так, удалось картировать метилирование генома неандертальцев и денисовцев. Выяснилось, что некоторые гены были более метилированы у древних людей, чем у современных. Анализ метилирования позволяет также определить возраст индивида (как современного – что важно для криминалистики, так и древнего).

Официальное извещение о начале нового проекта

18 февраля решил заново начать свой проект по изучению аутосом народонаселения восточной Европы.
Формально это означает окончание моего предыдущего проекта MDLP.
Я решил начать с нуля — на этот раз в основу будет положен контрольный сет из 400 000 снипов лаборатории Райха (Affymetrix HumanOriginsv3), точнее подмножество снипов этого сета, прошедшее контрольные QC-тесты.
Первая задача — самая трудная. Нужно импутировать на основании имеющихся 300-400 Kb те 990 000 снипов референсной панели 1000G (эти общие снипы референсной панели фазированных гаплотипов 1000G и чипсета 23andme v3.
Основная трудность в компьютерной ресурсозатратности задачи (на ее выполнение в кластерной системе из 8 узлов с 16 виртуальными процессорами и 136 гигабайтами оперативной памяти RAM требуется несколько недель распределенных вычислений).
Я попытаюсь выполнить эту задачу с помощью наименее эргоемкой комбианции — предварительного фазирования гаплотипов в SHAPEIT и импутации в IMPUTE2.
Если удастся — можно будет создать успешный пайплайн (на основании уже существующих образцов, которые я установил  на EC2-виртуальной машине амазоновского облака)  для прямого и максимально точного непосредственного сравнения сотен древних геномов с даннами клиентов компаний FTDNA и 23andme.

Будет тяжело, но без этого sine qua non этапа будущность моих исследований под большим вопросом

Генетический компонент северных евразийцев (ANE) в свете новых данных

Начало февраля порадовало важным событием: на  сервере Bioraxiv размещен препринт монументальной статьи Haak et al. (Iosif Lazaridis , Nick Patterson , Nadin Rohland , Swapan Mallick , Bastien Llamas , Guido Brandt , Susanne Nordenfelt , Eadaoin Harney , Kristin Stewardson , Qiaomei Fu , Alissa Mittnik , Eszter Bánffy , Christos Economou , Michael Francken , Susanne Friederich , Rafael Garrido Pena , Fredrik Hallgren , Valery Khartanovich , Aleksandr Khokhlov , Michael Kunst , Pavel Kuznetsov , Harald Meller , Oleg Mochalov , Vayacheslav Moiseyev , Nicole Nicklisch , Sandra L. Pichler , Roberto Risch , Manuel A. Rojo Guerra , Christina Roth , Anna Szécsényi-Nagy , Joachim Wahl , Matthias Meyer , Johannes Krause , Dorcas Brown , David Anthony , Alan Cooper , Kurt Werner Alt , David Reich) «Massive migration from the steppe is a source for Indo-European languages in Europe».  Несмотря на то, что сама статья еще находится на стадии препринта, уже сейчас очевидна глубина проработки материала. Нет никаких сомнений в том, что это объемное, вдумчивое и тщательное исследование  войдет в число главных работ в области индоевропеистики. По своей сути, коллектив авторов подвел в этой работе итоги всех предыдущих исследований введенных  «полных геномов» древних жителей Европы (возрастом в 8 000 -4 000 лет),  введенных в научных оборот за последние 2-3 года. Благодаря систематическому подходу к материалу и синтезу предыдущих наработок,  а также за счет использования  новейших физико-химических методов экстрагирования палео-ДНК вкупе с передовым современейшим биоинформатическим программным обеспечением,  авторы смогли строго и скурпулезно подойти к одному из важнейших вопросов истории, лингвистики и археологии — к вопросу о происхождении индоевропейцев.  К чести авторов, они признают, что даже после столь внушительного по своим размерам и качеству исследования, вопрос о первичном месте происхождения индоевропейцев остается открытым, и поэтому собственно обсуждение релевантности исследования палео-ДНК в свете существующих 4 главных теорий  происхождения индоевропейцев занимает в работе относительно мало места (стр.134-139).  Впрочем, вряд ли кто всерьез ожидал от этого исследования окончательного ответа на все вопросы индоевропеистики.  Тем не менее, подробный анализ аутосомного генома, а также однородительских маркеров (митохондриального генома и  Y-хромосомы) представителей целого ряда культур неолита, медногл и бронзового века восточной и западной Европы, и в особенности представителей Ямной культуры,  дает новую подпитку вечному спору между сторонниками разных версий происхождения индоевропейцев (т.к. многие вслед за Гимбутас связывают ямную культуру с общностью протоиндоевропейцев).

annurev-linguist-030514-124812.f2

Зато остальная часть этой 172-страничной работы настолько богата (насыщена) фактическим материалом, что любой, даже самый искушенный, читатель попгенетической литературы получит большое удовольствие от приобщения к плодам многолетней работы умнейших ученых.   А работа, действительно, проделана огромная. Ученые воссоздали геномные данные 69 европейцев, живших между 8 000-3000 лет тому назад, за счет обогащения амплифицированных библиотек палео-ДНК. Эти библиотеки палео-ДНК они использовали для целевого отбора  394577 таргентных полиморфизмов (снипов) в панелях Affymetrix Human Origins. Обогащение именно этих специально отобранных таргентных позиций позволило снизить необходимые для анализа древней ДНК объемы секвенирования в среднем примерно в 250 (!) раз, что позволило авторам изучить на порядок больше лиц в сравнении с предыдущими исследованиями, и получить более полные знания о прошлом.

map

В работе показано, что уже 8,000-5,000 лет  назад население западной и восточной Европы следовали противоположным траекториям развития.

На заре евпропейского неолита, примерно 8,000-7,000 лет назад, отдельныетесно связанные родством и отличные от коренных европейских охотников-собирателей, группы  ранних земледельцев появились в Германии, Венгрии и Испании, в то время как Россия была населена особой группой восточных охотников-собирателей, имеющих родство с населением сибирского палеолита (24 000 л.н.в) , эта группа древних северо-евразийцев (ANE), представлена образцом MA1 (мальчик с палеолитической стоянки Malta-1 из южной Сибири); кроме того, этот компонент неплохо аппроксимируется «сибирской частью» генома изолированных индейцев Южной Америки (каритиана). Два образца охотников-собирателей из России (Карелия и Самары) образуют кластер «восточно-европейских охотников-собирателей «(EHG); пост-мезолитические охотники-собиратели  из Люксембурга, Испании и Венгрии (WHG) находятся на противоположенном конце клина охотников-собирателей, в то время как охотники-собиратели  Швеции  (SHG) находятся посередине. Интересно отметить, что геном охотника-собирателя из Карелии представляет собой смесь 38-40% компонента ANE и 60-62% компонента WHG, причем величина ANE значительно выше 20% ANE, выведенных для  шведского-охотника собирателя Motala-12 в предыдущем исследовании Lazaridis et al 2014).
В соответствии с тем, что EHG являются обмен население больше аллелей с «древних Северной евразийцев» (ГУ 7), чем любой другой.

pca

Примерно  6-5 тысяч лет назад,  на большой части  Европы назад  произошел новый «подъем» потомков мезолитических охотников-собирателей, но в России  степные скотоводы Ямной культуры время произошли от смешивания  предыдущих племен восточно-европейских охотников-собирателей с населением ближневосточного происхождения.  Население Ямной культуры отличалось от своих предшественников -восточно-европейских охотников-собирателей EHG —  меньшим количеством обших аллелей с MA1 (| Z | = 6,7), что  свидетельствует о процессе дисперсии носителей ANE  на территории европейских степей где-то между 5 000-3 000 гг. до н.э. Уменьшение числа общих с образцом MA1 аллелей, вероятно объясняется появлением «примеси» от популяции или популяций, тесно связанных с
популяциями современного ближнего Востока, т.к. самая отрицательная f3-статистика  (отрицательная статистика однозначно свидетельствует о примеси) наблюдается при моделировании жителей Ямной культуры как продукта смешивания носителей компонента EHG  и современных популяций ближнего Востока, таких как армян (Z = -6,3).

Непосредственный контакт между населением западной и восточной Европой состоялся   ~ 4500 лет назад, а в геноме поздне-неолитического населения культуры шнуровой керамики на территории Германии прослеживается 75%-ный «генетический» вклад «степного» компонента представителей ямной культуры. Таким образом геном жителей культуры шнуровой керамики «документирует» массовую миграцию населения с восточной периферии Европы в ее центральные области. Данный «степной» компонент Yamna (гибрид EHG и ближневосточных популяций) сохранялась в значительных пропорциях у всех имеюшисхя образцах из центральной Европы как минимум до ~ 3000 г.н.э, и повсеместно встречается у современных европейцев.

 

admix2

 

Если географическая дихотомия неолитического и мезолитического генетических компонентов в Европе была отмечена еще в работах пионеров популяционной генетки вроде Л. Кавалли-Сфорца, то данные этой работы позволяют вставить последнее звено в решении головоломки. На основании данных можно предположить, каким именно образом третий генетический компонент европейцев (ANE) попал из Сибири  в Европу: сначала этот компонент несли представители EHG,  затем он перешло к «ямникам» (смешанная популяция восточно-европейских охотников-собирателей и населения ближневосточного типа), а затем от ямников к представителям культуры шнуровой керамики, которые представляли собой смесь представителей ямной культуры с средне-неолитическими европейцами.  В настоящее время этот компонент имеет плавное распределение на территории Европы, и по этой причине, мы можем использовать его в анализах структуры как генофонда целых народов, так и генома отдельно взятых людей.

В январе я провел небольшой  эксперимент c «чистым вариантом» аутосомного компонента ANE (ancestral North-Euarasians), впервые описаном в известной работе Lazaridis et al. 2014. Процедура вывода третьего генетического компонента в генофонде европейцев (ANE) оказалась гораздо сложнее, чем я предполагал в начале. Основная сложность заключалась в том, что в отличии от мезолитических и неолитческих сэмплов, у нас нет хорошого образца палеоДНК носителей компонента ANE. Пришлось заниматься реконструкцией генома, используя в качестве заменителей геном MA1 и не-восточноазиатскую часть генома индейцев каритиана. Технически, данный «компонент» был «синтезирован» в программе Plink с помощью 2последовательных запусков генерации «синтетических» популяций на основании частот аллелей аутосомных снипов, вычисленных в3 последовательных запусках программы Admixture.

Я получил компонент с максимально приближенным значениями к значениям компонента ANE в разных популяциях мира в работе Lazaridis et al. 2014. Изучение этого компонента важно для понимания многих неясных моментов истоии древних популяций в восточной Европе и на северном Кавказе. Последние статьи и анонсы лаборатории Давида Рейха к новой статье о составляющих аутосомного генофонда представителей ямной культуры и культуры шнуровой керамики дают основания полагать, что компонент ANE в Евразии могли разносить потоки миграции индоевропейцев, а генетическое разнообразие жителей Европы и Кавказа практически вписывается внутри класссического треугольника (клинов) генетических компонентов ANE-WHG-EEF (см.  ниже график PCA).

10896832_10205857624789575_5582535068712806983_n

Формально,эта гипотеза проверяется с помощью инструментов f3-статистики (A; B,C) — формального теста на статистическую значимость предполагаемого варианта присутствия адмикса двух популяций-доноров в популяции-рецепиенте.

Я решил проверить надежность модели путем представления ряда европейских и кавказских популяций в виде продукта гибридизации носителей компонента ANE с «неолитическим» и «пост-мезолитическим» населением Европы (результаты ниже,  Z в последней колонке.

 

North-Caucas Caucasian ANE -0.0006748 5.13E-05 -13.166
Mesolithic-North Loschbour ANE -0.0011573 0.0001605 -7.21171
Mediterranean-Neolithic Otzi ANE -0.0012012 0.0002376 -5.05634
Mesolithic-North LaBrana ANE -0.0010358 0.0002097 -4.94043
Italian-East Otzi ANE -0.0012473 0.0005013 -2.48825
Italian-East Italian-West ANE -0.0005022 0.0004325 -1.16129
Maltese Otzi ANE -0.0001611 0.0004147 -0.388512
Assyrian-1 Caucasian ANE -0.0002994 0.0009656 -0.310081
Spanish-Canar Loschbour ANE -0.0002557 0.0011264 -0.227017
Italian-East Maltese ANE 2.36E-05 0.0003026 0.0779574
Italian-East Caucasian ANE 6.32E-05 0.000274 0.230808
Spanish-Canar Otzi ANE 0.0003307 0.0012476 0.265081
Assyrian-1 Italian-West ANE 0.0003321 0.0012207 0.272035

Практически все полученные варианты для современных популяций в тесте f3 дали отрицательную Z-оценку.

Буквой Z обозначается стандартная оценка, основанная на нормальном распределении. Иначе говоря, Z-o. является мерой отклонения от среднего, выраженной в единицах стандартного отклонения. Z –оценка будет иметь отрицательную величину, если показатели адмикса будут выше медианного значения.
Очень высокие или очень низкие (отрицательные) Z-оценки, связанные с очень маленькими p-значениями, располагаются в хвостах нормального распределения, и является значимыми, а не случайными. А значит, компонент ANE был индуцирован мною правильно.

 

 

Что еще любопытно, так это то, что третья составляющая современных европейцев — компонент ANE в моем эксперименте плавно разделился на две подсоставляющих — MA1 (древние сибиряки эпохи палеолита) и Кавказ (в качестве основы я брал геномы грузин и армян).

То есть, скорее всего компонент ANE появился в результате смешивания «труъ» древних северных евразийцев и кавказцев. Собственно, об этом намекал Рейх в анонсе своей публикации результатов анализа геномов жителей ямной культуры.

Вероятно, что кавказские популяции (особенно в Дагестане), характеризующиеся высоким уровнем гомо- и аутозиготности в определенном смысле «законсервировали» в своем геноме тот первый массовый вброс компонента ANE в свой генофонд. И по этой причине, например, без специальной методики, в программе Admixture практически весь компонент ANE маскируется бимодальным компонентом, вроде знаменитого Caucas-Gedrosia в одном из первых этно-популяционных калькуляторов проекта Dodecad. Похоже, что генетика может в очередной раз частично примирить две антиномные теории (вернее, целые кластеры теорий) происхождения ИЕ — анатолийскую и степную. Нечто подобное наблюдалось после прочтения геномов неандертальцев и получения убедительных фактов гибридизации предков соврменного человека и архаических гомининов — неандертальцев, денисовцев. В результате чего теории мультирегионального и монорегионального происхождения человка были хотя бы в отдельных моментах приведены к общему знаменателю.

Как я уже упоминал ранее, мой опыт с «выведением» предкового аутосомного компонента индоевропейцев полностью удался. Поскольку всем очевидно, что этот компонент родственен «североиндийскому предковому компоненту» (ANI — обозначение из статьи Reich et al. 2009 и Moorjani et al 2011) о структуре генофонда индийских этнических групп), я взял 10 индийских этнических групп, имеющихся в кураторском наборе лаборатории Райха и проанализировал эту выборку в Admixture на пропорции вхождения их геномов в 2 априорно заданные кластеры. Первый кластер ANE был априорно задан 40 синтетическим индивидами, сгенерированными в программе Plink на основании расчитанных ранее частот аллелей «чистого» компонента ANE. В качестве дополнительного контрольного образца я использовал геном Malta1, т.к. он содержит в себе наивысшее содержание компонента ANE. Второй кластер был задан 4 индивидами Onge (одна из аборигенных народностей Андаманских островов). Как неоднократно указывалось в литературе, именно жители Андаманских островов являются самыми «чистыми» носителями т.н «южно-индийского» предкового компонента ASI (на континенте чистых носителей этого «компонента» не осталось, в том числе и среди популяций дравидов, ведда и мунда). После нескольких экспериментов по эвристическому методу проб и ошибок, я получил более или менее приемлимое разделение индивидов на 2 кластера, а затем вычислил частоты аллелей в каждом из этих кластеров. Любопытно, что в ходе опыта, удалось не только выделить компонент ANI, но и добиться неплохого уровня дискримнации между компонентом ANI, ANE, и благодаря этому, оба компонента могут быть включены в мой следующий этно-популяционный калькулятор.

Надежность компонентов я проверил на собственных данных. В рабочей модели калькулятора K14 удельное распределение этно-генографических компонентов моего генома выглядит следующим образом:

68.75% — европейский мезолитический компонент
13.12% — северо-евразийский компонент ANE
10.23% — европейский неолитический компонент
4% — ANI (северо-индийский предковый компонент)
1.6% — кавказский компонент
1.2% — алтайский компонент
0.2% — сибирский компонент

R Graphics Output

 

 

Новая российская компания на рынке персональной геномики

 

В сентябре в Москве открылся один из «сколковских стартапов» -медицинский центр «Атлас», который специализируется на «персонализированной» и «превентивной» медицине. Своим пациентам центр предлагает сначала cделать скрининговый тест http://www.atlas.ru, а потом уже разрабатывать план профилактики и лечения на основе его результатов — выявленных предрасположенностей и рисков возникновения заболеваний, а также генетически обусловленных реакций на лекарства.

Массовой расшифровкой генома в России занялись ещё в 2007 году, поэтому на рынке уже существует несколько похожих компаний. Однако «Атлас» назвал своей целью сделать генотипирование популярным и доступным — примерно так, как это удалось 23andMe, американской компании бывшей жены Сергея Брина Анны Войжитски, в которую Google инвестировала почти 4 миллиона долларов. Популярность 23andMe явно не даёт покоя владельцам «Атласа», поэтому даже домен 23&me.ru они зарегистрировали на себя. Биомедицинский холдинг Atlas основан в 2013 году. Команда Atlas включает в себя специалистов, уже сейчас внедряющих в клиническую практику концепцию персонализированной медицины и работающих на стыке фундаментальной науки и практической медицины.

Нужно сказать, что бизнес-модель «Атласа» действительно построена на основе модели 23andme. Спектр предлагаемых клиентам сервисов персональной геномики также похож на тот, что имеется в 23andme. Вместе с этим, имеется одно принципиальное отличие — в отличии от 23andme, предлагавшей в своем продукте в числе прочего и описание медицинских генетических рисков, продукт «Моя генетика» компании Atlas не просто представляет перечень рисков, но и предполагает консультацию профессионального специалиста по медицинской генетике в медицинском центре Atlas (входящего в состав холдинга).  На мой взгляд, это очень удачный ход. Как известно, в прошлом году у компании 23andme возникли серьезные проблемы с  FDA. Управление по санитарному надзору за качеством пищевых продуктов и медикаментов[3] (англ. Food and Drug Administration, FDA, USFDA) — агентство Министерства здравоохранения и социальных служб США, один из федеральных исполнительных департаментов. Управление занимается контролем качества пищевых продуктов, лекарственных препаратов, косметических средств, табачных изделий и некоторых других категорий товаров, а также осуществляет контроль за соблюдением законодательства и стандартов в этой области. В прошлом году это агентство по жалобе нескольких клиентов инициировало проверки соответствия рынка персональной медицинской генетика законодательству, в результате которой 23andme было предписано временно прекратить включение данных о генетических рисках в свои отчеты. И хотя российским законодательством данная область практически не регулируется, тем не менее включение в продукт услуг профессионального врача-генетика, безусловно, правильный ход, так как позволяет клиенту получить профессиональную консультацию специалиста в довольно специфической и сложной области медцинской генетики.

Лицам, интересующимся генетической генеалогией и своим происхожден, будет интересен раздел, в котором можно посмотреть данные о своих гаплогруппах; проценте генов, доставшихся от неандертальцев; а также разбиение генетических вариантов своего «генома» по компонентам происхождения.  Поскольку я помогал компании Atlas разрабатывать этот раздел (в плане составления описания гаплогрупп и разработки алгоритмов определения компонентов происхождения), то могу поручиться своей репутацией за научную состоятельность выдаваемых результатов.

Процитирую отзыв одного из первых клиентов

«Самая серьёзная и достоверная рубрика — здоровье: в ней связь определённых типов генов с возможным заболеванием подтверждена научными исследованиями, в которых принимало участия более тысячи человек. Здесь риски развития заболеваний сгруппированы в процентах и сравниваются со средним риском по популяции, отображены наследственные заболевания, а также так называемая фармокогенетика, индивидуальная чувствительность к лекарствам (аллергические реакции, побочные эффекты).

Самыми высокими рисками для меня, согласно тесту, являются меланома (0,18 % при среднем риске 0,06 %), системная склеродермия (0,05 % при среднем 0,03 %), сахарный диабет первого типа (0,45 % при среднем 0,13 %), аневризма сосудов головного мозга (2,63 % при среднем 1,8 %), системная красная волчанка (риск 0,08 % при среднем риске 0,05 %), эндометриоз (1,06 % при среднем риске 0,81 %), артериальная гипертензия (42,82 % при среднем риске 40,8 %). Ну и так далее. Кроме того, тест выявил, что я являюсь здоровым носителем варианта гена, связанного с периодической болезнью. Моя же чувствительность к лекарствам оказалась совершенно среднестатистической, ничем не примечательной, поэтому никаких особых побочных эффектов или аллергических реакций тест не выявил.

В рубрике «Питание» мне рекомендовали то, что рекомендуют своим читателям все журналы о здоровом образе жизни, — сбалансированную диету и почему-то не больше 998 килокалорий в день (при норме для взрослого человека, который не занимается спортом, в 1 200). Не рекомендовали есть сладкое и жирное, пить крепкий алкоголь, закусывать его картошкой или заедать рисом, запретили сладкое и жареное. В общем, всё, что можно было бы посоветовать любому россиянину старше 18 лет. У меня заподозрили непереносимость лактозы и запретили молочные продукты, хотя никаких проблем с молоком у меня никогда не было. Несмотря на это, в разделе «Рекомендации» мне посоветовали есть «больше молочных продуктов каждый день» (потом разработчики сказали, что это — баг), потому что молоко «снижает риск развития сахарного диабета», который у меня повышен. Если пить его вместо сладкой газировки, то, наверное, снижает. Но сейчас прогрессивное человечество уже задумывается о том, насколько молоко вообще необходимо взрослому человеку, — связи потребления молока с крепкими костями и восполнением витамина D, о которой говорили раньше, так и не было найдено.

В разделе «Спорт» меня назвали «спринтером» и посоветовали силовые тренировки, поэтому рекомендовали гандбол, регби и плавание и запретили бег, баскетбол, конный спорт и зимние виды спорта. На мой удивлённый вопрос: «Почему запретили бег, который почти всем можно?» — врач-генетик Ирина Жигулина, с которой мы потом общались, ответила, что речь идёт о профессиональном спорте. Профессионального бегуна из меня, по их мнению, не выйдет.

В разделе «Происхождение» меня ждала интерактивная инфографика о том, как мои предки по материнской линии вышли из Восточной Африки 150–180 тысяч лет назад и двинулись в Северную Европу. У меня нет Y-хромосомы, поэтому, что там происходило с отцовской линией, совершенно непонятно. Мои надежды найти успешных родственников так и не оправдались — бегунок остановился на отметке «500 лет назад» и выдал результат, что 50,9 % моего ДНК — от жителей Северной Европы. Жаль, что это совсем не то, что получают, например, покупатели теста 23andMe, которым предоставляют доступ к социальной сети, где можно найти своих родственников. А так хотелось прожить такую историю, как Стэйси и Грета, которые узнали, что они сёстры, благодаря 23andMe!

Больше всего меня удивила информация под заголовком «Личные качества». Тут я узнала, что у меня снижен риск развития никотиновой зависимости, есть предрасположенность к абсолютному слуху, нет риска ранней менопаузы и есть склонность к избеганию вреда. Этот раздел создатели относят к «развлекательной генетике», потому что данные в ней строятся на основе экспериментов с небольшой выборкой испытуемых (меньше 500). Но они меня вовсе не развлекли, а расстроили. Во-первых, выяснилось, что у меня нет предрасположенности к кудрявым волосам: «у вас не выявлен генетический вариант, часто встречающийся у кудрявых людей», хотя я кудрявей, чем многие каракулевые шубы. А во-вторых, у меня «не выявлен вариант гена, встречающийся у большинства творческих людей». В-третьих, я и вовсе интроверт.

Результаты теста заканчиваются рекомендациями пройти консультацию с терапевтом (по поводу риска системной красной волчанки), с эндокринологом (по поводу сахарного диабета) и с дерматологом (склеродермия, меланома), а также ежегодно сдавать анализ крови, делать маммографию, с 40 лет — регулярно ЭКГ. Ещё рекомендовали пить кофе и молоко, витамины, регулярно заниматься спортом и редко загорать»

Предварительный обзор нового этнокалькулятора от FTDNA myOrigins

Предварительный обзор нового этнокалькулятора от FTDNA myOrigins (дополнено 06.05)

Сегодня компания FTDNA открыла ограниченный доступ к бета-версии своего нового этнокалькулятора, который должен прийти на смену Population Finder. Необходимость замены старой утилиты давно назрела — предикты, выдаваемые этим инструментом, отличались крайней неточностью, и выглядели откровенно неудачно на фоне продукта основного конкурента — Ancestry Composition от 23andMe.

Видимо, после недавнего фиаско с громким анонсом обновленного дерева Y-DNA, в компании решили проявить разумную осторожность и открыли доступ к новому продукту лишь админам проектов, предупредив, что это закрытый бета-тест. На текущий момент можно видеть результаты лишь примерно половины участников (остальные, вероятно, ждут просчета. К сожалению, в этот список попал и я. Дополнение — как выяснилось, «переносы» из 23andMe все же были просчитаны, но не поставлены ссылки  на результат), однако этого достаточно для предварительной оценки нового инструмента.

Видно, что проделана большая работа, и в целом myOrigins (а именно так решили назвать Population Finder 2.0) выглядит гораздо достойнее своего предшественника. Выделен ряд географических зон, к которым может быть отнесен геном тестируемого, полностью либо частично. Зоны, к которым отнесена хотя бы часть его наследственности, выделяются на карте. Чем выше вклад зоны, тем ярче пятно. Похромосомного режима, как в Ancestry Composition, нет. Впрочем, выделяемые им сегменты часто бывают довольно сомнительными, поэтому я не считаю данный факт недостатком myOrigins. Как и следовало ожидать от компании, ориентированной в первую очередь на покупателей из Северной Америки и Западной Европы, наибольшей детализации подверглась Северо-Западная Европа. Она разделена на три близких между собой зоны — «британскую» Coastal Islands, «франко-германскую» Coastal Plain и «скандинавскую» Northlands.

Насколько хорошо получилось произвести разделение, покажет будущее — я в основном обратил внимание на компоненты, важные для восточноевропейцев. Кстати, возникает ощущение, что названия и кое-что в описании зон взято из другой версии программы, поскольку они зачастую плохо стыкуются с картой. Так, «балто-славянское» пятно названо Trans-Ural Peneplain, однако при этом нарисовано на территории Польши, Белоруссии и Украины. Но я забегаю вперед. Итак, две основные зоны, выделенные для Восточной Европы — это «балто-славянская» Trans-Ural Peneplain и «финская» North Circumpolar. Кроме этого, довольно часто проявляется «восточноазиатский» компонент Asian Northeast. Распределение выглядит разумно — украинцы, белорусы, южные русские преимущественно относятся к «балто-славянской зоне», со сдвигом к северу растет вклад «финской» зоны. «Восточноазиатский» компонент, проявляющийся у северян, не удивляет, а то, что он периодически встречается у украинцев, можно отнести на влияние Степи. Впрочем, конкретные соотношения двух основных восточноевропейских компонентов у некоторых участников вызывают подозрение в заметных случайных отклонениях процентовки. Дополнение — подозрения перешли в уверенность.

Тем большее удивление вызывают результаты некоторых представителей народов Поволжья и Урала. У них «найдены» «британский» и «франко-германский» компоненты, причем процент может доходить до 20. Думаю, причина здесь в отсутствии «уральской» зоны. Судя по описанию, ее роль должен был взять на себя «финский» компонент, якобы доходящий вдоль Полярного Круга до самой Гренландии. Частично ему это удается — видно, что у чувашей, марийцев, татар его много. Однако финны очень своеобразны, и не могут полностью отображать все не-азиатское разнообразие Севера Евразии. Как результат — заметную часть генома уральцев алгоритм не может отнести ни к «финскому», ни к «балто-славянскому» компоненту, при этом видно его европейское происхождение. Подозреваю, что такие варианты «на всякий случай» относят к британцам. Логично для алгоритма, рассчитанного в первую очередь на американцев.

Дополнение — как оказалось, «франко-германская» зона довольно часто рисуется и восточным славянам. Видимо, дело здесь не только в отсутствии «уральской» зоны, но и в других особенностях используемого алгоритма. «Британская» зона так и продолжает связываться с «уральцами».

Другие зоны, могущие представлять интерес — «средиземноморская» North Mediterranean, «анатолийско-кавказская» Anatolian Crossroads, «афганско-среднеазиатская» Eurasian Heartland, «америндская» Bering Expansion. Все эти компоненты могут встречаться в небольших количествах у восточноевропейцев, обычно их присутствие вполне оправдано.

На мой взгляд, в целом выделение зон сделано вполне разумно. Основная претензия — отсутствие «уральской» зоны, но честно говоря, сложно ожидать от американской компании внимания к этой тонкости. Излишнее выделение зон в Европе также вполне понятно. Дополнение — к недостаткам я бы отнес и отсутствие варианта «nonspecific» для неопределенных случаев, как сделано в Ancestry Composition. Тогда казусов с неверным разнесением по зонам было бы меньше. На первый взгляд, продукт получился вполне на уровне конкурента, а значит, компания может не беспокоиться еще несколько лет )). После полного просчета результатов всех участников и перехода утилиты в открытый вид мы увидим, действительно ли это так.

Этногеномика беларусов — часть V

Обсуждение результатов и выводы

 

Как отмечалось в введении к нашей статье, главной задачей нашего исследования являлась проверка двух рабочих гипотез, озвученных в предыдущих исследованиях профессиональных попгенетиков. Во-первых, это гипотеза о присутствии трех основных древних компонентов , которая указывает на возможность общего происхождения славян и балтов. Во-вторых, это утверждение о том, что своеобразие аутосомного генофонда беларусов может быть связанно с вкладом балтского субстрата.

После внимательного изучения результатов нашего исследования,можно сказать, что оба из приведенных выше заключений представляют собой крайне упрощеные варианты сложного процесса формирования аутосомного генофонда беларусов. Хотя мы и не можем предоставить окончательных аргументов в пользу или опровержение каждой из этих версий, мы может предоставить более полное и подробное обозрение структуры аутосомного генофонда. В отличие от трех основых компонентов, упомянутых выше, в нашем исследовании мы выделили шесть основных компонентов, типичных для европейцев в целом. Основу генофонда составляет компонент, который мы обозначили как северо-восточно-европейский компонент. Именно этот компонент выделяет беларусов среди других восточных славян, приближая их к современным балтийским популяциям (у литовцев процент компонента составляет 81,9, у латышей — 79,5%, у беларусов -76,4%, у эстонцев — 75,2%). Примечательно, по мере удаления от территории Беларуси на север в с торону Латвии и Эстонии, увеличивается процент северо-европейского генетического компонента (как мы полагаем, этот компонент доминировал в генофонде доисторических жителей Скандинавии в эпоху до распространения финно-угоров и индо-европейцев). С другой стороны, беларусов и других восточных славян отдаляет от балтов и сближает друг к другу более высокий процент так называемого западно-азиатского или кавказского компонента (любопытно, что в этом случае эта закономерность может свидетельствовать в пользу западно-азиатской теории происхождения индо-европейцев).

Далее, как показывает анализ в программе fineStructure, генофонд беларусов характеризируется высокой степенью генетических контактов как с балтами, так и остальными славянами, а также с рядом финно-угорских популяций (например, c эрзя и мокша). О симметричном характере межпопуляционного обмена свидетельствует симметричное расположение популяции беларусов относительно этих трех групп.

Исходяизвышенаписанного,представляетсялогичнымсделатьвыводотом,чтоосновнойкритическийэтапстановленияаутосомногогенофондапришелсянапериодсмешиванияносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,послечегопредковыйаутосомныйгенофондбеларусовприобрелотносительнуюстабильность.Разумеется,даннаямодельнеисключаетпозднейшиеэпизодысмешиванияпопуляций,ноониоставилименьшийследвструктуреаутосомногогенофондабеларусов.Вэтойсвязивозникаеточевидныйвопрос–вкакойименноисторическийпериодпроизошлосмешениеносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,иктобылиихносителями?
В начале сентября 2012 года известная американская лаборатория популяционной генетики доктора Райха опубликовала альфа-версию программного продуктаADMIXTOOOLS1.0. Альфа-версия была разработана для внутреннего использования, поэтому modusoperandiэтого продукта вряд ли является кристально понятным для стороннего пользователя. Положительным аспектом на мой взгляд является то, что ADMIXTOOLSпакет обеспечивает полную совместимость с форматом другой очень популярной программыEIGENSOFT, которая была разработана в той же лаборатории. Это немаловажное обстоятельство намного упрощает процесс обучения в ADMIXTOOLS.

Вышеупомянутый пакет включает в себя 6 приложений, среди которых я считаю наиболее полезнойqp3Popи утилиты для вычисления частотной характеристики аллелей. Впрочем, я не собираюсь обсуждатьqp3popво всех деталях и в контексте данной заметки достаточно отметить, что эта программа реализует тест three_pop(F_3), подробно описанный в известной статье Рейха и соавт. 2009.

Однако другой имплементированный в пакете метод, – метод rolloff– нуждается в более пристальном внимании. Этот метод позволяет производить математическую оценку как времени, так как и уровня адмикса. Оценка производится на основании анализа неравновесия по сцеплению между SNP-ами. Тут необходимо вспомнить стандартное определение неравновесия по сцеплению.Неравновесием по сцеплению (часто используется английская аббревиатураLD) называется неслучайная связь между двумя аллелями, в силу которой определенные комбинации аллелей встречаются наиболее часть. В теории, чем дальше друг от друга находятся SNP-ы ,тем меньше будет уровень LD. Темп угасания снижения LDв адмиксе напрямую связана с числом поколений, прошедших с момента адмикса, так как cвозрастанием числа поколений увлечивается число рекомбинаций произошедших между двумя отдельными SNP-ами. Проще говоря: Rolloffсоответствует экспоненциальной кривой угасания уровня LDот расстояния, и эта скорость экспоненциального снижения как раз и используется для оценки числа поколений, так и уровня адмикса в анализируемой популяии. Учитывая, что одно поколение примерно равно 29 лет, можно преобразовать число поколений в года.

Этот метод открывает интересные перспективы. Для целей этого анализа, я создал специальный набор SNP-данных, который включает в себя около 750 000 cнипов, частично или полностью в 250 различных популяциях человека. Далее, я разбил популяции 3 * 62 000 трио в следующем виде (X, Y, Z), где X и Y – пара рефренсных групп, а Z – белорусы из коллекцииBehar et al.2010. После этого я провел q3Pop анализ этих трио.

Результаты изложены в нижеприведенной таблице

Indian Polish Belarusian -0.000736 0.000251 -2.935
Polish Indian Belarusian -0.000736 0.000251 -2.935
Karitiana Sardinian Belarusian -0.001278 0.000517 -2.471
Sardinian Karitiana Belarusian -0.001278 0.000517 -2.471
Otzi North_Amerind Belarusian -0.002556 0.001126 -2.271
Cirkassian Polish Belarusian -0.000488 0.000231 -2.113
Polish Cirkassian Belarusian -0.000488 0.000231 -2.113
Pima Otzi Belarusian -0.002727 0.00137 -1.99
Pima Sardinian Belarusian -0.000794 0.000431 -1.843
Sardinian Pima Belarusian -0.000794 0.000431 -1.843
Otzi Surui Belarusian -0.002938 0.001931 -1.522
Surui Otzi Belarusian -0.002938 0.001931 -1.522

 

На первый взгляд, результаты нашего эксперимента с 3qPop, кажется, неплохо согласуются с выводами, содержащимися в работеПаттерсон и др. 2012: “Самый поразительный вывод состоит в обнаружени четкого сигнала адмикса в северной Европе, один из элементов которого связан с предками населения наиболее близкого по своей генетике к баскам и жителям Сардинии, а другой – с предками современного населения северо-восточной Азии и Америки. Этот явный сигнал, вероятно, отражает историю смешивания неолитических мигрантов с коренным населением Европы, что подтверждается недавним генетическим анализом древних костей Швеция и секвенированием полного генома Отци Тирольца”. Что касается собственно белорусов, то источники сигнала смешивания с посторонними популяцими менее ясны и расплывчаты. Как было показано ранее, с точки зрения формального анализа примесей (f3 статистики), белорусы могут быть представлены в виде популяционного микса поляков и индусов / черкессов. Первый компонент смеси может быть связан с носителями культуры шнуровой керамики/боевых топоров и культуры колоковидных кубков; второй, в соответствии с результатами, должен быть общим для индусов и черкесов.

 

Белорусы = ((неолитические культуры Европы) + “носители культуры колоковидных кубков”) + (мезолитическое население Европы) + компонент носителей культуры шнуровой керамики)) + скифо-сарматский тип

 

Для оценки дата события базового адмикса в белорусской популяции, мы использовали в качестве референсных популяций поляков и индусов (Примечание: мы снизили порог генетических дистанции в параметрах Rolloff для снижения уровня шума от более поздних адмиксов).

 

rolloff

Как вы можете видеть, сигнал присутствия адмикса обнаруживается гораздо хуже, и в силу этого, погрешности в оценке временного промежутка высоки:

154,158 + -87,024 поколений назад (или, 4470 + -2523 года до настоящего времени / 2510 – +2523 лет до н.э.).

 

Исходя из этого, мы решили модифицировать Rolloff-анализ генофонда белорусов, используя на этот раз в качестве референсов литовцев и пуштунов. Следуя этому совету, я решил предпринять вторую попытку формального анализа адмикса в двух имеющихся у нас выборках беларусов ( выборка беларусов из статьи Behar et al. 2011), и выборка беларусов, собранная в нашем проекте.Ниже приведены результаты эксперимента с двумя этими группам (в отличие результатов нашей предыдущей попытки, результаты данного эксперимента менее “зашумленные”):

rolloff2

 

Интервал числа поколений, прошедших со времен анализируемого адмикса (105.086+-52.59) или 3069 +- 1525 лет до настоящего времени, что соответствует временном интервалу 2 тыс. до нашей эры – 6 век нашей эры. Принимая во внимание эти выводы, мы можем предположить, что основной аутосомный эпизод смешивания предковых популяций беларусов произошел в течении довольно таки продолжительного времени, охватывающего несколько тысяч лет. В этой связи, вопрос о том, кто именно был носителями северо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента, остается открытым.

О новых профессиях связанных с генетикой и молекулярной биологией

17 февраля известное российское Агентство стратегических инициатив и Московской школы управления «СКОЛКОВО» разродилось примечательным изданием — атласом новых профессий. Я не буду останавливаться на отдельных моментах этого издания (благо, что он находится в открытом доступе), и процитирую те фрагменты атласа, в которых описываются новые потенциальные области трудовой занятости, так или иначе связанных с генетикой

Генетический консультант. Проводит первичный и плановый генетический анализ в диагностических центрах, обрабатывает данные с диагностических устройств, дает заключение и рекомендации по дальнейшей схеме лечения (выявление наследственных заболеваний, онкомаркеров и т.д.
Сегодня генетические консультации нам известны, преимущественно благодаря компании 23andMe, которая предлагает частным заказчикам генетический анализ генома. Компания любопытна не столько даже тем, что предлагает за разумные деньги целый ворох прелюбопытной информации (посмотреть можно, например, тут) или тем, что основательница компании – супруга Сергея Брина, или тем, что одним из инвесторов в компанию является Юрий Мильнер, совладелец Mail.ru Group. Интересно, что сейчас компания проходит тот путь внешнего сопротивления регулирующих органов, который, вероятно, отражает общую судьбу новых технологий: в ноябре 2013 года FDA (Агентство Минздрава США по надзору за качеством продуктов и медикаментов) предписала 23andMe приостановить продажи тестов, поскольку компания нарушает закон, говоря, что на основе ее тестов можно определить более 250 заболеваний. Как авторитетно говорит агентство, утверждать это можно, только основываясь на медицинских тестах, одобренных FDA. Посмотрим, что будет дальше, но ясно, что запрос на первичный генетический анализ в ближайшее время будет расти, а значит, будут нужны генетические консультанты.

Клинический биоинформатик. В случае нестандартного течения болезни строит модель биохимических процессов болезни, чтобы понять первопричины заболевания (выявляет нарушения на клеточном и субклеточном уровне)
Клиническая биоинформатика на западе также существует не первый год. Сегодня на Западе клиническая биоинформатика (или трансляционная биоинформатика) направлена на то, чтобы по максимуму использовать весь багаж накопленной информации – генетической, биологической и медицинской – может быть применен для того, чтобы разработать персонализированную терапию и траектории лечения пациента. В основе клинической биоинформатики лежит использование IT-методов для анализа фундаментальной биомедицинской и генетической научной информации для применения в клинической медицине. Трансляционная медицина есть и в России, и специалисты прогнозируют появление большого количества рабочих мест в этой области (подробнее можно узнать в рассказе Сергея Румянцева для ПостНауки)

Дайджест новостей генетики, геномики и биоинформатки

Благодаря нашумевшему проекту «Геном человека» слов с суффиксом «-ом» становится все больше. Появление вслед за генóмом и протеóмом большого количества новых омов — свидетельство важной тенденции в мире современной биологии. Все больше проводится крупномасштабных исследований, результатом которых становится не описание отдельных молекул, а большие массивы сложно организованных данных. О том, какие новые дисциплины появились в эпоху большой биологии и какое развитие получили «классические» омики, рассказывается в статье ««Омики» – эпоха большой биологии».
Подробности:
http://biomolecula.ru/content/1387

Классические «омы»

Геном

В нашу «постгеномную» эру непросто найти того, кто не слышал о проекте «Геном человека» [1]. Если описать его коротко: 13 лет (1990–2003), три миллиарда нуклеотидов, три миллиарда долларов. Не все ожидания ученых оправдались (последовательность ДНК расшифрована, но не всегда понятно, что она кодирует), но технологическому прорыву в генетических исследованиях последнего десятилетия мы во многом обязаны именно работе над геномом человека. Вслед за ним стали активно секвенировать геномы других млекопитающих: 2002 — геном мыши, 2004 — крысы, 2005 — шимпанзе, 2007 — макаки [10] и так далее (в настоящий момент известны последовательности геномов почти 30 млекопитающих, а дальше это число будет только расти). Кроме этого, расшифровка генома человека привела к появлению специализированных геномных проектов, цель которых — описать работу определенной группы генов, связанных с работой отдельных систем органов или развитием какого-либо заболевания.

Транскриптом

Транскриптом — это совокупность всех молекул РНК, которые синтезируются в клетке, в каком-то органе или ткани. Интересно, что хотя транскриптом и является продуктом экспрессии нашего генома, ни один из них не обеспечивает полное описание другого. Это связано с тем, что, с одной стороны, в геноме немало так называемой «мусорной» ДНК, которая ничего не кодирует (по крайней мере, так кажется). С другой стороны, существуют процессы, которые изменяют РНК после транскрипции: например, процесс редактирования РНК, который, согласно недавним исследованиям [11], распространен очень широко и происходит на более чем 90% всех мРНК. Кроме того, нельзя забывать, что в составе транскриптома есть не только белок-кодирующие мРНК, но и другие виды РНК — начиная от тРНК и рРНК и до различных видов малых регуляторных РНК [12].

Последовательность генома является более-менее постоянной характеристикой организма (хотя есть и исключения — например, последовательности некоторых генов разительно отличаются друг от друга в ДНК лимфоцитов одного человека). Транскриптом же может являться постоянной характеристикой органа, ткани или отдельной популяции клеток, т.к. разные типы клеток выполняют разные функции и экспрессируют разные гены, причем он также может зависеть от условий окружающей среды и меняться во времени. Именно поэтому в последнее время ученые все больше занимаются исследованиями транскриптома клеток определенного типа (например, эмбриональных стволовых клеток) или отдельных органов (например, транскриптома мозга человека [13]).

Протеом

Так как разные клетки в разные моменты времени экспрессируют разные гены, то не только набор РНК не будет одинаковым во всем организме, но и набор белков будет различаться. Это соображение подтолкнуло ученых к исследованию протеома человека — созданию полного перечня белков, которые присутствуют в разных клетках и тканях человека в каждый момент времени. Ученые сформировали международную организацию Human Proteom Organisation (HUPO), которая возглавила проект «Протеом человека» (Human Proteom Project, HPP), запущенный в 2008 году (об этом событии Биомолекула уже писала [14]). Одна из сложностей этого проекта — невероятное разнообразие белков в организме человека, ведь один ген может обеспечивать синтез нескольких вариантов одного белка, которые в дальнейшем могут подвергаться дополнительным химическим модификациям. В результате HPP разделился на два проекта — C-HPP и B/D-HPP. В первом из них разные группы ученых изучаются белки, закодированные на той или иной хромосоме (хромосому 18 изучает группа российских ученых в НИИ биомедицинской химии им. Ореховича в Москве). Во втором проекте изучаются группы белков согласно их биологической роли или вовлеченности в развитие тех или иных заболеваний. К настоящему моменту исследование протеома человека все еще находится в своей начальной стадии, на которой научные группы ищут новые подходы к анализу белков и подбирают биоинформатические алгоритмы [15], однако можно надеяться, что не за горами и первые успехи этого проекта.

Метаболом

Словом «метаболом» описывают совокупность небольших молекул-метаболитов, которые можно найти в клетке, ткани или целом организме. К метаболитам относят молекулы молекулярной массой не более 1 кДа (это как небольшие пептиды, например, некоторые гормоны, так и другие биологически важные органические вещества — антибиотики, липиды и другие вторичные метаболиты). В настоящее время все результаты исследования метаболома собираются в единую базу данных — Human Metabolome Database. Сейчас в этой базе собраны данные по более чем 40 тысячам различных метаболитов. Для каждого из этих веществ создана учетная запись — MetaboCard — которая не только исчерпывающе описывает химические свойства метаболита, но и то, с какими белками или нуклеиновыми кислотами это вещество может взаимодействовать и какое значение оно имеет в клинической практике (связь с заболеваниями или лекарствами).

В настоящее время метаболомика помогает ученым исследовать как физиологию человеческого организма, так и обнаруживать или лечить различные болезни. Одно из широких применений метаболомных исследований — поиск биохимических маркеров различных заболеваний, например, для болезни Паркинсона [16]. В таких исследованиях ученые пытаются обнаружить вещества, изменение концентрации которых в крови может помочь поставить диагноз на ранней стадии и своевременно начать лечение [17].

Существуют множество технологических решений для создания машин для секвенирования ДНК. До недавнего времени самым экзотическим решением считалось решение китайских ученных из Пекинского университета — в своей машине он имплементировали сетки процессоров от известной игровой приставки Sony PS3. Но их превзошли израильские ученные, cоздавшие ДНК, которая считает ДНК. Ученые Израильского технологического института разработали компьютер, состоящий из живых молекул. В основе такого микропроцессора лежат ДНК и ферменты. Этот микропроцессор способен работать непосредственно с генетическим кодом и может его изменять.

Источник: http://www.sciencedaily.com/releases/2013/05/130523180318.htm

Ученые из Оттавы выдвинули теорию о том, как продвинутое математическое моделирование может оказать влияние различных видов терапии, генетических модификаций на терапию рака.

Разработана уникальная методика прогнозирования набора ДНК.

В результате последнего эксперимента, который был проведен американскими учеными из калифорнийского университета, была разработана уникальная методика, позволяющая расшифровать генетический материал человека и при этом точно определить, кому и какой ген достался от родителей.

В научном отчете исследователей говорится о том, что у каждого человека двойной набор хромосом. Исключением являются только половые хромосомы. Все дело в том, что эти копии не являются идеальными, следовательно они могут отличатся между собой.

 
Один из авторов эксперимента, профессор Бинг, в ходе презентации новой методики заявил, что значение технологии трудно переоценить. Все дело в том, что новый метод позволяет с высокой точностью определить предрасположенность к разным заболеваниям. Более того, методика также позволяет определить и сами болезни.

Необходимость такого исследования была обусловлена нынешней ситуацией. Ведь известно, что в последние годы количество передаваемых по наследству различных патологий сильно увеличилось. Следовательно, пришлось искать способы решения данной проблемы.

Научные сотрудники представили красочный пример, который имеет прямое отношение к развитию злокачественной опухоли. Недавно стало известно, что раковые заболевания — это ни что иное как результат генетических мутаций. И вот как раз новая методика позволила определить точное место расположения мутации, а также возможность ее развития. Смысл состоит в том, что в случае возникновения мутации в одной хромосоме, вторая хромосома способна полностью компенсировать все недостатки, а это ведет к полному выздоровлению человека.

Кроме того, стоит подчеркнуть, что при помощи данной методики существует возможность точного определения шансов приживания донорских органов после их трансплантации. Такая возможность является востребованной в том случае, когда необходима срочная операция по пересадке органов. Естественно, что в данной ситуации времени на проведение дополнительных тестов нет.

К слову, методика также позволяет выяснить миграционные пути человечества. Конечно, что этот вектор не мог не заинтересовать ученых. Исходя из этого, планируется проведение серии дополнительных экспериментов.

Ссылка sbio.info

Новости от сибирских генетиков

Как сообщают СМИ,  новосибирские учёные научились разрезать ДНК человека с помощью особого фермента

Составлять «экономный» геномный портрет человека научились учёные Новосибирского предприятия SibEnzyme с помощью особого метода подготовки ДНК. Об этом ИТАР-ТАСС в рамках Первого международного форума технологического развития «Технопром» рассказал гендиректор предприятия Евгений Дубинин.

«С помощью современной методики геномного секвенирования можно получить персональный генетический «паспорт». Изучив его, врач заранее выявляет предрасположенность человека к генетическим заболеваниям, возможные способы лечения и наиболее эффективные лекарства. Стоимость создания геномного портрета в настоящее время высока, она не позволяет внедрить эту технологию в массовую медицину», — отметил Дубинин.

Он заявил, что можно вдвое удешевлять этот процесс, заранее расщепляя ДНК с помощью особого фермента. В геноме человека за кодирование информации отвечает только 5-7% его последовательностей. Фермент разрезает ДНК на фрагменты определенной длины в строго определенных местах. Для анализа выбирают только несколько фрагментов, исключив ненужные, и именно эта «ферментная» подготовка ДНК удешевляет исследование. Дубинин подчеркнул, что, несмотря на то что рынок геномного секвенирования находится на начальном этапе формирования, в ближайшее время его ждет интенсивный рост. По оценкам экспертов, его прогнозируемый объём в течение пяти-десяти лет — 100 миллиардов долларов.

В другом сибирского городе — Томске — также находится примечательная лаборатория Томский НИИ медицинской генетики (возглавляемая известным генетиком В.Степановым), одного из ведущих медико-генетических учреждений России. НИИ был основан в 1982 году и является первым специализированным институтом в области медицинской генетики на территории Сибири и Дальнего Востока. Сегодня деятельность института включает осуществление специализированной медико-генетической помощи населению, научные исследования и профессиональное образование в области медицинской генетики.

В лаборатории работает множество замечательных ученных, из которых для ДНК-генеалогии наиболее важен Владимир Харьков.

Har-kov

Благодаря его научному рвению была не только определена структура мужского генофонда многих сибирских народов, но и раскрыта недавняя серия тягчайших преступлений на сексуальной почве (в ходе анализа Y-хромосомы, Владимир установил не только национальность маньяка-насильника, но и место вероятного происхождения/жительства с точностью до села). Ув. Валерий Запорожченко поделился подробностями этой истории, озвученной на одной из последних конференций.

Не так давно к Владимиру Харькову из Томского института медгенетики обратились следователи СК по Новосибирской области. Искали они маньяка насиловавшего девочек-дошкольниц. Насилуя, он никого не убивал, иногда просто мастурбировал на глазах детей, и как правило оставлял на месте преступления биологический материал — сперму. Девочки описали его как описывают кавказцев. Следователи ловили местных выходцев с Кавказа всех подряд, типировали, но тщетно, профили не совпадали. Судебные генетики не справились, пришлось обратиться к эволюционистам. Владимир довольно быстро понял, что владелец спермы не кавказец, а выходец из Бурятии, причем выборки собранные лабораторией позволили точно идентифицировать не только национальность извращенца, но даже определить происхождение мужской линии с точностью до двух соседних районов. Получив ориентировку, следователи первым делом изучили местные «висяки», и обнаружили, что незадолго до первого новосибирского эпизода было несколько преступлений аналогичного почерка в Улан-Удэ. Пришлось перетрясти всю базу прописки — кто из указанных районов ее сменил на новосибирскую в последние годы. И что же, работа была вознаграждена — появился подозреваемый, идеально соответствующий ориентировке. Его тормознули на дороге под видом гибдд. Скрутили. Отпирался. Наперли. Признался! Впрочем, даже если бы не признался, его приперли по образцу ДНК который оказался идентичен полученному из спермы. Кстати, преступник бурят только по отцу, от которого и получил выдавшую его У-хромосому.

Таким образом была еще раз продемонстрирована плодотворность и перспективность изучения игрек-хромосомы в ДНК-криминалистике.

Кроме того, Владимир не чурается общения в Интернете с любителями ДНК-генеалогии, и некоторое время даже участвовал в работе форума Молген.

The inferred distribution of grandparental contribution — Gene Expression | DiscoverMagazine.com

Разиб Хан поделился ссылкой на интересное эмпирическое исследование в котором были опубликованы гистограммы распределения доли генома, унаследованных от дедушек и бабушке в большой выборке обследованных индивидов.

Основной вывод — распределение долей генома наследуемых от родителей матери и отца в геноме мужчин имеет более значительные, «длинные» хвосты. В геноме женщин распределение аналогичных долей ближе к нормальному.

Цитата

«Therefore, you see that 1 in 200 sperm are skewed such as that 20% or less of genetic material in the sperm is from one grandparent. Because you have to divide this by half in the fertilized zygote, what this means that in 1 in 200 individuals you have a case where 10% or less of their genome is from one paternal grandparent, and 40% or more from the other! The histogram for females, as you can see, is much less dispersed, though the variation there is not trivial either. I suspect that the scientists at 23andMe almost certainly know the empirical distribution, as they likely have many pedigrees to compare. It would be nice if they shared that with us.«

 

The inferred distribution of grandparental contribution — Gene Expression | DiscoverMagazine.com.