Новости от сибирских генетиков

Как сообщают СМИ,  новосибирские учёные научились разрезать ДНК человека с помощью особого фермента

Составлять «экономный» геномный портрет человека научились учёные Новосибирского предприятия SibEnzyme с помощью особого метода подготовки ДНК. Об этом ИТАР-ТАСС в рамках Первого международного форума технологического развития «Технопром» рассказал гендиректор предприятия Евгений Дубинин.

«С помощью современной методики геномного секвенирования можно получить персональный генетический «паспорт». Изучив его, врач заранее выявляет предрасположенность человека к генетическим заболеваниям, возможные способы лечения и наиболее эффективные лекарства. Стоимость создания геномного портрета в настоящее время высока, она не позволяет внедрить эту технологию в массовую медицину», — отметил Дубинин.

Он заявил, что можно вдвое удешевлять этот процесс, заранее расщепляя ДНК с помощью особого фермента. В геноме человека за кодирование информации отвечает только 5-7% его последовательностей. Фермент разрезает ДНК на фрагменты определенной длины в строго определенных местах. Для анализа выбирают только несколько фрагментов, исключив ненужные, и именно эта «ферментная» подготовка ДНК удешевляет исследование. Дубинин подчеркнул, что, несмотря на то что рынок геномного секвенирования находится на начальном этапе формирования, в ближайшее время его ждет интенсивный рост. По оценкам экспертов, его прогнозируемый объём в течение пяти-десяти лет — 100 миллиардов долларов.

В другом сибирского городе — Томске — также находится примечательная лаборатория Томский НИИ медицинской генетики (возглавляемая известным генетиком В.Степановым), одного из ведущих медико-генетических учреждений России. НИИ был основан в 1982 году и является первым специализированным институтом в области медицинской генетики на территории Сибири и Дальнего Востока. Сегодня деятельность института включает осуществление специализированной медико-генетической помощи населению, научные исследования и профессиональное образование в области медицинской генетики.

В лаборатории работает множество замечательных ученных, из которых для ДНК-генеалогии наиболее важен Владимир Харьков.

Har-kov

Благодаря его научному рвению была не только определена структура мужского генофонда многих сибирских народов, но и раскрыта недавняя серия тягчайших преступлений на сексуальной почве (в ходе анализа Y-хромосомы, Владимир установил не только национальность маньяка-насильника, но и место вероятного происхождения/жительства с точностью до села). Ув. Валерий Запорожченко поделился подробностями этой истории, озвученной на одной из последних конференций.

Не так давно к Владимиру Харькову из Томского института медгенетики обратились следователи СК по Новосибирской области. Искали они маньяка насиловавшего девочек-дошкольниц. Насилуя, он никого не убивал, иногда просто мастурбировал на глазах детей, и как правило оставлял на месте преступления биологический материал — сперму. Девочки описали его как описывают кавказцев. Следователи ловили местных выходцев с Кавказа всех подряд, типировали, но тщетно, профили не совпадали. Судебные генетики не справились, пришлось обратиться к эволюционистам. Владимир довольно быстро понял, что владелец спермы не кавказец, а выходец из Бурятии, причем выборки собранные лабораторией позволили точно идентифицировать не только национальность извращенца, но даже определить происхождение мужской линии с точностью до двух соседних районов. Получив ориентировку, следователи первым делом изучили местные «висяки», и обнаружили, что незадолго до первого новосибирского эпизода было несколько преступлений аналогичного почерка в Улан-Удэ. Пришлось перетрясти всю базу прописки — кто из указанных районов ее сменил на новосибирскую в последние годы. И что же, работа была вознаграждена — появился подозреваемый, идеально соответствующий ориентировке. Его тормознули на дороге под видом гибдд. Скрутили. Отпирался. Наперли. Признался! Впрочем, даже если бы не признался, его приперли по образцу ДНК который оказался идентичен полученному из спермы. Кстати, преступник бурят только по отцу, от которого и получил выдавшую его У-хромосому.

Таким образом была еще раз продемонстрирована плодотворность и перспективность изучения игрек-хромосомы в ДНК-криминалистике.

Кроме того, Владимир не чурается общения в Интернете с любителями ДНК-генеалогии, и некоторое время даже участвовал в работе форума Молген.

Географическое позиционирование людей на основании их генетических данных

Как известно, значительное количество людей интересуется вопросом своего положения в мире. Развитие биоинформатики и персональной геномики позволяют дать один из возможных вариантов ответа на вопрос о нахождении своего места в мире, причем в прямом смысле этого слова, т.е в смысле географического положения проекции генома индивида на карте мира.

На научном языке этот трюк называется генографическая визуализация или биогеографическое позиционирование. В своем блоге я показывал разные способы подобной визуализации, главными из которых являются:
1) Наиболее важным из них представляется  эксплицитное пространственное моделирования частот аллелей позволяет достаточно точно локализовать положение отдельно взятого человеческого индивида  на географической карте только на основании генетической информации — метод SPA.

2) Вторым по важности методом является метод, предложенный Сергеем Козловым — метод визуализации пространственного расположения индивида, исходя исключительно из аллельных чистот снипов в геноме (подробнее читай в моем блоге).

3) Наконец, третий подход опирается на рецепт Франсуа Оливье, который предложил  использовать графическую библиотеку статистического программного обеспечения R для отображения пространственной интерполяции  коэффициентов адмикса (Q матрица) в двух измерениях (где пространственные координаты записываются как географические долгота и широта) (подробности здесь).

Разумеется, методов и способ визуально-пространственного отображения генетических различий в глобальном мировом масштабе гораздо больше.

Подтверждением этого является разработанный сотрудниками  Genomics and Computational Biology Research Group, University of South Wales (Австралиями) метод GPS- позиционирования места происхождения индивида на основе анализа admixture в индивидуальных данных чипсета Geno 2.0 (совместный продукта Спенсера Уэллса и National Geographic). Метод был обкатан на данных сардинцев, и согласно заверениям авторов, этот метод доказал свою робастность на реальных данных:

Поиск биогеографического метода, который использует биологическую информацию для прогнозирования места происхождения, занимал ученых на протяжении тысячелетий. Современные алгоритмы биогеографического позиционирования достигают точности предсказания с погрешностью +- 700 км в Европе, однако их результаты оказываются крайне неточны в других местах, в частности в Юго-Восточной Азии и Океании. Здесь мы представляем новый метод анализа admixture на основе географической структуры населения (GPS), который точно определяет регион биогеографического происхождения лиц по всему миру вплоть до локального уровня. Точность GPS демонстрируется на трех наборах данных:  на популяциях всего мира, популяциях Юго-Восточной Азии, Океании и Сардинии (Италия) с использованием  40,000-130,000 снипов чипа GenoChip. GPS правильно расположены 80%  индивидов в пределах их страны происхождения, причем эта точность достигла 87% для азиатов и жителей Океании. Применительно к более чем 200 сардинцам обоих полов, GPS разместил примерно четверть в их родовые «деревни», а большинство остальных (то есть 80%) в пределах 50 км от их села, что позволяет нам определить демографические процессы, которые сформировали общество Сардинии. Наконец, мы еще раз продемонстрировали три дополнительных приложения GPS в отслеживании биогеографического происхождения друзов населения и выявления истоков европейской североамериканцев.Точность и эффективность GPS подчеркивают важность методов биогеографии основанных на данных Admixture и имеет важные последствия для генетического тестирования происхождения, судебно-медицинских и медицинских наук, и  общих вопросов генетической конфиденциальности.

Хотя изначально тест и разрабатывался под чип Geno 2.0, логика использования приложений GPS (которые работают на выходных данных анализа Admixture) легко позволяет создавать «самодельные» модификации c помощью имитирующих запусков Admixture на данных, чьи параметры соответствуют параметрам данных использованных для создания приложений GPS.

В качестве таких пилотных трюков можно упомянуть трюк геномного блоггера Веселовского. С результатами этого интересного эксперимента можно ознакомиться на Gedmatch, так как использованный в эксперимента Веселовского калькулятор K9b был имплементрован на Gedmatch.

Вот например, мои данные (которые, в принципе были предсказуемы) для большинства выходцев из Северо-восточной Европы. Как видно, погрешность точки локализации по-прежнему составляет +-700 км (если не больше) в радиусе от вычисленного положения на карте.

Calculated Place of Origin: Lithuanians

Longitude: 19.1421697241843,
Latitude: 51.767721502303

 

Пример проведения экспертизы родства по aутосомным STR маркерам

На протяжении последних нескольких лет я успел убедиться в том, что познания так называемых любителей ДНК- генеалогии в  генетике носит фрагментарный, если не сказать поверхностный, характер. Основная причина сего весьма прискорбного феномена кроется в идиосинкратическом отношении к смежным с ДНК генеалогией (читай: популяционной генетикой) областями генетического исследования. Наибольший интерес с точки зрения скрытого потенциала исследования представляют медицинская генетика и ДНК-судебная криминалистика.

Как я уже неоднократно подчеркивал, я являюсь категорическим противником строгого дисциплинарного разделения областей  изучения генетики человека, за исключением, пожалуй, более сложных для понимания рядового обывателя областей вроде транскриптономики или протеомики.  При рассмотрении всех генетических вопросов, я исхожу из более перспективной методологической установки холизма. Онтологический принцип холизма гласит: целое всегда есть нечто большее, чем простая сумма его частей. С холистической позиции, весь мир — это единое целое, а выделяемые нами отдельные явления и объекты имеют смысл только как часть общности. C этой позиции можно рассматривать  ДНК-генеалогию (популяционную генетику), медицинскую генетику и ДНК-криминалистику как имманентно связанные между собой части общего. Поясню это простыми словами на простых примерах.

Связь ДНК-криминалистики и ДНК-генеалогии наиболее очевидна.  В наличии такой связи можно убедиться, прочитав заключения суд.медэкспертов по вопросу идентификации останков семьи Романовых.
В этих заключениях методологические примеры собственно ДНК-генеалогии органично вписываются в более формализованные методы ДНК-криминалистика.  Методы ДНК-генеалогии хорошо аппроксимируют методы ДНК-криминалистики, однако только выводы с использованием четко регулируемой на законодательном уровне ДНК-криминалистики могут иметь практическое значение для установления определенных юридических фактов (факт происхождения одного лица от друга; установление личности).

Связь ДНК-генеалогии с медицинской генетикой гораздо менее заметна. Тем не менее, последние исследования в области ряда редких аутосомно-доминантных аутоиммунных синдромов выявили ряд закономерностей. Например, медики описали редкий синдром, встречающийся не более чем тысячи человек во всем мире. При изучении их генетических данных, у всех лиц с этим синдромом была выявлена общая мутация. Более того, эта мутация оказалась общей по происхождению — родословные линии всех носителей этой мутации восходили к одному голландскому моряку, который в 17 веке на протяжении нескольких десятков лет участвовал во многих морских экспедициях в Африку и Азию. До начало полномасштабного исследования, носители синдрома ничего не знали о своем родстве.  Таким образом, некоторые генетические синдромы могут рассматриваться как указания на генеалогическое родства.
Существует и обратная связь между медицинской генетикой и ДНК-генеалогия.
Эта связь находит свое выражение в одной из двух общепринятых методологией нахождения медицински релевантных мутациях. Речь идет о методе pedgree-analysis, метод изучения родословной семьи, в ходе которого изучается генеалогия расширенной семьи, определяются генотипы больных и здоровых членов семьи, и механизм наследования аномальных или дефектных версий генов.

Впрочем, c точки зрения новичка, столь тонкую грань между разными аспектами генетического анализа очень трудно уловить.
Именно поэтому очень часто новичок, получивший результаты медицинского ДНК-тестирования или сделавший анализ ДНК в лаборатории судмедэкспертов, обращается с просьбой проинтерпретировать результаты по неверному адресу (например на крупнейший форум молекулярной генеалогии — molgen.org).

Подобный случай произошел совсем недавно на вышеупомянутом форуме, когда новый участник попросил дать заключение в экспертной форме по данным cвоих аутосомных STR и аутосомных STR своего предполагаемого дяди.

Можно ли определить-«Мы родственники?»                                                                                                                                                     1.   D8S1179   8, 14  —14,17
2.   D21S11   28, 30—32.2, 33.2
3.   D7S820   8, 12—-12,12
4.   CSF1PO   10, 13—10,12
5.   D3S1358   17, 17—14,17
6.   TH 01   7, 9—-7,9.3
7.   D13S317   9, 13—11,12
8.   D16S539   11, 13—11,14
9.   D2S1338   20, 25—17,25
10.   D19S433   13.2, 15—13,13.2
11.   vWA   18, 19—15,16
12.   TPOX    8, 8—8,8
13.   D18S51   14, 15—12,17
14.   D5S818   12, 12—-11,12
15.   FGA   22, 22—-20,22
16.   Амелогенин (половая принадлежность)   X, Х—-YX

В целях облегчения понимания необходимо привести общедоступную информацию о системе STR-локусов аутосом (источник DNALab.ru)В большинстве случаев установления родства используются системы, основанные на аутосомных STR-локусах. К настоящему времени известно несколько сотен тысяч различных аутосомных STR-локусов, которые достаточно равномерно распределены по всему геному человека, что позволяет составить большое количество систем на их основе. В вероятностных расчетах, проводимых при оценке достоверности результатов анализов, используются данные популяционной генетики. Для корректного использования популяционных данных чаще всего необходимо, чтобы входящие в систему локусы были независимыми, то есть располагались на разных хромосомах, либо на одной хромосоме, но на достаточно большом расстоянии друг от друга. При выборе локусов-кандидатов учитывается данная особенность, характерная для анализа родства и идентификации человека на основе аутосомных маркеров.

Бурное и одновременное развитие методов ДНК-анализа для идентификации человека в различных странах привело к созданию баз данных STR-профилей лиц, совершивших преступления, и биологических объектов, изъятых с мест преступлений. Требование совместимости растущих баз данных привело к созданию региональных, а затем и международных стандартов для систем STR-локусов.

Так, в Европе, в результате сотрудничества Интерпола и организации ENFSI (European Network of Forensic Science Institutes) двенадцать маркерных STR-локусов (D21S11, FGA, vWA, TH01, D18S51, D3S1358, D8S1179, D1S1656, D2S441, D10S1248, D12S391, D22S1045) были приняты в качестве стандарта ESS (Extended European Standard Set). В стандартную систему, утвержденную латиноамериканской организацией GITAD — Grupo Iberoamericano de Trabajo en Analisis de DNA входят шесть локусов (TH01, CSF1PO, D16S539, D7S820, D13S317, TPOX). Наконец, система CODIS (COmbined DNA Index System), принятая в США и Канаде состоит из 13 локусов (TH01, CSF1PO, D16S539, D7S820, TPOX, D21S11, FGA, vWA, D8S1179, D3S1358, D18S51, D13S317, D5S818).

Как видно, по приведенной выше схеме, маркеры сравниваемых в нашем примере племянницы и дяди входят в  панель набора AmpFLSTR .

Но вернемся к нашему случаю. Итак, новичок-девушка задала на Молгене совершенно невинный вопрос, биологические родственники они с дядей или же нет. Естественно, конкретный характер вопроса предполагал получение квалифицированного экспертного заключения. Однако, по ставшей уже недоброй молгеновской традицией, вместо четкого ответа на вопрос, ее ожидания были вознаграждены отповедью двух лицемерных невежд, напустивших на бедную деву облако пустых словес и рассуждений в духе приснопамятного Полиграфа Шарикова («взять все и поделить на два!»).
Правда, чуть позже один все-таки взял себя в руки  и выдал нечто отдаленно смахивающее на экспертное заключение (впрочем, как мы покажем ниже, оно далеко не полное):

Если использовать нормализованные значения (то есть принцип УПСов), и не забыть при этом от маркера 12. TPOX взять только половину (там участок полного совпадения), то имеем 71.43% совпадения.

Вывод: с высокой вероятностью протестированный является дядей Кати.

Оставляя в стороне замечания по этике поведения, и сосредотачиваясь на сути вопроса нужно сказать, что так экспертные заключения не даются.

Возникает вопрос: а как надо было правильно анализировать данные новичка?

Как совершенно верно и четко отметил в ходе дискуссии уважаемый Владимир Рудич (один из немногих грамотных участников Molgena), по тесту аутосомных STR-маркеров надёжно можно установить родство между родителем и его ребёнком. И то при этом никогда не дают вероятность 100%. Обычно 99,99% или 99,999%,  в зависимости от количества протестированных маркеров. Для более далёких родственников можно определить только вероятность родства, причём она не будет близка к 100%. Есть специальные методики(обязательно учитывающие степень родства), утверждённые минздравом РФ для расчёта вероятности. Есть таблицы распространения аллелей в популяциях. Есть утверждённые вероятности мутаций. Естественно, зная механизм передачи аутосомных маркеров очевидно, что для разной степени родства расчёт вероятности будет разный.Надо знать родной это дядя или например двоюродный. В лабораториях, которые делают такие тесты, должны делать и расчёт вероятности.

 

От себя добавлю, что  в мире существует множество методик и критерии определения родства по аутосомным маркерам, а также специальное программное обеспечение.  Хорошим стартовым материалом для углубления в эту проблему является страница Американского Института Стандартов и Технологии (NISTR), на которой ведущий американский эксперт по аутосомным STR Люис О’Коннор, разместил ссылки на статьи и базы данных, связанных с этой проблемой. Поэтому, отсылая читателя к более компетентному источнику, я не буду подробно останавливаться на деталях принципа анализа. Отмечу лишь одно важное ограничение. К сожалению, большинство из двух дюжин программ анализа родства с помощью аутосомных STR являются коммерческими продуктами, и хуже того, распространяются на основании специальной лицензии среди сертифицированных центров судебной ДНК-экспертизы. Из небольшого числа доступных в trial-версии программ, можно отметить GeneProof2, который используется в работе Федеральным государственным бюджетным учреждением «Российский центр судебно-медицинской экспертизы  Минздрава России». Поскольку программа относительно проста, именно ее мы будем использовать для анализа.

Нужно отметить, что относительно небольшое число параметров влияет на надежность экспертного заключения. Например, в GenoProof2 нет параметра, которым задается вероятность мутации и т.д. Несмотря даже на столь важные ограничения, результаты анализа в программе выглядят гораздо более профессиональными, в сравнении с ехидными насмешками участников Молгена.

В первом анализе, мы допустили что новичок и ее дядя происходят из одной, российской популяции (программа загрузила усредненные значения аллельных частот по популяциям РФ). Нами были получены следующие результаты:

Тип предполагаемого родства

Единоутробные/единокровные братья и сестры / дедушка-внук / дядя, тетя-племянник, племянница

Вероятность  60.77847174  

Рейтинг: наиболее вероятное родства

Сводная вероятность: 24,0058

Тип предполагаемого родства

Двоюродные братья

Вероятность

29.53426894

Рейтинг

В два раза менее вероятно, чем родство по типу дедушка-внук / дядя, тетя-племянник, племянница

Сводная вероятность

11,6652
Тип предполагаемого родства

Братья и сестры

Вероятность

7.1554302

Рейтинг

8 раз менее вероятно, чем родство типа родства половинных братья и сестры / дедушка-внук / дядя, тетя-племянник

Сводная  вероятность

2,8262
Тип

Неродственники

Вероятность

2.53182912

Рейтинг

В 24 раза менее вероятно, чем половинные братья и сестры / дедушка-внук / дядя, тетя-племянник, племянница

Сводная вероятность  1,0000

Теперь посмотрим, изменится ли результат если мы допустим, что проанализированные индивиды происходят из другой популяции. В качестве популяции во втором эксперименте мы использовали популяцию басков.

Type Probability Rating Joint Probability
First Cousins 41.17540894 most likely 1.8924
Half Siblings / Grandparent-Grandchild / Uncle,Aunt-Nephew,Niece 35.21813837 equiprobable as First Cousins 1.6186
Unrelated 21.75884564 2 times less likely than First Cousins 1.0000
Full Siblings 1.84760704 22 times less likely than First Cousins 0.0849
Parent-Child 0 0.0000

Как видно из вышеприведенной таблицы, в случае с исходной популяцией басков,  вероятность типа предполагаемого родства. Наиболее вероятной степенью родства в этом случае являются двоюродное родства. Из этого следует один важный вывод; данные о аллельных частотах в популяциях предков сравниваемых индивидов имеют критическое значение для оценки вероятности той или иной степени родства.