Анализ древней ДНК – проблемы, их преодоление и результаты

На портале Генофонд.ру размещен реферат важной статьи, подводящей промежуточные итоги изучения древней ДНК. Я позволю себе удовольствие процитировать себе некоторые места этого замечательного обзора, написанного ув. Надеждой Марковой

Термин «древняя ДНК» возник в научной литературе в 1980-х годах в связи с появлением новой области исследований, которая получила название «молекулярная палеонтология». С развитием сначала методов ДНК-амплификации (полимеразной цепной реакции), а потом методов секвенирования нового поколения эта область получила мощный толчок к развитию и сегодня стала основным средством реконструкции эволюции живых организмов, и в том числе реконструкции истории человека.

Революция в эволюционной генетике

Исследование древней ДНК совершило революцию в эволюционной генетике, так как появилась возможность напрямую исследовать прошлое, законсервированное в «капсуле времени» ДНК, пишут авторы статьи. Работы последних десятилетий показали, что древняя ДНК может сохраняться в костях, зубах, мумифицированных и замороженных тканях, и может быть извлечена из этих древних образцов. Впервые древняя ДНК была извлечена в 1984 г. (Higuchi et al.) из высохшей мышцы вымершего родственника зебры. Но ее анализ целиком зависел от развития технологий, поэтому стал возможен с появлением ДНК-амплификации (метод полимеразно-цепной реакции – ПЦР), и вышел на новый уровень с появлением методов секвенирования нового поколения. На рисунке авторы представили основные вехи в истории изучения древней ДНК.

О методологии исследования палео-ДНК

Методы палеогенетики оказались незаменимы, чтобы разобраться в  ключевых этапах человеческой цивилизации. Например, понять, как именно происходила смена обществ охотников-собирателей на первых земледельцев, как распространялось по Европе сельское хозяйство – имела ли место передача технологий от одних популяций другим или же происходила смена самих популяций («циркуляция идей или людей»). Анализ древней ДНК показал, что между периодами 8 и 5 тысяч лет назад Европа не была генетически однородной: первые земледельцы с Ближнего Востока мигрировали в Западную Европу и  смешивались там с местными охотниками-собирателями. В Восточную Европу около  6-5 тыс. лет назад туда пришли группы людей из Анатолии, которые смешавшись с охотниками-собирателями, дали начало популяциям скотоводов, наиболее успешная из которых известна по ямной культуре.  Полагают, что именно миграции ямников из понто-каспийских степей на запад и на восток около 4,5 тыс. лет назад можно связать с распространением технологий и, возможно, языков индоевропейской семьи.

Древняя ДНК может помочь и в изучении развития признаков, характерных только для Homosapiens, таких как речь, подчеркивают авторы статьи. Изучение генетических вариаций, связанных с языком, дает информацию о том, когда мог возникнуть сложный  язык, присущий человеку. Так, было показано, что определенный вариант гена FOXP2 (именно его в первую очередь связывают с развитием речи)  имелся уже у неандертальцев. Вероятно, считают специалисты, этот вариант возник у общих предков неандертальцев и современного человека.

Древняя ДНК помогает в изучении адаптации человека к разным условиям среды. При анализе древних геномов в них были выявлены сигналы отбора, связанных с изменением диеты, чувствительностью к ультрафиолету  и пр. Так, становится ясно, как распространялись по Европе такие черты, как светлая кожа и толерантность  к лактозе (способность переваривать молоко во взрослом возрасте).

Трудности в изучении палео-ДНК и их преодоление

Одна из основных проблем, с которыми сталкиваются исследователи древней ДНК, это ее деградация, которая неизбежно происходит со временем.  Обычно ДНК из древних образцов сильно фрагментирована, загрязнена микробной ДНК и химически модифицирована. Причем степень деградации  в больше степени зависит от условий, в которых находился древних образец (температура, влажность), чем от его возраста. Последние исследования показали, что теоретический предел возраста образца, из которого можно извлечь ДНК, составляет 1-1,5 млн лет. Авторы описывают методы, которыми можно преодолеть трудности, связанные с особенностями древней ДНК.

Фрагментация ДНК может быть частично преодолена с помощью современных протоколов, позволяющих извлекать и анализировать очень короткие фрагменты, длиной 50-70 нуклеотидов. К тому же, методы секвенирования нового поколения ориентированы на анализ коротких фрагментов, длина которых составляет 50-100 нуклеотидов.

Большую проблему составляет контаминация древней ДНК современной ДНК. Преодолеть ее нужно путем строгого соблюдения протоколов, учитывающих правила сбора образов, обработки рабочих помещений, применение методов ДНК-аутентификации, независимой перепроверки результатов и пр. Развиваются также методы механической и химической деконтаминации – авторы их описывают.

Еще одна важная проблема – посмертное изменение ДНК из-за гидролиза и окисления, вызывающее деаминацию нуклеотидов, которая ведет к ложным результатам ПЦР. Авторы описывают несколько молекулярно-генетических и биоинформатичесих подходов для преодоления этой проблемы, с ними можно ознакомиться в тексте статьи.

Инструменты анализа

С увеличением числа образцов древней ДНК ученые получают возможность исследовать древнюю генетическую изменчивость на популяционном уровне и сравнивать ее с современной. Различные методы (PCA, STRUCTURE, ADMIXTURE, SPAMIX, SPA, ADMIXTOOLS, GPS, LAMP, HAPMIX,  reAdmix, MUTLIMIX, mSpectrum, SABER и др.), которые были разработаны для анализа современных популяций, применяются и к древним популяциям. В комбинации с антропологическими данными и историческими  сведениями они позволяют реконструировать пути миграций, определять состав предков той или иной популяции, выяснять географическое  происхождение гаплотипов.

Эпигенетика и палео-ДНК

Фенотипическое проявление генотипической изменчивости зависит не только от изменчивости тех или иных аллелей в геноме, но и от степени экспрессии генов, а она во многом определяется химическими модификациями, не затрагивающими последовательность нуклеотидов в ДНК, то есть эпигенетическими. Это метилирование ДНК, модификация белков-гистонов, спектр некодирующей РНК. Последние исследования показали, что некоторые эпигенетические модификации сохраняются и postmortem. Так, удалось картировать метилирование генома неандертальцев и денисовцев. Выяснилось, что некоторые гены были более метилированы у древних людей, чем у современных. Анализ метилирования позволяет также определить возраст индивида (как современного – что важно для криминалистики, так и древнего).

Предварительный обзор нового этнокалькулятора от FTDNA myOrigins

Предварительный обзор нового этнокалькулятора от FTDNA myOrigins (дополнено 06.05)

Сегодня компания FTDNA открыла ограниченный доступ к бета-версии своего нового этнокалькулятора, который должен прийти на смену Population Finder. Необходимость замены старой утилиты давно назрела — предикты, выдаваемые этим инструментом, отличались крайней неточностью, и выглядели откровенно неудачно на фоне продукта основного конкурента — Ancestry Composition от 23andMe.

Видимо, после недавнего фиаско с громким анонсом обновленного дерева Y-DNA, в компании решили проявить разумную осторожность и открыли доступ к новому продукту лишь админам проектов, предупредив, что это закрытый бета-тест. На текущий момент можно видеть результаты лишь примерно половины участников (остальные, вероятно, ждут просчета. К сожалению, в этот список попал и я. Дополнение — как выяснилось, «переносы» из 23andMe все же были просчитаны, но не поставлены ссылки  на результат), однако этого достаточно для предварительной оценки нового инструмента.

Видно, что проделана большая работа, и в целом myOrigins (а именно так решили назвать Population Finder 2.0) выглядит гораздо достойнее своего предшественника. Выделен ряд географических зон, к которым может быть отнесен геном тестируемого, полностью либо частично. Зоны, к которым отнесена хотя бы часть его наследственности, выделяются на карте. Чем выше вклад зоны, тем ярче пятно. Похромосомного режима, как в Ancestry Composition, нет. Впрочем, выделяемые им сегменты часто бывают довольно сомнительными, поэтому я не считаю данный факт недостатком myOrigins. Как и следовало ожидать от компании, ориентированной в первую очередь на покупателей из Северной Америки и Западной Европы, наибольшей детализации подверглась Северо-Западная Европа. Она разделена на три близких между собой зоны — «британскую» Coastal Islands, «франко-германскую» Coastal Plain и «скандинавскую» Northlands.

Насколько хорошо получилось произвести разделение, покажет будущее — я в основном обратил внимание на компоненты, важные для восточноевропейцев. Кстати, возникает ощущение, что названия и кое-что в описании зон взято из другой версии программы, поскольку они зачастую плохо стыкуются с картой. Так, «балто-славянское» пятно названо Trans-Ural Peneplain, однако при этом нарисовано на территории Польши, Белоруссии и Украины. Но я забегаю вперед. Итак, две основные зоны, выделенные для Восточной Европы — это «балто-славянская» Trans-Ural Peneplain и «финская» North Circumpolar. Кроме этого, довольно часто проявляется «восточноазиатский» компонент Asian Northeast. Распределение выглядит разумно — украинцы, белорусы, южные русские преимущественно относятся к «балто-славянской зоне», со сдвигом к северу растет вклад «финской» зоны. «Восточноазиатский» компонент, проявляющийся у северян, не удивляет, а то, что он периодически встречается у украинцев, можно отнести на влияние Степи. Впрочем, конкретные соотношения двух основных восточноевропейских компонентов у некоторых участников вызывают подозрение в заметных случайных отклонениях процентовки. Дополнение — подозрения перешли в уверенность.

Тем большее удивление вызывают результаты некоторых представителей народов Поволжья и Урала. У них «найдены» «британский» и «франко-германский» компоненты, причем процент может доходить до 20. Думаю, причина здесь в отсутствии «уральской» зоны. Судя по описанию, ее роль должен был взять на себя «финский» компонент, якобы доходящий вдоль Полярного Круга до самой Гренландии. Частично ему это удается — видно, что у чувашей, марийцев, татар его много. Однако финны очень своеобразны, и не могут полностью отображать все не-азиатское разнообразие Севера Евразии. Как результат — заметную часть генома уральцев алгоритм не может отнести ни к «финскому», ни к «балто-славянскому» компоненту, при этом видно его европейское происхождение. Подозреваю, что такие варианты «на всякий случай» относят к британцам. Логично для алгоритма, рассчитанного в первую очередь на американцев.

Дополнение — как оказалось, «франко-германская» зона довольно часто рисуется и восточным славянам. Видимо, дело здесь не только в отсутствии «уральской» зоны, но и в других особенностях используемого алгоритма. «Британская» зона так и продолжает связываться с «уральцами».

Другие зоны, могущие представлять интерес — «средиземноморская» North Mediterranean, «анатолийско-кавказская» Anatolian Crossroads, «афганско-среднеазиатская» Eurasian Heartland, «америндская» Bering Expansion. Все эти компоненты могут встречаться в небольших количествах у восточноевропейцев, обычно их присутствие вполне оправдано.

На мой взгляд, в целом выделение зон сделано вполне разумно. Основная претензия — отсутствие «уральской» зоны, но честно говоря, сложно ожидать от американской компании внимания к этой тонкости. Излишнее выделение зон в Европе также вполне понятно. Дополнение — к недостаткам я бы отнес и отсутствие варианта «nonspecific» для неопределенных случаев, как сделано в Ancestry Composition. Тогда казусов с неверным разнесением по зонам было бы меньше. На первый взгляд, продукт получился вполне на уровне конкурента, а значит, компания может не беспокоиться еще несколько лет )). После полного просчета результатов всех участников и перехода утилиты в открытый вид мы увидим, действительно ли это так.

Дайджест новостей геномики и генетики за февраль 2014

Несмотря на то, что февраль — самый короткий месяц в году, он был также наполнен многими знаменательными и значимыми событиями в области геномики и генетики.


Авторы программы Plink (незаменимого инструмента для работы со снипами) порадовали энтузиастов-любителей и профессионалов релизом новой версии своей программы Plink2 (Plink1.9). В новой версии добавлено множество новых функций, позволяющих работать с форматами данными секвенирования нового поколения. Cамое главное — это значительное (в десятки и сотни раз) ускорение скорости обработки данных, а также устранению ограничений на размер выборки, благодаря чему можно собирать громадные массивы данных (сотни тысяч людей генотипированных по миллионам снипов):

Беспрецедентная скорость
Благодаря интенсивному использованию битовых операций , последовательных шаблонов доступа к памяти , многопоточности и алгоритмических улучшениям более высокого уровня , Plink 1.9 гораздо быстрее, чем Plink 1,07 и другие популярные программы . Некоторые из самых ресурсоемких задач  , в том числе вычисление IBS-матрицы , расстояний на основе кластеризации , LD-коррекция и пермутационный анализ геномных ассоциации , в настоящее время завершить в сотни или даже тысячи раз быстрее , и даже выполнение  тривиальных операций  ускоряется, как правило, в 5 — в 10 раз благодаря улучшению модели ввода / вывода данных.


В журнале «Труды Королевского общества Британии) опублкиована статья о том, являлся ли риск развития рака кожи селективной причиной появляения черной пигментации кожи в начале эволюции гоминидов.  Критики  указывают на тот аргумент,  что рак является, очевидно, болезнью, проявляющейся в конце жизни, и поэтому онкологические заболевания не могут играть значительной роли в  селективном отборе. Сторонники же мнения, содержащегося в статье, приводят следущие убедительные доводы: химические процессы , вызванные ультрафиолетовым излучением приводят к разрушению фолиевой кислоты , а это, в свою очередь, приводит к повышенной частоте выкидыша из-за дефектов нервной трубки (neural tube). Представляется возможным согласовать эти выводы эволюционной биологии с некоторыми молекулярно-генетическими открытиями последних лет.  В свете новых данных, серьезным фактором сдерживающего отбора являются генетические изменения в домене гена  MC1R около 1-2 млн. лет назад.  Согласно этой модели, чдревние гоминиды, при перемещении в область африканской саванны , потеряли свою шерсть в связи с нуждами терморегуляции , а затем приобрели темный  цвет кожи, чтобы защитить себя от радиации.


Разиб-хан разместил в своем блоге интересные рассуждения о CRISPr (новой парадигме, cоединяющей в себе генную инженерию и клонирование) и  глубоких генетических связях населения южной и юго-восточной Азии (т.н. «Австрало-Меланезийский» компонент).


Как я уже писал ранее в своем блоге, значительные усилия современной медицины и генетики направлены на решение проблем продления жизни (и не столько из-за любви к человечеству, сколько в целях предотвращению неминуемой пенсионной катастрофы 20-ых-30-ых годов этого века). В феврале в СМИ был опубликован анонс нового стартапа Human Longevity Inc, который планирует использовать новейшие наработки в области геномики, экзомики, протеомики в целях решения проблемы продления жизни. Начальный капитал стартапа составляет $70 млн — и этого хватит на то, чтобы построить крупнейший в мире центр по секвенированию человеческого генома, который превзойдёт даже китайскую компанию BGI. Фирма планирует приобрести 20 новых секвенирующих машин компании Illumina за миллион долларов каждая. После выхода на полную мощность стартап снизит стоимость получения человеческого генома до $1 000.


Исследовательница Kasia Bryc, работающая в компании 23andme, объявила, что согласно ее исследованиям, примерно 4% живущих в США американцев имеет 1% или более процентов африканских «генов». У афроамериканцев этот процент составляет 73%, процент европейских «компонентов» примерно 27%, в то время как у латиноамериканцев расклад более пестрый (70% европейского генетического происхождения, 14% — коренного американского населения, и 8% африканского


В новой работе по филогенетической структуре гаплогруппы R1b-M269  (Recent Radiation within Y-chromosomal Haplogroup R-M269 Resulted in High Y-STR Haplotype Resemblance ) на пример анализа гаплотипов подгрупп R1b-M269 было показано, что в тех случаях, когда происходит стремительное  расширение носителей гаплогруппы, точное определение положение гаплотипа в структуре филогенетического древа на основании данных о вариациях гаплотипов невозможно. В этих случаях нужно прибегать к детальному изучению одиночных бинарных полиморфизмов (снипов).


В новой работе  Using ancestry-informative markers to identify fine structure across 15 populations of European origin затрагивается актуальная для любых этно-геномных исследований проблема AIM (ancestry informative markers — информативных маркеров этно-популяционного происхождения).  Авторы исследования считают, что вместо традиционно принятого порога фильтрации снипов с частотой минорного аллеля менее чем 5% нужно использовать значительно пониженный порог в 1%. В противном случае теряется значительное число высокоинформативных маркеров (снипов).
Признаюсь, что при составлении всех выборок для будующих своих этно-популяционных калькуляторов, путем метода проб и ошибок, я, независимо от авторов этой статьи, пришел к выводу о том, что нужно использовать именно этот порог в 1% (он использовался во всех моих этно-популяционных калькуляторах).


В еще одной любопытной февральской статье  «No evidence that natural selection has been less effective at removing deleterious mutations in Europeans than in West Africans», группа исследователей приводит убедительные эмпирические доказательства одинаковой эффективности естественного отбора в европейских и западно-африканских популяциях.  В основе работы лежит хорошо продуманный и грамотно выполненный анализ соотношения мутации в синонимических и несинономических сайтах генома. Как известно,  в геноме неафриканских популяций хорошо заметны следы так называемых бутылочных горлышек (ботлнеков)  после разделения этих популяций людей с  популяциями Западной Африки. Наблюдаемая картина натолкнула некоторых исследователей на мысль, что естественный отбор, (в узком смысле вымывания из популяции вредных мутаций), возможно был менее эффективен в неафриканских популяциях. Чтобы  проверить эту гипотезу, ученные измерили динамику накопления вредных мутаций в  геномах самых разных людей. Существенных различий между африканцами и неафриканцами обнаружено не было, хотя у  архаичных «денисовских людей» темп накопления несинонимичных мутаций был гораздо выше, чем у современных людей,  что соответствует более длительному времени разделения современных и архаичных людей. Авторы пришли к выводу о том, что те эмпирические закономерности, которые были истолкованы как свидетельство менее эффективного удаления вредных мутаций у неафриканцев, были вызваны не различиями в характере отбора после разделения африканских и неафриканских популяций, а как следствие нейтральной эволюции.


Команда Понтуса Скоглунда продолжает работу над изучением древних «ископаемых» ДНК — в феврале была опубликована статья с результатами изучения митохондриального ДНК окладниковского неандертальца. Как всегда, этот коллектив демонстрирует блестящее владение техникой отделения аутентичного ДНК останков архаичных людей от ДНК современных людей, загрязнивших исследуемые образцы при своей работе.


Кроме того, в феврале были опубликованы важные статьи о присутствии генетического сигнала о древних популяционных контактах (∼900–1,800 лет тому назад) между Западной Азией и южной/восточной Африкой (Pickerell et al.2014), эпохальные блестящие работы содержащие результаты изучения генома древнего индейца Anzik (Rasmussen et al. 2014)  и метод изучения эпигенетических аспектов древних геномов (прежде всего уровня метиляции ДНК) и реконструкции нуклеосомной карты древних геномов (Pedersen et al.2014).

 

 

 

Дайджест новостей генетики и ДНК-генеалогии за январь-февраль 2014 года (часть 2)

**

Разработчики pyGenClean разместили полезный инструмент для предварительной подготовки выборки популяций для GWAS и этно-популяционного анализа. С помощью можно значительно автоматизировать относительно сложный процесс нахождения генетических outliers (т.е посторонних образцов выделающихся на фоне гомогенной однородной структуры популяции), а также провести многомерное шкалирования имеющихся популяций.

**

Я закончил проект по изучению структуры аутосомного генофонда грузинских этнографических групп. Ниже приведены выполненные в проекте публикую графики c результатами многомерного скалирования (MDS) и  анализа главных компонент (PCA) в изученной выборке. Еще я понял свою главную ошибку во время работы с предыдущими графиками — она состоит в том, что я раньше не сохранял в R framework данные и историю проделанных над ними операций. R очень гибкая среда для статистического анализа, но в силу большого разнообразия существующих пакетов для визуализации данных для выполнения одних и тех же команд часто возникает путаница с выбором подходящей техники визуализации. Поэтому лучше всего не начинать каждый раз с нуля, а сохранять workflow для последующих экспериментов. 1488015_10202873063857417_243934024_n 1526938_10202873450227076_1155088601_n

**

В русскоязычном секторе Интернета увеличивается число простых людей (и не совсем простых людей, вроде Татьяны Толстой), которые не боятся рассказывать открыто о своих генетических рисках, хотя в силу своего непонимания того что именно означает указанная в отчете risk odd (вероятность риска) , многие их выводы выглядят наивными.
Впрочем, ничего нет нового под Луной. Многие из моих сверхоптимистеских собеседников предполагали, что именно благодаря 23andme у рядового обывателя появилась возможность  наблюдения за своими генотипами (или геномами , под которым мы — summa summarum — понимаем здесь всю совокупность прочитанных генотипов), и даже за динамикой экспрессии свого экзома.
Тем не менее, даже я помню, как задолго до начала моего увлечения генетикой, примерно в 2002 году я видел передачу про исландскую компанию Decodeme по Discovery Channel. После длинного интервью с тогдашним ведущим сотрудником этой компании (К.Стефансон), в котором он рассказал о тотальном (почти 80%) генотипировании всей исландской нации, создатели фильма взяли краткие интервью у простых исландцев. Мне запомнился один исландец-докер, который — не отрываясь от процесса разгрузки траулера с рыбой, — с улыбкой на лице сказал: «Я могу выпивать по 10 чашек кофе в течении одного часа. Cогласно исследованиям ученных из DeCODE Genetics, в гене метаболизма кофеина у меня аллельный вариант, повышаюший скорость метаболизма кофеина».
Вывод — 23andme не были первыми, их заслуга в другом — в том что они вывели персональную геномику (в ее упрощенной форме) на новый, международно доступный уровень.

**
Компания Nanoporetech выпустила на рынок портативное устройство MinION, предназначенное для анализа молекул (в том числе и молекул ДНК), его можно применять для анализа структуры протеина и секвенрования ДНК. Устройство можно подключить к обычному компьютеру через USB-порт.
**

Уважаемый Pavel Bernshtam предложил реалистичную перспективу на стартапы. Кроме всего прочего, между строк замечаний Бернштама можно прочитать имплицитное неявное объяснение феномена значительной молодости самых известных стартаперов (им нечего терять и их руки-головы не связаны-загружены семейными обязанностями прокормки супруги и спиногрызов).
Я стою на перепутье выбора между развитием идеи этно-популяционного ДНК-калькулятора в форме стартапа, либо форме краудсорзинга, либо некоммерческая инструментализация разработки в криминалистике (в виде патента на методику нового вида криминалистической ДНК-экспертизы, которая со временем заменит надоевший всем фбр-овский CODIS):

«Хорошо, если просили про стартапы. Для стартапа нужно несколько вещей. Самое простое — идея. Идея сама по себе не стоит ничего. 0. Самая классная идея — НИЧЕГО. Идея начинает хоть что то стоить (тоже немного) если на ее основе написан бизнес план. Обоснованный бизнес план. Бизнес план, который может убедить. Сколько юзеров придет к вам на сайт в первые полгода? миллион? А почему? Докажите. А сколько зарегестрируется? Почему?
Следущее, что нужно — человек, который может принести инвестиции. Для этого нужно — представительность, бизнес план, знакомства и уйма всего иного. Нужно найти выход на инвесторов (без выхода тоже можно, но разговаривать с тобой будут иначе), нужно что бы тебя порекомендовали, нужно уметь рассказывать и убеждать. Далее — деньги. Скорее всего у Вас не получится сделать прототип, достаточный для получения инвестиции вечером на коленке, параллельно с основной работой. Вам надо будет уволиться и писать код.»

**
Как Вы помните, на Gedmatch.com были размещены разработанные мною этно-популяционные калькуляторы MDLP на платформе DIY Dodecad. Они позволяют довольно-точно определять этническое и популяционное происхождение исходя только из сравнительноого анализа частот полиморфизмов ДНК протестированного человека с частотами полиморфизмов ДНК в референсных популяциях. Несмотря на простоту использования (загрузил свое raw data, нажал на кнопку — получил результат), основные пользователи этого инструмента — американцы — имеют траблз с пониманием и интерпретацией результатов. Вот например, из свежего, присланного мне в январе. Ко мне уже обращаются как к доктору, который должен выдать свой авторитетный этнодиагноз:

» I had my test at 23and me and it has me as 100 European.
My mom says its a lie as my dad was an inuit from Alaska .My kit is ******
Could you please debunk inuit story»

Papa was a rolling stone (c)

«My results are for North-Amerind, (North American Indian) .. I suspect 4 generations back

Chr 1 1.7%
Chr 7 3.3%
Chr 18 2.5%

Is this a definite result for American Indian Heritage?»

На такие письма я вообще больше не отвечаю. Весьма странно что у столь многих американцев в последнее время появился фетиш происхождения от американских индейцев. Раньше это было не так заметно.

**

Повторное ресеквенирование «древнего» генома останков жителя мезолитической Иберии из La Brana 1 (того самого, которого исследовали в позапрошлом году на аутосомы и митохондриальный геном) показало, что этот человек имел очень необычную для Европы Y-хромосомную гаплогруппы — С6. Странности заметны на и уровне фенотипа: согласно анализу комплекса снипов, определяющих на уровне генотипа цвет кожи и глаз, он был темнокожим человеком с голубыми глазами (!).  У древнего европейца, жившего в пещере Ла-Бранья-Аринтеро (La Braña-Arintero, León) на севере Испании примерно 7 тысяч лет назад, были голубые глаза и очень смуглая кожа. Так художник представил себе то, как выглядел житель испанской пещеры 7 тысяч лет назад. (Ниже рисунок, опубликованный в Эль Паис.)

Палеогенетики успешно прочитали ДНК из костей древнего европейца, жившего в одной из пещер на севере Испании примерно 7 тысяч лет назад, и выяснили, что у него были голубые глаза и очень смуглая кожа, говорится в статье, опубликованной в журнале Nature. «Главным сюрпризом для нас стало то, что этот человек обладал типично «африканскими» версиями генов, которые управляют пигментацией кожи, что вероятно делало его очень смуглым или даже темнокожим, хотя мы и не можем точно определить ее тон. Еще более удивительным стало то, что этот «испанец» обладал теми вариациями генов, которые делают глаза европейцев голубыми, что делает этот геном уникальных, так как по всем остальным признакам он происходит из Северной Европы», — заявил Карлес Лалуэса-Фокс из Института эволюционной биологии в Барселоне (Испания). Что касается редкой гаплогруппы (C6, или по мнению некоторых исследователей просто C), то оказывается, что еще в 2013 году несколько любителей-непрофессионалов предсказывали вероятность присутствия С у части жителей палеолитической и мезолитиской Европы — по их мнению, мужское население палеолитической Европы могло принадлежать к линиям — C-V20 (в ISOGG С6), F и IJ.

«Ранние представители современного человека в Европе (EEMH), широко известные как кроманьонцы, мигрировали с Ближнего Востока в Европу несколькими волнами. Задумывашись над тем, какие гаплогруппы Y-ДНК могут быть связаны с ними, и в каком порядке они мигрировали в Европу, я придумал следующую хронологии для верхнего палеолита.

1) Гаплогруппа С6 (или С *, которая развилась в C6 в Европе)

2) Гаплогруппа F

3) Гаплогруппа IJ (которая развилась в Европе в гаплогруппу I) «

Заслуживает внимание и мастерское использование в данном исследовании методов секвенирования нового поколения — в частности, после того как генетики собрали геном древнего европейца из прочитанных мелких сегментов ДНК («ридов») по методу отображения ридов на референсный геном человека,  осталось приличное количество неиспользованных ридов. Генетики использовали «сухой остаток» для проведения метагеномического анализа. Как известно, метагеномика работает с набором всех ДНК находящихся в среде; следовательно генетики сделали удачное предположение о том, что «риды» без привязки к человеческому геному принадлежали геномам бактерии. BLAST-анализ ридов в Генбанке позволил установить те виды бактерий, секвенсы геномов которых были наиболее близки к изучаемым ридам.


В конце января были опубликованы две замечательные статьи на русском языке, посвященные бурно развивающейся области исследований — молекулярной патологии: «Молекулярная патология и роль врача-патологоанатома»  и «Наследственно обусловленный рак молочной железы и яичников«.


The Coop Lab продолжает размещать материалы о статистических рассхождениях в характере наследования генетического материала у ближайших родственников. Традиционно считается, что сибсы (сиблинги) одного пола похожи друг на друга в той или иной степени. Различие в фенотипических чертах объясняются разными факторами окружающей среды воздействующих в разной степени на их развитие. Тем не менее, как было показано в статье The Coop Lab,сибсы различаются также на уровне своего генома, за счет случайности сегрегации и рекомбинации.


Китайские генетики разработали  новый метод генной хирургии (точное геномое редактирование) и успешно применили его на макаках.


Ученные из университета Северной Аризоны «возродили» вирус древней чумы, пандемия которой пришлась на время правения византийского императора Юстиниана (Юстинианова чума). В лаборатории был прочтена последовательность ДНК бактерии-возбудителя чумы, которая содержалась в останках жертв этой пандемии. Очевидно, здесь также применялись методы метагеномики.


В сетевой версии журнала «Наука и жизнь» размещена статья о характере генетической интрогрессии (межвидовым обменом чужеродной генетической изменчивостью) произошедшей между неандертальцами и предками анатомически современного человека много десятков тысяч лет назад, и приведшей к частичной гибридизации двух видов, чьи эволюционные пути разошлись около полумиллиона лет тому назад:
«Оказалось, что практически все неандертальские гены локализованы в Х хромосоме, а значит, передались нам по женской линии. Ученые пришли к выводу, что мальчики, рождавшиеся в результате смешения кровей, были в большинстве своем бесплодны. «Когда неандертальцы и люди скрещивались, это было на краю биологической совместимости, ведь два генома не встречались друг с другом примерно полмиллиона лет», — комментирует результаты исследования один из его авторов Дэвид Рейч, генетик из Медицинской школы Гарварда (США).»

Я еще в 2010 году говорил, что если смешивание с неандертальцами происходило, то скорее всего гены были привнесены от связей между мужчинами homo sapiens sapiens и женщинами-неандертальцами. Не откажу себе в удовольствии процитировать свое сообщение на форуме Молгена.

«Re: Люди носят гены неандертальцев
Ответ #23 : 10 Май 2010, 19:40:25  Самое неубедительное в обеих работах это
1)отбор снипов для анализа (перекрестное сравнение снипов орангутанга, человека и шимпанзе — выбрали те, которые у человека являются, как считается, потомковыми).
2) по отобранным снипами произвели выравнивание (alignment) секвенсов шимпанзе, человека и неандертальца фазирование предкового генотипа общего предка человека, неандертальца и современного человека (т.е говоря проще, реконструировали (предсказали) гипотетический генотип по методу Байесовской апостериорной вероятности)
3) затем разбили фрагменты генома неандертала по снипами по признаку совпадения или несовпадения с предковыми значения гипотетического секвенса общего предка шимпанзе и гомо, на три группы -гомозиготные с предковым значением снипа, гомозиготные с потомковым значением и просто гетерозиготы. Про исключение более половины мутаций (пусть и синонимических), я вообще молчу. Но кто может гарантировать, что предковый генотип реконструирован верно, и, что самое главное — где доказательство того, что у неандертала должно быть именно предковое значение снипа, а не мутировавшее параллельно с человеком.
Наконец, на приведенном выше графике, разброс участков генома совпадающих у человека и неандертальца по X хромосоме, находится в меньшем диапозоне SD (стандартного отклонения), эти участки небольшие, но по структуре более дивергентные.
Из чего следует 2 вывода:
a) основное генное вливание шло через X хромосому и b) поскольку около 2/3 генетической информации X хромосомы аккумулируется в женских линиях, то направление вливания шло через самок неандертальцев и мужчин-сапиенсов, что несколько противроечит картине изображенной в первой статье.»

Любопытно, что при ресеквенировании геномов неандертальцев и секвенировании геномов новых неандертальцев (из пещеры Окладникова) применили новый метод секвенирования. В частности, они секвенировали митохондриальную ДНК из кости неандертальца и отделили ее от ДНК современного человека, что позволило доказать родство между жившими в Сибири и в Европе неандертальцами.Метод определения посторонних наслоений ДНК основан на анализе ее естественных мутаций. Так, у 30–40% образцов, возраст которых насчитывает несколько тысяч лет, цитозин превращается в тимин, а гуанин — в аденин. Ученые разработали систему, моделирующую процессы естественного изменения ДНК и сравнивающую полученный результат с данными образца.

Аналогичная методика была применена и в отношении менее древних образцов ДНК. Насчет мезолитических образцов из работы Лазаридиса, я не читал ту часть сапплемента где описывается техническая сторона опыта. Но в другой работе упомянутого в статье Скоглунда (Skoglund et al .2012) — в неолитическах образцах результаты поссмертной гидролитической деаминации (cytosine —> thymine or guanine —> adenine) были удалены. Но у неандера разумеется из было горадо больше и пришлось придумывать методику реконструкции первоначальных нуклеотидов.Кроме того, в статье Lazardis et.al.2013 (точнее в сапплементе) содержится указание на использование урацил-ДНК-гликосилазы и эндонуклеозы при подготовке библиотек для сиквенирования.Использование этого метода значительно (!) уменьшает включение деаминированных остатков C/G→T/A (здесь подробности).


Уважаемый «любитель» Владимир Таганкин на основе большого эмпирического материала (десятки тысяч гаплотипов) провел серьезное исследование дисперсии значений локусов Y-STR. Это исследование  по своему качеству превосходит многие статьи профессиональных популяционных генетиков.


В статье доктора Линча известный «феномен раздутости нефункциональной части человеческого генома» объясняется сочетанием ряда генетических факторов. Мутации, увеличивающие размер генома (дупликации), с гораздо меньшей вероятностью вредят организму, чем мутации, при которых часть генома теряется (делеции). Поэтому с увеличением частоты мутаций геном начинает непроизвольно расти. То есть причинно-следственная цепочка тут следующая:

малый размер популяции > увеличение генетического дрейфа > нарушение аккуратности репликации генома (увеличение частоты мутаций) > увеличение размера генома.

Как мне кажется, это объяснение можно применить к анализу всех мутаций, в том числе и STR (коротких тандемных потворов).


В январе и начале февраля было опубликовано несколько статей, в которых затрагивается тематика ДНК-криминалистика. Так в ходе проведенного Федеральным Бюро Расследований США аудита национальной базы данных ДНК, было обнаружено 166 ДНК-профиля, которые содержали ошибки. Часть этих ошибок появилась в результате ошибок клерков, другая часть связана с ошибками при интерпретации данных допущенных сотрудниками лабораторий. Проведенная тогда же проверка профилей ДНК в базе данных города Нью-Йорке дала аналогичные результаты. Неприятный факт обнаружения ошибок в STR-профилях ДНК поднимает старые вопрос о необходимости замены существующей системы CODIS. В более ранней работе, в которой рассматривалась роль и место устаревающей, но по-прежнему существующей системы CODIS в системе быстро развивающегося комплекса знаний о геноме человека, авторы сделали интересный вывод: несмотря на то, что маркеры CODIS часто лежат в пределах геномных и генных доменов, связанных с риском развития определенных заболеваний или отвечающих за определенные функции генома, не было найдено никаких  убедительных доказательств того, что «короткие тандемные повторы», используемые в качестве маркеров CODIS, могут помочь установить физические черты человека.  Наконец, в совсем новой работе по ДНК-криминалистике («Recent Advances in Forensic DNA analysis«), наряду с обсуждением сугубо технических моментов сбора и подготовки биологического материала к анализу, затрагивается и вопрос о возможных альтернативах STR (коротких тандемных повторов), т.е того типа маркеров которые лежат в основе системы CODIS. Одной из логичных альтернатив являются однонуклеотидные полиморфизмы (снипы). Одним из преимуществ снипов над STR является тот факт, что в сильнодеградированные фрагменты ДНК могут быть проанализированы только с помощью снипов. Будучи биаллельным маркером, снип может быть включен в ДНК-профиль, однако информативность одичного снипа гораздо ниже информативности STR-локусов, в силу чего  процесс установления личности при работе со смесью разнородных ДНК усложняется. Хотя единчный снип менее информативен ( в силу биаллельности), чем STR, но этот недостаток можно легко избежать за счет увеличения  количества SNP(снип)-маркеров, используемых при анализе. Разный уровень гетерозиготности  является одной из наиболее ценных особенностей снипов. Другой положительной чертой снипов является то, что при определении снипов нет нужды на разделение сегментов по их размеру, что делает мультиплексирование и автоматизации более доступны, чем  в анализе коротких тандемных повторов. Кроме того,  низкая скорость мутации снипов значительно улучшает их стабильность в качестве генетических маркеров.

 

Дайджест новостей генетики и ДНК-генеалогии за январь

В январе, несмотря на рождественские каникулы, ученые порадовали энтузиастов изучения ДНК и генетики целым спектром значимых  (и не очень значимых) новостей.

Молекулярные генетики прочитали последовательность ДНК бактериальной линии, возникшей в Китае 1500 лет назад, которая вызвала пандемию 

Ancient Plague’s DNA Revived From A 1,500-Year-Old Tooth

Коллектив ведущих русскоязычных специалистов по ДНК-генеалогии опубликовал замечательную статью о филогении гаплогруппы Q-M378 — «Филогенетическая структура субклада Q-М378 по данным полного сиквенса Y-хромосомы». Владимир Гурьянов Vladimir Gurianov), Леон Кулль (Leon Kull), Роман Сычёв (Maximus Centurion), Владимир Таганкин (Vladimir Semargl), Вадим Урасин (Vadim Urasin).

Поздравляю Вадима Урасина со второй статьей,  остальных авторов с дебютом
http://rjgg.org/index.php/RJGGRE/article/viewArticle/132

В самом конце месяца новичкам в области любительской популяционной генетики (и ДНК-генеалогии) были предложены 2 полезных инструмента для вычисления времени жизни последнего общего предка выборки носителей Y-хромосомы

Первый инструмент Y-TMRCA для расчета времени жизни последнего общего предка, созданный эфиопом Ehelix.

Второй инструмент —  инструмент для оценки  TMRCA (времени жизни последнего общего мужского предка) методом выборочных пар (МВП) на дереве, построенном методом UPGMA (Метод невзвешенного попарного среднего). Инструмент стал доступен для широкой общественности благодаря усилиям легендарного разработчика базы Semargl — Vladimir Semargl Tаганкина. Ниже приведено краткое описание метода:

Оценка TMRCA методом выборочных пар (МВП) на дереве, построенном методом UPGMA (Метод невзвешенного попарного среднего).

http://www.semargl.me/ru/dna/ydna/tools/build-tree-and-asd-pairs/

Запускаю бета версию. Интерфейс недоработан, но интуитивно понятен. По крайней мере надеюсь на это. Калькулятор предназначен для построения филогенетического дерева близких совпаденцев и отображением его в графическом формате с возрастом каждого узла. Расчет производится с помощью МВП (метода выборочных пар).
Из ограничений:
1) только для 37, 67, 111 маркерных гаплотипов. Версии для 12, 25 маркеров не будет.
2) Пока поставил ограничение в 20 гаплотипов. Гаплотипы сверх этого будут проигнорированы в расчете.
3) Гаплотипы, имеющие нулевое или отсутствующее значение маркера из стандартной панели будут пропущены в расчете. В планах сделать их обработку, путем подставки вместо отсутствующего маркера модального значения выборки.
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
5) Желательно исключать из расчетов известные гаплотипы с гомоплазией к основной части выборки. Снипы в расчет не принимаются.

Сразу скажу, что анализ идет с помощью кластеризации и значительно уступает таким популярным филогенетическим программам, как TNT, Мурка и др. В расчет не берутся значения снипов.
Калькулятор сделан для новичков, которые постоянно задаются вопросом — «когда жил общий предок с тем-то и тем-то», а также в помощь администраторам проектов, для быстрого принятия решения по тому или иному гаплотипу, без ковыряния в громоздких программах.

Данный калькулятор позволяет кроме подсчета ВБОП выявить группы близких гаплотипов и найти устойчивые кластеры.

В поле KITs вводить номера китов, разделенных запятой. Одной строкой.
Поля mrate и generation length можно оставить пустым

 

Дайджест новостей генетики, геномики и биоинформатки

Благодаря нашумевшему проекту «Геном человека» слов с суффиксом «-ом» становится все больше. Появление вслед за генóмом и протеóмом большого количества новых омов — свидетельство важной тенденции в мире современной биологии. Все больше проводится крупномасштабных исследований, результатом которых становится не описание отдельных молекул, а большие массивы сложно организованных данных. О том, какие новые дисциплины появились в эпоху большой биологии и какое развитие получили «классические» омики, рассказывается в статье ««Омики» – эпоха большой биологии».
Подробности:
http://biomolecula.ru/content/1387

Классические «омы»

Геном

В нашу «постгеномную» эру непросто найти того, кто не слышал о проекте «Геном человека» [1]. Если описать его коротко: 13 лет (1990–2003), три миллиарда нуклеотидов, три миллиарда долларов. Не все ожидания ученых оправдались (последовательность ДНК расшифрована, но не всегда понятно, что она кодирует), но технологическому прорыву в генетических исследованиях последнего десятилетия мы во многом обязаны именно работе над геномом человека. Вслед за ним стали активно секвенировать геномы других млекопитающих: 2002 — геном мыши, 2004 — крысы, 2005 — шимпанзе, 2007 — макаки [10] и так далее (в настоящий момент известны последовательности геномов почти 30 млекопитающих, а дальше это число будет только расти). Кроме этого, расшифровка генома человека привела к появлению специализированных геномных проектов, цель которых — описать работу определенной группы генов, связанных с работой отдельных систем органов или развитием какого-либо заболевания.

Транскриптом

Транскриптом — это совокупность всех молекул РНК, которые синтезируются в клетке, в каком-то органе или ткани. Интересно, что хотя транскриптом и является продуктом экспрессии нашего генома, ни один из них не обеспечивает полное описание другого. Это связано с тем, что, с одной стороны, в геноме немало так называемой «мусорной» ДНК, которая ничего не кодирует (по крайней мере, так кажется). С другой стороны, существуют процессы, которые изменяют РНК после транскрипции: например, процесс редактирования РНК, который, согласно недавним исследованиям [11], распространен очень широко и происходит на более чем 90% всех мРНК. Кроме того, нельзя забывать, что в составе транскриптома есть не только белок-кодирующие мРНК, но и другие виды РНК — начиная от тРНК и рРНК и до различных видов малых регуляторных РНК [12].

Последовательность генома является более-менее постоянной характеристикой организма (хотя есть и исключения — например, последовательности некоторых генов разительно отличаются друг от друга в ДНК лимфоцитов одного человека). Транскриптом же может являться постоянной характеристикой органа, ткани или отдельной популяции клеток, т.к. разные типы клеток выполняют разные функции и экспрессируют разные гены, причем он также может зависеть от условий окружающей среды и меняться во времени. Именно поэтому в последнее время ученые все больше занимаются исследованиями транскриптома клеток определенного типа (например, эмбриональных стволовых клеток) или отдельных органов (например, транскриптома мозга человека [13]).

Протеом

Так как разные клетки в разные моменты времени экспрессируют разные гены, то не только набор РНК не будет одинаковым во всем организме, но и набор белков будет различаться. Это соображение подтолкнуло ученых к исследованию протеома человека — созданию полного перечня белков, которые присутствуют в разных клетках и тканях человека в каждый момент времени. Ученые сформировали международную организацию Human Proteom Organisation (HUPO), которая возглавила проект «Протеом человека» (Human Proteom Project, HPP), запущенный в 2008 году (об этом событии Биомолекула уже писала [14]). Одна из сложностей этого проекта — невероятное разнообразие белков в организме человека, ведь один ген может обеспечивать синтез нескольких вариантов одного белка, которые в дальнейшем могут подвергаться дополнительным химическим модификациям. В результате HPP разделился на два проекта — C-HPP и B/D-HPP. В первом из них разные группы ученых изучаются белки, закодированные на той или иной хромосоме (хромосому 18 изучает группа российских ученых в НИИ биомедицинской химии им. Ореховича в Москве). Во втором проекте изучаются группы белков согласно их биологической роли или вовлеченности в развитие тех или иных заболеваний. К настоящему моменту исследование протеома человека все еще находится в своей начальной стадии, на которой научные группы ищут новые подходы к анализу белков и подбирают биоинформатические алгоритмы [15], однако можно надеяться, что не за горами и первые успехи этого проекта.

Метаболом

Словом «метаболом» описывают совокупность небольших молекул-метаболитов, которые можно найти в клетке, ткани или целом организме. К метаболитам относят молекулы молекулярной массой не более 1 кДа (это как небольшие пептиды, например, некоторые гормоны, так и другие биологически важные органические вещества — антибиотики, липиды и другие вторичные метаболиты). В настоящее время все результаты исследования метаболома собираются в единую базу данных — Human Metabolome Database. Сейчас в этой базе собраны данные по более чем 40 тысячам различных метаболитов. Для каждого из этих веществ создана учетная запись — MetaboCard — которая не только исчерпывающе описывает химические свойства метаболита, но и то, с какими белками или нуклеиновыми кислотами это вещество может взаимодействовать и какое значение оно имеет в клинической практике (связь с заболеваниями или лекарствами).

В настоящее время метаболомика помогает ученым исследовать как физиологию человеческого организма, так и обнаруживать или лечить различные болезни. Одно из широких применений метаболомных исследований — поиск биохимических маркеров различных заболеваний, например, для болезни Паркинсона [16]. В таких исследованиях ученые пытаются обнаружить вещества, изменение концентрации которых в крови может помочь поставить диагноз на ранней стадии и своевременно начать лечение [17].

Существуют множество технологических решений для создания машин для секвенирования ДНК. До недавнего времени самым экзотическим решением считалось решение китайских ученных из Пекинского университета — в своей машине он имплементировали сетки процессоров от известной игровой приставки Sony PS3. Но их превзошли израильские ученные, cоздавшие ДНК, которая считает ДНК. Ученые Израильского технологического института разработали компьютер, состоящий из живых молекул. В основе такого микропроцессора лежат ДНК и ферменты. Этот микропроцессор способен работать непосредственно с генетическим кодом и может его изменять.

Источник: http://www.sciencedaily.com/releases/2013/05/130523180318.htm

Ученые из Оттавы выдвинули теорию о том, как продвинутое математическое моделирование может оказать влияние различных видов терапии, генетических модификаций на терапию рака.

Разработана уникальная методика прогнозирования набора ДНК.

В результате последнего эксперимента, который был проведен американскими учеными из калифорнийского университета, была разработана уникальная методика, позволяющая расшифровать генетический материал человека и при этом точно определить, кому и какой ген достался от родителей.

В научном отчете исследователей говорится о том, что у каждого человека двойной набор хромосом. Исключением являются только половые хромосомы. Все дело в том, что эти копии не являются идеальными, следовательно они могут отличатся между собой.

 
Один из авторов эксперимента, профессор Бинг, в ходе презентации новой методики заявил, что значение технологии трудно переоценить. Все дело в том, что новый метод позволяет с высокой точностью определить предрасположенность к разным заболеваниям. Более того, методика также позволяет определить и сами болезни.

Необходимость такого исследования была обусловлена нынешней ситуацией. Ведь известно, что в последние годы количество передаваемых по наследству различных патологий сильно увеличилось. Следовательно, пришлось искать способы решения данной проблемы.

Научные сотрудники представили красочный пример, который имеет прямое отношение к развитию злокачественной опухоли. Недавно стало известно, что раковые заболевания — это ни что иное как результат генетических мутаций. И вот как раз новая методика позволила определить точное место расположения мутации, а также возможность ее развития. Смысл состоит в том, что в случае возникновения мутации в одной хромосоме, вторая хромосома способна полностью компенсировать все недостатки, а это ведет к полному выздоровлению человека.

Кроме того, стоит подчеркнуть, что при помощи данной методики существует возможность точного определения шансов приживания донорских органов после их трансплантации. Такая возможность является востребованной в том случае, когда необходима срочная операция по пересадке органов. Естественно, что в данной ситуации времени на проведение дополнительных тестов нет.

К слову, методика также позволяет выяснить миграционные пути человечества. Конечно, что этот вектор не мог не заинтересовать ученых. Исходя из этого, планируется проведение серии дополнительных экспериментов.

Ссылка sbio.info