Новая российская компания на рынке персональной геномики

 

В сентябре в Москве открылся один из «сколковских стартапов» -медицинский центр «Атлас», который специализируется на «персонализированной» и «превентивной» медицине. Своим пациентам центр предлагает сначала cделать скрининговый тест http://www.atlas.ru, а потом уже разрабатывать план профилактики и лечения на основе его результатов — выявленных предрасположенностей и рисков возникновения заболеваний, а также генетически обусловленных реакций на лекарства.

Массовой расшифровкой генома в России занялись ещё в 2007 году, поэтому на рынке уже существует несколько похожих компаний. Однако «Атлас» назвал своей целью сделать генотипирование популярным и доступным — примерно так, как это удалось 23andMe, американской компании бывшей жены Сергея Брина Анны Войжитски, в которую Google инвестировала почти 4 миллиона долларов. Популярность 23andMe явно не даёт покоя владельцам «Атласа», поэтому даже домен 23&me.ru они зарегистрировали на себя. Биомедицинский холдинг Atlas основан в 2013 году. Команда Atlas включает в себя специалистов, уже сейчас внедряющих в клиническую практику концепцию персонализированной медицины и работающих на стыке фундаментальной науки и практической медицины.

Нужно сказать, что бизнес-модель «Атласа» действительно построена на основе модели 23andme. Спектр предлагаемых клиентам сервисов персональной геномики также похож на тот, что имеется в 23andme. Вместе с этим, имеется одно принципиальное отличие — в отличии от 23andme, предлагавшей в своем продукте в числе прочего и описание медицинских генетических рисков, продукт «Моя генетика» компании Atlas не просто представляет перечень рисков, но и предполагает консультацию профессионального специалиста по медицинской генетике в медицинском центре Atlas (входящего в состав холдинга).  На мой взгляд, это очень удачный ход. Как известно, в прошлом году у компании 23andme возникли серьезные проблемы с  FDA. Управление по санитарному надзору за качеством пищевых продуктов и медикаментов[3] (англ. Food and Drug Administration, FDA, USFDA) — агентство Министерства здравоохранения и социальных служб США, один из федеральных исполнительных департаментов. Управление занимается контролем качества пищевых продуктов, лекарственных препаратов, косметических средств, табачных изделий и некоторых других категорий товаров, а также осуществляет контроль за соблюдением законодательства и стандартов в этой области. В прошлом году это агентство по жалобе нескольких клиентов инициировало проверки соответствия рынка персональной медицинской генетика законодательству, в результате которой 23andme было предписано временно прекратить включение данных о генетических рисках в свои отчеты. И хотя российским законодательством данная область практически не регулируется, тем не менее включение в продукт услуг профессионального врача-генетика, безусловно, правильный ход, так как позволяет клиенту получить профессиональную консультацию специалиста в довольно специфической и сложной области медцинской генетики.

Лицам, интересующимся генетической генеалогией и своим происхожден, будет интересен раздел, в котором можно посмотреть данные о своих гаплогруппах; проценте генов, доставшихся от неандертальцев; а также разбиение генетических вариантов своего «генома» по компонентам происхождения.  Поскольку я помогал компании Atlas разрабатывать этот раздел (в плане составления описания гаплогрупп и разработки алгоритмов определения компонентов происхождения), то могу поручиться своей репутацией за научную состоятельность выдаваемых результатов.

Процитирую отзыв одного из первых клиентов

«Самая серьёзная и достоверная рубрика — здоровье: в ней связь определённых типов генов с возможным заболеванием подтверждена научными исследованиями, в которых принимало участия более тысячи человек. Здесь риски развития заболеваний сгруппированы в процентах и сравниваются со средним риском по популяции, отображены наследственные заболевания, а также так называемая фармокогенетика, индивидуальная чувствительность к лекарствам (аллергические реакции, побочные эффекты).

Самыми высокими рисками для меня, согласно тесту, являются меланома (0,18 % при среднем риске 0,06 %), системная склеродермия (0,05 % при среднем 0,03 %), сахарный диабет первого типа (0,45 % при среднем 0,13 %), аневризма сосудов головного мозга (2,63 % при среднем 1,8 %), системная красная волчанка (риск 0,08 % при среднем риске 0,05 %), эндометриоз (1,06 % при среднем риске 0,81 %), артериальная гипертензия (42,82 % при среднем риске 40,8 %). Ну и так далее. Кроме того, тест выявил, что я являюсь здоровым носителем варианта гена, связанного с периодической болезнью. Моя же чувствительность к лекарствам оказалась совершенно среднестатистической, ничем не примечательной, поэтому никаких особых побочных эффектов или аллергических реакций тест не выявил.

В рубрике «Питание» мне рекомендовали то, что рекомендуют своим читателям все журналы о здоровом образе жизни, — сбалансированную диету и почему-то не больше 998 килокалорий в день (при норме для взрослого человека, который не занимается спортом, в 1 200). Не рекомендовали есть сладкое и жирное, пить крепкий алкоголь, закусывать его картошкой или заедать рисом, запретили сладкое и жареное. В общем, всё, что можно было бы посоветовать любому россиянину старше 18 лет. У меня заподозрили непереносимость лактозы и запретили молочные продукты, хотя никаких проблем с молоком у меня никогда не было. Несмотря на это, в разделе «Рекомендации» мне посоветовали есть «больше молочных продуктов каждый день» (потом разработчики сказали, что это — баг), потому что молоко «снижает риск развития сахарного диабета», который у меня повышен. Если пить его вместо сладкой газировки, то, наверное, снижает. Но сейчас прогрессивное человечество уже задумывается о том, насколько молоко вообще необходимо взрослому человеку, — связи потребления молока с крепкими костями и восполнением витамина D, о которой говорили раньше, так и не было найдено.

В разделе «Спорт» меня назвали «спринтером» и посоветовали силовые тренировки, поэтому рекомендовали гандбол, регби и плавание и запретили бег, баскетбол, конный спорт и зимние виды спорта. На мой удивлённый вопрос: «Почему запретили бег, который почти всем можно?» — врач-генетик Ирина Жигулина, с которой мы потом общались, ответила, что речь идёт о профессиональном спорте. Профессионального бегуна из меня, по их мнению, не выйдет.

В разделе «Происхождение» меня ждала интерактивная инфографика о том, как мои предки по материнской линии вышли из Восточной Африки 150–180 тысяч лет назад и двинулись в Северную Европу. У меня нет Y-хромосомы, поэтому, что там происходило с отцовской линией, совершенно непонятно. Мои надежды найти успешных родственников так и не оправдались — бегунок остановился на отметке «500 лет назад» и выдал результат, что 50,9 % моего ДНК — от жителей Северной Европы. Жаль, что это совсем не то, что получают, например, покупатели теста 23andMe, которым предоставляют доступ к социальной сети, где можно найти своих родственников. А так хотелось прожить такую историю, как Стэйси и Грета, которые узнали, что они сёстры, благодаря 23andMe!

Больше всего меня удивила информация под заголовком «Личные качества». Тут я узнала, что у меня снижен риск развития никотиновой зависимости, есть предрасположенность к абсолютному слуху, нет риска ранней менопаузы и есть склонность к избеганию вреда. Этот раздел создатели относят к «развлекательной генетике», потому что данные в ней строятся на основе экспериментов с небольшой выборкой испытуемых (меньше 500). Но они меня вовсе не развлекли, а расстроили. Во-первых, выяснилось, что у меня нет предрасположенности к кудрявым волосам: «у вас не выявлен генетический вариант, часто встречающийся у кудрявых людей», хотя я кудрявей, чем многие каракулевые шубы. А во-вторых, у меня «не выявлен вариант гена, встречающийся у большинства творческих людей». В-третьих, я и вовсе интроверт.

Результаты теста заканчиваются рекомендациями пройти консультацию с терапевтом (по поводу риска системной красной волчанки), с эндокринологом (по поводу сахарного диабета) и с дерматологом (склеродермия, меланома), а также ежегодно сдавать анализ крови, делать маммографию, с 40 лет — регулярно ЭКГ. Ещё рекомендовали пить кофе и молоко, витамины, регулярно заниматься спортом и редко загорать»

Этногеномика беларусов — часть V

Обсуждение результатов и выводы

 

Как отмечалось в введении к нашей статье, главной задачей нашего исследования являлась проверка двух рабочих гипотез, озвученных в предыдущих исследованиях профессиональных попгенетиков. Во-первых, это гипотеза о присутствии трех основных древних компонентов , которая указывает на возможность общего происхождения славян и балтов. Во-вторых, это утверждение о том, что своеобразие аутосомного генофонда беларусов может быть связанно с вкладом балтского субстрата.

После внимательного изучения результатов нашего исследования,можно сказать, что оба из приведенных выше заключений представляют собой крайне упрощеные варианты сложного процесса формирования аутосомного генофонда беларусов. Хотя мы и не можем предоставить окончательных аргументов в пользу или опровержение каждой из этих версий, мы может предоставить более полное и подробное обозрение структуры аутосомного генофонда. В отличие от трех основых компонентов, упомянутых выше, в нашем исследовании мы выделили шесть основных компонентов, типичных для европейцев в целом. Основу генофонда составляет компонент, который мы обозначили как северо-восточно-европейский компонент. Именно этот компонент выделяет беларусов среди других восточных славян, приближая их к современным балтийским популяциям (у литовцев процент компонента составляет 81,9, у латышей — 79,5%, у беларусов -76,4%, у эстонцев — 75,2%). Примечательно, по мере удаления от территории Беларуси на север в с торону Латвии и Эстонии, увеличивается процент северо-европейского генетического компонента (как мы полагаем, этот компонент доминировал в генофонде доисторических жителей Скандинавии в эпоху до распространения финно-угоров и индо-европейцев). С другой стороны, беларусов и других восточных славян отдаляет от балтов и сближает друг к другу более высокий процент так называемого западно-азиатского или кавказского компонента (любопытно, что в этом случае эта закономерность может свидетельствовать в пользу западно-азиатской теории происхождения индо-европейцев).

Далее, как показывает анализ в программе fineStructure, генофонд беларусов характеризируется высокой степенью генетических контактов как с балтами, так и остальными славянами, а также с рядом финно-угорских популяций (например, c эрзя и мокша). О симметричном характере межпопуляционного обмена свидетельствует симметричное расположение популяции беларусов относительно этих трех групп.

Исходяизвышенаписанного,представляетсялогичнымсделатьвыводотом,чтоосновнойкритическийэтапстановленияаутосомногогенофондапришелсянапериодсмешиванияносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,послечегопредковыйаутосомныйгенофондбеларусовприобрелотносительнуюстабильность.Разумеется,даннаямодельнеисключаетпозднейшиеэпизодысмешиванияпопуляций,ноониоставилименьшийследвструктуреаутосомногогенофондабеларусов.Вэтойсвязивозникаеточевидныйвопрос–вкакойименноисторическийпериодпроизошлосмешениеносителейсеверо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента,иктобылиихносителями?
В начале сентября 2012 года известная американская лаборатория популяционной генетики доктора Райха опубликовала альфа-версию программного продуктаADMIXTOOOLS1.0. Альфа-версия была разработана для внутреннего использования, поэтому modusoperandiэтого продукта вряд ли является кристально понятным для стороннего пользователя. Положительным аспектом на мой взгляд является то, что ADMIXTOOLSпакет обеспечивает полную совместимость с форматом другой очень популярной программыEIGENSOFT, которая была разработана в той же лаборатории. Это немаловажное обстоятельство намного упрощает процесс обучения в ADMIXTOOLS.

Вышеупомянутый пакет включает в себя 6 приложений, среди которых я считаю наиболее полезнойqp3Popи утилиты для вычисления частотной характеристики аллелей. Впрочем, я не собираюсь обсуждатьqp3popво всех деталях и в контексте данной заметки достаточно отметить, что эта программа реализует тест three_pop(F_3), подробно описанный в известной статье Рейха и соавт. 2009.

Однако другой имплементированный в пакете метод, – метод rolloff– нуждается в более пристальном внимании. Этот метод позволяет производить математическую оценку как времени, так как и уровня адмикса. Оценка производится на основании анализа неравновесия по сцеплению между SNP-ами. Тут необходимо вспомнить стандартное определение неравновесия по сцеплению.Неравновесием по сцеплению (часто используется английская аббревиатураLD) называется неслучайная связь между двумя аллелями, в силу которой определенные комбинации аллелей встречаются наиболее часть. В теории, чем дальше друг от друга находятся SNP-ы ,тем меньше будет уровень LD. Темп угасания снижения LDв адмиксе напрямую связана с числом поколений, прошедших с момента адмикса, так как cвозрастанием числа поколений увлечивается число рекомбинаций произошедших между двумя отдельными SNP-ами. Проще говоря: Rolloffсоответствует экспоненциальной кривой угасания уровня LDот расстояния, и эта скорость экспоненциального снижения как раз и используется для оценки числа поколений, так и уровня адмикса в анализируемой популяии. Учитывая, что одно поколение примерно равно 29 лет, можно преобразовать число поколений в года.

Этот метод открывает интересные перспективы. Для целей этого анализа, я создал специальный набор SNP-данных, который включает в себя около 750 000 cнипов, частично или полностью в 250 различных популяциях человека. Далее, я разбил популяции 3 * 62 000 трио в следующем виде (X, Y, Z), где X и Y – пара рефренсных групп, а Z – белорусы из коллекцииBehar et al.2010. После этого я провел q3Pop анализ этих трио.

Результаты изложены в нижеприведенной таблице

Indian Polish Belarusian -0.000736 0.000251 -2.935
Polish Indian Belarusian -0.000736 0.000251 -2.935
Karitiana Sardinian Belarusian -0.001278 0.000517 -2.471
Sardinian Karitiana Belarusian -0.001278 0.000517 -2.471
Otzi North_Amerind Belarusian -0.002556 0.001126 -2.271
Cirkassian Polish Belarusian -0.000488 0.000231 -2.113
Polish Cirkassian Belarusian -0.000488 0.000231 -2.113
Pima Otzi Belarusian -0.002727 0.00137 -1.99
Pima Sardinian Belarusian -0.000794 0.000431 -1.843
Sardinian Pima Belarusian -0.000794 0.000431 -1.843
Otzi Surui Belarusian -0.002938 0.001931 -1.522
Surui Otzi Belarusian -0.002938 0.001931 -1.522

 

На первый взгляд, результаты нашего эксперимента с 3qPop, кажется, неплохо согласуются с выводами, содержащимися в работеПаттерсон и др. 2012: “Самый поразительный вывод состоит в обнаружени четкого сигнала адмикса в северной Европе, один из элементов которого связан с предками населения наиболее близкого по своей генетике к баскам и жителям Сардинии, а другой – с предками современного населения северо-восточной Азии и Америки. Этот явный сигнал, вероятно, отражает историю смешивания неолитических мигрантов с коренным населением Европы, что подтверждается недавним генетическим анализом древних костей Швеция и секвенированием полного генома Отци Тирольца”. Что касается собственно белорусов, то источники сигнала смешивания с посторонними популяцими менее ясны и расплывчаты. Как было показано ранее, с точки зрения формального анализа примесей (f3 статистики), белорусы могут быть представлены в виде популяционного микса поляков и индусов / черкессов. Первый компонент смеси может быть связан с носителями культуры шнуровой керамики/боевых топоров и культуры колоковидных кубков; второй, в соответствии с результатами, должен быть общим для индусов и черкесов.

 

Белорусы = ((неолитические культуры Европы) + “носители культуры колоковидных кубков”) + (мезолитическое население Европы) + компонент носителей культуры шнуровой керамики)) + скифо-сарматский тип

 

Для оценки дата события базового адмикса в белорусской популяции, мы использовали в качестве референсных популяций поляков и индусов (Примечание: мы снизили порог генетических дистанции в параметрах Rolloff для снижения уровня шума от более поздних адмиксов).

 

rolloff

Как вы можете видеть, сигнал присутствия адмикса обнаруживается гораздо хуже, и в силу этого, погрешности в оценке временного промежутка высоки:

154,158 + -87,024 поколений назад (или, 4470 + -2523 года до настоящего времени / 2510 – +2523 лет до н.э.).

 

Исходя из этого, мы решили модифицировать Rolloff-анализ генофонда белорусов, используя на этот раз в качестве референсов литовцев и пуштунов. Следуя этому совету, я решил предпринять вторую попытку формального анализа адмикса в двух имеющихся у нас выборках беларусов ( выборка беларусов из статьи Behar et al. 2011), и выборка беларусов, собранная в нашем проекте.Ниже приведены результаты эксперимента с двумя этими группам (в отличие результатов нашей предыдущей попытки, результаты данного эксперимента менее “зашумленные”):

rolloff2

 

Интервал числа поколений, прошедших со времен анализируемого адмикса (105.086+-52.59) или 3069 +- 1525 лет до настоящего времени, что соответствует временном интервалу 2 тыс. до нашей эры – 6 век нашей эры. Принимая во внимание эти выводы, мы можем предположить, что основной аутосомный эпизод смешивания предковых популяций беларусов произошел в течении довольно таки продолжительного времени, охватывающего несколько тысяч лет. В этой связи, вопрос о том, кто именно был носителями северо-восточно-европейскогогенетическогокомпонентасносителямизападно-азиатского(кавказского)генетическогокомпонента, остается открытым.

Неандертальские варианты генов метаболизма жиров у современного человека

Реконструированный геном неандертальца, опубликованный несколькими годами ранее, обеспечил исследователями генетических вариантов высших приматов богатым материалом для изучения на годы вперед. Уже при публикации чернового (драфт) варианта реконструированного генома неандертальца (вернее неандертальцев, поскольку при создании референсного генома неандертальца, также как и при реконструкции референсного генома человека, использовались совокупные геномы нескольких особей неандертальцев), было понятно, что сравнительный анализ геномов неандертальца и современного человека прольет свет на многие, ранее неразрешимые, вопросы эволюции человека.

Например, появился ряд работ, в которых были представлены убедительные доказательства того, что определенные генетически детерминированные варианты микроцефалии у людей появились в результате «вливания неандертальских генов». В другой работе авторы пришли к выводу о неандертальском происхождении ряда характерных аллельных вариантов генов гистосовместимости, распространенных в Европе. В новом исследовании, исследователи анализировали статистику представленности неандертальских вариантов генов в человеческой популяции. Доля таких генов у современных людей не-африканского происхождения в среднем составляет около 1–4 процентов генома. Она почти одинакова в разных популяциях за пределами Африки, однако при более тщательном анализе ученые обнаружили, что у европейцев существуют гены, которые как минимум в три раза обогащены именно неандертальскими вариантами.

Большая часть этих генов оказалась связана с метаболизмом жирных кислот, – веществ, которые входят в состав жира и составляют основу клеточных мембран. Статистический анализ говорит о том, что нендертальские варианты генов были предметом отбора, то есть накапливались у европейцев, а значит они давали некоторое эволюционное преимущество своим обладателям.

 

 

 

Древние геномы человека в перспективе генетического разнообразия современных популяций

Примерно месяц тому назад, один из замечательных представителей «гражданской науки» в области генетики, известный геномный блоггер Polako (Давид Веселовски) разместил в своем блоге заметку, в которой были приведены результаты самостоятельного изучения вариативности снип-мутаций в пяти наиболее известных  из отсеквенированных геномов древних людей.  Хотя, как мне представляется, основное внимание Давид уделил все же прояснению ответа на вопрос о расположении  древнего генома сибирского мальчика со стоянки Malta (13 тысяч снипов-вариантов в аутосомах) в пространстве главных компонентов генетического разнообразия (PCA) cовременных человеческих популяций. К слову, этот же образец (Malta-1) был на днях включен в новую таблицу откалиброванных процентных соотношений 13 конвенциональных генетических компонентов в популярном среди пользователей Gedmatch этно-популяционногенетическом калькуляторе Eurogenes K=13 .  Наряду с вышеназванным образцом, в отреферированном анализе использовались геномные снип-варианты древнего ДНК австралийского аборигена (46 тыс.снипов), Anzick-1 генома древнего индейца культуры Кловис (106 тыс.снипов), генома древнего экскимоса Saqqaq (68 тыс.снипов), геном обитателя мезолитической Испании La-Brana 1 (23 тыс.снипов).

Можно предположить, что при проведении статистических анализов PCA, Давид использовал в качества сравнительного эталона-референса известный график из статьи Lazaridis et al. 2013.

PCA из статьи-препринта Lazaridis et. al .2013.

К сожалению ,  Давид из Eurogenes по определенным причинам не включил в свой анализ варианты снипов остальных известных евразийских древних геномов задействованных в PCA-анализе статьи-препринта Lazaridis et al. 2013, в частности древние геномы неолитического периода — женщин  культур воронковидных кубков (Swedish_farmer) и культуры линейно-ленточной керамики Южной Германии (Stuttgart), а также неолитического жителя Тирольских Альп — Этци (Iceman). Нет в  анализе Давида и образцов мезолитического и эпинеолитического генофонда Европы — мезолитических охотников-собирателей Motala  и Losсhbour и неолитических охотников с острова Готланд (Skoglund_merge). C другой стороны, в широко обсуждаемой предварительной версии статьи Лазаридиса к анализу привлечены только актуальные в евразийской перспективе образцы, и поэтому на графике PCA отсутствуют геномы древнего аборигена Австралии и двух древних геномов из Северной Америки.

Я решил исправить эти недочеты за счет сведения всех древних геномов в единый график, увязав все эти геномы с древними популяциями предков современных этно-популяционных групп.  Принципы анализа были относительно просты, окончательная выборка популяций  была получена путем полуавтономного процесса слияния разных источников данных.  Отсеве снипов у представителей популяций в окончательной выборке был минимальный — использовались только модификаторы фильтра MAF (частота минорных аллелей) и HWE (пороговый критерий качества снипов с точки зрения закона равновесия Харди-Вайнберга).  Пороговое значение фильтр качества снипов по генотипированию я специально  оставил слегка заниженным, так как снипы отбирались по низкому значению коэффицента попарного сцепления в неравновесном наследовании.

Ниже в таблице приведены сводные данные о древних геномах и размерности числа снипов  этих образцов, которые использовались в моем анализе

Аncient (Afontova Gora) 10965
Australian Aborigen 236880 
Otzi_Tyrolean 171195 
Swedish_merged_farmer 1600
Swedish_merged_HG 4053
La Brana  57050
Malta-1 44459
LBK_Stuttgart 54220
Motala12 54677
Loschbour 54591
Motala_merged 35010
R Graphics Output
Визуализация двух первых главных компонентов разнообразия в популяциях выборки

В качестве программного обеспечения для проведения эксперимента с PCA, я использовал имплементацию PCA в новой версии программы plink. Эта имплементация уступает в точности вычислений классической программе Eigenstrat, однако заметно опережает в скорости, особенно на больших массивах данных.

Ниже я разместил серию визуализаций графика PCA. Первая иллюстрация — визуализация двух первых главных компонентов разнообразия, ставшая уже классической форма V-образного клина.

Из-за высокой плотности точек на графике, первая иллюстрация сложна для чтения. Поэтому  вместо того, чтобы наносить названия точек на график, я рассчитал центроиды точек популяций и разместил их на графике вместе с названием популяции.

Центроиды популяций
Центроиды популяций

 Как видно из второго графика, мировый популяции равномерно распределились по углам триангуляции. Африканские популяции длинным шлейфом-вектором  от пигмеев до фулани, cахарцев и эфиопских этносов распредились в левой части V-клина. Между ними и европейцами находится большая группа смешанных рассовых групп — пуэрто-риканцы, доминиканцы, афроамериканцы Карибского региона и Северной Америки, морокканцы, мозабиты и жители Туниса. В вершине угла V клина находятся все классические европейские этнические группы и народности. Они образуют внутренний европейский градиент генетической вариативности, уменьшающийся по мере удаления на север.  Северные популяции европейцев (особенно в Скандинавии и Прибалтике) смыкаются с находящимися на самой веришине угла древними геномами европейцев времен мезолита (Motala, Loschbour, La Brana,и перехода к неолита. Эта картина соответствует тому, что мы наблюдаем на графике Lazaridis et al. 2013.  Наблюдаемая на моем графике более значительная дистанция шведских охотников-собирателей шведской культуры ямочной керамики от современных популяций северной Европы объясняется только тем, что в работе Lazaridis et al. 2013 использовалась большее количество тех снипов древних геномов, которые встречаются и в современных популяциях (т.е находятся в пределах современной вариативности генов жителей современной северной Европы). Поэтому дистанция в узказанной работе между древними и современными популяцими ниже (тот же феномен наблюдается и в неолитическом векторе). Неолитический «вектор» представлен шведским неолитическим фермером, Этци Тирольцем, женщиной из неолитического поселения возле современного Штуттгарта. Из современных популяций к этому вектору находятся близко сардинцы и баски.
 

Однако наиболее интересная картина наблюдается в правой части графика, где мы наблюдаем наложение сразу нескольких клинов-градиентов разнообразия. Наиболее сложная структура наблюдается в том месте правого «крыла» графика, куда проецируются геномы двух палеолитических жителей Сибири (Malta-1 и AG). В этом месте график начинает ветвиться на три тесно переплетенные вектора-градиенты. Один уходит через Средную Азию-Непал-Северную Индию на юг, где встречается в двигающимся ему навстречу вектору-градиенту представленному австралийскими аборигенами, онге, папуасами, меланизийцами, андаманцами и дравидами.  Второй вектор ведет через Алтай-Монголию и Китай в Индокитай и юго-восточную Азию.

Третий вектор разделяется сразу на две части — одна ведет к палеосибирским народами и далее к алеутам и экскимосам. Этот вектор заканчивается древним геномом Saqqaq, который видимо является самым чистым «образчиком» генома древних людей, связанных с этими группами. Второй уходит через группу североамериканских индейских народов на юг, в Мезоамерику и далее к индейцам южной Америки. Вектор заканчивается на Anzick-1, и — по аналогии c Saqqaq, — можно сделать вывод о том, что этот геном является квинтэссенцией «чистого америндского компонента» без позднейших вкраплений в ходе контактов с европейцами.

Примечательно, что эти вектора переплетены между собой настолько, что в 2-мерном пространстве первых двух компонент, чукчи и коряки, североамериканские индейцы и экскимосы, кхмеры и индусы оказываются рядом. Очевидно, что эта иллюзия. С целью доказать это  утверждения, я построил трехмерную визуализацию положения центроидов популяций в пространстве первых трех главных компонентов генетического разнообразия.

persp3d
Трехмерная перспектива PCA

Об особенностях наследования X-хромосомы: функциональная избыточность гена ITM2A приводит к низкому росту

В феврале этого года в журнале Plos Genetics была опубликованна статья «Chromosome X-Wide Association Study Identifies Loci for Fasting Insulin and Height and Evidence for Incomplete Dosage Compensation» , в которой содержится исследования влияние феномена «неполной компенсации дозы генов»* X-хромосомы на рост регуляцию инсулина в организме человека. Удивительно, но число работ по генетике X-хромосомы, несмотря на свою важность в развитии ряда болезней обусловленных наличием Х-сцепленного рецессивного гена на X-хромосома,  гораздо меньше аналогичных работ по аутосомах. С одной стороны, известно около 300 генов, локализованных в хромосоме X, вызывающих наследственные болезни (гены, локализованные в хромосоме X, называют X-сцепленными). К ним относятся гены гемофилии А, миопатии Дюшенна, Х-сцепленного ихтиоза, пигментной дистрофии сетчатки, ангидротической формы эктодермальной дисплазии, синдрома ломкой хромосомы X с умственной отсталостью, гидроцефалии, синдромов Коффина — Лоури, Пейна, Опитца, одной из форм мукополисахаридоза, X-сцепленной невральной амиотрофии, недостаточности глюко-зо-6-фосфатдегидрогеназы и многих других заболеваний.

С другой стороны, к настоящему времени ученым известны сотни генов, связанных с чертами внешности, однако при их изучении Х-хромосома, как правило, оставалась за бортом. Я могу объяснить этот феномен только тем, что в открытых источниках данных (по наиболее известным референсным популяциям) содержится крайне мало генотипов X-хромосомы . Именно по этой технической причине, X-хромосома не используется в  этно-популяционных калькуляторах на Gedmatch.com.

Суть исследования, проведенного исследователи из Хельсинкского университета сводится к  выяснению  генетических причин отличий в здоровье мужчин и женщин. Прежде чем мы перейдем к краткому изложению материала, напомним, что у человека пол гетерогаметен. Женщины имеют во всех клетках две хромосомы X, а мужчины — одну X и одну У хромосомы. Хромосома Y не гомологична хромосоме X, в ней содержится небольшое число генов. Мужчины являются гемизиготами по хромосоме X и всем содержащимся в ней генам. Наследование половых хромосом происходит как наследование простых менделевских признаков ( см. нижеприведенную решетку Пеннета):

Из таблицы видно, что при случайном объединении гамет должно образовываться равное количество зигот женского и мужского пола. (Источник: MedUniver.com)

 

В исследовании, результаты которого авторы описали в журнале PLOS Genetics , они нашли ген ITM2A, расположенный на Х-хромосоме, варианты которого определяют больший или меньший рост. Это объясняется тем, что ген участвует в развитии хрящевой ткани. Чем дольше развивается хрящевая ткань, тем человек вырастает более высоким.

Вариант гена, который приводит к его усиленной работе, как показали ученые, сопровождается низкорослостью. Это довольно интересное заключение, особенно если принять во внимание бытовавшее ранее мнение о том, что иногда как раз добавочная Х-хромосома является причиной высокого роста девушек. Данное исследования опровергает это мнение, о чем упоминается в интервью исследователей средствам СМИ:

Двойная доза Х-хромосомных генов у женщин может вызывать проблемы в течение развития, — объясняет профессор Сэмюли Рипатти, руководитель исследования. — Чтобы избежать этого, в женских клетках действует механизм, который заставляет вторую Х-хромосому замолчать. Но рядом с геном ITM2A мы нашли участок, который позволяет этому гену избежать подавления работы. Когда мы его нашли, это нас особенно вдохновило».

Это позволяет Х-хромосомному гену ITM2A продолжать в женских клетках работать в двойном объеме, а женщины из-за этого перестают расти.

 

 


*Механизм регуляции экспрессии генов, сцепленных с полом; при механизме определения пола XX-XY у самок К.д. связана с инактивацией одной из Х-хромосом X-inactivation (при полисомии polysomy по Х-хромосоме — всех Х-хромосом кроме одной), образующей интерфазное тельце Барра (sex chromatin); к К.д. относят и более сложные внутригеномные взаимоотношния, связанные с регуляционно-репрессорными механизмами (см. autosomal dosage compensation).

ДНК-тестирование: новый тип теста от Exogen Bio

#DNA_crowdfunding

http://www.indiegogo.com/projects/exogen-bio-how-damaged-is-your-dna

На известной платформе краудфандинга — Indiegogo — появился анонс замечательного проекта компании Exogen Bio. Компания разрабатывает принципиально новый коммерческий вид ДНК-тестирования. Несмотря на присутствие в названии компании слова «экзо», судя по видео-презентации на Indiegogo в задачу компании не входит классическое прочтение (секвенирования) экзома или генома. В одном из кадров показан новенький Synergy Neo HTS Multimode Microplate reader, благодаря чему можно сделать вывод о сути анализа.
Это будет не секвенирование, а так называемый скрининг cостояния ДНК в клетках донорах (кинетика и спектральное сканирование). По результатам скрининга можно получить представление о динамике повреждения ДНК, и сопоставить их с возможными рисками развития молекулярных патологий.
Нужно сказать, что сам метод не является принципиально новым, первоначально он разрабатывался для нужд молекулярной онкологии. Новизна состоит в ином: компания планирует привлечь значительное количество «сitizen scientists», чьи данные помогут провести исследования о связи повреждений структуры ДНК и патологий. Эти исследования помогут развить доступную для врачей лабораторную базу. Таким образом, данные проект продвинет существующие в академических лабораториях технологии ближе к народу, и через пару десятков лет такие анализы будут назначаться врачами в рутинном порядке.

Очередные исследования генетических факторов влияющих на возникновение шизофрении и аутизма

Один из ведущих новостных порталов сообщает о том, что международная группа исследователей выявила изменения вариации числа копий генов, связанные с возникновением шизофрении и аутизма. Как сообщается в статье, опубликованной в журнале Nature, удаление или дублирование одного и того же региона на коротком плече хромосомы 15 приводит к противоположным изменениям в сером и белом веществе головного мозга.

http://polit.ru/news/2013/12/19/ps_schizophrenia/

От себя добавлю, что одно из многих уже опубликованных  исследований (и исследований, публикация которых еще только предстоит) в этой области.  Изучение генетических факторов аутизма и шизофрении показывает, что простая модель «один полиморфизм-одно заболевание» здесь просто не работает, тем более процентный вклад генетических факторов наряду с эпигенетическими факторами в развитие этого заболевания неизвестен . Поэтому, несмотря на по-медийному оптимистическое название статьи, не стоит делать далеко идущие выводы о том, что в этих исследованиях можно ставить точку.

Дайджест новостей генетики, геномики и биоинформатки

Благодаря нашумевшему проекту «Геном человека» слов с суффиксом «-ом» становится все больше. Появление вслед за генóмом и протеóмом большого количества новых омов — свидетельство важной тенденции в мире современной биологии. Все больше проводится крупномасштабных исследований, результатом которых становится не описание отдельных молекул, а большие массивы сложно организованных данных. О том, какие новые дисциплины появились в эпоху большой биологии и какое развитие получили «классические» омики, рассказывается в статье ««Омики» – эпоха большой биологии».
Подробности:
http://biomolecula.ru/content/1387

Классические «омы»

Геном

В нашу «постгеномную» эру непросто найти того, кто не слышал о проекте «Геном человека» [1]. Если описать его коротко: 13 лет (1990–2003), три миллиарда нуклеотидов, три миллиарда долларов. Не все ожидания ученых оправдались (последовательность ДНК расшифрована, но не всегда понятно, что она кодирует), но технологическому прорыву в генетических исследованиях последнего десятилетия мы во многом обязаны именно работе над геномом человека. Вслед за ним стали активно секвенировать геномы других млекопитающих: 2002 — геном мыши, 2004 — крысы, 2005 — шимпанзе, 2007 — макаки [10] и так далее (в настоящий момент известны последовательности геномов почти 30 млекопитающих, а дальше это число будет только расти). Кроме этого, расшифровка генома человека привела к появлению специализированных геномных проектов, цель которых — описать работу определенной группы генов, связанных с работой отдельных систем органов или развитием какого-либо заболевания.

Транскриптом

Транскриптом — это совокупность всех молекул РНК, которые синтезируются в клетке, в каком-то органе или ткани. Интересно, что хотя транскриптом и является продуктом экспрессии нашего генома, ни один из них не обеспечивает полное описание другого. Это связано с тем, что, с одной стороны, в геноме немало так называемой «мусорной» ДНК, которая ничего не кодирует (по крайней мере, так кажется). С другой стороны, существуют процессы, которые изменяют РНК после транскрипции: например, процесс редактирования РНК, который, согласно недавним исследованиям [11], распространен очень широко и происходит на более чем 90% всех мРНК. Кроме того, нельзя забывать, что в составе транскриптома есть не только белок-кодирующие мРНК, но и другие виды РНК — начиная от тРНК и рРНК и до различных видов малых регуляторных РНК [12].

Последовательность генома является более-менее постоянной характеристикой организма (хотя есть и исключения — например, последовательности некоторых генов разительно отличаются друг от друга в ДНК лимфоцитов одного человека). Транскриптом же может являться постоянной характеристикой органа, ткани или отдельной популяции клеток, т.к. разные типы клеток выполняют разные функции и экспрессируют разные гены, причем он также может зависеть от условий окружающей среды и меняться во времени. Именно поэтому в последнее время ученые все больше занимаются исследованиями транскриптома клеток определенного типа (например, эмбриональных стволовых клеток) или отдельных органов (например, транскриптома мозга человека [13]).

Протеом

Так как разные клетки в разные моменты времени экспрессируют разные гены, то не только набор РНК не будет одинаковым во всем организме, но и набор белков будет различаться. Это соображение подтолкнуло ученых к исследованию протеома человека — созданию полного перечня белков, которые присутствуют в разных клетках и тканях человека в каждый момент времени. Ученые сформировали международную организацию Human Proteom Organisation (HUPO), которая возглавила проект «Протеом человека» (Human Proteom Project, HPP), запущенный в 2008 году (об этом событии Биомолекула уже писала [14]). Одна из сложностей этого проекта — невероятное разнообразие белков в организме человека, ведь один ген может обеспечивать синтез нескольких вариантов одного белка, которые в дальнейшем могут подвергаться дополнительным химическим модификациям. В результате HPP разделился на два проекта — C-HPP и B/D-HPP. В первом из них разные группы ученых изучаются белки, закодированные на той или иной хромосоме (хромосому 18 изучает группа российских ученых в НИИ биомедицинской химии им. Ореховича в Москве). Во втором проекте изучаются группы белков согласно их биологической роли или вовлеченности в развитие тех или иных заболеваний. К настоящему моменту исследование протеома человека все еще находится в своей начальной стадии, на которой научные группы ищут новые подходы к анализу белков и подбирают биоинформатические алгоритмы [15], однако можно надеяться, что не за горами и первые успехи этого проекта.

Метаболом

Словом «метаболом» описывают совокупность небольших молекул-метаболитов, которые можно найти в клетке, ткани или целом организме. К метаболитам относят молекулы молекулярной массой не более 1 кДа (это как небольшие пептиды, например, некоторые гормоны, так и другие биологически важные органические вещества — антибиотики, липиды и другие вторичные метаболиты). В настоящее время все результаты исследования метаболома собираются в единую базу данных — Human Metabolome Database. Сейчас в этой базе собраны данные по более чем 40 тысячам различных метаболитов. Для каждого из этих веществ создана учетная запись — MetaboCard — которая не только исчерпывающе описывает химические свойства метаболита, но и то, с какими белками или нуклеиновыми кислотами это вещество может взаимодействовать и какое значение оно имеет в клинической практике (связь с заболеваниями или лекарствами).

В настоящее время метаболомика помогает ученым исследовать как физиологию человеческого организма, так и обнаруживать или лечить различные болезни. Одно из широких применений метаболомных исследований — поиск биохимических маркеров различных заболеваний, например, для болезни Паркинсона [16]. В таких исследованиях ученые пытаются обнаружить вещества, изменение концентрации которых в крови может помочь поставить диагноз на ранней стадии и своевременно начать лечение [17].

Существуют множество технологических решений для создания машин для секвенирования ДНК. До недавнего времени самым экзотическим решением считалось решение китайских ученных из Пекинского университета — в своей машине он имплементировали сетки процессоров от известной игровой приставки Sony PS3. Но их превзошли израильские ученные, cоздавшие ДНК, которая считает ДНК. Ученые Израильского технологического института разработали компьютер, состоящий из живых молекул. В основе такого микропроцессора лежат ДНК и ферменты. Этот микропроцессор способен работать непосредственно с генетическим кодом и может его изменять.

Источник: http://www.sciencedaily.com/releases/2013/05/130523180318.htm

Ученые из Оттавы выдвинули теорию о том, как продвинутое математическое моделирование может оказать влияние различных видов терапии, генетических модификаций на терапию рака.

Разработана уникальная методика прогнозирования набора ДНК.

В результате последнего эксперимента, который был проведен американскими учеными из калифорнийского университета, была разработана уникальная методика, позволяющая расшифровать генетический материал человека и при этом точно определить, кому и какой ген достался от родителей.

В научном отчете исследователей говорится о том, что у каждого человека двойной набор хромосом. Исключением являются только половые хромосомы. Все дело в том, что эти копии не являются идеальными, следовательно они могут отличатся между собой.

 
Один из авторов эксперимента, профессор Бинг, в ходе презентации новой методики заявил, что значение технологии трудно переоценить. Все дело в том, что новый метод позволяет с высокой точностью определить предрасположенность к разным заболеваниям. Более того, методика также позволяет определить и сами болезни.

Необходимость такого исследования была обусловлена нынешней ситуацией. Ведь известно, что в последние годы количество передаваемых по наследству различных патологий сильно увеличилось. Следовательно, пришлось искать способы решения данной проблемы.

Научные сотрудники представили красочный пример, который имеет прямое отношение к развитию злокачественной опухоли. Недавно стало известно, что раковые заболевания — это ни что иное как результат генетических мутаций. И вот как раз новая методика позволила определить точное место расположения мутации, а также возможность ее развития. Смысл состоит в том, что в случае возникновения мутации в одной хромосоме, вторая хромосома способна полностью компенсировать все недостатки, а это ведет к полному выздоровлению человека.

Кроме того, стоит подчеркнуть, что при помощи данной методики существует возможность точного определения шансов приживания донорских органов после их трансплантации. Такая возможность является востребованной в том случае, когда необходима срочная операция по пересадке органов. Естественно, что в данной ситуации времени на проведение дополнительных тестов нет.

К слову, методика также позволяет выяснить миграционные пути человечества. Конечно, что этот вектор не мог не заинтересовать ученых. Исходя из этого, планируется проведение серии дополнительных экспериментов.

Ссылка sbio.info

Сибирские ученые выявили у тувинцев особую мутацию, отвечающую за глухоту

Сибирские ученые выявили у тувинцев особую мутацию, отвечающую за глухоту

 

Потеря слуха входит в число самых распространенных врожденных заболеваний. В среднем, один из двух тысяч людей появляется на свет глухим. Более половины из них имеют генетическую причину недуга. Чаще всего в этом виноват ген GJB2 (Сх26). Оказалось, что почти у каждой расы он имеет свои специфические изменения, приводящие к глухоте. Кандидату биологических наук Ольге Леонидовне Посух из Института цитологии и генетики СО РАН удалось выявить мутацию, из-за которой в большинстве случаев рождаются тугоухие дети в Тыве.

 

Географическое распространение компонентов нового калькулятора проекта MDL K27

Не успела бета-версия моего нового этно-популяционного калькулятора и сопутствующего ему геномного оракула (Dodecad oracle) пойти в массы, как один талантливый россиянин Сергей Козлов из Новосибирска (о котором я уже много раз упоминал в блоге) написал программу, позволяющую довольно точно проецировать/предсказывать ареал происхождения анализируемого человека по мере степени увеличения или убывания  процентов предковых компонентов (или аллельных частот)  в отношении к априори заданым точкам на контурным картам (эти точки на контурной карте соответствуют контрольным группам референсных популяций).

Отклоняясь в сторону от темы, хочу отметить что два года назад, когда я начал работу над проектом MDL, я не надеялся найти активных последователей среди русскоговорящего населения, хотя задекларированный в анонсе ареал проекта частично охватывал часть современной западной европейской части России.  Причина моего пессимизма была очевидна — современные русские (впрочем как и 90% прочего человеческого населения) ленивы, глупы и любят бесплатно паразитировать на результатах труда других людей.  К началу 2011 года можно было по пальцам пересчитать тех русскоязычных людей, которые занимались  практическим изучением аутосомного родства и изучения происхождения, или создавали соответствующее программное обеспечение. По прошествии 2 лет,  я должно признать, что в своих мрачных прогнозах немного ошибался.   К счастью, не перевелись еще в известных российских IT-селениях вроде Новосибирска энтузиасты-кулибины.  А это означает, что надежда на пробуждение массового  интереса к ДНК-генеалогии в РФ, так же как это произошло уже в США, где уже сейчас можно наблюдать геномную революцию  во всей ее динамике.

Но вернемся к теме.

Итак,  уважаемый Сергей Козлов разработал интересное программное решение для визуализации пространственного расположения индивида, исходя исключительно из аллельных чистот снипов в геноме:

Я написал программу для совмещения данных этно-калькулятора с географической картой. Чем краснее область, тем более похож протестированный на ее жителей. И наоборот, чем зеленее, тем дальше от них. Черным цветом надписаны популяции, основанные на данных реальных людей, серым — частично или полностью основанные на предположениях.

В связи  с этим, нужно отметить два важных нюанса.
Во-первых,  число реперных точек (т.е «реперных» популяций) по европейской части РФ у Сергея  гораздо выше, чем в оригинальной бета-версии моего калькулятора K27 . Число точек в модификации Сергея было увеличено за счет включения фиксирующих дополнительных групп народонаселения РФ.
Во-вторых, cама идея визуализации  геномных данных на географической карте далеко не нова.  Весной этого года, в своей большой обзорной статье о принципах созданиях этно-популяционных калькуляторов на примере MDL World K22,  я указал на возможность визуализации коэффициентов адмикса в географическом пространстве:

… я решил визуализировать компоненты на поверхности земного шара путем отображения коэффициентов адмикса. Избегая излишних премудростей, я воспользовался готовым рецептом Франсуа Оливье, который предложал  использовать графическую библиотеку статистического программного обеспечения R для отображения пространственной интерполяции  коэффициентов адмикса (Q матрица) в двух измерениях (где пространственные координаты записываются как географические долгота и широта).

При вдумчивом прочтении подобных методов, встает неизбежный вопрос — почему градиенты аллельных частот в геноме людей являются крайне информативными при определении места их происхождения?   Частичный ответ на этот вопрос можно найти в другой моей заметке «О новых перспективах геномной геногеографии: SPA анализ участников проекта MDL«. В этой заметке я обсуждал перспективу расширения традиционных геногеографических методов, так как эксплицитное пространственное моделирования частот аллелей позволяет достаточно точно локализовать положение отдельно взятого человеческого индивида  на географической карте только на основании генетической информации. Если географическое происхождение лиц известно априори, то можно использовать эту информацию для определения функции частот аллелей в каждом SNP. Однако, если таковая информация отсутствует, то наша модель позволяет определить географическое происхождение физических лиц, используя только их генетические данные аналогично более известному методу  многомерного скалирования , основанному на определении пространственных координат статистических параметров.
Это заключение подтверждается в независимом исследовании компании 23andme, согласно которому анализ главных компонентов генетического разнообразия в геноме человека позволяет точно определить его место происхождения в Европе.

К сожалению, в отличии от авторов программы SPA, Cергей Козлов пока не счел нужным опубликовать формальное описание своего метода. Вместо этого, он обкатал программу на данных живых людей и привел их результаты. Вот результаты самого Сергея

Легенда

Результаты «типичного русского»

Результаты карпатского русина

Кроме этого, программа  Сергея умеет визуализировать частоты компоненты калькулятора в мировом масштабе. Ниже приведены все 27 компонентов калькулятора в алфавитном порядке:

Ancestral-South-Indian Ancestral-Yayoi Arabic Australo-Melanesian Austronesian Baltic-Finnic Bantu Bushmen Caucasian-Near-Eastern Central-African-Hunter-Gatherers Central-African-Pygmean Congo-Pygmean Cushitic East-Siberean Gedrosia-Caucasian Kalash Nilo-Saharian Nilotic-Omotic North-African North-Amerindian North-Circumpolar North-European-Baltic Papuan-Australian South-Meso-Amerindian South-West-European Tibeto-Burman Uralic