Географическое позиционирование людей на основании их генетических данных

Как известно, значительное количество людей интересуется вопросом своего положения в мире. Развитие биоинформатики и персональной геномики позволяют дать один из возможных вариантов ответа на вопрос о нахождении своего места в мире, причем в прямом смысле этого слова, т.е в смысле географического положения проекции генома индивида на карте мира.

На научном языке этот трюк называется генографическая визуализация или биогеографическое позиционирование. В своем блоге я показывал разные способы подобной визуализации, главными из которых являются:
1) Наиболее важным из них представляется  эксплицитное пространственное моделирования частот аллелей позволяет достаточно точно локализовать положение отдельно взятого человеческого индивида  на географической карте только на основании генетической информации — метод SPA.

2) Вторым по важности методом является метод, предложенный Сергеем Козловым — метод визуализации пространственного расположения индивида, исходя исключительно из аллельных чистот снипов в геноме (подробнее читай в моем блоге).

3) Наконец, третий подход опирается на рецепт Франсуа Оливье, который предложил  использовать графическую библиотеку статистического программного обеспечения R для отображения пространственной интерполяции  коэффициентов адмикса (Q матрица) в двух измерениях (где пространственные координаты записываются как географические долгота и широта) (подробности здесь).

Разумеется, методов и способ визуально-пространственного отображения генетических различий в глобальном мировом масштабе гораздо больше.

Подтверждением этого является разработанный сотрудниками  Genomics and Computational Biology Research Group, University of South Wales (Австралиями) метод GPS- позиционирования места происхождения индивида на основе анализа admixture в индивидуальных данных чипсета Geno 2.0 (совместный продукта Спенсера Уэллса и National Geographic). Метод был обкатан на данных сардинцев, и согласно заверениям авторов, этот метод доказал свою робастность на реальных данных:

Поиск биогеографического метода, который использует биологическую информацию для прогнозирования места происхождения, занимал ученых на протяжении тысячелетий. Современные алгоритмы биогеографического позиционирования достигают точности предсказания с погрешностью +- 700 км в Европе, однако их результаты оказываются крайне неточны в других местах, в частности в Юго-Восточной Азии и Океании. Здесь мы представляем новый метод анализа admixture на основе географической структуры населения (GPS), который точно определяет регион биогеографического происхождения лиц по всему миру вплоть до локального уровня. Точность GPS демонстрируется на трех наборах данных:  на популяциях всего мира, популяциях Юго-Восточной Азии, Океании и Сардинии (Италия) с использованием  40,000-130,000 снипов чипа GenoChip. GPS правильно расположены 80%  индивидов в пределах их страны происхождения, причем эта точность достигла 87% для азиатов и жителей Океании. Применительно к более чем 200 сардинцам обоих полов, GPS разместил примерно четверть в их родовые «деревни», а большинство остальных (то есть 80%) в пределах 50 км от их села, что позволяет нам определить демографические процессы, которые сформировали общество Сардинии. Наконец, мы еще раз продемонстрировали три дополнительных приложения GPS в отслеживании биогеографического происхождения друзов населения и выявления истоков европейской североамериканцев.Точность и эффективность GPS подчеркивают важность методов биогеографии основанных на данных Admixture и имеет важные последствия для генетического тестирования происхождения, судебно-медицинских и медицинских наук, и  общих вопросов генетической конфиденциальности.

Хотя изначально тест и разрабатывался под чип Geno 2.0, логика использования приложений GPS (которые работают на выходных данных анализа Admixture) легко позволяет создавать «самодельные» модификации c помощью имитирующих запусков Admixture на данных, чьи параметры соответствуют параметрам данных использованных для создания приложений GPS.

В качестве таких пилотных трюков можно упомянуть трюк геномного блоггера Веселовского. С результатами этого интересного эксперимента можно ознакомиться на Gedmatch, так как использованный в эксперимента Веселовского калькулятор K9b был имплементрован на Gedmatch.

Вот например, мои данные (которые, в принципе были предсказуемы) для большинства выходцев из Северо-восточной Европы. Как видно, погрешность точки локализации по-прежнему составляет +-700 км (если не больше) в радиусе от вычисленного положения на карте.

Calculated Place of Origin: Lithuanians

Longitude: 19.1421697241843,
Latitude: 51.767721502303

 

Advertisements

Географическое позиционирование людей на основании их генетических данных: Один комментарий

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s