Хочу выразит публично огромную признательность ув. Александру Бурнашеву за проделанную работу над новым приложением, использующием в качестве входных данных аллельные частоты компонентов, определенных у различных человеческих популяций с помощью моего калькулятора и калькуляторов Диенека и Веселовского.
Cкажу честно — я уже не надеялся увидеть в российском секторе интересующихся ДНК-генеалогией и генетикой вдумчимвых и предприимчивых новичков, способных к тщательному и глубокому анализу данных, а также умеющих реализовать все это в виде программного обеспечения. К cожалению, большинство любителей и полупрофессионалов в это узкой сфере не отличаются особым стремлением к инновациям, погрязнув в простых арифметических упражнениях.

Поэтому новое детище Александра заслуживает особого внимания. Речь идет о EtnoGraph (Версия 093: http://db.tt/5w7sxGOM). На правах рекламы дам краткое изложение принципов со слов автора, тем более что это касается и моего детища World-22 MDLP:
«Делает PCA и рисует PCA плоты.
При загрузке данных выборки генерирует файл с результатами PCA (для тех, кому он интересен).В архив добавлены файлы данных калькуляторов с использованием точки (а не запятой) как разделителя целой и дробной частей — для тех, у кого такие настройки системы.

##########

Добавлена возможность «скрывать» достаточно удаленные точки (расстояние вычисляется по всем осям, а не только по отображаемым). Уровень «скрытия» можно плавно менять.
Добавлена возможность вместо своих персональных данных использовать данные какой-либо выборки. Удобно при анализе различных народов.»

«Выдаваемый плот — это проекция точки в 21-мерном пространстве (суть PCA — построить такую метрику, чтобы все векторы были ортогональными) на 2-мерную плоскость. Если взять другие оси, то, скажем чехи все равно будут рядом со словаками, а вот лумби (которые попадают между ними при выборе пары PCA1 и PCA3) окажутся далеко. Кстати, этноплот 23иЯ похожим образом устроен (при разных масштабах выбираются разные оси).

Да и у Макдональда белорусы возле ирландцев.
Степень информативности каждой оси можно посмотреть в генерируемом файлике (столбец EIGENVALUES)
По сути у нас все оси информативны, но некоторые больше, некоторые меньше. Видимо, это специфика самого калькулятора.

Взяв за базис малоинформативные оси, получим на плоте тесную «кучу» популяций и несколько «выбросов». Информация о специфических качествах последних как раз и содержится в малоинформативных осях.

Поигрался с разными калькуляторами. Интересные результаты.

У MDLP-W22 есть 3 наиболее информативных оси и 18 менее. Например, 4-я ось — специфическая австралийско-меланезийско-пигмейская.

У J-Testa 11 осей средней информативности и целых 3 (вместо одной) полностью вырожденных. У EU-Testa 2 вырожденных. Думаю, это говорит о том, что результаты этих калькуляторов избыточны. Видимо, значение Ashkenazi и еще какое-то одно (общее у обоих тестов Поляко) генерируются на основании других.»