О нарушениях менделеевского закона

В дополнение к предыдущем посту неплохая информативная статья на смежную тему (полный вариант здесь):

Кто делает вас в генетическом смысле тем, кто вы есть? Простой ответ — ваша семья. Более пространный ответ начинается с того факта, что все человеческие существа имеют двух родителей (по крайней мере пока) и, как правило, двух бабушек и двух дедушек (есть и не очень счастливые исключения). В генетическом отношении вы являетесь рекомбинацией четырех отдельных индивидов. Но это не означает, что вы получили равный вклад от всех этих четырех людей. Обычно человек имеет 23 пары хромосом: 22 аутосомные пары и одну пару половых хромосом, либо двух копий X у женщины, либо пары X и Y у представителей мужского пола. По закону Менделя о сегрегации, вы получаете одну копию каждой пары от вашей матери (через яйцо) и одну копию пары от вашего отца (через сперму). Это означает, что ровно половину вашего генома вы получаете от каждого из родителей.

Ситуация становится более сложной, если пойти на два поколения назад. Кто-то может подумать, что из 44 аутосомных хромосом вы получите по 11 от каждого из них. (Для простоты мы пока оставим в стороне половые хромосомы. Если вы женщина, то вы получите по одной X-хромосоме от каждого из родителей, а если вы мужчина, то вы получите X-хромосому от вашей матери и Y-хромосому от вашего отца, который получил ее от своего отца). В то время как пропорции наследственности от родителей фиксированы точной необходимостью, наследственность от бабушек и дедушек зависит от случайности. В отношении каждой хромосомы, унаследованной вами от родственников, у вас 50% шансов получить копию от вашего дедушки и 50% шансов получить копию от вашей бабушки. Закон независимой вероятности предполагает, что здесь речь идет об одном из 4 миллионов случаев, при котором все ваши материнские или отцовские хромосомы могут принадлежать только одному из родителей ваших родителей. Более того, генетическая рекомбинация означает, что эти хромосомы не будут получены в чистом виде от одного дедушки или от одной бабушки; во время деления клетки и образования спермы и яйца, хромосомы обмениваются своими сегментами и становятся гибридами. Совершенно определенно можно сказать о том, что вы имеете различный генетический вклад от родителей ваших родителей.

The inferred distribution of grandparental contribution — Gene Expression | DiscoverMagazine.com

Разиб Хан поделился ссылкой на интересное эмпирическое исследование в котором были опубликованы гистограммы распределения доли генома, унаследованных от дедушек и бабушке в большой выборке обследованных индивидов.

Основной вывод — распределение долей генома наследуемых от родителей матери и отца в геноме мужчин имеет более значительные, «длинные» хвосты. В геноме женщин распределение аналогичных долей ближе к нормальному.

Цитата

«Therefore, you see that 1 in 200 sperm are skewed such as that 20% or less of genetic material in the sperm is from one grandparent. Because you have to divide this by half in the fertilized zygote, what this means that in 1 in 200 individuals you have a case where 10% or less of their genome is from one paternal grandparent, and 40% or more from the other! The histogram for females, as you can see, is much less dispersed, though the variation there is not trivial either. I suspect that the scientists at 23andMe almost certainly know the empirical distribution, as they likely have many pedigrees to compare. It would be nice if they shared that with us.«

 

The inferred distribution of grandparental contribution — Gene Expression | DiscoverMagazine.com.

О убийце по прозвищу Zodiac, биоинформатике и генетических алгоритмах.

Пожалуй, одна из самых загадочная фигура среди тех серийных убийц, чьи личности и преступления остались нераскрытыми. Собственно говоря, легенда Зодиака основана не на числе убитых — в сравнении с другими серийными убийцами, список его жертв небольшой, официально «всего лишь» 5 человек (сам Зодиак заявил в своем письме о гораздо большем числе жертв). Гораздо интереснее способ коммуникации Зодиака с общественностью — он присылал письма, которые содержали в себе намеки на личность преступники. Причем эти намеки либо были закодированы, либо представлены в виде текстовых или графических шарад.

Наиболее интересной частью посланий являются 4 закодированных сообщений. Это «408», «340» и 2 коротких закодированных посланий в конце обычных писем. (одно их которых якобы содержало имя убийцы).
Код «408» был расшифрован любителями — семьей учителей из Калифорнии за один день. Короткие сообщения в силу своей краткости (небольшого числа (10-13) символов) вряд ли когда-либо получат однозначную расшифровку. На настоящий день известны десятки тысяч вариантов прочтения, и множество имен подходящих под паттерн предполагаемого кодированного имени. Но все они под вопросам.

Первые три криптограммы состояли из символов, заменяющих буквы. Но в них была одна хитрость: некоторые из наиболее часто встречающихся букв, таких как «е» обозначались несколькими символами, поэтому найти решение при помощи простых дешифровальных техник, таких, как обнаружение наиболее распространённых букв, было невозможно.

Три шифровки были, в конце концов, прочитаны. Помогло предположение, что в подобный текст не мог обойтись без слов «убить» и «убийство». Когда полученные результаты сложили вместе, получилось одно длинное письмо, в котором убийца подробно описывал удовольствие, которое получал, совершая то, что совершал. Никаких намёков на его или её личность не было и в помине.

Вполне возможно, имя убийцы скрывает четвёртая шифровка, датированная ноябрём 1969-го года, которую Зодиак прислал в редакцию местной газеты. В ней 340 символов, это меньше, чем в трёх предыдущих, и методы шифрования в ней использованы абсолютно другие. Начальник отдела криптоанализа ФБР Дэн Олсон как-то заявил, что для его команды эта криптограмма, известная как Z-340 – «приоритет номер один в горячей десятке нерасшифрованных кодов». Он утверждает, что каждый год от 20 до 30 дешифровщиков-любителей предлагают ему свою помощь в решении этой загадки, но никакого положительного результата добиться пока не удалось.

Команда профессионалов проанализировала распределение символов в тексте, чтобы выяснить, не является ли послание «пустышкой». Если никакого решения нет, или текст был изменён до полной неузнаваемости, тогда распределение знаков в строке должно было совпасть с распределением знаков в столбцах, но этого не произошло.

В 2009 году ученый Райан Гарлик, работающий в области компьютерных наук в Университете Северного Техаса в Дантоне, попытался вместе со своими студентами «вывести» решение, используя так называемый генетический алгоритм (Класс алгоритмов, базирующийся на генетике и естественном отборе. Его суть заключается в перемешивании наиболее перспективных вариантов решений из первоначального случайного набора вариантов, совмещённом с процессом отбора лучших вариантов; прим. mixednews).

Сначала ученики Гарлика составляли возможные пары английских букв с символами из закодированного текста. После этого они анализировали полученные с их помощью последовательности из двух-трёх букв, отбирая те, которые могли бы содержаться в потенциальном решении, например цепочки букв «th» или «es», характерные для английского.

Самые подходящие пары принимались для дальнейшего отбора и комбинирования. Используя этот метод, они сумели найти ключ к первой криптограмме Зодиака, но с Z-340 серьёзного успеха не добились.

Гарлик предположил, что в этом случае нужна некая перегруппировка символов в тексте. Но, в этом случае, количество возможных действий с текстом бесконечно. Это обескураживает. Учёный уверен, что никакие компьютерные программы не помогут приблизиться к разгадке, пока не удастся разгадать сам принцип, по которому текст был зашифрован.

Сравнительно недавно программист-любитель Дан Умановскис написал дополнительный модуль к известной среди любителей криптографии программы zkdecrypto-lite (c помощью этой программы код Z-408 дешифруется меньше чем за минуту):

time ./zkdecrypto-lite cipher/408.zodiac.solved.txt -s 44000
44027,ITIKEKILTINGPEOPLEBECAUSEITISSOMUCHFUNITIUMORERUNTHAN
KILLINGWITDGAMEINTHEFORHESTBECAUSEMANISTHEMOATDANGERTUEANAM
ALORALLTOKILLSOMETHINGGIVESMETHEMOATTHRILLINGECPEHENCEITISE
VENBETTERTHANGETTINGYOURHOCKSOFRWITHAGIRTTHEBESTPARTOFITIAT
HAEWHENIDIEIWILLBEHEBORNINPARADICEUNDATTTHEIHAVEKITTEDWILLB
ECOMEMYSLAVESIWILTNOTGIVEYOUMYNAMEBECAUSEYOUWITLTRYTOSLOIDO
WNOHUTOPMYCOLLECTINGORSTAVESFORMYAFTERLIREEBEORIETEMETHHPITI

real 0m1.241s
user 0m1.167s
sys 0m0.028s

Умановскис добавил интересное описание своего подхода:

Во-первых, несколько простых определений для GP.

Индивид — это один из вариантов решения  проблемы. С точки зрения биологической аналогии, он соответствует одному отдельному индивиду — представителю вида (класса), отсюда и название.
Геном — это описание индивида. В качестве простого примера , если нашей задачей является нахождение формулы объема пирамиды , то геном по своей сути будет представлять формулу.
Поколение — большее количество » синхронно рассматриваемых» индивидов.
Кроссовер(рекомбинация) — аналогия полового размножения в биологии, то есть процесс, в котором новые индивиды создается с помощью двух других индивидов предыдущего поколения. Геном нового индивида представляет собой смесь из родительских геномов .
Мутации — случайные изменения генома индивида.
Приспособленность — это показатель того, насколько «приспособленным» является отдельно взятый индивид. В нашем случае, насколько приспособленной является полученная расшифровка с точки зрения семантики и грамматики связанного текста, иными словами, насколько приемлемо расшифрованное сообщение с точки зрения семантики связанного и грамматически оформленного текста.

Без углубления в технические детали, и используя только вышеприведенные определения, объяснение принципов работы GP можно озвучить примерно так:

1. Создается набор индивидов , со случайно генерируемыми геномами. Это поколение 0 .
2 . Производится оценка пригодности каждого отдельного индивида (с использование ZKD -Lite) .
3 . Значительное число индивидов поколения 0 воспроизводят потомство через кроссовер , которое заменяет популяцию индивидов поколения 0. Это следующее поколение.
4 . В популяцию вносятся мутации, которые случайным образом вносят изменения в геномы индивидов этого поколения .
5 . Возвращение к точке № 2.

Мне нравится применение генетических алгоритмов, формализующих основные биологические и биохимические явления, в областях имеющих к биологии и генетики далекое отношение (например, в криптоанализе). Тут наверное необходимо пояснить, почему эти алгоритмы называются генетическими.

В принципе, в Интернете сторонниками и противниками применения генетических алгоритмов для решения небиологических проблем  размещено немало материала на эту тему (например см. работу о применение генетических алгоритмов в криптоанализе). Одно из лучших описаний сути и принципов генетических алгоритмов можно найти на форуме Хабрахабра. Внизу приведена выдержка с этого форума.

Щепотка истории

Как говорит Википедия: «Отец-основатель генетических алгоритмов Джон Холланд, который придумал использовать генетику в своих целях аж в 1975 году». Для справки в этом же году появился Альтаир 8800, и нет, это не террорист, а первый персональный компьютер. К тому времени Джону было уже целых 46 лет.

Где это используют

Поскольку алгоритм самообучающийся, то спектр применения крайне широк:

  • Задачи на графы
  • Задачи компоновки
  • Составление расписаний
  • Создание «Искусственного интеллекта»

Принцип действия

Генетический алгоритм — это в первую очередь эволюционный алгоритм, другими словами, основная фишка алгоритма — скрещивание (комбинирование). Как несложно догадаться идея алгоритма наглым образом взята у природы, благо она не подаст на это в суд. Так вот, путем перебора и самое главное отбора получается правильная «комбинация». 
Алгоритм делится на три этапа:

  • Скрещивание
  • Селекция (отбор)
  • Формирования нового поколения

Если результат нас не устраивает, эти шаги повторяются до тех пор, пока результат нас не начнет удовлетворять или произойдет одно из ниже перечисленных условий:

  • Количество поколений (циклов) достигнет заранее выбранного максимума
  • Исчерпано время на мутацию
Более подробно о шагах

Создание новой популяции. На этом шаге создается начальная популяция, которая, вполне возможно, окажется не кошерной, однако велика вероятность, что алгоритм эту проблему исправит. Главное, чтобы они соответствовали «формату» и были «приспособлены к размножению». 
Размножение. Ну тут все как у людей, для получения потомка требуется два родителя. Главное, чтобы потомок (ребенок) мог унаследовать у родителей их черты. При это размножаются все, а не только выжившие (эта фраза особенно абсурдна, но так как у нас все в сферическом вакууме, то можно все), в противном случае выделится один альфа самец, гены которого перекроют всех остальных, а нам это принципиально не приемлемо.
Мутации. Мутации схожи с размножением, из мутантов выбирают некое количество особей и изменяют их в соответствии с заранее определенными операциями.
Отбор. Тут начинается самое сладкое, мы начинаем выбирать из популяции долю тех, кто «пойдет дальше». При этом долю «выживших» после нашего отбора мы определяем заранее руками, указывая в виде параметра. Как ни печально, остальные особи должны погибнуть.

Практика

Вы успешно прослушали «сказку» про чудо-алгоритм и вполне возможно заждались, когда мы его начнем эксплуатировать наконец, хочу вас обрадовать, время настало.
Давайте рассмотрим на примере моих любимых Диофантовых уравнений (Уравнения с целочисленными корнями).
Наше уравнение: a+2b+3c+4d=30
Вы наверно уже подозреваете, что корни данного уравнения лежат на отрезке [1;30], поэтому мы берем 5 
случайных значений a,b,c,d. (Ограничение в 30 взято специально для упрощения задачи)
И так, у нас есть первое поколение:

  1. (1,28,15,3)
  2. (14,9,2,4)
  3. (13,5,7,3)
  4. (23,8,16,19)
  5. (9,13,5,2)

Для того чтобы вычислить коэффициенты выживаемости, подставим каждое решение в выражение. Расстояние от полученного значения до 30 и будет нужным значением. 

  1. |114-30|=84
  2. |54-30|=24
  3. |56-30|=26
  4. |163-30|=133
  5. |58-30|=28

Меньшие значения ближе к 30, соответственно они более желанны. Получается, что большие значения будут иметь меньший коэффициент выживаемости. Для создания системы вычислим вероятность выбора каждой (хромосомы). Но решение заключается в том, чтобы взять сумму обратных значений коэффициентов, и исходя из этого вычислять проценты. (P.S. 0.135266 — сумма обратных коэффициентов)

  1. (1/84)/0.135266 = 8.80%
  2. (1/24)/0.135266 = 30.8%
  3. (1/26)/0.135266 = 28.4%
  4. (1/133)/0.135266 = 5.56%
  5. (1/28)/0.135266 = 26.4%

Далее будем выбирать пять пар родителей, у которых будет ровно по одному ребенку. Давать волю случаю мы будем давать ровно пять раз, каждый раз шанс стать родителем будет одинаковым и будет равен шансу на выживание.
3-1, 5-2, 3-5, 2-5, 5-3
Как было сказано ранее, потомок содержит информацию о генах отца и матери. Это можно обеспечить различными способами, но в данном случае будет использоваться «кроссовер». (| = разделительная линия)

  • Х.-отец: a1 | b1,c1,d1 Х.-мать: a2 | b2,c2,d2 Х.-потомок: a1,b2,c2,d2 or a2,b1,c1,d1
  • Х.-отец: a1,b1 | c1,d1 Х.-мать: a2,b2 | c2,d2 Х.-потомок: a1,b1,c2,d2 or a2,b2,c1,d1
  • Х.-отец: a1,b1,c1 | d1 Х.-мать: a2,b2,c2 | d2 Х.-потомок: a1,b1,c1,d2 or a2,b2,c2,d1

Есть очень много путей передачи информации потомку, а кросс-овер — только один из множества. Расположение разделителя может быть абсолютно произвольным, как и то, отец или мать будут слева от черты. 
А теперь сделаем тоже самое с потомками:

  • Х.-отец: (13 | 5,7,3) Х.-мать: (1 | 28,15,3) Х.-потомок: (13,28,15,3)
  • Х.-отец: (9,13 | 5,2) Х.-мать: (14,9 | 2,4) Х.-потомок: (9,13,2,4)
  • Х.-отец: (13,5,7 | 3) Х.-мать: (9,13,5 | 2) Х.-потомок: (13,5,7,2)
  • Х.-отец: (14 | 9,2,4) Х.-мать: (9 | 13,5,2) Х.-потомок: (14,13,5,2)
  • Х.-отец: (13,5 | 7, 3) Х.-мать: (9,13 | 5, 2) Х.-потомок: (13,5,5,2)

Теперь вычислим коэффициенты выживаемости потомков.

  • (13,28,15,3) — |126-30|=96(9,13,2,4) — |57-30|=27
    (13,5,7,2) — |57-30|=22
    (14,13,5,2) — |63-30|=33
    (13,5,5,2) — |46-30|=16

    Печально так как средняя приспособленность (fitness) потомков оказалась 38.8, а у родителей этот коэффициент равнялся 59.4. Именно в этот момент целесообразнее использовать мутацию, для этого заменим один или более значений на случайное число от 1 до 30. 
    Алгоритм будет работать до тех, пор, пока коэффициент выживаемости не будет равен нулю. Т.е. будет решением уравнения.
    Системы с большей популяцией (например, 50 вместо 5-и сходятся к желаемому уровню (0) более быстро и стабильно.


О ДНК Капетингов, Наполеона и потомках Ötzi (тирольского ледяного человека)

Кроме работ по митохондриальной ДНК жителей доисторической Европы, следует упомянуть ряд исследований ДНК гораздо более известных, исторических личностей, опубликованных в этом же месяце.

Во-первых, это исследование Y-хромосомы Наполеона в статье Lucotte et al. «Reconstruction of the Lineage Y Chromosome Haplotype of Napoléon the First «.

В одном из ранних исследований биологического материала Наполеона, была показана принадлежность его к Y-хромосомной гаплогруппе E1b1b1c1* (E-M34*) (Lucotte et al. 2011). Новая работа уточняет некоторые детали предыдущего исследования, и в ней реконструируется 111-маркерный гаплотип Наполеона путем сравнения гаплотипа Наполеона с гаплотипами прямых и побочных потомков рода Буонопарте.

В рамках проекта геном Наполеона I, мы реконструировали более чем сто Y -STR (Y- коротких тандемных повторов ) в полном Y- гаплотипе нерекомбинантной части Y -хромосомы ( NRY ) французского императора Наполеона I ( 1769-1821 ) . Ранее нам были известны значения аллелей в Y- маркерах Y- хромосомы Наполеона I , только в палиндромных STR-локусах YCAIIa и В, а также в непалиндромном Y-STR DYS19 . Настоящий опыт реконструкции ставит своей целью сравнить аллельные значения в Y -STR ДНК Шарля  Наполеона (CN) , ныне живущего потомка в четвёртом поколении Жерома Бонапарта (младшего брата Наполеона I ) , с аллельными значениями Y-STR ДНК Александра Колонны-Валевского ( ACW ) , потомка  в четвертом поколении графа Александра Валевского (рожденного от внебрачной связи Наполеона I с графиней Марии Валевской ). Ранее нами было установлено, что Наполеон I , CN и A.C.W. имеют одинаковую Y- гаплогруппу E1b1b1b2a1 .

Другая работа Larmuseau et. all (2013) «Genetic genealogy reveals true Y haplogroup of House of Bourbon contradicting recent identification of the presumed remains of two French Kings» , возвращается к анализу Y-гаплогруппы представителей Бурбонов — династии французских королей. Однако, в отличии от работы по Наполеону, результаты этого исследования опровергают результаты исследования  предполагаемой крови Людовика XVI в работах Lalueza-Fox et al. (2011) и предполагаемых останков (мумифицированной головы) короля Генриха IV в работе Philippe Charlier et al. (2012). В предыдущих работах было показано, что гаплотипы Y-STR в древних образцах ДНК принадлежали к гаплогруппе G2a, причем короткий 6-маркерный гаплотип предполагаемой мумии Генриха IV совпал по 5 маркерам с предполагаемым гаплотипом его потомка Людовика XVI.

Новое исследование произведенное с использованием ДНК 3 официально признанных членов суверенной династии Бурбонов (princes Sixte-Henri de Bourbon-Parme, Axel de Bourbon-Parme et Jean d’Orléans-Bragance), показало что их гаплотипы и гаплогруппа (R1b-U106) отличаются от тех, что были объявлены в двух более ранних исследованиях:

Генетический анализ в значительной степени улучшает способы идентификации останков или других биологических образцов исторических деятелей. Однако проверка точности этой идентификации имеет важное значение и должна выполняться путем ДНК-типирования  ныне живущих родственников. На основании сходства ограниченного набора Y -STR , проба крови и мумифицированная голова недавно были идентифицированы как принадлежащие , соответственно, королю Людовику XVI, и его  предку по отцовской линии, королю Генриху IV. В этом исследовании мы собрали образцы ДНК трех человек, происходящих из королевского дома Бурбонов для проверки спорной идентификации этих останков. Анализ ДНК трех живых родственников показал с высоким филогенетическим разрешением наличие характерного Y- хромосомного варианта Бурбонов для некоторых членов династии Бурбонов, имеющих общего предка в родословной линии, которая идет от  Генриха IV к Людовику XVI. Этот вариант «истинных» Бурбонов отличается от опубликованных раннее Y-STR профилей крови, а также мумифицированной головы. Таким образом, более ранняя идентификации этих образцов , не может быть достоверной. Кроме того, матрилинейные генеалогические данные показали , что опубликованная последовательность мтДНК головы также отличается от последовательности мтДНК  у серии матрилейнынх родственников короля Генриха IV . Таким образом, мы приходим к выводу , что анализируемые образцы не принадлежат французским королям. Наше исследование еще ​​раз показало, что в целях реализации точной генетической идентификации ДНК останков исторических деятелей, необходимо проводить проверку с помощью анализа ДНК живых людей , которые по отцовской или материнской линии связанны с предполагаемым донором образцов .

Прочитав эту ремарку авторов, мне почему-то вспомнилось фрагменты из известной книги Робера Амбелена «Драмы и секреты истории», в которой убедительно доказывалось, что значительное число принцев и даже королей из различных отраслей рода Капетингов (Валуа, Бурбонов и прочих) не были биологическими потомками своих родителей. Вот, например,  характерный пассаж из книги Амбелена:

Карл VI, родившийся 3 декабря 1368 г., женился 18 июля 1385 г. на Изабо Баварской, родившейся в 1371 г. Ему было 17 лет, ей — 14. Она была красива, чувственность пробудилась в ней очень рано. В течение всей ее жизни эта чувственность предъявляла ей все большие требования. Он был наделен не менее пылким темпераментом, но, кроме того, он мечтал о сражениях и славе[72]. Французский двор тех времен был более развращен, чем при Людовике XV, потому что инстинкты тогда проявлялись более примитивно. Два этих поколения разделяют четыре века, и это говорит о многом. Не будем же поражаться скандальным оргиям, происходившим в замке Ботэ-сюр-Марн, рядом с теперешним Ножаном. За замком — огромный в те времена Венсеннский лес. В дальнейшем Изабо Баварская устроила в нем свой причудливый «Двор любви». В нем в отличие от воспетого Петраркой прибежища его Лауры царила не платоническая любовь, а плотская, возбуждавшая самые низменные инстинкты и самые изощренные извращения, которые в данном случае были единственными, удостаивавшимися награды.

«Летопись монаха из Сен-Дени» сообщает нам, что во время церемонии посвящения в рыцари юного короля Сицилии, сына графа Анжуйского и кузена Карла VI, рядом с прославленной базиликой происходили поразительные оргии. А ведь в ней покоились короли Франции. Мы читаем в этой летописи: «Каждый стремился удовлетворить свою похоть, так что нашлись мужья, которым пришлось расплачиваться за непутевость своих супруг, и были также девицы, забывшие заботу о своей чести». Подобные дела, впрочем, творились в Ботэ-сюр-Марн сплошь и рядом, и придворные пиры завершались попросту свальным грехом.

На 17-м году своей жизни юная королева Изабо стала любовницей Луи Орлеанского и оставалась ею вплоть до его смерти в 1407/1408 г. Было ей тогда 36 лет. Через 10 лет, в свои 46 лет, она стала возлюбленной Иоанна Бесстрашного — убийцы Луи Орлеанского.

Но ни оргии в Ботэ-сюр-Марн, ни эти связи с французскими «принцами крови» не вызывали официальных скандалов. Добрый народ втихомолку судачил о них, но законный супруг — Карл VI — в те промежутки времени, когда его разум вновь возвращался к нему, не задавал никаких вопросов о законнорожденности детей Изабо. Все это, однако, прекратилось в тот зимний день 1416 г., когда граф Бернар VII д’Арманьяк, тесть Карла Орлеанского, только что назначенный коннетаблем, открыл Карлу VI глаза на связь с одним из почетных шталмейстеров, Луи де Буа-Бурдоном, иначе именуемым де Буаредоном, рыцарем, великим магистром дворца королевы, и одним из его советников. Связь эта длилась уже около 30 лет. Когда она началась, Изабо было 17 лет. Карл VI только что отбыл на войну во Фландрию, и ей казалось, что одинокие ночи не соответствуют ее темпераменту.Луи де Буа-Бурдон был доблестным воином. В ноябре 1411 г. он защищал форт Этамп, осажденный войсками Иоанна Бесстрашного. В 1415 г. при Азенкуре он командовал одним из флангов королевской армии. В 1416 г. он был арестован в присутствии самого Карла VI. Долгое время он содержался с цепью на шее, со скованными руками и ногами в темнице замка Монлери. В конце концов его привезли в Париж. Несколько дней подряд он подвергался допросу под пыткой. В 1417 г. его приговорили к смерти за оскорбление величества и за предательство своего государя, короля Франции. Он был зашит в кожаный мешок с надписью: «Дорогу королевскому правосудию» — и брошен в Сену.
Так вот, едва де Буа-Бурдон был схвачен, Карл VI приказал доставить Изабо в Тур, а имущество, которое она накопила и спрятала в разных местах, чтобы скрыть его размеры, конфисковал. В Туре она находилась под неусыпным надзором трех тюремщиков, головой отвечавших за ее поведение. Ее заклятый враг коннетабль Бернар д’Арманьяк тогда же занимался распродажей ее нарядов, драгоценностей, мебели и прочего. Он явно зашел чересчур далеко.
Изабо Баварской удалось сохранить при своей особе некоего Ле Клера, лакея Луи де Буа-Бурдона. Через него она сумела завязать переписку с герцогом Бургундским, Иоанном Бесстрашным, которому она предложила заключить союз. Герцог тотчас же снял осаду Корбея и помчался с 800 вооруженными всадниками на Тур. Согласно заранее выработанному плану, Изабо направилась в аббатство Нуармутье, чтобы говеть там перед причастием. Тогда владыка де Фавез во главе 60 вооруженных воинов окружил церковь, взял в плен двоих из надсмотрщиков (третьему удалось бежать через ризницу), заковал их в цепи и возвратил Изабо свободу. В тот же момент в Тур входил Иоанн Бесстрашный во главе своего небольшого войска. Он увез королеву в Шартр. Положение во Франции менялось.

В контексте этого небольшого фрагмента (всего лишь одного из многих!), меня нисколько не смущают расхождения в гаплогруппах различных доноров, официально или предположительно происходивших от Капетингов и Бурбонов. Что касается принадлежности Капетингов-Робертинов к гаплогруппе R1b-U106 (или если точнее R1b-Z381), то оно также весьма правдоподобно, принимая во внимание их франконское происхождение. Более того, Y-гаплогруппа образца древнего ДНК останков представителей рода австрийских герцогов Бабенбергов (см. работу Bauer et al. 2013) была определена как R1b-L48. В этой связи заслуживает упоминания одна из версий происхождения Бабенбергов, возводящая их к одному, общему с Робертинами-Капетингами, предку. По некоторым непроверенным слухам, к R1b-Z381 принадлежали и представители другого знатного немецкого рода — дома Веттинов.

Но довольно о королях и капусте. Третья статья гораздо более примечательна в том смысле, что в ней идет речь о потомках доисторической личности — Эци (тирольском ледяном человеке).  Ранее, в 2011 году, после изучения генома Эци, ученые также предположили, что генетическая группа людей, к которой принадлежит тирольский ледяной человек, уже не существует, и никто из ныне живущих людей не может быть потомком Эци.

В октябре этого года представители Медицинского университета Инсбрука (Австрия), воспользовавшись ранее прочитанным генетическим кодом Эци, установили, что в приграничных областях Италии и Швейцарии и сейчас тоже можно найти потомков Эци. Это утверждение последовало после анализа крови у 3700 добровольцев, среди которых у 19-ти была обнаружена та же редкая гаплогруппа G-L91, что и у древнего жителя Тирольских Альп. Характерно, что эти выводы по Y-хромосомной гаплогруппе подкрепляются моими собственными исследованиями в программе fineStructure.

После того, как я отфазировал «геномные варианты-снипы» Эци, а затем провел кластерный анализ схожести образцов ДНК в  fineStructure,  Эци оказался в одном кластере с пьемонтцами, то есть с жителями Северной Италии.  

Митохондриальная ДНК древних жителей Европы.

Октябрь этого года был особо богат публикациями на тему древней ДНК. Самым важным представляется исследование Brandt et al. «Ancient DNA Reveals Key Stages in the Formation of Central European Mitochondrial Genetic Diversity». По своей сути, эта статья подводит итоги десятилетия исследования митохондриальной ДНК древних жителей Европы в период между мезолитом/ранним неолитом и бронзовым веком. Поскольку статья носит обзорный характер, то в ней больше обобщений накопленной информации, чем собственно новой информации.

Древняя митохондриальная ДНК, выделенная из древних скелетов, была использована для восстановления первой подробной генетической истории современных европейцев. Исследование продемонстрировало, как менялся состав населения, происходили волны доисторической миграции. Исследователи составили каталог 364 результатов мтДНК  доисторических жителей Центральной Европы в период начиная с раннего неолита до бронзового века (продолжительность периода составляет примерно четыре тысячи лет). Главным выводом работы представляется тезис авторов  о том, что смешение коренных охотников-собирателей и пришлых ближневосточных земледельцев не может объяснить современное генетическое разнообразие, гораздо более сложное, чем результат простого смешения. Вместе с тем, ученые обнаружили, что эти две культуры на грани бронзового века 4200 лет назад сыграли существенную роль в формирование генетического строения в Центральной Европе.

Исследователей заинтриговало то, что генетические связи можно напрямую сравнивать с изменениями в материальной культуре. Генетические изменения происходили в период, когда культура расширяла свое влияние, и это может служить доказательством взаимодействия древних людей на больших расстояниях. К таким взаимоотношениям относятся миграции из Западной и Восточной Европы в конце каменного века, за счет расширения таких культур, как культура колоколовидных кубков и культура шнуровой керамики (они получили название по форме изготавливаемой посуды).

Тем не менее, один предварительный вывод уже может быть сделан. Парадигма миграционизма жива и по-прежнему актуальна. Любому исследователю-приверженцу парадигмы «горшки -это не люди»  будет трудно объяснить дискретность/прерывание преемственности, обнаруженной при исследовании и сравнении образцов ДНК неолита и бронзового века. Наблюдается серия контрастов: контраст между мито-ДНК древнеевропейских охотников и собирателей (митогаплогруппы U, U4, U5, U8) и ДНК первых европейских земледельцев (митогаплогруппы N1a,T2,K,J,HV,V, W,X) которые, в свою очередь, отличаются от ДНК представителей  позднего европейского неолита (медного века, гаплогруппы I, U2, T1, R), которые вытеснили земледельцев спустя несколько тысяч лет и породили культуры бронзового века. Если парадигма «горшки — это не люди» верна,  то весьма странно, что контрасты между археологическими культурами,  в значительной степени маркируются типом горшков  также, совпадают с зоной генетических контрастов.

Кроме того, удалось проследить не только хорошо изученный миграционный путь через Ближний Восток во времена так называемой неолитической революции, но также путь из Западной и Восточной Европы.


Следующая статья Bollongino et al. 2013 «2000 Years of Parallel Societies in Stone Age Central Europe» рассматривает проблему генетической преемственности под несколько иным углом. В работе показывается,  что охотники-собиратели не исчезли в Центральной Европе после введения сельского хозяйства, но некоторые из их потомков сосуществовали вместе с земледельцами еще в течение двух тысяч лет.

 

О вечной репродуктивной жизни и решении экономической проблемы глазами ведущих генетиков

В качестве эпиграфа

— Хорошо, послушай аргументы. Слыхал ли ты легенду о Филемоне и Бавкиде? Так вот, это была самая верная супружеская пара среди людей, и боги даровали им счастье умереть в один день, а после смерти превратили их в дуб и липу. Ромеро собрал все данные о Филемоне и Бавкиде и предложил Справочной просчитать их взаимное соответствие. Угадай, сколько получилось? Восемьдесят семь, на шесть сотых меньше, чем у тебя, чудак! Ты должен петь от радости, а не печалиться!

Герберт Уэллс «Люди как боги».

В этом очерки мы поговорим о интересных перспективах которая открывает нам генетика старения и новые репродуктивные технологии. В качестве примера, обратимся к насущной и злободневной темы касающейся целого спектра проблем, связанных с ЭКО (экстракорпоральным оплодотворением) и суррогатным материнством. Проблема получила свое широкое освещение в средствах массовой информации в связи с недавним благополучным разрешением экстракорпоральным бременем четы А.Пугачевы и Максима Галкина. Очевидно, что речь идет о интересном случае физиологического читерства, то есть обмана определенных процессов природы. Поскольку вопрос о легитном воспроизводстве ооцитов (яйцеклеток) у А.Пугачевой снимается в хотя бы в силу почтенного возраста, то на основании скупых фактов выданных в СМИ можно было предварительно выдвинуть две гипотезы.

Гипотеза A. При зачатии (образовании зиготы) была использована яйцеклетка А.Б, заблаговременно сданная на хранение в репродуктивный репозиторий сильных мира сего. Эта гипотеза, хотя и не столь интересная, косвенно подтверждала мою интуиционистскую догадку о популярности подобных учреждений у известного круга лиц. Но, в отличие от своих предшественников Онанисов и Кеннеди из 70-ых годов прошлого века, замораживавших себя в криокамерах в надежде на свое личное бессмертие, современные представители haute societe замораживают свои герминальные клетки, обеспечивая себя репродуктивным бессмертием. С научной зрения, последнее более разумно, т.к можно становится родителями в любом возрасте — хоть в 60, хоть в 100 лет.

Гипотеза B. Это более интересная гипотеза, но она отсылает к сомнительным с этической и технической точки зрения технологиям, основанных на принципе переноса генов реципиента и внедрения их в (геном) клетки донора. То есть геном донорской клетки был заменен на геном А.Б. Но насколько мне известно такие методики неизвестны, по-крайней мере широкой общественности. Да, технология генных векторов существует давно, но направлены они именно на модификацию отдельных генов, что несоизмеримо проще. Хотя как показали последние эксперименты, она вполне применима к приматам, в том числе и человеку. В настоящее время эффективные методы изменения генома человека находятся на стадии разработки и испытаний на приматах. Долгое время генетическая инженерия обезьян сталкивалась с серьёзными трудностями, однако в 2009 году эксперименты увенчались успехом: в журнале Nature появилась публикация об успешном применении генноинженерных вирусных векторов для исцеления взрослого самца обезьяны от дальтонизма. В этом же году дал потомство первый генетически модифицированный примат (выращенный из модифицированной яйцеклетки) — игрунка обыкновенная.

С этой темой — темой интервенции в цикл развития и угасания репродуктивных функции — связан более широкий круг вопросов касающихся интервенции в сам процесс старения — универсальный биологический процесс угасания и деградации функций (потери функциональности) и систем человеческого тела.  Совсем недавно портал Постнаука разместил интересную лекцию биоинформатика Жаронкова. В этой лекции г-н Жаронков имплицитно, то есть неявным способом, в скрытом подтексте своей (в целом) замечательной лекции указывает на прямую связь между решением проблемы старения человека (возрастного кризиса) и глобального экономического кризиса.  Наряду с чисто техническими аргументами генетики (увеличение продолжительности жизни у немотод и дрожжей в 10-15 раз), биогеронтологии  и медицины, автор приводит чисто экономические аргументы:

Насколько мы знаем, если людям что-то дать, потом этого уже не отнимешь. Такого концепта как пенсия до 1887 года, до того, как Отто фон Бисмарк принес это нововведение, эту финансовую инновацию в общество, не существовало. Никто даже не мог себе представить, что люди когда-либо выйдут на пенсию. В США эта концепция была принята в 1930-х годах. Но за восемьдесят лет люди настолько к этому привыкли, что начали считать, что государство им что-то должно. Любое изменение в текущей структуре они понимают как государственную измену и начинают против этого выходить на улицы, бастовать. Хотя государство этого хочет не просто так — государству это нужно для того, чтобы сбалансировать экономику.

Интересно так же отметить упоминание инновационной технологии интервенции в геном — РНК-интерференция. Это «технология, которая позволяет использовать очень небольшие кусочки ДНК или РНК. В зависимости от того, как их доставлять и упаковывать, что будет с ними дальше происходить, мы сможете снижать экспрессию каких-то определенных генов.»

Аналогичные мысли были озвучены и другим исследователем — биофизиком Петром Федичевым в краткой аннотации лекции про старение дрожжей и безопасности лечения старости

О прибыльности коммерческого генетического тестирования

Любопытная статистика, касающаяся прибыльности коммерческих компаний в сфере consumer genetic testing.

Источник: http://seqonomics.blogspot.ru/2013/10/is-direct-to-consumer-genetic-testing.html

 

The most well-known company in this space is 23andMe. That’s no coincidence: It is working hard at increasing its profile and even has its own commercials.

As of September this year, 23andMe has genotyped 400,000 customers. That’s220,000 more than a year earlier, meaning that at a current price of $99 per test 23andMe made around $22m in the last 12 months. Contrasting this with the $161m in investment the company has attracted since it was founded in 2007, that’s not great.
Competing companies are not doing much better. As the list below shows, 23andMe is currently to my knowledge the only company still active selling direct-to-consumer genetic testing services. The others have either declared bankruptcy or have otherwise stopped offering direct-to-consumer services.
It’s obvious that genetic testing by genotyping is a niche market. Since it’s unlikely that the value of these tests to consumers is going to increase dramatically, it’s not clear to me how this could change in the near future.

Зияющие высоты лже-академика Клесова. Анти-Клесов (часть 2)

Так получилось, что 100 запись в блоге посвящена личности известного шарлатана. Хотя в начале этой записи и не планировалось, я все же решил показать еще раз как работает мышление людей,  чья деятельность является ничем иным как умелой мимикрией или имитацией истинной науки.  На мой взгляд,  также не менее важно показать (на хорошо исследованном мною предмете исследования — происхождения I2a на Балканах), как подобные поверхностные рассуждения дилетантов вроде Клесова приводят к мифотворчеству.

Дед Толя Клесов — известный графоман. И, подобно другим горе-писателям графоманам, Клесов пытается количеством наукообразной писанины компенсировать качество своих заметок. Качество последних оставляет желать лучше, так как в силу a) невежественного непонимания основ генетики, и b) стремления к пафосным рассуждениям, текст очень сильно упрощается, зачастую превращается в манифест учения. Также очевидно, что Клесов хорошо усвоил требование Геббельса к нацистским пропагандистам: находить наиболее простые слова и мысли, максимально упрощать речь, произносимую «на площади». И многократно повторять одну и ту же мысль.  Все это приводит к идеологизации, а  значит и мифологизации того, о чем пишет Клесов.

…Впрочем Клесов этого и не стесняется. Чем больше шума, тем лучше. В конце сентября этого года он хвастается в своем дневнике. Несмотря на последующие попытки оправдаться отсылкой к искажению информации в  сломанном телефоне, и тем что его неверно поняли, видно что в конечном итоге он доволен жаренной сенсацией:


19 сентября этого года вдруг все основные сербские газеты как по команде опубликовали по сути один и тот же материал, но с разными заголовками, и с разными моими фотографиями. Некоторые поставили заголовки аршинными буквами, что я якобы доказал, что сербы – самый древний народ не только Балкан и бывшей Югославии, но и всей Европы. Вот, например, заголовок в самой читаемой сербской газете «Телеграф»: NAUČNO DOKAZANO: Srbi najstariji narod iz čijeg gena potiču Hrvati, Bosanci i Arijevci! Anatolij Aleksejevič Kljosov, profesor biologije Harvadskog univerziteta, u svom naučnom radu izneo je tvrdnje da je srpski gen star 12.000 godina i da potiče od Nojevog sina.  Пикантность здесь придает то, что последние слова в заголовке говорят о том, что «сербский ген», по якобы моим данным, произошел от сына библейского Ноя. В целом же заголовок переводится так, хотя многие уже, наверное, сами перевели, в ходе чтения:

 

О понятиях ДНК-генеалогии и популяционный генетики (продолжение)

Несколько месяцев тому назад я писал в этом блоге о некоторых основных понятий ДНК-генеалогии и популяционной генетике (нужно помнить о том, что хотя множество терминов ДНК-генеалогии и перекрывается в основной своей части множеством терминов ДНК-генеалогии, все же отношения между двумя типами терминов далеки от строгой семантической эквивалентности, или говоря языком математической логики, от конгруэнции).

К моему удивлению, несмотря на огромные объемы написанного на тему разъяснительного и пояснительного материала, споры и непонимание  продолжают сопровождать даже столь краеугольные понятия, как гаплотип.
Обиднее всего, что объеме или экстенсионале этого ключевого понятия,  продолжают путаться не только новички, но и маститые корифеи ДНК-генеалогии, многие из которых пришли в ДНК-генеалогию задолго до меня.
Например, один из уважаемых мною деятелей пишет:

Гаплотип все-таки характеризует гаплоидные наборы аллелей, т.е. только Y-хромосому, и мтДНК. Аутосомные наборы являются парными, т.е. диплоидными. Термин «диплотип» я не встречал. Скорее, для аутосом уместен термин «диплоидный набор аллелей». Здесь нет разницы, какие аллели рассматриваются: STR-повторы или однонуклеотидные аллели. В отношении гаплотипов я придерживаюсь мнения, что в широком смысле под гаплотипом надо понимать всю совокупность аллелей Y-хромосомы или мтДНК каждого отдельного лица. У каждого человека — свой гаплотип и свой диплоидный набор. Просто из-за сложностей и ограничений в определении всей цепочки, например, Y-хромосомы мы видим только очень маленькую часть всего гаплотипа.

Написанное выше не является точным определением понятия гаплотип.

Как известно из энциклопедии, гаплотип (сокр. от «гаплоидный генотип») совокупность аллелей на локусах одной хромосомы, обычно наследуемых вместе. Если же при кроссинговере комбинация аллелей меняется (что происходит очень редко), говорят о возникновении нового рекомбинантного гаплотипа.  Применение этого термина для описания совокупности аллелей на Y-хромосомы и совокупности аллелей в митохондриальном геноме совершено мотивированно хотя бы уже в силу того, что аллели на локусах нерекомбинантной части Y-хромосомы  и митохондриона наследуются в  гаплоидной форме, то есть только от одного родителя. В то время как генотип определенных (prima facie аутосомных генов) диплоидной особи состоит из двух гаплотипов, расположенных на двух хромосомах, полученных от матери и отца соответственно.

Полагаю, что вышеприведенная информация не нуждается в пояснении, хотя бы уже в силу своей интуитивной ясности и общеизвестности. Гораздо важнее то, что я напишу сейчас. На самом деле, приведенный выше термин «диплоидный набор аллелей» — не совсем удачен, так как вызывает у новичка ложные ассоциации.  С другой стороны, термин-сокращение диплотип ( сокр. от диплоидный генотип) практически не прижился  не только в русскоязычной, но и в англоязычной терминологии. Это подтверждает анализ литературы в Google Books Ngram Viewer.

Untitled 

Вместе с тем не стоит путать понятия «диплоидный генотип (набор аллелей)» с понятием  «генотипом» в собственном смысле этого слова. Ибо диплотип определяется как пара гаплотипов (разумеется, у диплоидного организма каковым и является человек) с известной фазой, в то время как в генотипе фаза неизвестна.


Здесь мы должны вспомнить о понятии фазы в генетике, и о процессе фазирования, о котором я уже неоднократно упоминал в своем блоге.
Вопреки распространенному ложному мнению, фазирование это отнюдь не абстрактно-отвлеченное, лишенное практического биологического смысла, упражнение в математической эквилибристике. Напротив, задача фазирования (или если хотите, установление фазы) генотипа крайне проста — определить какой гаплотип был унаследован от отца, а какой от матери, ибо и мужская гамета-сперматозоид, и женская гамета-яйцеклетка несут гаплоидный набор аллелей или гаплотип. И только при оплодотворении (образовании зиготы) слияние двух гаплотипов образует диплоидный генотип/диплотип (в случае с неполовыми хромосомами).

Разумеется, сразу же встает вопрос, а как практически использовать эти новые знание для определения своего диплотипа на примере данных 23andme, то есть как определить какая часть досталась в виде аутосомного гаплотипа от отца, а какая — от матери.

При ответе на ответ вопрос будет полезно рассмотреть следующие ложное суждение, принадлежащего на этот раз новичку.

«совокупность снипов с 23эндМи» является гаплотипом. Однако это SNP-гаплотип, а не STR-гаплотип. Ценность второго в том, что он имеет большую информационную насыщенность для анализа на более коротких генеалогических дистанциях.

 

Это абсолютно неверное предположение (если только автор не имеет ввиду исключительно Y хромосомные SNP-ы). Если речь идет о всех снипах 23andme, то с автором нельзя согласиться.  Дело в том, что процедура типирования снипов в чипсетах построена таким образом, что по получаемым в виде «совокупности снипов» данным невозможно сказать, какой именно из аллельных вариантов входит в состав материнского, а какой отцовского гаплотипа.  Об этом я уже писал несколько раз в блоге, поэтому не буду повторяться еще раз.  Именно по этой причине, без возможности определить фазу генотипа, нельзя утверждать о том, что данные «совокупности снипов» (выдаваемые клиенту в виде RawData, т.е перечня снипов с аллельными вариантами клиента) представляют собой диплотип. А поскольку диплотип есть пару гаплотипов с известной фазой, то тем паче «совокупность аллелей»от 23andme не может быть гаплотипом

Итак, из сказанного постулируется очевидный вывод о том, что приведенные выше цитаты с умозаключениями как чайника, так и корифея представляются неточными.

Хотя, конечно же, причина сей весьма досадной терминологическая оказии совершенно очевидна.
Терминология ДНК-генеалогия (по крайней мере в том виде, в котором она получила свое развитие в русскоязычных около-научных кругах) существенна упрощена в сравнении с генетикой, и самый термин гаплотип используется в ней только  in sensu strictissimo (в самом узком смысле), применительно только к так называемым Y (хромосомным )-STR гаплотипам. Именно этот тип гаплотип обычно и подразумевают ДНК-генеалоги, говоря о гаплотипе в своем узком кругу.  Но нужно помнить что семантическое поле понятия гораздо шире, и охватывает в себя различные классы референциального употребления. Так, в зависимости от контекста, это понятие  может обозначать не только Y-STR, но и многое другое — от аутосомных STR и митохондриального гаплотипа до целых хромосом и даже генома. Бывают и совсем уникальные варианты применения термина гаплотип, когда он описывают гетерогенную систему генетических маркеров, одна часть которых была определена классическим серологическим способом, а другая — новейшими методами ДНК-диагностирования (наилучший пример таких систем —  HLA гаплотип):

Гены HLA находятся на 6-й хромосоме . Совокупность генов HLA, лежащих на одной хромосоме, называют гаплотипом HLA а на обеих хромосомах — генотипом HLA .

Поскольку наследование гаплотипов HLA подчиняется законам Менделя, вероятность совпадения генотипов HLA у братьев и сестер составляет 25%. Однако следует учитывать, чтокроссинговер (обмен гомологичных хромосом участками во время мейоза) с однопроцентной вероятностью приводит к образованию нового гаплотипа HLA.

Отдельный кластер генов MHC обозначается как «гаплотип» и обычно наследуется весь целиком как отдельный менделевский признак; гены, входящие в его состав, выявляются при кроссинговере. Гены HLA наследуются кодоминантно и передаются потомству двумя блоками — по одному от каждого родителя ( рис. 17.1 ). Такой блок носит название гаплотипа HLA. Частота рекомбинаций внутри гаплотипа HLA составляет около 1%, в материнской хромосоме она несколько выше. Ребенок наследует по два аллеля каждого гена HLA: один из материнского гаплотипа, другой — из отцовского. Если удается выявить лишь одну аллельную форму какого-нибудь антигена HLA, это означает, что носитель гомозиготен по данному аллелю или в типирующем наборе нет сыворотки для определения другой аллельной формы антигена. Гаплотип HLA можно установить лишь при анализе наследования генов HLA в семье.