Новая российская компания на рынке персональной геномики

 

В сентябре в Москве открылся один из «сколковских стартапов» -медицинский центр «Атлас», который специализируется на «персонализированной» и «превентивной» медицине. Своим пациентам центр предлагает сначала cделать скрининговый тест http://www.atlas.ru, а потом уже разрабатывать план профилактики и лечения на основе его результатов — выявленных предрасположенностей и рисков возникновения заболеваний, а также генетически обусловленных реакций на лекарства.

Массовой расшифровкой генома в России занялись ещё в 2007 году, поэтому на рынке уже существует несколько похожих компаний. Однако «Атлас» назвал своей целью сделать генотипирование популярным и доступным — примерно так, как это удалось 23andMe, американской компании бывшей жены Сергея Брина Анны Войжитски, в которую Google инвестировала почти 4 миллиона долларов. Популярность 23andMe явно не даёт покоя владельцам «Атласа», поэтому даже домен 23&me.ru они зарегистрировали на себя. Биомедицинский холдинг Atlas основан в 2013 году. Команда Atlas включает в себя специалистов, уже сейчас внедряющих в клиническую практику концепцию персонализированной медицины и работающих на стыке фундаментальной науки и практической медицины.

Нужно сказать, что бизнес-модель «Атласа» действительно построена на основе модели 23andme. Спектр предлагаемых клиентам сервисов персональной геномики также похож на тот, что имеется в 23andme. Вместе с этим, имеется одно принципиальное отличие — в отличии от 23andme, предлагавшей в своем продукте в числе прочего и описание медицинских генетических рисков, продукт «Моя генетика» компании Atlas не просто представляет перечень рисков, но и предполагает консультацию профессионального специалиста по медицинской генетике в медицинском центре Atlas (входящего в состав холдинга).  На мой взгляд, это очень удачный ход. Как известно, в прошлом году у компании 23andme возникли серьезные проблемы с  FDA. Управление по санитарному надзору за качеством пищевых продуктов и медикаментов[3] (англ. Food and Drug Administration, FDA, USFDA) — агентство Министерства здравоохранения и социальных служб США, один из федеральных исполнительных департаментов. Управление занимается контролем качества пищевых продуктов, лекарственных препаратов, косметических средств, табачных изделий и некоторых других категорий товаров, а также осуществляет контроль за соблюдением законодательства и стандартов в этой области. В прошлом году это агентство по жалобе нескольких клиентов инициировало проверки соответствия рынка персональной медицинской генетика законодательству, в результате которой 23andme было предписано временно прекратить включение данных о генетических рисках в свои отчеты. И хотя российским законодательством данная область практически не регулируется, тем не менее включение в продукт услуг профессионального врача-генетика, безусловно, правильный ход, так как позволяет клиенту получить профессиональную консультацию специалиста в довольно специфической и сложной области медцинской генетики.

Лицам, интересующимся генетической генеалогией и своим происхожден, будет интересен раздел, в котором можно посмотреть данные о своих гаплогруппах; проценте генов, доставшихся от неандертальцев; а также разбиение генетических вариантов своего «генома» по компонентам происхождения.  Поскольку я помогал компании Atlas разрабатывать этот раздел (в плане составления описания гаплогрупп и разработки алгоритмов определения компонентов происхождения), то могу поручиться своей репутацией за научную состоятельность выдаваемых результатов.

Процитирую отзыв одного из первых клиентов

«Самая серьёзная и достоверная рубрика — здоровье: в ней связь определённых типов генов с возможным заболеванием подтверждена научными исследованиями, в которых принимало участия более тысячи человек. Здесь риски развития заболеваний сгруппированы в процентах и сравниваются со средним риском по популяции, отображены наследственные заболевания, а также так называемая фармокогенетика, индивидуальная чувствительность к лекарствам (аллергические реакции, побочные эффекты).

Самыми высокими рисками для меня, согласно тесту, являются меланома (0,18 % при среднем риске 0,06 %), системная склеродермия (0,05 % при среднем 0,03 %), сахарный диабет первого типа (0,45 % при среднем 0,13 %), аневризма сосудов головного мозга (2,63 % при среднем 1,8 %), системная красная волчанка (риск 0,08 % при среднем риске 0,05 %), эндометриоз (1,06 % при среднем риске 0,81 %), артериальная гипертензия (42,82 % при среднем риске 40,8 %). Ну и так далее. Кроме того, тест выявил, что я являюсь здоровым носителем варианта гена, связанного с периодической болезнью. Моя же чувствительность к лекарствам оказалась совершенно среднестатистической, ничем не примечательной, поэтому никаких особых побочных эффектов или аллергических реакций тест не выявил.

В рубрике «Питание» мне рекомендовали то, что рекомендуют своим читателям все журналы о здоровом образе жизни, — сбалансированную диету и почему-то не больше 998 килокалорий в день (при норме для взрослого человека, который не занимается спортом, в 1 200). Не рекомендовали есть сладкое и жирное, пить крепкий алкоголь, закусывать его картошкой или заедать рисом, запретили сладкое и жареное. В общем, всё, что можно было бы посоветовать любому россиянину старше 18 лет. У меня заподозрили непереносимость лактозы и запретили молочные продукты, хотя никаких проблем с молоком у меня никогда не было. Несмотря на это, в разделе «Рекомендации» мне посоветовали есть «больше молочных продуктов каждый день» (потом разработчики сказали, что это — баг), потому что молоко «снижает риск развития сахарного диабета», который у меня повышен. Если пить его вместо сладкой газировки, то, наверное, снижает. Но сейчас прогрессивное человечество уже задумывается о том, насколько молоко вообще необходимо взрослому человеку, — связи потребления молока с крепкими костями и восполнением витамина D, о которой говорили раньше, так и не было найдено.

В разделе «Спорт» меня назвали «спринтером» и посоветовали силовые тренировки, поэтому рекомендовали гандбол, регби и плавание и запретили бег, баскетбол, конный спорт и зимние виды спорта. На мой удивлённый вопрос: «Почему запретили бег, который почти всем можно?» — врач-генетик Ирина Жигулина, с которой мы потом общались, ответила, что речь идёт о профессиональном спорте. Профессионального бегуна из меня, по их мнению, не выйдет.

В разделе «Происхождение» меня ждала интерактивная инфографика о том, как мои предки по материнской линии вышли из Восточной Африки 150–180 тысяч лет назад и двинулись в Северную Европу. У меня нет Y-хромосомы, поэтому, что там происходило с отцовской линией, совершенно непонятно. Мои надежды найти успешных родственников так и не оправдались — бегунок остановился на отметке «500 лет назад» и выдал результат, что 50,9 % моего ДНК — от жителей Северной Европы. Жаль, что это совсем не то, что получают, например, покупатели теста 23andMe, которым предоставляют доступ к социальной сети, где можно найти своих родственников. А так хотелось прожить такую историю, как Стэйси и Грета, которые узнали, что они сёстры, благодаря 23andMe!

Больше всего меня удивила информация под заголовком «Личные качества». Тут я узнала, что у меня снижен риск развития никотиновой зависимости, есть предрасположенность к абсолютному слуху, нет риска ранней менопаузы и есть склонность к избеганию вреда. Этот раздел создатели относят к «развлекательной генетике», потому что данные в ней строятся на основе экспериментов с небольшой выборкой испытуемых (меньше 500). Но они меня вовсе не развлекли, а расстроили. Во-первых, выяснилось, что у меня нет предрасположенности к кудрявым волосам: «у вас не выявлен генетический вариант, часто встречающийся у кудрявых людей», хотя я кудрявей, чем многие каракулевые шубы. А во-вторых, у меня «не выявлен вариант гена, встречающийся у большинства творческих людей». В-третьих, я и вовсе интроверт.

Результаты теста заканчиваются рекомендациями пройти консультацию с терапевтом (по поводу риска системной красной волчанки), с эндокринологом (по поводу сахарного диабета) и с дерматологом (склеродермия, меланома), а также ежегодно сдавать анализ крови, делать маммографию, с 40 лет — регулярно ЭКГ. Ещё рекомендовали пить кофе и молоко, витамины, регулярно заниматься спортом и редко загорать»

Скрытые возможности клиентских данных 23andme в плане молекулярной диагностики.

Компания 23andme не нуждается в особом представлении читателям этого блога. Вплоть до конца прошлого года компанию занимало существенный сегмент рынка персональной геномики, ориентированного на предоставление  клиентам информации о генетических медицинских рисках (genetic risks) и генетической генеалогии (genetic origin). Информация о медико-генетических рисках содержалась в ряде сервисов портала компании, а также в доступном для скачивания отчета о генетических рисках и, разумеется, в первичных данных генетического отчета, в котором содержались значимые с точки зреемя медико-генетического диагностирования генетические полиморфизмы (SNP).

Всвязи с известными событиями и последующим за ними предписанием USA Food and Drug Administration (FDA) компании 23andme о запрете выпуска на рынок услуг персонального геномического диагностирования своего «медицинского девайза» (т.е интерпретации медико-генетических рисков развития заболеваний), компании пришлось сузить свою сферу деятельности до оказания генетико-генеалогических услуг.

Несмотря на это досадное обстоятельство, сказавшееся нелучшим образом на динамике увеличения клиентской базы компании,  нужно помнить, что все клиенты сохранили доступ к своим первичным данным тестирования (т.е списку снипов с генотипами). И при вдумчивом, творческом подходе любой человек может не только «вытащить» из этих «cырых данных» важную с точки зрения медицины информацию, но и заменить спомощью полученной информацией результаты более традиционных тестов.

Каковы могут быть варианты использования данных 23andmе не в привычных генеалогических целях, а скажем для получения сведений, который могут впоследствии пригодится для молекулярного диагностирования?

Я приведу пару примеров такого использования.

Определение HLA-фенотипа.

На мембране клеток организма присутствуют продукты генов всех локусов, размещенных на обеих нитях 6-й хромосомы.

 

bsl-hla1

 

Это означает, что HLA-гены наследуются по кодоминантному типу, т. е. одну хромосому ребенок наследует от матери, а другую – от отца. Как уже упоминалось, совокупность генов, расположенных на одной хромосоме, составляет гаплотип. Таким образом, у человека два гаплотипа и каждая клетка организма несет на себе диплоидный набор антигенов системы HLA, один из которых кодируется HLA-генами матери, а другой – отца. Исключение составляют половые клетки (яйцеклетка и сперматозоид), каждая из которых содержит в своем ядре только по одному гаплотипу.

Антигены гистосовместимости, выявляемые на клетках конкретного человека, составляют HLA-фенотип. Для его определения необходимо произвести фенотипирование клеток индивида. Как правило, “типируются” лимфоциты периферической крови. До настоящего времени в большинстве лабораторий HLA-A. В, С и DR-антигены определяют при помощи серологических методов, в частности, лимфоцитотоксического теста. тот тест основан на способности анти-НLА-антител в присутствии комплемента разрушать лимфоциты, несущие соответствующие антигенные детерминанты. Гибель клеток демонстрируется при помощи добавления трипанового синего. При этом мертвые поврежденные клетки окрашиваются, и под микроскопом учитывается их количество.

Эти тесты часто требуются в ходе стандартных медицинских процедур обследования во время начала беременности, или для изучения этологии аутоимунных заболеваний. Еще более важно определение гистосовеместимости в транплантологии, где типирование HLA-фенотипа  донора является обязательным условием.

Однако, с приходом новых микроматричных технологий опеределния нуклеотидов ДНК и биоинформатических методов рутинной обработки последовательности человеческих геномов , появился дешевая и относительно простая альтернатива классическим серологическим тестам (которые стоят в интервале от 100 до 500 долларов).

Я не буду останавливаться на принципиальном описании процедур, с помощью которых на основании данных 23andme можно с помощью метода «импутирования» определить HLA-фенотип, так как в прошлом году я уже разместил в этом блоге пошаговую инструкцию для выполнения этой задачи.

Впрочем, уже после того, как  я отписался на эту тему здесь,  в департаменте биостатистики Университета Вашингтона был разработан алгоритм HIBAG который принципиально мало чем отличается от алгоритма HLA*IMP (в обеих алгоритмах используется training model, позволяющая определять фенотип HLA по снипам 23andme).  Входные данные программного решения этого алгоритма (язык R) представляют собой формат Plink. А так как в последней версии Plink была включена нативная поддержка формата 23andme, то преобразовать данные 23andme в бинарный формат Plink не сооставит особого труда. Что касается обработки данных в HIBAG, то примерный порядок выполнения команд выглядит следующим образом:

# Load the published parameter estimates from European ancestry
model.list <- get(load(«European-HLA4.RData»))#########################################################################
# Import your PLINK BED file
#
yourgeno <- hlaBED2Geno(bed.fn=».bed», fam.fn=».fam», bim.fn=».bim»)
summary(yourgeno)

# HLA imputation at HLA-A
hla.id <- «A»
model <- hlaModelFromObj(model.list[[hla.id]])
summary(model)
# HLA allele frequencies
cbind(frequency = model$hla.freq)

# SNPs in the model
head(model$snp.id)
# «rs2523442» «rs9257863» «rs2107191» «rs4713226» «rs1362076» «rs7751705»
head(model$snp.position)
# 29525796 29533563 29542274 29542393 29549148 29549597

# best-guess genotypes and all posterior probabilities
pred.guess <- predict(model, yourgeno, type=»response+prob»)
summary(pred.guess)
pred.guess$value
pred.guess$postprob

 
 

Панель метилирования Яско

В последние 10 лет, крупные генетические исследования выявили сотни генных мутаций, которые возникают чаще у аутичных пациентов, чем в общей популяции. Тем не менее, каждый пациент имеет только одну или несколько из этих мутаций, что затрудняет разработку лекарств против болезни. В настоящее время, изучением генетических факторов аутизма занимается большое количество врачей-генетиков,  одним из них является доктор Эми Яско занимается исследованиями генных мутаций у аутистов. Как показали многочисленные молекулярно-генетические обследования и спектрометрия аминокислот, органических кислот и карнитинов, значительное количество аутистов страдает метаболическими нарушениями.  Есть виды аутизма, вызываемые именно этими генетическими нарушениями обмена вещест.

Доктор Эми Яско разработала тест на панель метиляции Яско — тест этот дорогой, стоит 500 долларов, в этой проверяют что-то около 30 генных полиморфизмов (снипов). Выбор снипов в этой панели мотивирован тем, что эти снипы связаны с  определенными генами на «молекулярно-биохимическом пути метиляции» (methyliation pathway),  т.е генами которые влияют на способность организма выполнять ряд ключевых биохимических функций. Наличие генетических дисбалансовт.е снипов в пути метиляции, будет ограничивать эффективность пути метиляции.

 

Yasko-Methylation-Pathway

 

К счастью клиентов 23andme, чипсет снипов этой компании включает в себя если не все, то большую часть снипов панели Яско.
Один из проектов, возникший всвязи с неудовлетворенной потребностью клиентов в более развернутой и детальной обработке данных 23andme
, Genetic Genie предлагает  условно-бесплатный сервис с помощью которого данные релевантных снипов можно привести к  традиционному виду таблицы с отчетом по панели Яско:

Gene & Variation rsID Alleles Result
COMT V158M rs4680 AA +/+
COMT H62H rs4633 TT +/+
COMT P199P rs769224 GG -/-
VDR Bsm rs1544410 CC -/-
VDR Taq rs731236 __ no call
MAO-A R297R rs6323 TT +/+
ACAT1-02 rs3741049 AG +/-
MTHFR C677T rs1801133 GG -/-
MTHFR 03 P39P rs2066470 AG +/-
MTHFR A1298C rs1801131 GG +/+
MTR A2756G rs1805087 AA -/-
MTRR A66G rs1801394 GG +/+
MTRR H595Y rs10380 CC -/-
MTRR K350A rs162036 AA -/-
MTRR R415T rs2287780 CC -/-
MTRR A664A rs1802059 AG +/-
BHMT-02 rs567754 CC -/-
BHMT-04 rs617219 AA -/-
BHMT-08 rs651852 __ no call
AHCY-01 rs819147 __ no call
AHCY-02 rs819134 __ no call
AHCY-19 rs819171 __ no call
CBS C699T rs234706 GG -/-
CBS A360A rs1801181 __ no call
CBS N212N rs2298758 __ no call
SHMT1 C1420T rs1979277 __ no call

Несмотря на то, что на выходе клиент получает  готовый частный отчет по тесту Яско, медико-биологическая интерпретация результатов не так уж и проста, и требует определенной интеллектуальной сноровки и общегенетической эрудиции в плане понимания того, какую функцию выполняет тот или иной ген. Строго говоря, при грамотной интерпретации этих результатов, можно самостоятельно составить себе диету из витаминов-пищевых добавок, которые позволяет компенсировать обусловленный генетическим дисбалансом дефицит тех или иных энзимов.Примерный образец интерпретации можно посмотреть здесь

 

 

Алгоритм самостоятельного анализа результатов экзомного тестирования

Осенью 2011 года один из флагманов коммерческой персональной геномики, компания 23andme, запустила пилотный проект экзомного тестирования, в котором клиентам предлагался продукт — экзомный тест за 999 американских долларов вместе с интерпретацией результатов.  Тест покрывал примерно 50 млн. базовых пар ДНК, включающих в себя информацию необходмую для синтеза протеинов. К сожалению, пилотный проект быстро закрылся из-за отсутствия интереса и высокой стоимости теста. Тем не менее, некоторые из россиян успели заказать себе этот тест и получить результаты. Но так как авторизированный отчет 23andme с толкованием полученных результатов оказался написанным на сложном для понимания эзотерическом научном языке,  возникла необходимость в дополнительной интерпретации, вернее разжевывании имеющейся интерпретации, то я решил показать, как можно проанализировать экзом самостоятельно с помощью подручных средств.

В качестве примера я использую анонимизированный файл vcf (файл с перечнем геномных вариантов) одного из немногих россиян, заказавших экзомное тестирование в 23andme.

 

Техническое описание исследования.

Для анализа экзома я использовал NGS-библиотеки пакета Bioconductor-R (в среде статистических вычислений R), предназначенного для анализа полногеномных данных. Основной библиотекой, задействованной в анализе была библиотека variantAnnotation.

source(«http://bioconductor.org/biocLite.R&#187;)

library(VariantAnnotation)

Загрузка требуемого пакета: BiocGenerics

Загрузка требуемого пакета: parallel

Присоединяю пакет: ‘BiocGenerics’

Загрузка требуемого пакета: GenomicRanges

Загрузка требуемого пакета: IRanges

Загрузка требуемого пакета: XVector

Загрузка требуемого пакета: Rsamtools

Загрузка требуемого пакета: Biostrings

Присоединяю пакет: ‘VariantAnnotation’

В самом начале я загрузил заархивированный файл x.vcf в память с использованием координат геномного билда hg19 (т.к. VCF был получен из bam-файла, координаты которого были взяты из GRCh37.64, соответствующего hg19):
> vcf <- readVcf(«x.vcf», «hg19»)

> vcf

class: CollapsedVCF

dim: 110651 1

rowData(vcf):

  GRanges with 5 metadata columns: paramRangeID, REF, ALT, QUAL, FILTER

info(vcf):

  DataFrame with 28 columns: AB, AC, AF, AN, BaseQRankSum, DB, DP, DS, Dels,.

geno(header(vcf))

DataFrame with 5 rows and 3 columns

        Number        Type

   <character> <character>

AD           .     Integer

DP           1     Integer

GQ           1       Float

GT           1      String

PL           .     Integer

head(rowData(vcf), 3)

GRanges with 3 ranges and 5 metadata columns:

             seqnames         ranges strand | paramRangeID            REF

                <Rle>      <IRanges>  <Rle> |     <factor> <DNAStringSet>

  rs79585140        1 [14907, 14907]      * |         <NA>              A

  rs75454623        1 [14930, 14930]      * |         <NA>              A

  rs78601809        1 [15211, 15211]      * |         <NA>              T

                            ALT      QUAL      FILTER

             <DNAStringSetList> <numeric> <character>

  rs79585140                  G    494.81  MQFilter40

  rs75454623                  G    718.96  MQFilter40

  rs78601809                  G    125.22  MQFilter40

Затем я определил качество полученных генотипов (эти данные содержаться в колонке GQ секции генотипов vcf). Как видно из приведенных ниже значений, только 52% всех генотипов имеют 99%  степень аккуратности определения, качество остальных 48% вариантов лежит в диапазоне между 0 и 90% процентами. 

> geno(vcf)

List of length 5

names(5): AD DP GQ GT PL

> GQ <-geno(vcf)$GQ

> dim(GQ)

[1] 110651      1

> geno(vcf)

List of length 5

names(5): AD DP GQ GT PL

> GQ <-geno(vcf)$GQ

> dim(GQ)

[1] 110651      1

> fivenum(GQ)

[1]  0.03 33.98 99.00 99.00 99.00

> length(which(GQ==99.00))/length(GQ)

[1] 0.5221552

 hist(GQ[GQ != 0], breaks=seq(0, 100, by=10)

qc

На следующем этапе я опредилил число ранее неизвестных (новельных, то есть отствующих в базе dbSNP) вариантов в файле VCF. Всего вариантов 110651, из них известных 106076 и новельных 4575 (в отчете 23andme 4137). В целях определения качества новельных снипов я создал метрику для оценки качества снипов на основе сопоставления двух параметров – качества глубины покрытия генома и качества генотипирования. Из приведенного ниже графика видно, что примерно 25 % новельных снипов находятся в зоне низкого качества глубины покрытия, и это означает что примерно четверть новельных снипов могут представлять собой артефакт генотипирования:

info(vcf)$DB -> dbsnpsnp

metrics <- data.frame(QUAL=qual(vcf), inDbSNP=dbsnpsnp, RSQ=info(vcf)$QD)

 

qdПосле предварительных статистических тестов, я приступил к определению генов, в которых были обнаружены варианты. В зависимости от своего расположения, варианты могут оказаться в одном из 7 участков: интрон,  кодирующий участок, 5’UTR, 3’UTR, интергенный регион, сплайс-сайт и промоутер.   Для обнаружения положения вариантов, я задействовал библиотеку TxDb.Hsapiens.UCSC.hg19.knownGene.  Сначала я определил положение всех вариантов (cм.  Excel файл exomevariants.xlsx), однако поскольку нас интересует в первую очередь frameshift мутации, то гораздо более информативным является нахождение вариантов в кодирующих участках. Всего таких вариантов в кодирующих участка обнаружено 56035 в 23140 генах, причем 989 из 23140 генов имеет больше одного обнаруженного варианта в кодирующем участке

library(TxDb.Hsapiens.UCSC.hg19.knownGene)

txdb <- TxDb.Hsapiens.UCSC.hg19.knownGene

loc <- locateVariants(rd, txdb, CodingVariants())

table(sapply(splt, function(x) length(unique(x)) > 1))

FALSE  TRUE

22151   989

Далее, я использовал функцию predictCoding, она вычисляет изменения кодирования аминокислот в несинонимичных вариантах. В запросе к базе данных рассматрываются только те участки , которые перекрываются с кодирующей областью. Референсные последовательности извлекаются из BSgenome. Вариант последовательности определяется путем замены, вставки или удаления значения в колонке varAllele в референсной последовательности.  Код аминокислот вычисляются для последовательности кодонов  в тех вариантах, когда длина кратна 3.

library(BSgenome.Hsapiens.UCSC.hg19)

coding <- predictCoding(vcf, txdb, seqSource=Hsapiens)


Затем из полученных 56035 вариантов в кодирующей области я выбрал только те, которые привели к сдвигу рамки чтения (таковых оказалось 412).

coding[mcols(coding)$CONSEQUENCE == «frameshift»]

Благодаря запуску функции predictCoding я отождествил код измененных аминокислот для не-синонимичных вариантов.  Анализируя это подмножество, я задался целью установить, какой физиологический ущерб эти изменения кодируемых аминокислот могут нанести при экспресии в фенотип.  Для этих целей я использовал методы PolyPhen, которые предсказывают последствия замены аминокислот в человеческих протеинах.  PolyPhen использует информарцию о функции последовательностей и структурную информацию, характеризующую замену аминокислоты для прогнозах о структуре и функции белка.

nms <- names(coding)

idx <- mcols(coding)$CONSEQUENCE == «nonsynonymous

nonsyn <- coding[idx]

rsids <- unique(names(nonsyn)[grep(«rs», names(nonsyn), fixed=TRUE)])

library(PolyPhen.Hsapiens.dbSNP131)

pp <- select(PolyPhen.Hsapiens.dbSNP131, keys=rsids,cols=c(«TRAININGSET», «PREDICTION», «PPH2PROB»))

head(pp[!is.na(pp$PREDICTION), ])

Полученные файлы сохранены в Excel файл x.xlsx, и затем подсчитано в каких протеинах наблюдается наибольшое число потенциально вредных frameshift мутаций

Название гена  Число frameshift мутаций

 

NA 2288
uc001lsw.2 44
P20930 34
P22105-3 21
P25940 13
O60732 12
Q5SSG8 10
Q86YZ3 10
Q9NYF8 9
P46013 9
Q5VU43 9
Q14500 9
Q9UMD9 8
O14513 8
A6NKC6 8
uc003ssj.2 7
O95678 7
O15360 7
Q86VF7 7
uc001mdw.3 6
Q9Y289 6
Q8NEZ4 6
Q96C45 6
Q9HD43 6
Q01955 6
Q2KHM9 6
Q701N2 6
P38570 6
P24821 6
P46734 6
Q9Y2K3 5
uc002vwl.2 5
uc002nfb.2 5
uc003nsm.1 5
Q9UNS1 5
Q9NZH6 5
D3DSV6 5
C9IYD7 5
P20853 5
Q14676 5
P38159 5
P35125 5
P35670 5
Q8N6F8 4
Q96Q06 4
uc001bvt.2 4
uc011dxu.1 4
uc004csb.2 4
Q8TE73 4
Q9H2D6 4
uc002yfm.2 4
Q96J66 4
uc002zag.1 4
Q8TB24 4
Q96RN1 4
Q99572 4
Q9C0D2 4
uc002zwe.2 4
Q9ULD2 4
Q8WXH0-2 4
uc003uhx.2 4
O95050 4
O75128 4
P02533 4
A3KMH1 4
Q5HYK9 4
P48634 4
O15069 4
Q8IUA7 4
Q16600 4
P60331 4
Q5D862 4
B7ZBR5 4
Q5KU26 4
Q12802-2 4
A8MTL4 4
P23327 4
Q7Z3S9 4
O75096 4
A1A5D9 4
Q15149 4
P54257-2 4
uc001saw.2 3
Q96PX6 3
Q9BWT7 3
Q9H0J4 3
uc001kgr.1 3
Q9H0U9 3
uc002uln.2 3
Q8TD33 3
Q9BYR5 3
Q9H339 3
Q9Y6R7 3
Q8N808 3
Q96RW7 3
uc003wcz.2 3
uc002fmv.2 3
Q8N865 3
uc002ycq.2 3
Q92954 3
uc003eee.3 3
Q9NQN1 3
Q9UQ84 3
Q9NQT5 3
Q96PX9 3
Q8NC74 3
Q8NGH7 3
uc011lix.1 3
Q8NH40 3
Q9NWH7 3
uc001rks.2 3
Q96EZ4 3
uc001wit.3 3
Q8N436 3
Q8TAX7 3
Q9P126 3
Q99954 3
Q9UI47 3
Q9BRB3 3
Q9UIU6 3
Q9BYQ6 3
Q96JF6 3
uc003kju.2 3
Q96L96 3
Q8N1N5 3
Q96PQ1 3
Q9H4A3 3
uc003zfz.2 3
Q9HCE0 3
uc010ebn.2 3
Q9HCS5 3
Q9NQG7-3 3
Q5JU00 3
Q6ZW33 3
Q6E0U4 3
O60500 3
O94900 3
P56945 3
Q5VIY5 3
P57679 3
Q6PFW2 3
A2I2N5 3
O60269 3
P60369 3
O15016 3
P60371 3
Q5QNZ9 3
P78334 3
Q5VY09 3
O75056 3
Q6NTE8 3
Q02386 3
Q6XYB7-2 3
Q07092 3
Q75N90 3
Q07157 3
P51689 3
Q08170 3
Q4G0N8 3
Q12789 3
P35908 3
C9JIP1 3
C9JLR2 3
Q12889 3
B9EIK7 3
Q13033 3
P11473 3
Q13635 3
Q685J3 3
Q14246 3
Q6H9L7 3
O14617 3
Q6PEW0 3
P27816 3
Q6UWM9 3
Q15051 3
Q6ZS72 3
Q15084 3
P13645 3
P27987 3
P47881 3
Q15345 3
P49747 3
P30926 3
Q17RW2 3
Q02447 3
uc002ckw.2 2
Q9BYQ4 2
uc002xvf.2 2
Q9H1I8 2
uc009zoy.1 2
Q9H1M4 2
uc002npq.1 2
Q92764 2
uc003cbl.3 2
Q92766-2 2
Q8NDY8 2
Q8N568 2
uc001say.2 2
Q9HBR0 2
uc002hwr.2 2
Q9HC10 2
uc002qoi.1 2
Q9HCC9 2
uc002yxk.1 2
Q92956 2
Q9BX84 2
Q9HCH5-8 2
uc003tcj.1 2
Q969J2 2
uc003xza.2 2
Q8NG08 2
uc010neg.1 2
Q9NP71 2
Q96SK3 2
Q9NPR9 2
Q99518 2
Q9NQ92 2
uc002mdk.2 2
uc010ooe.1 2
uc002oyh.1 2
Q96DS6 2
Q8N531 2
Q8NGF6 2
Q9BS92 2
Q9NQW5 2
uc002zwc.1 2
uc010sxc.1 2
uc003cwg.3 2
Q96GX9 2
Q9BYD2 2
Q8N146 2
uc003qtl.2 2
Q9NU22 2
Q8WXA2 2
Q9NV39 2
uc003xio.3 2
Q96JA4 2
Q8WXU2 2
Q9NY99 2
uc010cov.2 2
Q8NGV6 2
uc001sax.2 2
Q9NYQ6 2
uc001sck.2 2
Q96JM2 2
uc001zrt.2 2
Q9NZM3 2
uc002cyd.1 2
Q96KT7 2
uc002frs.1 2
Q9P2F8 2
uc002jjm.3 2
Q9UBK8 2
Q8TD19 2
Q9UGC7 2
uc002oxx.2 2
Q96KV7 2
uc002pdw.2 2
Q8NH01 2
uc002shl.3 2
Q9UK85 2
Q9BQ66 2
Q96LB9 2
Q8TE60 2
Q96LP6 2
uc002yip.1 2
Q96MC2 2
Q9BW66 2
Q9UPR6 2
Q8ND61 2
Q96NY9 2
uc003cpb.3 2
Q9Y237-2 2
uc003dnv.2 2
Q8N3K9 2
uc003gix.2 2
Q8N1A6 2
uc003lwz.2 2
Q8TAX9-3 2
uc003pgu.3 2
uc001aru.2 2
Q8WWF5 2
Q96PY6 2
uc003tpz.2 2
uc001dpq.2 2
uc003vuk.3 2
uc001drv.2 2
uc003wsh.3 2
uc001jrr.3 2
uc003xkm.1 2
Q8NA69 2
Q9GZP7 2
Q96QA5 2
uc009vzo.2 2
Q96RD9 2
uc010azk.1 2
uc001qnn.1 2
Q9H0R5 2
Q8TBZ5 2
Q8WZ92 2
Q8TCU5 2
Q9NRD8 2
Q5T9A4 2
Q6ZRI6 2
B9EGI0 2
O75830 2
Q86VW1 2
C9J2Y8 2
Q658L1 2
C9JF86 2
Q6PEY2 2
P60412 2
Q7RTR8 2
O95153 2
Q8IYM2 2
O95255 2
O60391 2
O95425 2
Q6DT37 2
Q8IZ20-2 2
Q6NXP2-2 2
O95460-2 2
P50226 2
A6NMZ7 2
P54253 2
O95786 2
Q86TB3 2
Q0P670 2
P59827 2
Q0VAR9 2
Q5T6X5 2
Q0VDD8-4 2
O60336 2
O95817 2
O60423-2 2
A6PVS8 2
Q68DN1 2
P04439 2
O60602 2
A8MSH3 2
Q6NV75 2
Q13427 2
Q6P6B7 2
A8MSQ1 2
Q6PXP3 2
Q14028 2
Q6ZMY3 2
Q14031-2 2
Q6ZTY8 2
P15822 2
B9ZVK6 2
P15848 2
Q7Z570 2
P17931 2
Q86UQ0 2
Q14929 2
Q86XA9 2
P20742 2
Q8IYG6 2
A8MT70 2
P60014 2
A8MT77 2
Q5T8R8 2
O14830 2
Q5TZA2 2
Q15643 2
Q5VTH9 2
P23141-2 2
Q5VV43 2
P23280 2
Q5W0A0 2
Q24JP5-2 2
O60443 2
A6ND91 2
Q6BDS2 2
Q2M243 2
A6NE01 2
Q32MH5 2
Q6IMN6 2
Q32P51 2
Q6NUI1 2
Q3L8U1-2 2
Q6NWU0 2
Q499Z3 2
Q6P3X3 2
O15018 2
A6NEL2 2
Q4G0P3 2
O75081 2
Q4LDE5 2
Q6U949 2
Q58DX5 2
P50238 2
Q58EX7 2
Q6ZN79 2
Q5D0E6 2
O75095 2
P25391 2
P54108 2
A9UL12 2
Q70EL2 2
Q5JTH9 2
Q76I76 2
B4E1X0 2
P56545-2 2
Q5JUB6 2
Q7Z6J9 2
O15389 2
Q86TY3 2
O43164 2
A5PLN7 2
B5MDQ5 2
Q86W24 2
Q5T035 2
O75376 2
Q5T036 2
Q8IUX4 2
Q5T0J7 2
Q8IYK2 2
Q5T124 2
Q8IYS4 2
Q5T1M5 2
Q5T6F2 2
Q12955 2
uc003xax.3 1
uc002eax.2 1
uc001dwa.2 1
Q96JL9 1
uc003aka.2 1
Q8N9L9 1
Q9Y2Y8 1
Q96JQ0 1
uc001rig.1 1
Q96KD3 1
Q92889 1
Q8N9R8-2 1
uc003mtg.2 1
Q8N9T8 1
Q96HJ3 1
Q96L50 1
Q9Y623 1
Q8N386 1
uc001law.2 1
Q8NA82 1
uc001whc.2 1
Q96LI9 1
uc002lvh.2 1
Q8NAT2 1
Q93075 1
Q96LW7-2 1
uc003fpa.2 1
Q96LW9 1
uc003sys.2 1
Q96M29 1
uc004bmg.1 1
Q96M89 1
Q9Y2G2 1
Q96M91 1
Q9Y566 1
Q8NC38 1
uc001abz.3 1
Q96MG8 1
uc001hfx.2 1
Q96MK3 1
uc001mty.2 1
Q96MY7 1
uc001stk.2 1
Q96N77 1
uc002aon.2 1
Q8N3D4 1
Q92583 1
Q96P69 1
Q8N323 1
Q96PC2 1
uc002sfp.2 1
Q96PD4 1
Q969T7 1
Q96PE6 1
Q96AQ6 1
Q96PH1 1
uc003hti.2 1
Q96PL5 1
uc003ntp.1 1
Q96PN7 1
uc003vsp.2 1
Q8NCW5 1
uc003yyy.2 1
Q96PQ7 1
uc009wcm.2 1
Q8N196 1
uc010jzk.1 1
Q8NDN9 1
Q8WUP2 1
Q8NDX1 1
Q9Y442 1
Q8NDX9 1
Q9Y5P1 1
Q8N3Y1 1
Q9Y6J0 1
Q96QD9 1
uc001cqe.3 1
Q96QE3 1
uc001fgr.1 1
Q96QI5 1
Q8WW52 1
Q8NDZ6 1
uc001mgt.2 1
Q96RG2 1
uc001qyz.3 1
Q96RL6 1
Q8WXD5 1
Q8NE62 1
uc001urv.2 1
Q96RP7 1
uc001zhi.2 1
Q8NEG0 1
uc002cmq.1 1
Q96S42 1
Q92543 1
Q96SB8 1
uc002iob.2 1
Q8NEQ5 1
uc002mkl.2 1
Q96SN8 1
uc002oqh.1 1
Q96ST8 1
Q92935 1
Q96SZ5 1
uc002unu.2 1
Q96T17 1
Q8N8C0 1
Q99456 1
Q969X1 1
Q8NEV8 1
uc003cna.3 1
Q8N412 1
Q96AY2 1
Q99595 1
Q96BF3 1
Q99678 1
uc003knc.2 1
Q99705 1
uc003nif.3 1
Q99707 1
Q8N910 1
Q99856 1
Q96E39 1
Q8NFD2 1
Q8N960 1
Q8NFT2 1
Q96FX8 1
Q9BQI5 1
uc003zsj.2 1
Q9BR39 1
uc009vnn.1 1
Q9BR77 1
Q96HD9 1
Q8NFV5 1
Q96HP8 1
Q9BRQ8 1
Q8N9H6 1
Q8NFZ6 1
Q9Y2I6 1
Q9BSA9 1
Q9Y2R9 1
Q9BT25 1
Q9Y3N9 1
Q9BU76 1
Q9Y4K0 1
Q9BUV0 1
Q9Y5E3 1
Q9BVL2 1
Q9Y5T5 1
Q9BVP2 1
Q9Y6C9 1
Q8NG04 1
Q9Y6S9-2 1
Q9BWD1 1
uc001bfk.2 1
Q9BWH6 1
Q8WW01 1
Q9BWN1 1
uc001epm.3 1
Q8N434 1
uc001ggg.1 1
Q9BWW9 1
uc001ikw.3 1
Q9BX26 1
Q8N715 1
Q8NG31-2 1
uc001lvm.2 1
Q9BXA9 1
uc001mjv.2 1
Q9BXI2 1
Q8WWU7 1
Q9BXI9-2 1
uc001rdt.2 1
Q9BXL6 1
uc001sah.1 1
Q9BXR5 1
uc001saz.2 1
Q9BXT6 1
uc001ugs.3 1
Q9BXT8 1
uc001vmt.2 1
Q9BXW6 1
uc001wja.2 1
Q9BY07 1
Q8WYQ9 1
Q8NGD2 1
uc002axo.2 1
Q9BYH1 1
uc002dai.3 1
Q9BYJ0 1
uc002flb.2 1
Q8NGD4 1
uc002hjn.2 1
Q8N123 1
uc002hzw.2 1
Q9BYR3 1
Q92610 1
Q8N475 1
uc002mdo.3 1
Q9BZE2 1
uc002nhl.1 1
Q9BZJ0 1
uc002oek.2 1
Q9BZJ3 1
Q92794 1
Q9BZY9 1
uc002pgj.1 1
Q9C000 1
uc002rxt.1 1
Q8NGI3 1
uc002spl.1 1
Q9C0D6 1
uc002vfa.2 1
Q9C0G6 1
uc002wtp.2 1
Q9C0J9 1
Q969S8 1
Q8NGJ0 1
uc002zji.3 1
Q9GZS9 1
uc002zxx.2 1
Q9GZU2 1
uc003cfi.1 1
Q9H063 1
Q96AP0 1
Q9H094 1
uc003dar.2 1
Q8NGK0 1
uc003eny.2 1
Q9H0M4 1
uc003fts.2 1
Q8NGV0 1
uc003gxu.2 1
Q9H0U6 1
uc003jig.2 1
Q8N4B4 1
Q96BJ8-3 1
Q9H190 1
uc003mwv.2 1
Q8NGX0 1
Q96BT3 1
Q9H1L0 1
uc003nzw.2 1
Q8NGY9 1
Q96CB5 1
Q9H1V8 1
Q8N957 1
Q9H201 1
Q96E52 1
Q9H205 1
uc003vvi.2 1
Q9H208 1
Q96F05 1
Q9H222 1
uc003xda.2 1
Q9H2B4 1
Q96GQ7 1
Q8N4T4 1
uc003zjw.2 1
Q9H306 1
uc004aid.2 1
Q8N4W9 1
Q8N9B5 1
Q9H347 1
uc009vxy.2 1
Q9H3S1 1
uc009yor.2 1
Q8NHC8 1
uc009zxk.2 1
Q9H4I0 1
Q96HP0 1
Q9H4M7 1
uc010fxm.1 1
Q9H583 1
uc010lpr.1 1
Q9H5L6 1
Q9Y2F5 1
Q9H6S0 1
Q9Y2H0-1 1
Q9H6Y2 1
Q9Y2K1 1
Q9H720 1
Q9Y2K9 1
Q9H816 1
Q9Y2T7 1
Q9H8X2 1
Q9Y345 1
Q9H9Y2 1
Q9Y3T6 1
Q9HAT1 1
Q9Y485 1
Q9HBF5 1
Q9Y508 1
Q9HBJ7 1
Q9Y585 1
Q9HBL0 1
Q9Y5E6 1
Q9HBM0 1
Q9Y5P3 1
Q8NHL6-3 1
Q9Y5W3 1
Q9HBW9 1
Q9Y644 1
Q8NHY0 1
Q9Y6G9 1
Q8NHY3 1
Q8WV93 1
Q8NI17-2 1
Q9Y6X5 1
Q9HCG8 1
Q8WVE6 1
Q8NI35 1
Q8WVT3 1
Q8N4X5 1
uc001doh.2 1
Q9HCX3 1
Q8WW43 1
Q8N1N2 1
uc001dzr.2 1
Q9NNX1 1
uc001ffh.2 1
Q9NP70 1
uc001fst.1 1
Q8TAZ6 1
uc001hdj.2 1
Q9NPB3 1
uc001hob.3 1
Q9NPB6 1
uc001ioo.2 1
Q9NPG4 1
uc001kal.3 1
Q8TB03 1
uc001koi.2 1
Q8N1N4 1
Q8WWK9 1
Q9NQC3 1
Q8WWQ8 1
Q8TB52 1
uc001mhb.3 1
Q8N5C6 1
uc001mqw.2 1
Q9NQS7 1
uc001nps.2 1
Q8TC84 1
uc001qvk.1 1
Q9NQW1 1
uc001qzt.2 1
Q8TCG1 1
uc001rgh.2 1
Q9NR11-2 1
Q8N7M2 1
Q9NR20 1
Q8WXB1 1
Q9NRC9 1
Q8WXG8 1
uc010otd.1 1
Q8N7Q3 1
Q8TCU4 1
uc001swc.3 1
uc010xwr.1 1
uc001uom.2 1
Q8N5H7 1
uc001usl.3 1
Q8TCY9 1
uc001vwo.1 1
Q9NRY5 1
Q8N7U7 1
Q9NU02 1
uc001wph.3 1
Q8TD07 1
uc001zif.2 1
Q9NV12 1
uc002adi.2 1
Q8N5W8 1
uc002ari.2 1
Q9NVI1 1
Q8N7X4 1
Q9NVL8 1
Q92485 1
Q9NVR5 1
uc002eab.2 1
Q9NVV2 1
uc002elh.2 1
Q8TD31-2 1
Q92535 1
Q9NWN3 1
uc002gov.3 1
Q9NWS6 1
uc002hwb.2 1
Q9NWS9 1
uc002hzv.2 1
Q9NX76 1
uc002ile.3 1
Q8N628 1
uc002jad.2 1
Q9NYA4 1
uc002knr.2 1
Q8TDM6 1
Q92614 1
Q9NYG8 1
uc002mkc.2 1
Q9NYK6 1
Q8N309 1
Q8TDR0-2 1
uc002niv.2 1
Q9NYQ8 1
uc002nrk.3 1
Q9NYR8 1
uc002onr.2 1
Q9NYW5 1
uc002owt.2 1
Q9NZ56 1
uc002oyf.1 1
Q9NZC7 1
Q92932 1
Q8TDV0 1
uc002pjn.2 1
Q8TDX9 1
uc002red.2 1
Q9NZM4 1
uc002sen.3 1
Q9NZP2 1
Q8N884 1
Q9NZP6 1
Q8N8A6 1
Q9NZQ3 1
uc002vcz.2 1
Q9NZQ8 1
uc002vml.2 1
Q9P0L9 1
uc002wgf.1 1
Q9P0W8 1
Q969H9 1
Q8TDY8 1
Q969Q4 1
Q9P1Z2 1
Q969T3 1
Q9P212 1
uc002zcm.2 1
Q9P266 1
uc002zsk.1 1
Q9P272 1
Q96A59-2 1
Q9P275-2 1
uc003afo.2 1
Q9P2A4 1
Q96A84-3 1
Q9P2E9-3 1
uc003cib.2 1
Q8TE59 1
uc003com.2 1
Q9P2X7 1
uc003cqx.2 1
Q9UBC7 1
uc003cxg.2 1
Q8N183 1
Q96AQ9 1
Q9UBS4 1
uc003eev.3 1
Q9UBU2 1
uc003fli.1 1
Q9UDX4 1
uc003frm.2 1
Q9UFP1 1
uc003gco.3 1
Q8TE68 1
uc003gkv.3 1
Q9UGP5 1
uc003hqx.3 1
Q9UH36 1
uc003ian.3 1
Q9UH92 1
Q96BH3 1
Q9UHF4 1
uc003lnj.2 1
Q9UHN6 1
uc003mlz.3 1
Q8N6I1 1
uc003mwa.3 1
Q9UIS9 1
uc003nef.2 1
Q8TEC5 1
uc003nkt.2 1
Q9UJ78 1
uc003ntn.3 1
Q9UJA3 1
uc003nvm.1 1
Q9UJL9 1
uc003ods.2 1
Q9UJW7 1
uc003qtf.2 1
Q8TER0 1
Q96DA0 1
Q9UKB5 1
uc003tbm.2 1
Q9UKP4 1
uc003toq.2 1
Q9UL01 1
uc003tzn.2 1
Q9UL49 1
uc003vrz.2 1
Q9UL52 1
Q96EK5 1
Q8TER5 1
uc003wcr.1 1
Q9ULE4 1
uc003wkp.2 1
Q9ULE6 1
uc003wwm.2 1
Q9ULI1 1
uc003xcu.2 1
Q9ULI3 1
uc003xep.1 1
Q9ULM0 1
Q96G42 1
Q8TEV9 1
uc003yyd.2 1
Q9UMR7 1
Q96GU1 1
Q9UMS0 1
uc003zlr.1 1
Q9UMX9 1
uc004aay.2 1
Q9UNI1 1
uc004atg.3 1
Q9UNK9 1
uc004can.3 1
Q9UNQ0 1
uc004ded.1 1
Q8TEX9 1
uc009vvi.2 1
Q9UPA5 1
Q96HA7 1
Q9UPN6 1
uc009ynk.2 1
Q9UPP2-2 1
uc009zhj.2 1
Q8TF21 1
uc009zwi.2 1
Q9UPV0 1
uc010awk.1 1
Q9UQ35 1
uc010boe.2 1
Q9UQ74 1
uc010eas.2 1
Q8TF76 1
uc010fvs.1 1
Q9UQ90 1
uc010inb.2 1
Q9UQP3 1
uc010ljy.1 1
Q8WTP8 1
Q8N9F8 1
Q8WTV0-2 1
Q8N9H9 1
Q9Y2A4 1
uc010wmr.1 1
Q9NRH2 1
uc010yvx.1 1
Q9NRP7 1
uc011jvp.1 1
Q9NRR1 1
Q8N0W5 1
Q9NRR4 1
Q8IX07 1
Q6P461 1
Q5TCM9 1
P19075 1
P10515 1
P19484 1
Q5JZ73 1
P19878 1
Q66K79 1
P19971 1
Q6W5P4 1
P20138 1
Q86V20 1
P20702 1
O95202 1
C9JN24 1
A6NGG8 1
C9JN71 1
Q5VVP1 1
D3DQK9 1
Q6IQ23 1
P21462 1
P08123 1
A6NMK8 1
Q6ZR62 1
A6NMR0 1
Q7Z5M8-2 1
O00182 1
Q86YD7 1
O00192 1
Q8IYW5 1
P23490 1
Q5JRA6 1
P24071 1
O95521 1
O00253 1
Q5T5J6 1
P24928 1
P02452 1
O00292 1
Q5XUX1-3 1
P25440 1
Q6AZY7 1
P25774 1
P05362 1
O00330 1
Q6PHR2 1
P26378 1
Q6UWT4 1
P26640 1
Q6ZMZ3 1
O00418 1
Q6ZU80 1
O00421 1
A2RUB6 1
P28070 1
Q86T20 1
P28330 1
P13646 1
P30042 1
Q8IVF2 1
P30154-2 1
A6NM10-2 1
O00451 1
Q8IZJ4 1
P31391 1
O95229 1
P31930 1
O95359 1
P32519 1
Q5QGT7 1
P34741 1
Q5SXM8 1
P34820 1
Q5T197 1
P34947 1
Q5T7V8 1
O00566 1
Q5TZ20 1
P35346 1
Q5VUJ5 1
P35372-3 1
P02462 1
P35452 1
Q63HK3 1
P35542 1
Q68DQ2 1
P35556 1
P04264 1
A2RUE3 1
P05107 1
P35789 1
P06133 1
O14610 1
P07197 1
P35968 1
Q6Q4G3 1
P36888 1
Q6UQ28 1
P37108 1
Q6V0I7 1
P37231 1
P08572 1
P38117-2 1
Q6ZNH5 1
A6NNB3 1
P09172 1
O14641 1
P0C0P6 1
P40145 1
P10643 1
P40394 1
Q7Z4N2 1
P42694 1
Q7Z736 1
P42898 1
P12643 1
P43360 1
Q86VI3 1
O14656 1
P14060 1
O14777 1
Q8IUC4 1
O14798 1
Q8IWC1 1
P48357 1
Q8IXT1 1
A2RUQ5 1
Q8IYN0 1
P48681 1
P17693 1
P48736 1
Q587J8 1
O14944 1
Q5CZA4 1
P49917 1
O95236 1
A7MBM2 1
B9A029 1
A8K1K9 1
Q5JVX7 1
P50748 1
Q5M775 1
P50995 1
A6NFJ4 1
P51172-2 1
Q5SXH7-4 1
P51636 1
Q5SYB0 1
P51659 1
A6NII6 1
O15021-3 1
O95900 1
P51801 1
O95988 1
P51858 1
P01011 1
P51957 1
Q5TEA6 1
P51993 1
Q5U5R9 1
P52569-2 1
Q5VTT5 1
O15031 1
P02461 1
A8K8G6 1
Q5VXM1 1
O15205 1
Q5VZR2-2 1
P55103 1
Q5Y7D6 1
P55198 1
Q659C4 1
P56159 1
Q68D06 1
A8K979 1
Q68EA5 1
P56696 1
P04004 1
P56715 1
P04626 1
A8MQT4 1
Q6MZQ0 1
P57071 1
Q6NUQ4 1
O15534 1
Q6NVY1 1
P57727 1
Q6P0N0 1
P57737 1
P06734 1
P58182 1
P07919 1
P59046 1
P07996 1
P59282 1
Q6S9Z5 1
P59533 1
Q6UDR6 1
P59826 1
Q6UWB4 1
O15553 1
Q6UXN2 1
P59910 1
Q6VVB1 1
O43151 1
Q6X4T0 1
A2VDJ0-5 1
Q6ZMT4 1
P60368 1
P08949-2 1
O43187 1
Q6ZQQ6 1
P60370 1
Q6ZRQ5 1
O43314-2 1
Q6ZS82 1
P60411 1
Q6ZUX3 1
O43493-2 1
Q70CQ4 1
P63211 1
Q7KYR7 1
P68363 1
Q7RTV2 1
P78329 1
Q7Z3Y9 1
O43555 1
Q7Z5L4 1
P78364 1
P12109 1
P78396 1
Q7Z7A1 1
P80075 1
Q86TC9 1
P98164 1
P12645 1
Q00056 1
Q86V71 1
Q008S8 1
Q86VY4 1
Q01459 1
Q86WB0 1
Q01658 1
Q86XM0 1
Q01664 1
P15169 1
O43731-2 1
C9JG81 1
O60225 1
Q8IVF5 1
O60243 1
Q8IWE2 1
Q02742 1
Q8IXI1 1
Q02880-2 1
Q8IYD8 1
Q03188 1
P15924 1
Q03405 1
P17036 1
Q03468 1
Q8IYX7 1
Q04671 1
Q8IZF2 1
Q04844 1
A6NM11 1
Q05952 1
O95185 1
Q07075 1
Q58F21 1
A1A4T8-2 1
O95206 1
O60285 1
Q5H9F3 1
Q07283 1
Q5IJ48 1
O60292 1
Q5JSS6 1
Q08397 1
Q5JTV8 1
Q08426 1
O95394 1
Q08999 1
Q5JWR5 1
Q08AF3 1
A1A519 1
Q08AG7 1
Q5M9N0 1
Q09MP3 1
Q5QJE6 1
O60312 1
Q5SQ64 1
Q0P6D6 1
Q5SW96 1
A4D1E9 1
Q5SXM2 1
A4D263 1
Q5SY16 1
Q0ZGT2 1
Q5SZD4 1
Q0ZLH3 1
A6NHR9 1
O60403 1
O95897 1
A4Z6T7 1
Q5T1B0 1
Q12887 1
Q5T2N8 1
A8MV65 1
O95944 1
Q8IZU2 1
Q5T7B8 1
Q8IZY2 1
O95995 1
A0PJX4 1
Q5TAA0 1
A1IGU5 1
Q5TD97 1
Q13084 1
Q5THR3 1
Q13127 1
P01031 1
Q13137 1
P01833 1
Q13233 1
Q5VTJ3 1
Q13316-2 1
P02458 1
O60548 1
Q5VV41 1
Q13470-2 1
Q5VVB8 1
Q13487 1
Q5VW36 1
Q13601 1
Q5VXT5 1
Q13615 1
Q5VYM1 1
B1AH88 1
C9JBG3 1
Q13748 1
Q5XX13-4 1
Q13753 1
Q60I27 1
Q13797 1
P02538 1
Q13946-2 1
Q66K74 1
O60603 1
P02730 1
O60721 1
P02788 1
Q14032 1
Q68DV7 1
Q14112 1
Q6A555-2 1
Q14126 1
Q6B9Z1 1
Q14160-3 1
P04259 1
Q14209 1
C9JDV5 1
Q14210 1
Q6IPM2 1
Q14244 1
Q6L8Q7 1
B1ANC0 1
P04731 1
Q14331 1
Q6NUN0 1
O75023-3 1
Q6NUS8 1
B1APY0 1
Q6NVV3 1
Q14679 1
P05787 1
Q14690 1
Q6NY19-2 1
Q14774 1
P06732 1
B2R6C3 1
Q6P4A8 1
Q14934-3 1
Q6PDB4 1
Q14980 1
P07900-2 1
Q14990 1
Q6PGQ1 1
Q15032 1
Q6PJF5-2 1
B4DQM4 1
Q6Q0C1 1
A6ND48 1
Q6Q759 1
B5B2M5 1
Q6T423 1
O75161 1
Q6UB98 1
O75185 1
Q6UE05 1
Q15652 1
Q6UW78 1
Q16204 1
P08151 1
Q16348 1
Q6UXC1-2 1
B5MDD1 1
Q6UXY1 1
Q16610 1
Q6V1P9 1
Q16762 1
Q6W3E5-2 1
Q16787 1
Q6WQI6 1
Q16790 1
Q6X784 1
Q16828 1
Q6XZB0-2 1
Q17R60 1
P08922 1
O75635 1
Q6ZN28 1
Q18PE1 1
Q6ZNB6 1
Q1EHB4 1
Q6ZP82 1
Q1X8D7 1
Q6ZR52-2 1
O75717 1
P08F94 1
Q2HXU8 1
Q6ZRV2 1
Q2I0M4 1
Q6ZS81 1
A1L443 1
P09871 1
Q2L4Q9 1
Q6ZUB1 1
O75952 1
Q6ZV73 1
Q2M2I5 1
P10321 1
Q2M329 1
P10412 1
Q2M3C7 1
P10523 1
Q2NL98 1
Q7RTR0 1
Q2TAA8 1
Q7RTS3 1
Q2TAL5 1
Q7Z2W4 1
Q2TBF2 1
Q7Z3Y8 1
Q2VIQ3 1
Q7Z407 1
Q2VPA4 1
P12107-2 1
Q2VPK5 1
Q7Z5L7-3 1
Q30201 1
Q7Z5Y6 1
Q32M84 1
Q7Z6L1 1
Q32M92 1
Q7Z745 1
O76014 1
Q86SH2 1
Q32MK0 1
P12270 1
O94769 1
Q86TJ5 1
Q3KPI0 1
Q86U06 1
O94823 1
Q86US8 1
Q3LHN0 1
Q86V48 1
Q3LI76 1
P13284 1
Q3LIE5 1
C9JFW9 1
Q3MJ13 1
Q86VZ4 1
Q3SY84 1
Q86W28 1
Q3YEC7 1
Q86X19 1
Q3ZCM7 1
Q86XL3 1
Q3ZCV2 1
Q86YB8 1
Q3ZCX4 1
Q86YE8-3 1
Q495D7 1
P15313 1
Q495Z4 1
Q8IUN9-2 1
O94850 1
Q8IUX7 1
Q49A88-6 1
Q8IVF4 1
Q49MG5 1
Q8IWA6 1
A1Z1Q3-2 1
Q8IWD5 1
B7ZLS8 1
Q8IWT3 1
Q4G0Z9 1
Q8IX12 1
B8A4U7 1
Q8IXS2 1
Q4VX76-2 1
Q8IY37 1
Q4W5C3 1
Q8IYE1 1
Q4W5G0 1
Q8IYI8 1
Q4ZJI4 1
P17022 1
Q53EZ4 1
Q8IYR2 1
Q53GL7 1
Q8IYU4 1
Q53HC0 1
Q8IYX0 1
Q53QW1 1
Q8IYY4 1
Q53RT3 1
Q8IZC4 1
Q53S99 1
Q8IZF3 1
Q53SF7 1
Q8IZT6 1
Q53T94 1
Q56UN5 1
Q8N0U7 1
Q13007 1
Q13018 1

 

На следующем этапе возникает вопрос — что делать с полученным списком генов с наибольшим числом frameshift мутаций? Можно ли определить характер и уровень функциональных изменений в организме человека? Оказывается, можно. Как упоминалась выше, полученные потенциальные генетические варианты, приведшие к замене кода аминокислот, были сохранены в таблице. Затем я подсчитал, в каких именно протеинах наблюдается наибольшое число потенциально вредных frameshift мутаций, и выделил их в отдельный список. Поскольку это самые интересные (с точки зрения возможных изменений в фенотипе) мутации, то далее я работал только с теми протеинами, в которых наблюдается повышенное количество вредоносных мутаций. Из общего числа я отобрал 35 протеинов с наибольшим количеством мутаций. Отмечу, что ни один из обнаруженных протеинов сам по себе не имеет значимой связи с риском развития заболеваний  интересующего нас спектра. Поэтому вышеприведенный список протеинов был обработан в программе Cytoscape, так как нас интересуют в первую очередь обнаружение функциональных связей с теми протеинами, которые ранее были описаны в литературе как потенциальные факторы развития отдельных расстройств и заболеваний.  Я не буду приводить полученные сетевые графы взаимодействия протеинов, так как они содержат деликатную информацию медицинского характера, поэтому помещенный ниже образец графического отображения в программе Cytoscape взаимодействия протеинов носит сугубо иллюстрирующий характер и взят с сайта програмыы Cytoscape

visualMapping1

Пример проведения экспертизы родства по aутосомным STR маркерам

На протяжении последних нескольких лет я успел убедиться в том, что познания так называемых любителей ДНК- генеалогии в  генетике носит фрагментарный, если не сказать поверхностный, характер. Основная причина сего весьма прискорбного феномена кроется в идиосинкратическом отношении к смежным с ДНК генеалогией (читай: популяционной генетикой) областями генетического исследования. Наибольший интерес с точки зрения скрытого потенциала исследования представляют медицинская генетика и ДНК-судебная криминалистика.

Как я уже неоднократно подчеркивал, я являюсь категорическим противником строгого дисциплинарного разделения областей  изучения генетики человека, за исключением, пожалуй, более сложных для понимания рядового обывателя областей вроде транскриптономики или протеомики.  При рассмотрении всех генетических вопросов, я исхожу из более перспективной методологической установки холизма. Онтологический принцип холизма гласит: целое всегда есть нечто большее, чем простая сумма его частей. С холистической позиции, весь мир — это единое целое, а выделяемые нами отдельные явления и объекты имеют смысл только как часть общности. C этой позиции можно рассматривать  ДНК-генеалогию (популяционную генетику), медицинскую генетику и ДНК-криминалистику как имманентно связанные между собой части общего. Поясню это простыми словами на простых примерах.

Связь ДНК-криминалистики и ДНК-генеалогии наиболее очевидна.  В наличии такой связи можно убедиться, прочитав заключения суд.медэкспертов по вопросу идентификации останков семьи Романовых.
В этих заключениях методологические примеры собственно ДНК-генеалогии органично вписываются в более формализованные методы ДНК-криминалистика.  Методы ДНК-генеалогии хорошо аппроксимируют методы ДНК-криминалистики, однако только выводы с использованием четко регулируемой на законодательном уровне ДНК-криминалистики могут иметь практическое значение для установления определенных юридических фактов (факт происхождения одного лица от друга; установление личности).

Связь ДНК-генеалогии с медицинской генетикой гораздо менее заметна. Тем не менее, последние исследования в области ряда редких аутосомно-доминантных аутоиммунных синдромов выявили ряд закономерностей. Например, медики описали редкий синдром, встречающийся не более чем тысячи человек во всем мире. При изучении их генетических данных, у всех лиц с этим синдромом была выявлена общая мутация. Более того, эта мутация оказалась общей по происхождению — родословные линии всех носителей этой мутации восходили к одному голландскому моряку, который в 17 веке на протяжении нескольких десятков лет участвовал во многих морских экспедициях в Африку и Азию. До начало полномасштабного исследования, носители синдрома ничего не знали о своем родстве.  Таким образом, некоторые генетические синдромы могут рассматриваться как указания на генеалогическое родства.
Существует и обратная связь между медицинской генетикой и ДНК-генеалогия.
Эта связь находит свое выражение в одной из двух общепринятых методологией нахождения медицински релевантных мутациях. Речь идет о методе pedgree-analysis, метод изучения родословной семьи, в ходе которого изучается генеалогия расширенной семьи, определяются генотипы больных и здоровых членов семьи, и механизм наследования аномальных или дефектных версий генов.

Впрочем, c точки зрения новичка, столь тонкую грань между разными аспектами генетического анализа очень трудно уловить.
Именно поэтому очень часто новичок, получивший результаты медицинского ДНК-тестирования или сделавший анализ ДНК в лаборатории судмедэкспертов, обращается с просьбой проинтерпретировать результаты по неверному адресу (например на крупнейший форум молекулярной генеалогии — molgen.org).

Подобный случай произошел совсем недавно на вышеупомянутом форуме, когда новый участник попросил дать заключение в экспертной форме по данным cвоих аутосомных STR и аутосомных STR своего предполагаемого дяди.

Можно ли определить-«Мы родственники?»                                                                                                                                                     1.   D8S1179   8, 14  —14,17
2.   D21S11   28, 30—32.2, 33.2
3.   D7S820   8, 12—-12,12
4.   CSF1PO   10, 13—10,12
5.   D3S1358   17, 17—14,17
6.   TH 01   7, 9—-7,9.3
7.   D13S317   9, 13—11,12
8.   D16S539   11, 13—11,14
9.   D2S1338   20, 25—17,25
10.   D19S433   13.2, 15—13,13.2
11.   vWA   18, 19—15,16
12.   TPOX    8, 8—8,8
13.   D18S51   14, 15—12,17
14.   D5S818   12, 12—-11,12
15.   FGA   22, 22—-20,22
16.   Амелогенин (половая принадлежность)   X, Х—-YX

В целях облегчения понимания необходимо привести общедоступную информацию о системе STR-локусов аутосом (источник DNALab.ru)В большинстве случаев установления родства используются системы, основанные на аутосомных STR-локусах. К настоящему времени известно несколько сотен тысяч различных аутосомных STR-локусов, которые достаточно равномерно распределены по всему геному человека, что позволяет составить большое количество систем на их основе. В вероятностных расчетах, проводимых при оценке достоверности результатов анализов, используются данные популяционной генетики. Для корректного использования популяционных данных чаще всего необходимо, чтобы входящие в систему локусы были независимыми, то есть располагались на разных хромосомах, либо на одной хромосоме, но на достаточно большом расстоянии друг от друга. При выборе локусов-кандидатов учитывается данная особенность, характерная для анализа родства и идентификации человека на основе аутосомных маркеров.

Бурное и одновременное развитие методов ДНК-анализа для идентификации человека в различных странах привело к созданию баз данных STR-профилей лиц, совершивших преступления, и биологических объектов, изъятых с мест преступлений. Требование совместимости растущих баз данных привело к созданию региональных, а затем и международных стандартов для систем STR-локусов.

Так, в Европе, в результате сотрудничества Интерпола и организации ENFSI (European Network of Forensic Science Institutes) двенадцать маркерных STR-локусов (D21S11, FGA, vWA, TH01, D18S51, D3S1358, D8S1179, D1S1656, D2S441, D10S1248, D12S391, D22S1045) были приняты в качестве стандарта ESS (Extended European Standard Set). В стандартную систему, утвержденную латиноамериканской организацией GITAD — Grupo Iberoamericano de Trabajo en Analisis de DNA входят шесть локусов (TH01, CSF1PO, D16S539, D7S820, D13S317, TPOX). Наконец, система CODIS (COmbined DNA Index System), принятая в США и Канаде состоит из 13 локусов (TH01, CSF1PO, D16S539, D7S820, TPOX, D21S11, FGA, vWA, D8S1179, D3S1358, D18S51, D13S317, D5S818).

Как видно, по приведенной выше схеме, маркеры сравниваемых в нашем примере племянницы и дяди входят в  панель набора AmpFLSTR .

Но вернемся к нашему случаю. Итак, новичок-девушка задала на Молгене совершенно невинный вопрос, биологические родственники они с дядей или же нет. Естественно, конкретный характер вопроса предполагал получение квалифицированного экспертного заключения. Однако, по ставшей уже недоброй молгеновской традицией, вместо четкого ответа на вопрос, ее ожидания были вознаграждены отповедью двух лицемерных невежд, напустивших на бедную деву облако пустых словес и рассуждений в духе приснопамятного Полиграфа Шарикова («взять все и поделить на два!»).
Правда, чуть позже один все-таки взял себя в руки  и выдал нечто отдаленно смахивающее на экспертное заключение (впрочем, как мы покажем ниже, оно далеко не полное):

Если использовать нормализованные значения (то есть принцип УПСов), и не забыть при этом от маркера 12. TPOX взять только половину (там участок полного совпадения), то имеем 71.43% совпадения.

Вывод: с высокой вероятностью протестированный является дядей Кати.

Оставляя в стороне замечания по этике поведения, и сосредотачиваясь на сути вопроса нужно сказать, что так экспертные заключения не даются.

Возникает вопрос: а как надо было правильно анализировать данные новичка?

Как совершенно верно и четко отметил в ходе дискуссии уважаемый Владимир Рудич (один из немногих грамотных участников Molgena), по тесту аутосомных STR-маркеров надёжно можно установить родство между родителем и его ребёнком. И то при этом никогда не дают вероятность 100%. Обычно 99,99% или 99,999%,  в зависимости от количества протестированных маркеров. Для более далёких родственников можно определить только вероятность родства, причём она не будет близка к 100%. Есть специальные методики(обязательно учитывающие степень родства), утверждённые минздравом РФ для расчёта вероятности. Есть таблицы распространения аллелей в популяциях. Есть утверждённые вероятности мутаций. Естественно, зная механизм передачи аутосомных маркеров очевидно, что для разной степени родства расчёт вероятности будет разный.Надо знать родной это дядя или например двоюродный. В лабораториях, которые делают такие тесты, должны делать и расчёт вероятности.

 

От себя добавлю, что  в мире существует множество методик и критерии определения родства по аутосомным маркерам, а также специальное программное обеспечение.  Хорошим стартовым материалом для углубления в эту проблему является страница Американского Института Стандартов и Технологии (NISTR), на которой ведущий американский эксперт по аутосомным STR Люис О’Коннор, разместил ссылки на статьи и базы данных, связанных с этой проблемой. Поэтому, отсылая читателя к более компетентному источнику, я не буду подробно останавливаться на деталях принципа анализа. Отмечу лишь одно важное ограничение. К сожалению, большинство из двух дюжин программ анализа родства с помощью аутосомных STR являются коммерческими продуктами, и хуже того, распространяются на основании специальной лицензии среди сертифицированных центров судебной ДНК-экспертизы. Из небольшого числа доступных в trial-версии программ, можно отметить GeneProof2, который используется в работе Федеральным государственным бюджетным учреждением «Российский центр судебно-медицинской экспертизы  Минздрава России». Поскольку программа относительно проста, именно ее мы будем использовать для анализа.

Нужно отметить, что относительно небольшое число параметров влияет на надежность экспертного заключения. Например, в GenoProof2 нет параметра, которым задается вероятность мутации и т.д. Несмотря даже на столь важные ограничения, результаты анализа в программе выглядят гораздо более профессиональными, в сравнении с ехидными насмешками участников Молгена.

В первом анализе, мы допустили что новичок и ее дядя происходят из одной, российской популяции (программа загрузила усредненные значения аллельных частот по популяциям РФ). Нами были получены следующие результаты:

Тип предполагаемого родства

Единоутробные/единокровные братья и сестры / дедушка-внук / дядя, тетя-племянник, племянница

Вероятность  60.77847174  

Рейтинг: наиболее вероятное родства

Сводная вероятность: 24,0058

Тип предполагаемого родства

Двоюродные братья

Вероятность

29.53426894

Рейтинг

В два раза менее вероятно, чем родство по типу дедушка-внук / дядя, тетя-племянник, племянница

Сводная вероятность

11,6652
Тип предполагаемого родства

Братья и сестры

Вероятность

7.1554302

Рейтинг

8 раз менее вероятно, чем родство типа родства половинных братья и сестры / дедушка-внук / дядя, тетя-племянник

Сводная  вероятность

2,8262
Тип

Неродственники

Вероятность

2.53182912

Рейтинг

В 24 раза менее вероятно, чем половинные братья и сестры / дедушка-внук / дядя, тетя-племянник, племянница

Сводная вероятность  1,0000

Теперь посмотрим, изменится ли результат если мы допустим, что проанализированные индивиды происходят из другой популяции. В качестве популяции во втором эксперименте мы использовали популяцию басков.

Type Probability Rating Joint Probability
First Cousins 41.17540894 most likely 1.8924
Half Siblings / Grandparent-Grandchild / Uncle,Aunt-Nephew,Niece 35.21813837 equiprobable as First Cousins 1.6186
Unrelated 21.75884564 2 times less likely than First Cousins 1.0000
Full Siblings 1.84760704 22 times less likely than First Cousins 0.0849
Parent-Child 0 0.0000

Как видно из вышеприведенной таблицы, в случае с исходной популяцией басков,  вероятность типа предполагаемого родства. Наиболее вероятной степенью родства в этом случае являются двоюродное родства. Из этого следует один важный вывод; данные о аллельных частотах в популяциях предков сравниваемых индивидов имеют критическое значение для оценки вероятности той или иной степени родства.

Обзор развития рынка коммерческой геномики в РФ: «Генотек»

Уже довольно таки давно я хочу рассказать читателем о состоянии дел на рынке коммерческой геномики в России, но из-за большого количества новостей приходится все время откладывать написание обзора.   Досадный пробел был заполнен за счет ре-поста вовремя появившегося пиар-релиза от ведущего российского стартапа  из сколковской лаборатории — компании «Генотек». Некоторое время назад после громкого релиза в околонаучных каналах рунета о создании этой компании, я начал отслеживать ее деятельность. Теперь, по прошествии двух лет, можно проанализировать особенности адаптированных под реалии российского рынка стратегий позиционировании и продвижении столь экзотического  для россиян продукта, как genomic service.
Стартаперы расшифровали геном Анны Чапман
Стартаперы расшифровали геном Анны Чапман
Основатели компании «Генотек» решили сделать бизнес на том, что в России никогда не выходило за пределы научных лабораторий: на расшифровке генома. Они смогли сделать генетический тест доступным по цене, но столкнулись с новой проблемой — рекламное продвижение. Чтобы раскрутить бренд, «Генотек» предлагает знаменитостям бесплатно пройти такое исследование, но из сотни звезд согласились только пятеро. Среди смельчаков оказалась шпионка Анна Чапман.

О молекулярно-генетической диагностике, наследственности и геномном капитализме

Молочные железы стоимостью 3 миллиарда долларов

В статье, озаглавленной «Мой медицинский выбор» и опубликованной в газете New York Times, Анжела Джоли объясняет причины, по которым она приняла решение пройти операцию по удалению молочных желез (мастэктомию).  В числе прочего Джоли объяснила, что ее мать почти десять лет боролась с раком и умерла в 56-летнем возрасте.  У среднестатистической женщины этот риск составляет 12%. Только лишь в США рак груди в прошлом году был диагностирован у 232 тыс. американок, из которых примерно 40 тыс. умрут из-за этой болезни.  Эти обстоятельства побудили Джолт заказать полный пакет диагностирования предрасположености к развитию рака груди и рака яичников в американской компании Myriad Genetics.  Видимо, все подробности отчета по исследованию генов BRCA Джоли нам не удастся узнать никогда. Судя по первоисточнику информации (статье Джоли), «врачи» оценили вероятность ее заболевания раком молочной железы приблизительно в 87%, а раком яичников — в 50% и она является носителем «дефектного» гена BRCA1, который резко повышает риск развития рака молочной железы и рака яичников».

Оставим на совести Джоли несколько упрощенную подачу информацию. Во-первых, речь идет не о «врачах» (многие из которых как раз очень нервно относятся к посяганиям генетиков на их прерогативу ставить диагнозы и оценивать риски развития заболевания). Во-вторых, «дефектным» является не сам ген, а специфические  мутаций в BRCA-генах, связанные с возникновением рака молочной железы. В-третьих, существует еще целый спектр мутаций в других генах (например, в CHEK2, FGFR2, CASP8, STXBP4, TAB2 и др).  Разумеется, все эти досадные неточности не только просочились в падкие до сенсаций средства массовой информации, но и еще и обросли бородой из еще больших нелепостей.

Несмотря на все это, можно сказать, что эта статья и публичное обращение Джоли являются важным (возможно даже эпохальным) событием в стремительно развивающейся области персональной геномики, и особенно так называемого молекулярно-генетического диагностирования. Статья получила огромный резонанс, особенно с учетом все нарастающего публичного интереса к проблеме раннего диагностирования рака.  На моей памяти, это первый случай, когда икона общественного мнения и публичный человек такой величины как Джоли,  совершила столь радикальный поступок исходя из столь спекулятивных результов анализа.  Тут нужно сказать пару слов о компании Myriad Genetics — пионере так называемого патентирования генов в геномную эпоху.  Именно благодаря этой компании (основаной в  далеком 1996 году), даже далекие от биологии люди узнали о том, что их гены уже давно кому-то принадлежат.  Это было самое начало 2000-х годов, когда начались процессы о патентах на гены BRCA1 и BRCA2. Мутации в этих генах существенно повышают риск развития рака груди и яичников у женщин. Биотехнологическая и диагностическая компания Myriad Genetics в 1998-м и 2000-м годах соответственно запатентовала эти два гена (хотя фактор риска связанный с этими генами был впервые описанв 1994 году группой исследователей из унивеситета штата Юта), а также их мутантные варианты и методики выявления мутаций. А уже в 2001 году лаборатории, занимающиеся диагностическим тестированием на изменения в генах BRCA, получили письма с требованием прекратить все работы или выплатить Myriad причитающиеся отчисления.  Последовала предсказуемая реакция  в виде массового бурления. На умы далеких от науки потребителей излился целый шквал риторических возваний генетиков и биологов с мировыми именами, которые в целях накала страстей рисовали весьма мрачную картину последствий такой деятельности.  Разбирательства тянулись много лет, причем большая часть решений выносилась в пользу Myriad. Истцы упорно оспаривали вердикты, и очередной этап слушаний завершился 17 августа 2012 года. Апелляционный суд вновь счел, что патентные права биотехнологической компании на гены BRCA1 и BRCA2 законны. В апреле 2013 года в интервью журналу Forbes, CEO компании Питер Мельдрам заявил, что компания патентировала не сами гены, а диагностические средства определения риска развития рака груди:

After years of research, Myriad isolated and created new chemical (DNA) molecules corresponding to these genes from among the tangled mass of 20,000 genes in genomic DNA

Следущий этап слушаний в Верховном Суде США планируется на лето этого года, и тогда же ожидается окончательное решение этого вопроса, которое должно породить прецедент. В ожидании этого решения, ключевые игроки  перспективного зарождающегося рынка генетической диагностики решили стимулировать интерес общественности путем проведения ряда пиар-акций. Возможно, что откровения Джоли (частично) являются частью этой пиар-компании. Примечательно, что новость об удалении актрисой молочных желез груди совпала с объявлением еще одной, специализирующейся на исследовании генома, компании Genomic Health о выпуске на рынок 10 млн. обычных акций.

Закон не дышло

С чисто формальной точки зрения патентного права США, здесь все чисто. Хороший обзор юридических аспектов проблемы патентирования генома содержится в замечательной статье  «Господин не владеет собой»:

Идея присваивать права на чьи-либо гены выглядит дикой и, более того, законодательства большинства стран прямо запрещают патентовать то, что было создано природой (и законы природы тоже). Эти доводы неоднократно высказывались в судах и общественных дискуссиях, но пока патентное лобби успешно отбивает все нападки. Аргументы тех, кто считает, что права на использование генов внутри нас или целых живых организмов можно застолбить при помощи каких-либо документов, не лишены логики и даже некоторого изящества.

ДНК живых существ создана природой? — Так мы же патентуем не ту ДНК, что находится внутри клеток, а выделенные и очищенные молекулы, содержащие только искомые гены. В природе такие молекулы не встречаются — соответственно, их можно считать творением человека. Якобы подлежащие патентованию животные и культуры клеток были порождены не человеком, а появились на свет в результате естественных процессов? — Человек внес в геномы этих созданий определенные изменения (чаще всего патенты получают на генетически модифицированные организмы), значит, в природе они не существуют, а являются творениями людей. Это соображение использовалось еще во времена Луи Пастера: в 1873 году он запатентовал дрожжевой штамм, заявив, что «дрожжи, свободные ото всех паразитов и инфекций, являются промышленным изделием». По мнению сторонников отчуждаемости прав на использование биологических объектов, на их стороне стоит базовый патентный закон США, в пункте 101 которого (в толковании американского Конгресса) утверждается, что объектом патентования может быть «все, что есть под солнцем и создано человеком».

«Впервые идея патентовать гены, вернее, последовательности фрагментов экспрессируемых генов пришла в голову Крейгу Вентеру (одиозный американский биохимик, внесший существенный вклад в расшифровку генома человека и недавно заявивший о создании организма с искусственным геномом. По другим данным, и в своей автобиографии Вентер выступал против патентования генов – прим. «Ленты.ру»), еще когда он работал в NIH (Национальный институт здоровья США). Тогда по этому поводу был большой шум (как раз в связи с «полезностью» патентуемых последовательностей); кончилось дело тем, что Вентер ушел из NIH и создал частный институт геномных исследований», — комментирует ситуацию с патентами биолог Константин Северинов, профессор университета Ратгерса (США), заведующий лабораториями в Институте молекулярной генетики РАН и Институте биологии гена РА

К слову, подобный шум случился и в прошлом году, когда выяснилось, что компания 23andme запатентовала полиморфизм, связанный с риском развития болезни Паркинсона. Шум возник главным образом из-за того, что клиенты 23andme (чьи данные и использовались в ходе нахождения генетических факторов риска развития болезни Паркинсона) не были в курсе планов 23andme по патентованию генов. Но это скорее не юридическая, а моральная проблема.  Что касается определения генетических рисков развития рака груди, то тут возможности 23andme более чем ограничены — они определяют только три специфические (для ашкеназов) полиморфизмы-инделы генов BRCA -185delAG (DD/DI — i4000377) в гене BRCA1, 5382insC в гене BRCA1 (II/DI — i4000378), и 6174delT в BRCA2 (DD и DI — i4000379). Иными словами, тест 23andme (cтоимостью 99 долларов США) не заменит тест от Myriad Genetics (стоимостью 4000 долларов США).

Импакт-фактор.

Вернемся к статье Джоли и ее последствиям. Одно из последствий (пробуждение интереса к молекулярно-генетической диагностике) мы уже вкратце описали выше.  Обращение Джоли имело и другое важное последствие. До 14 мая Myriad Genetics была хотя и сканадально известным, но относительно небольшим (по американским меркам) бизнесом, который начал приносить доход только в прошлом году (то есть спустя 16 лет после основания).

Сразу после публикации Джоли, Myriad Genetics принялся стремительно расти в цене. За последний месяц акции этой компании подорожали с $25/шт. до $34/шт., подняв ее рыночную стоимость до $2,6 млрд.В 2005 г. выручка Myriad Genetics составляла $71 млн., а в 2012 г. она поднялась до $496 млн., 82% которых принесли продажи тестов.

В свою очередь, этот рынок подстегивает индустрию пластической хирургии. По данным Myriad Genetics, около трети женщин, у которых компания обнаружила мутации, в конечном итоге решают ампутировать молочные железы. Стоимость этой операции в США варьируется от $15 тыс. до $50 тыс. в зависимости от клиники и сложности косметических процедур.

Эффект основателя.

Практически все исследователи сходятся во мнении, согласно которому все полиморфизмы генов BRCA связаны с пресловутым эффектом основателя. Говоря простым языком, большинство носителей специфических мутаций этих генов унаследовали этот ген от общего предка, жившего (по абсолютным меркам) относительно недавно. Кроме того, эти мутации часто дифференцируются по популяциям. Следовательно, эти специфические мутации можно считать своего рода квази-генеалогическими маркерами, которые маркируют общность происхождения от определенной этнической и даже родовой группы.  Необходимо отметить, что существуют мутации, свойственные только определенным этническим группам. В качестве примера, в группе евреев-ашкенази имеются преобладающие мутации в гене BRCA1 (185delAG) и в гене BRCA2 (6174delT), которые почти никогда не встречаются в других этнических группах.  В целом, в группе евреев-ашкенази мутации в BRCA-генах встречаются заметно чаще, чем в других этнических группах. Процитирую авторитетный источник: 

Полагают, что в отношении оценок пенетрантности генов BRCA 1/2 важно этническое происхождение пациентов-носителей. В некоторых популяциях только несколько мутаций являются ответственными за генетическую предрасположенность к РМЖ. Они связаны с эффектом родоначальника, т.е. мутация, возникшая в одной из гамет предка, так называемая мутация de novo, впоследствии передается из поколения в поколение. Cреди евреев ашкенази «эффект родоначальника» ярко выражен. Он проявился тремя основными мутациями: гена BRCA 1 – 185 del AG, 5382 insC; гена BRCA 2 – 6174 delTT, которые отвечают за 60% случаев РЯ и 30% РМЖ, возникших у женщин до 40-летнего возраста [4]. Thorlacius и соавт. (1998 г.) продемонстрировали наличие основополагающей мутации гена BRCA 2 – 99 del5 в исландской популяции, ассоциированной с 37,2% риска РМЖ в возрасте до 70 лет у мужчин и женщин [46]. Мутация гена BRCA 1 1191 delC, описанная в Бельгии, на сегодняшний день не зарегистрирована в других популяциях [13]. Предполагают, что семьи имеют общий наследственный гаплотип, который охватывает і850 кБ гена BRCA 1 и более, а определенные внутригенные маркерные аллели наследуются от общего предка. Так, среди 7 различных мутаций гена BRCA 1 мутация 300 С>Т, чаще описываемая в Германии, Австрии и Венгрии, происходит от одного родового случая. Аналогично IVS5+3A>G является частым вариантом среди бельгийских и французских семей, в которых они возникли 34 поколения назад. Средний возраст наследования мутации 185 delAG составляет 61 поколение, или 980–2250 лет, мутация 5382 insC прослежена в 44 поколениях [1, 44].

Как уже было сказано выше, во всех странах имеется свой спектр мутаций в BRCA-генах, связанных с возникновением рака молочной железы. Вот например таблица генетического исследования больных РМЖ (рак молочной железы) и РЯ (рак яичников), проживающих на территории РФ (источник):

азвание
гена
Мутация Число
семей
Этническая принадлежность
пациентов
Локализация
опухоли
BRCA1 5382insC 9 Русские и евреи-ашкенази из Москвы, русские из Московской обл. и с Украины, белорусы из Белоруссии, татары из Азербайджана 23 случая РЯ,
3 случая РМЖ
BRCA1 5382insC 4 Русские и евреи-ашкенази из Санкт-Петербурга РМЖ
BRCA1 5382insC 3 Русские из Сибири РМЖ
BRCA1 4153delA 3 Русские из Москвы и Московской области РЯ
BRCA1 948Fs,
g.360445del10nt
1 Русские из Санкт-Петербурга 1 случай РЯ,
1 случай РМЖ
BRCA1 3875del4 1 Русские из Московской области РЯ
BRCA1 M1628T 1 Русские из Иркутска РЯ
BRCA1 2073delA 1 Русские из Москвы РЯ
BRCA2 6174delT 1 Евреи-ашкенази из Санкт-Петербурга Нет
695insT 1 Русские из Сибири РМЖ
1528del4 1 Русские из Сибири РМЖ
9318del4 1 Русские из Сибири РМЖ
S1099X 1 Русские из Сибири РМЖ

Литература

King et al. (2003) . “Breast and ovarian cancer risks due to inherited mutations in BRCA1 and BRCA2.” Science 302(5645):643-6.
Struewing et al. (1997) . “The risk of cancer associated with specific mutations of BRCA1 and BRCA2 among Ashkenazi Jews.” N. Engl. J. Med. 336(20):1401-8.
Mohamad and Apffelstaedt (2008) . “Counseling for male BRCA mutation carriers: a review.” none 17(5):441-50.
Thompson et al. (2001) . “Variation in cancer risks, by mutation position, in BRCA2 mutation carriers.” Am. J. Hum. Genet. 68(2):410-9.
Chen S et al. (2006) . “Characterization of BRCA1 and BRCA2 mutations in a large United States sample.” J. Clin. Oncol. 24(6):863-71.
Ferla R et al. (2007) . “Founder mutations in BRCA1 and BRCA2 genes.” Ann. Oncol. 18 Suppl 6:vi93-8.
Satagopan JM (2002) . “Ovarian cancer risk in Ashkenazi Jewish carriers of BRCA1 and BRCA2 mutations.” Clin. Cancer. Res. 8(12):3776-81.
Satagopan JM (2001) . “The lifetime risks of breast cancer in Ashkenazi Jewish carriers of BRCA1 and BRCA2 mutations.” Cancer. Epidemiol. Biomarkers. Prev. 10(5):467-73.
Chen S et al. (2007) . “Meta-analysis of BRCA1 and BRCA2 penetrance.” J. Clin. Oncol. 25(11):1329-33.
Грудинина Н.А., Голубков В.И., Татищева Ю.А., Брежнева Т.В., Васильев В.Б., Хансон К.П., Мандельштам М.Ю. Успехи в молекулярной диагностике наследуемых форм рака молочной железы в Санкт-Петербурге. Научно-практический симпозиум «Технологии генодиагностики в практическом здравоохранении» в рамках Международной конференции «Геномика, протеомика и биоинформатика для медицины», Москва 20-21 июня 2002 года. Сборник трудов симпозиума. С. 165-167.
Мандельштам М.Ю, Голубков В.И., Ламбер Е.П., Шапиро И.М., Брежнева Т.В., Семиглазов В.Ф., Липовецкий Б.М., Хансон К.П., Гайцхоки В.С. Поиск часто встречающихся мутаций в генах предрасположенности к раку молочной железы// Генетика. — 2001. — Т. 37, N 12. — С. 1681-1686.
Мандельштам М.Ю., Голубков В.И., Ламбер Е.П., Брежнева Т.В., Семиглазов В.Ф., Гайцхоки В.С., Хансон К.П. Частая мутация гена BRCA1 у больных с семейными формами рака молочной железы в России// Тихоокеанский медицинский журнал. — 2002. — N 1 (8). — С. 59-60.
Gayther S.A., Harrington P., Russell P., Kharkevich G., Garkavtseva R.F., Ponder B.A.J., UKCCCR Familial Ovarian Cancer Study Group. Rapid detection of regionally clustered germ-line BRCA1 mutations by multiplex heteroduplex analysis.// American Journal of Human Genetics, 1996. Vol. 58. P. 451-456.
Gayther S.A., Harrington P., Russell P., Kharkevich G., Garkavtseva R.F., Ponder B.A.J. Frequently occurring germ-line mutations of the BRCA1 gene in ovarian cancer families from Russia.// American Journal of Human Genetics, 1997. Vol. 60. P. 1239-1242.
Tereschenko I.V., Basham V.M., Ponder B.A., Pharoah P.D. BRCA1 and BRCA2 mutations in Russian familial breast cancer. //Human Mutation, 2002. Vol. 19, No 2. P. 184.