Как использовать ClinVar — Учебное пособие для начинающих

Что такое ClinVar?

Для многих секвенирование генома — это начало увлекательного путешествия. Однако часто люди не знают, с чего начать изучение данных ДНК. Чтобы узнать, как генетика влияет на здоровье, может быть чрезвычайно полезен инструмент под названием ClinVar. Но как именно работает этот инструмент? Этот урок научит вас!

Вы заинтересованы в обнаружении ВСЕХ генетических вариантов в вашей ДНК, чтобы получить большинство таких инструментов, как ClinVar? Nebula Genomics предлагает секвенирование всего генома всего за 299 долларов! Нажмите сюда, чтобы узнать больше!

99,9 процента

Геном человека состоит примерно из 3 миллиардов букв, разбросанных по 23 парам хромосом. Вместе эти буквы (также известные как нуклеотиды) действуют как инструкция по определению наших качеств. В геноме содержится рецепт, который делает каждого человека уникальным, от цвета волос до риска сердечных заболеваний.

Случайно выберите двух человек, и у них, вероятно, будет больше различий, чем сходства. Человек может быть высоким, нуждаться в очках, иметь семейный анамнез рака груди и ненавидеть вкус кинзы. У другого рыжие волосы, непереносимость лактозы, и он всегда был отличником.

Хотя эти два человека могут показаться не похожими друг на друга, в их геномах все же 99,9% одинаковых букв. Все различия между двумя случайными людьми, от их внешнего вида до риска заболевания, происходят из-за различий только в 0,1% (или 3 миллионах) букв в геноме!

0,1 процента

Буквы генома, которые могут отличаться у разных людей, известны как однонуклеотидные полиморфизмы или SNP (произносится как «отрезки»). Например, SNP присутствует, если у большинства людей в определенном месте генома есть буква «C», а у меньшинства — буква «T». Можно сказать, что этот SNP имеет 2 возможных варианта или «аллели»: C и T.

По оценкам ученых, в геноме потенциально может быть до 100 миллионов SNP. Многие из этих SNP встречаются в генах, последовательностях ДНК, которые действуют как инструкции для создания белков, молекулярных машин, которые выполняют различные задачи внутри и вне клеток. Однако гораздо больше SNP встречается за пределами этих регионов, в так называемых «Мусорная ДНК» . Несмотря на название, эта ДНК составляет около 99% информации нашего генома, и ученые продолжают открывать все больше и больше о ее важности для нашего здоровья.

Тем не менее, определение SNP является ключевым шагом в понимании личных геномных данных. Некоторые SNP могут сильно повлиять на предрасположенность человека к определенному заболеванию. Например, рассмотрим болезнь Альцгеймера. Конкретный SNP в APOE ген увеличивает риск развития болезни Альцгеймера у человека за счет более чем в 20 раз !

Благодаря достижениям в технологиях генетического тестирования, снижающим стоимость секвенирования генома человека, все больше и больше людей делают шаг вперед, чтобы узнать о себе через свою ДНК. Некоторые компании, занимающиеся генетическим тестированием, предоставляют своим пользователям доступ к файлам необработанной ДНК, чтобы они могли исследовать свои данные самостоятельно. Хотя это расширяет возможности пользователей, это одновременно может быть довольно сложным. Большинство людей не очень хорошо знакомы с генетикой человека и различными инструментами анализа данных. В частности, учитывая миллионы SNP, многие пользователи по понятным причинам не знают, как понять, что они означают.

Вы заинтересованы в обнаружении ВСЕХ генетических вариантов в вашей ДНК, чтобы получить большинство таких инструментов, как ClinVar? Nebula Genomics предлагает секвенирование всего генома всего за 299 долларов! Нажмите сюда, чтобы узнать больше!

Как пользоваться ClinVar

ClinVar — один из самых полезных инструментов, позволяющих узнать больше о том, что ваши SNP могут значить для здоровья. Это открытый общедоступный архив, целью которого является каталогизация взаимосвязей между генетическими вариантами и их влияния на состояние здоровья.

ClinVar находится в ведении Национальных институтов здравоохранения США. Он работает как центральная общедоступная база данных для исследователей и медицинских работников, в которой хранится информация о клинически значимых SNP. Например, если публикуется новое научное исследование, связывающее генетический вариант с определенным заболеванием, эту информацию можно отправить в ClinVar.

Несмотря на то, что ClinVar мощный, он часто может показаться громоздким и трудным для навигации. Изучение того, как эффективно выполнять поиск по сайту, может получить массу дополнительной информации из данных вашего генома.

По сути, вы можете выполнять поиск в ClinVar, используя любую из трех различных частей информации. Эти:

  • ID SNP
  • Ген
  • Заболевание / Состояние

Поиск ClinVar по SNP

Большинству SNP присваивается уникальный идентификатор, обычно начинающийся с букв «rs», а затем строки цифр (например, rs7412). Ввод этого идентификатора может напрямую связать вас с информацией о местоположении SNP, любых заболеваниях, с которыми он может быть связан, и многом другом.

Файлы необработанной ДНК независимо от формата обычно содержат список генетических вариантов и их идентификаторы. В Nebula Genomics мы предоставляем нашим пользователям их генетические варианты в формате VCF, который является наиболее часто используемым форматом. Чтобы изучить свои генетические варианты, вы можете файл VCF с помощью текстового редактора, такого как Sublime, или просто взглянуть на исследования в библиотеке Nebula. На сегодняшний день мы уже проанализировали более 8000 генетических вариантов, и каждую неделю добавляются новые исследования и варианты!

Чтобы узнать о клинической значимости определенного SNP, воспользуемся ClinVar. Начнем с перехода к сайт , где первая страница должна выглядеть так:

Домашняя страница ClinVar.
Домашняя страница ClinVar.

На этом сайте вы можете узнать больше о ClinVar и о том, как подавать новые заявки. Если у вас уже есть SNP, вы можете просто ввести его в строку поиска и нажать «Поиск». Здесь нам интересно узнать больше о SNP rs63750048.

ClinVar поиск.

Если какая-либо информация о SNP была загружена в ClinVar, сайт вернет результат поиска для этого SNP. Мы можем сразу увидеть, что он расположен в гене PSEN2 и связан с болезнью Альцгеймера 4 типа. Перейдя по ссылке (выделенной на скриншоте), мы сможем узнать еще больше о SNP.

Результаты поиска.

На этой странице представлена дополнительная информация о SNP, включая все условия, с которыми он может быть связан, и любые научные публикации, в которых упоминается SNP. Для каждого условия в разделе «Представленные интерпретации и доказательства» вы можете щелкнуть ссылку «Сведения о доказательствах», чтобы узнать, как SNP связан с заболеванием и как оно было обнаружено.

Запись в ClinVar.
Запись в ClinVar.
Доказательства в ClinVar.
Доказательства в ClinVar.

Здесь мы видим, что SNP был идентифицирован в итальянской семье, страдающей болезнью Альцгеймера. Нормальная буква в этом месте генома — C, но генетические тесты, проведенные в этом семействе, показывают, что многие члены имеют T в одном и том же месте, что может повлиять на функционирование гена PSEN2. Далее в отчете отмечаются определенные симптомы, которые испытывали члены семьи.

Подробные доказательства в ClinVar.
Подробные доказательства в ClinVar.

Поиск ClinVar по гену

Возможно, мы не имеем в виду конкретный SNP и вместо этого хотели бы найти все SNP, присутствующие в интересующем нас гене. Как только мы найдем интересный SNP, мы можем вернуться к нашим собственным геномным данным и проверить наш статус для этого SNP.

Начните с возврата на домашнюю страницу ClinVar и найдите ген, о котором вы хотите узнать больше. В данном случае мы ищем «BRCA», ген, вариации которого связаны с повышенным риском развития рака груди.

Поиск ClinVar по названию гена.
Поиск ClinVar по названию гена.

Поиск по имени этого гена возвращает сотни вариантов ClinVar. Некоторые из них находятся в генах BRCA, а другие — в генах, тесно связанных с BRCA. Чтобы не быть перегруженными результатами поиска, мы можем отфильтровать их, используя параметры в левой части страницы. К ним относятся:

  • Клиническая значимость: вызывает ли этот SNP конкретное заболевание (патогенное и, вероятно, патогенное) или нет (доброкачественное и, вероятно, доброкачественное)? Или неясно, каковы его эффекты? Или есть противоречивые результаты разных исследований?
  • Молекулярное следствие: какое влияние SNP оказывает на последовательность гена?
  • Тип вариации: буква добавляется к последовательности или удаляется из нее? Или одна буква заменяется другой (например, С на Т)?
  • Статус обзора: сколько клинических данных существует для этого SNP?
Фильтры ClinVar.
Фильтры ClinVar.

После просмотра множества SNP в разных фильтрах давайте узнаем больше о варианте, выделенном красным прямоугольником ниже.

Перейдя по ссылке, мы сразу сможем узнать больше о SNP. Мы можем видеть, что SNP — это изменение буквы G на букву C, расположенную на хромосоме 13, и потенциально связано с повышенным риском рака груди. Дополнительно мы можем узнать ID SNP (rs81002796).

Клиническое значение в ClinVar.
Клиническое значение в ClinVar.

Поиск ClinVar по заболеванию

Наконец, если мы не имеем в виду конкретный SNP или конкретный ген, мы можем выполнить поиск по всем SNP, связанным с конкретным заболеванием. Хотя это и не обязательно, добавление[disease/phenotype] Тег после поискового запроса может помочь ограничить результаты только наиболее подходящими для конкретного условия. Например, если нас интересуют SNP, связанные с диабетом, мы можем выполнить поиск в ClinVar по запросу «диабет.[disease/phenotype] ».

Поиск ClinVar по названию болезни.
Поиск ClinVar по названию болезни.

Поскольку возвращаются тысячи результатов, давайте отфильтруем результаты, чтобы отобразить только те, которые являются установленными «факторами риска» диабета. Затем давайте подробнее узнаем о первом результате.

Фильтр факторов риска.
Фильтр факторов риска.

Перейдя по ссылке, мы можем узнать, что этот SNP представляет собой замену буквы C на G, расположенную на хромосоме 1 в гене, известном как PTPN22. SNP был идентифицирован в публикации в 2006 году.

Ссылка на литературу.
Ссылка на литературу.

Если мы хотим узнать больше о том, как был найден SNP, мы можем перейти по ссылке публикации, чтобы узнать больше об исследовании.

Связанное исследование.
Связанное исследование.

ClinVar — мощный инструмент. Использовать его мудро.

Хотя ClinVar — это обширная база данных, в которой собраны результаты тысяч лабораторных и медицинских исследований, важно отметить, что этот инструмент не является генетическим консультантом. Он не предназначен для предоставления медицинских консультаций и диагностики. Если вы подозреваете, что информация, которую вы нашли во время поиска на сайте, может иметь отношение к вашему здоровью, важно обратиться к врачу или другому лицензированному специалисту в области здравоохранения для генетического консультирования.

Вам понравился наш учебник по ClinVar? Вы также можете найти это руководство полезным:

Об авторе