ClinVarの使用方法-初心者向けのチュートリアル

ClinVarとは何ですか?

多くの人にとって、ゲノムの配列を決定することは、刺激的な旅の始まりです。 しかし、多くの場合、人々は自分のDNAデータの探索をどこから始めればよいのかわからないままになっています。 遺伝学が健康にどのように影響するかを学ぶために、ClinVarと呼ばれるツールは非常に便利です。 しかし、このツールはどの程度正確に機能しますか? このチュートリアルはあなたに教えます!

ClinVarのようなツールのほとんどを入手するために、DNA内のすべての遺伝的変異を発見することに興味がありますか? Nebula Genomicsは、全ゲノムシーケンスをたった299ドルで提供しています。 詳細については、ここをクリックしてください。

99.9パーセント

ヒトゲノムは、23対の染色体にまたがる約30億文字で構成されています。 一緒に、これらの文字(ヌクレオチドとしても知られています)は、私たちの特性を決定するための取扱説明書として機能します。 個人の髪の色から心臓病のリスクまで、ゲノムには各人をユニークにするレシピが含まれています。

ランダムに2人を選びますが、類似点よりも多くの違いがある可能性があります。 背が高く、眼鏡が必要で、乳がんの家族歴があり、コリアンダーの味が嫌いな人もいます。 もう1つは赤い髪で、乳糖不耐症で、常にまっすぐな学生でした。

これらの2人は似ていないように見えるかもしれませんが、それでもゲノム内の同じ文字の99.9%を共有しています。 見た目から病気のリスクまで、2人のランダムな個人間のすべての違いは、ゲノム内の文字のわずか0.1%(または300万)の違いに起因します!

0.1パーセント

個人間で異なる可能性のあるゲノムの文字は、一塩基多型、またはSNP(「スニップ」と発音)として知られています。 たとえば、SNPは、大多数の個人がゲノムの特定の場所に文字「C」を持ち、少数派が代わりに「T」を持っている場合に存在します。 このSNPには、CとTの2つの可能なバリアントまたは「対立遺伝子」があると言われます。

科学者は、ゲノム全体に最大1億のSNPが存在する可能性があると推定しています。 これらのSNPの多くは、遺伝子、タンパク質を作るための指示として機能するDNA配列、細胞内外でさまざまなタスクを実行する分子機械内で発生します。 しかし、さらに多くのSNPが、これらの地域の外、いわゆる「ジャンクDNA」 。 その名前にもかかわらず、このDNAは私たちのゲノムの情報の約99%を構成しており、科学者は私たちの健康にとってのその重要性についてますます発見し続けています。

とにかく、SNPを特定することは、個人のゲノムデータを理解する上で重要なステップです。 一部のSNPは、特定の疾患に対する個人の感受性に強力な影響を与える可能性があります。 たとえば、アルツハイマー病について考えてみましょう。 の特定のSNP APOE遺伝子は、アルツハイマー病を発症するリスクを高めます20倍以上

遺伝子検査技術の進歩により、ヒトゲノムの配列決定のコストが削減され、ますます多くの人々がDNAを通じて自分自身について学ぶために飛躍しています。 一部の遺伝子検査会社は、ユーザーが自分のデータを自分で探索できるように、生のDNAファイルへのアクセスを許可しています。 これはユーザーに力を与えますが、同時に非常に困難な場合があります。 ほとんどの人は、人間の遺伝学やさまざまなデータ分析ツールにあまり精通していません。 特に、何百万ものSNPを考えると、多くのユーザーは当然のことながら、それらが何を意味するのかを学ぶ方法を知りません。

ClinVarのようなツールのほとんどを入手するために、DNA内のすべての遺伝的変異を発見することに興味がありますか? Nebula Genomicsは、全ゲノムシーケンスをたった299ドルで提供しています。 詳細については、ここをクリックしてください。

使い方ClinVar

あなたのSNPが健康に何を意味するかについてもっと学ぶための最も役立つツールの1つはClinVarです。 これは、遺伝的変異と健康状態への影響との関係をカタログ化することを目的とした、自由にアクセスできる公開アーカイブです。

ClinVarは、米国の国立衛生研究所によって運営されています。 研究者や医療専門家が臨床的に関連するSNPに関する情報を寄託するための中央の公開データベースとして機能します。 たとえば、遺伝子変異を特定の疾患に関連付ける新しい科学的研究が発表された場合、この情報をClinVarに送信できます。

ClinVarは強力ですが、扱いにくく、ナビゲートするのが難しいように見えることがよくあります。 サイトを効果的に検索する方法を学ぶことで、ゲノムデータから大量の追加情報を引き出すことができます。

基本的に、3つの異なる情報のいずれかを使用してClinVarを検索できます。 これらは:

  • SNP ID
  • 遺伝子
  • 病気/状態

検索中ClinVar SNPによる

ほとんどのSNPには一意のIDが割り当てられます。通常、文字「rs」で始まり、次に数字の文字列(rs7412など)が続きます。 このIDを入力すると、SNPの場所、関連する可能性のある病気などに関する情報に直接つながることができます。

形式に関係なく、生のDNAファイルには通常、遺伝的変異とそのIDのリストが含まれています。 Nebula Genomicsでは、最も一般的に使用されている形式であるVCF形式でユーザーに遺伝的変異を提供しています。 遺伝的変異を調べるには、SublimeなどのテキストエディターでVCFファイルを作成するか、星雲ライブラリの研究を確認します。 現在までに、8000を超える遺伝的変異を分析しており、毎週新しい研究と変異が追加されています。

特定のSNPの臨床的関連性について学ぶために、ClinVarを使用しましょう。 に移動することから始めましょうサイト、フロントページは次のようになります。

ClinVarホームページ。
ClinVarホームページ。

このサイトでは、ClinVarと新しい提出方法について詳しく知ることができます。 すでにSNPを考えている場合は、検索バーに入力して「検索」を押すだけです。 ここでは、SNPrs63750048について詳しく知りたいと思います。

ClinVar検索。

SNPに関する情報がClinVarにアップロードされている場合、サイトはそのSNPの検索結果を返します。 PSEN2と呼ばれる遺伝子に位置し、アルツハイマー病の4型に関連していることが一目でわかります。 リンク(スクリーンショットで強調表示されている)をクリックすると、SNPについてさらに詳しく知ることができます。

の検索結果。

このページでは、リンクされている可能性のあるすべての条件や、SNPに言及している科学出版物など、SNPに関する詳細情報が提供されています。 「提出された解釈とエビデンス」セクションの各状態について、「エビデンスの詳細」リンクをクリックして、SNPがどのように病気に関連しているか、そしてどのように発見されたかを知ることができます。

ClinVarのエントリ。
ClinVarのエントリ。
ClinVarでの証拠。
ClinVarでの証拠。

ここでは、SNPがアルツハイマー病に冒されたイタリアの家族で特定されたことがわかります。 ゲノムのこの場所での通常の文字はCですが、このファミリーで実行された遺伝子検査では、多くのメンバーが同じ場所にTを持っていることが示され、PSEN2遺伝子の機能に影響を与える可能性があります。 報告書はさらに、家族のメンバーが経験した特定の症状に注目しています。

ClinVarの詳細な証拠。
ClinVarの詳細な証拠。

遺伝子によるClinVarの検索

おそらく、特定のSNPを念頭に置いておらず、代わりに、関心のある遺伝子に存在するすべてのSNPを見つけたいと考えています。 興味深いSNPが見つかったら、自分のゲノムデータに戻って、このSNPのステータスを確認できます。

ClinVarホームページに戻ることから始めて、もっと知りたい遺伝子を検索します。 この場合、バリエーションが乳がんの発症リスクの増加に関連している遺伝子である「BRCA」を検索します。

遺伝子名によるClinVar検索。
遺伝子名によるClinVar検索。

この遺伝子名を検索すると、何百ものClinVarバリアントが返されます。 それらのいくつかはBRCA遺伝子にあり、他はBRCAに密接に関連する遺伝子にあります。 検索結果に圧倒されないように、ページの左側にあるオプションを使用して検索結果をフィルタリングできます。 これらには以下が含まれます:

  • 臨床的意義:このSNPは特定の疾患(病原性で病原性の可能性が高い)を引き起こすのか、そうでない(良性で良性の可能性が高い)のか? それとも、その効果が何であるかは不明ですか? または、異なる研究からの矛盾する結果がありますか?
  • 分子的影響:SNPは遺伝子の配列にどのような影響を及ぼしますか?
  • バリエーションタイプ:文字がシーケンスに追加されていますか、それとも削除されていますか? または、文字が別の文字に置き換えられますか(たとえば、CからT)?
  • レビューステータス:このSNPにはどのくらいの臨床的証拠がありますか?
ClinVarフィルター。
ClinVarフィルター。

さまざまなフィルターで多数のSNPを調べた後、下の赤いボックスで強調表示されているバリアントについて詳しく見ていきましょう。

リンクをたどることで、SNPに関する詳細情報をすぐに知ることができます。 SNPは、13番染色体上にある文字Gから文字Cへの変化であり、乳がんのリスク増加に関連している可能性があることがわかります。 さらに、SNP(rs81002796)のIDを学習できます。

ClinVarにおける臨床的意義。
ClinVarにおける臨床的意義。

病気によるClinVarの検索

最後に、特定のSNPまたは特定の遺伝子を念頭に置いていない場合は、特定の疾患に関連するすべてのSNPを検索できます。 必須ではありませんが、[disease/phenotype]検索語の後にタグを付けると、結果を特定の条件に最も適切なものだけに制限するのに役立ちます。 たとえば、糖尿病に関連するSNPに関心がある場合は、「糖尿病」という用語でClinVarを検索できます。[disease/phenotype] 」。

病気の名前によるClinVar検索。
病気の名前によるClinVar検索。

何千もの結果が返されるので、結果を除外して、糖尿病の「危険因子」として確立されている結果のみを表示しましょう。 次に、最初の結果について詳しく見ていきましょう。

危険因子フィルター。
危険因子フィルター。

リンクをたどると、このSNPは、PTPN22として知られる遺伝子の1番染色体にあるCからGへの文字の変化であることがわかります。 SNPは、2006年の出版物で特定されました。

文学へのリンク。
文学へのリンク。

SNPがどのように発見されたかについて詳しく知りたい場合は、出版物のリンクをたどって調査について詳しく知ることができます。

リンクされた研究。
リンクされた研究。

ClinVarは強力です。 賢く使ってください。

ClinVarは、何千もの実験室および医学研究の結果をまとめた広範なデータベースですが、このツールは遺伝カウンセラーではないことに注意することが重要です。 医学的アドバイスや診断を提供するようには設計されていません。 サイトでの検索で見つけた情報があなたの健康に関連していると思われる場合は、遺伝カウンセリングについて医師または他の認可された医療専門家に相談することが重要です。

ClinVarチュートリアルが気に入りましたか? これらのチュートリアルも役立つかもしれません:

About The Author