Skip to main content

ゲノムアセンブリとは何ですか?

ゲノムアセンブリとは、多くの小さな小片の遺伝的配列を採取し、それらをまとめてゲノム全体を表す一貫した全体に融合するプロセスを指します。これはバイオインフォマティクス分野の主要な焦点であり、この目的のためにさまざまなゲノムプロジェクトが存在します。ゲノムアセンブリは、ヒト、植物、動物、細菌など、多くの種のゲノムの分析を開始するために使用されています。他の多くの分析方法はアセンブリの成功に基づいて構築されており、遺伝子の識別はそれなしでは進行できません。遺伝子が発見される前でさえ、ゲノムアセンブリが成功する前でさえ、ゲノムのサイズ、その構造、およびその一般的な組成など、後の分析に多くの有用な情報を生成できます。ガイドとして絵や便利な形を持っていない。Raw Readsと呼ばれる最初のゲノムピースに直面したとき、特定のピースが行く、またはその方向性さえ兆候がありません。すべてのピースは、A、C、G、およびTの4つのDNA塩基と同様にコード化されています。ゲノムは、1つの大きな染色体に圧縮されるか、多くに分割されます。また、生の読み取りの一部が同じゲノム領域の複製ではないという保証はありません。これは、一見したよりも独自の情報が少ないことを意味します。種間のゲノムは著しく異なりますが、特定のゲノムタイプが続く特定のルールがあり、同じタイプの別のゲノムをまとめるとこれらを適用できます。たとえば、特定のタイプの生物が常に近くに特定のパターンを持っている場合、遺伝子が見つかった場合、それに類似した別の生物を組み立てるとき、そのようなパターンを見つけると、近くの遺伝子が示されると想定することができます。大規模には、多くの細菌ゲノムには1つの循環染色体があるため、新しい細菌の生のすべての読み取りが1つの染色体に何らかの形で適合することを予測するのが合理的です。この方法で一般的な遺伝的知識を適用することで、研究者は潜在的に数十万のデータを理解し始めることができます。方法に関係なく、ゲノムアセンブリは大きな仕事であり、しばしば時間がかかり、困難です。それは生物の多くの将来の遺伝分析の基礎であるため、エラーの余地はほとんどありません。