Skip to main content

게놈 어셈블리는 무엇입니까?

Genome Assembly는 많은 작은 유전자 서열을 취하고 유기체 전체 게놈을 나타내는 일관된 전체로 병합하는 과정을 말합니다.이것은 생물 정보학 분야의 주요 초점이며,이 목적을 위해 다양한 게놈 프로젝트가 존재합니다.게놈 어셈블리는 인간, 식물, 동물 및 박테리아를 포함한 많은 종의 게놈을 분석하기 시작했습니다.많은 다른 분석 방법은 성공적인 조립에 기반을두고 있으며 유전자의 식별은 그것 없이는 진행될 수 없습니다.유전자가 발견되기 전에도 성공적인 게놈 어셈블리는 게놈의 크기, 구조 및 일반적인 조성을 포함하여 나중에 분석에 여전히 많은 유용한 정보를 생성 할 수 있습니다.가이드로 그림이나 유용한 모양이 없으면.Raw Reads라고 불리는 첫 번째 게놈 조각에 직면 할 때, 특정 조각이가는 곳이나 지향적 인 징후는 거의 없습니다.모든 조각은 4 개의 DNA 염기, 약식 A, C, G 및 T와 유사하게 코딩됩니다. 게놈은 하나의 큰 염색체로 압축되거나 많은 것으로 분할 될 수 있습니다.또한 원시 판독 중 일부가 동일한 게놈 영역의 중복이 아니라는 보장은 없으며, 이는 언뜻보기에 나타나는 것보다 고유 한 정보가 덜 존재한다는 것을 의미합니다.종들 사이의 게놈은 현저히 다르지만, 특정 게놈 유형이 따르는 특정 규칙이 있으며, 동일한 유형의 다른 게놈을 결합 할 때이를 적용 할 수 있습니다.예를 들어, 특정 유형의 유기체가 항상 유전자가 발견되는 곳 근처에 특정 패턴을 가지고 있다면, 그와 유사한 다른 유기체를 조립할 때 그러한 패턴을 찾으면 근처의 유전자를 신호 할 것이라고 합리적으로 가정 할 수 있습니다.더 큰 규모로, 많은 박테리아 게놈에는 하나의 원형 염색체가 있으므로 새로운 박테리아의 모든 원시 읽기가 하나의 염색체에 함께 맞을 것으로 예상하는 것이 합리적입니다.이러한 방식으로 일반적인 유전자 지식을 적용하면 연구원이 수십만 개의 데이터를 잠재적으로 이해하기 시작할 수 있습니다.방법에 관계없이 게놈 어셈블리는 종종 시간이 많이 걸리고 어려운 큰 작업입니다.유기체에 대한 많은 미래의 유전자 분석의 기초이므로 오류의 여지가 거의 없습니다.