BMKCloud Log in
활형배너-03

소식

전체 게놈 재배열

srchttp___spider.ws_.126.net_21b922b6219133977833c7f1243b627d.jpegreferhttp___spider.ws_

중국 인구의 구조 변형과 표현형, 질병 및 인구 적응에 미치는 영향

나노포어 |팩바이오 |전체 게놈 재시퀀싱 |구조적 변형 호출

본 연구에서는 Biomarker Technologies에서 Nanopore PromethION 시퀀싱을 제공했습니다.

하이라이트

이 연구에서는 표현형, 질병 및 진화에서 SV에 대한 이해를 심화시키는 Nanopore PromethION 플랫폼의 장기 판독 시퀀싱을 통해 인간 게놈의 구조적 변이(SV)의 전반적인 환경이 밝혀졌습니다.

실험적 설계

샘플: 68개의 표현형 및 임상 측정값을 포함한 405명의 관련 없는 중국인(남성 206명, 여성 199명)의 말초 혈액 백혈구.전체 개체 중 조상지역은 북부가 124개체, 남부가 198개체, 남서부가 53개, 미상이 30개이다.
시퀀싱 전략: Nanopore 1D 읽기 및 PacBio HiFi 읽기를 사용한 전체 게놈 장기 읽기 시퀀싱(LRS).
시퀀싱 플랫폼: Nanopore PromethION;PacBio 속편 II

구조 변형 호출

2-1024x326

그림 1. SV 호출 및 필터링 작업 흐름

주요 성과들

구조 변형 발견 및 검증

Nanopore 날짜 집합: PromethION 시퀀싱 플랫폼에서 생성된 총 20.7Tb의 깨끗한 읽기로 샘플당 평균 51Gb 데이터를 달성합니다.17배 깊이.

참조 게놈 정렬(GRCh38): 평균 94.1%의 매핑 비율을 달성했습니다.평균 오류율(12.6%)은 이전 벤치마킹 연구(12.6%)와 유사했습니다(그림 2b 및 2c).

구조 변형(SV) 호출: 본 연구에 적용된 SV 호출자로는 Sniffles, NanoVar 및 NanoSV가 포함되었습니다.신뢰도가 높은 SV는 최소 두 명의 호출자가 식별하고 깊이, 길이 및 지역에 대한 필터링을 통과한 SV로 정의되었습니다.
각 샘플에서 평균 18,489개(15,439~22,505개 범위)의 높은 신뢰도 SV가 식별되었습니다.(그림 2d, 2e 및 2f)

삼

그림 2. Nanopore 데이터세트로 식별된 SV의 전체 환경

PacBio에 의한 검증: 하나의 샘플(HG002, 하위)에서 식별된 SV는 PacBio HiFi 데이터세트에 의해 검증되었습니다.전체 FDR(False Discovery Rate)은 3.2%로 Nanopore 판독에 의한 SV 식별이 상대적으로 신뢰할 수 있음을 나타냅니다.

중복되지 않는 SV 및 게놈 기능

비중복 SV: 67,405 DEL, 60,182 INS, 3,956 DUP 및 769 INV를 포함하는 모든 샘플의 SV를 병합하여 132,312개의 비중복 SV 세트를 얻었습니다.(그림 3a)

기존 SV 데이터 세트와의 비교: 이 데이터 세트는 게시된 TGS 또는 NGS 데이터 세트와 비교되었습니다.비교된 4개의 데이터세트 중 Long-read sequencing platform(PacBio)의 유일한 데이터세트인 LRS15는 이 데이터세트와 가장 큰 중복을 공유했습니다.또한, 이 데이터 세트의 SV 중 53.3%(70,471)가 처음으로 보고되었습니다.각 SV 유형을 살펴보면 긴 읽기 시퀀싱 데이터 세트로 복구된 INS의 수가 나머지 짧은 읽기 데이터 세트보다 훨씬 많았으며 이는 긴 읽기 시퀀싱이 INS 감지에 특히 효율적이라는 것을 나타냅니다.(그림 3b 및 3c)

13

그림 3. SV 유형별 비중복 SV 속성

게놈 특징: SV의 수는 염색체 길이와 유의미한 상관관계가 있는 것으로 나타났습니다.유전자, 반복, DEL(녹색), INS(파란색), DUP(노란색) 및 INV(주황색)의 분포가 Circos 다이어그램에 표시되었으며 SV의 일반적인 증가는 염색체 팔 끝에서 관찰되었습니다.(그림 3d 및 3e)

SV 길이: INS 및 DEL의 길이는 DUP 및 INV의 길이보다 훨씬 짧은 것으로 확인되었으며 이는 PacBio HiFi 데이터 세트에서 식별된 것과 일치합니다.확인된 모든 SV의 길이는 395.6Mb에 달하며 이는 전체 인간 게놈의 13.2%를 차지합니다.SV는 평균적으로 개인당 23.0Mb(약 0.8%)의 게놈에 영향을 미쳤습니다.(그림 3f 및 3g)

SV의 기능적, 표현형 및 임상적 영향

예측된 기능 상실(pLoF) SV: pLoF SV는 코딩 뉴클레오티드가 삭제되거나 ORF가 변경된 CDS와 상호작용하는 SV로 정의되었습니다.1,681개 유전자의 CDS에 영향을 미치는 총 1,929개의 pLoF SV에 주석이 추가되었습니다.그 중 38개 유전자는 GO 농축 분석에서 "면역글로불린 수용체 결합"을 강조했습니다.이러한 pLoF SV는 각각 GWAS, OMIM 및 COSMIC에 의해 추가로 주석이 추가되었습니다.(그림 4a 및 4b)

표현형 및 임상적으로 관련된 SV: 나노기공 데이터 세트의 다수의 SV가 표현형 및 임상적으로 관련된 것으로 나타났습니다.알파-지중해빈혈을 유발하는 것으로 알려진 19.3kb의 희귀한 이형접합성 DEL이 3명의 개체에서 확인되었으며, 이는 헤모글로빈 소단위 알파 1 및 2(HBA1 및 HBA2)의 유전자에 기능 장애를 일으켰습니다.HBB(헤모글로빈 소단위 베타)를 코딩하는 유전자에 대한 27.4kb의 또 다른 DEL이 다른 개체에서 확인되었습니다.이 SV는 심각한 혈색소병증을 일으키는 것으로 알려져 있습니다.(그림 4c)

14

그림 4. 표현형 및 질병과 관련된 pLoF SV

2.4kb의 공통 DEL은 성장 동형 수용체(GHR)의 3번째 엑손의 전체 영역을 덮는 35개의 동형접합체와 67개의 이형접합체 캐리어에서 관찰되었습니다.동형보인자는 이형보인자보다 유의하게 짧은 것으로 나타났다(p=0.033).(그림 4d)

또한 이러한 SV는 중국 북부와 남부의 두 지역 그룹 간의 인구 진화 연구를 위해 처리되었습니다.상당히 차등적인 SV가 Chr 1, 2, 3, 6,10,12,14 및 19에 분포되어 있는 것으로 나타났으며, 그 중 상위 SV는 IGH, MHC 등과 같은 면역 영역과 연관되어 있었습니다. 이러한 SV의 분화는 유전적 표류와 중국 하위 집단의 다양한 환경에 대한 장기적인 노출로 인해 발생할 수 있습니다.

참조

우, Zhikun, 그 외 여러분."중국 인구의 구조적 변이와 그것이 표현형, 질병 및 인구 적응에 미치는 영향."bioRxiv(2021).

뉴스 및 하이라이트 Biomarker Technologies와의 최신 성공 사례를 공유하고 연구 중에 적용된 뛰어난 기술뿐만 아니라 새로운 과학적 성과를 포착하는 것을 목표로 합니다.


게시 시간: 2022년 1월 6일

귀하의 메시지를 우리에게 보내십시오: