BMKCloud Log in
条形banner-03

Nyheter

RESEKVENSERING AV HELA GENOM

srchttp___spider.ws_.126.net_21b922b6219133977833c7f1243b627d.jpegreferhttp___spider.ws_

Strukturvarianter i kinesisk befolkning och deras inverkan på fenotyper, sjukdomar och befolkningsanpassning

Nanopore |PacBio |Återsekvensering av hela genomet |Strukturell variation callling

I denna studie tillhandahölls Nanopore PromethION-sekvensering av Biomarker Technologies.

Höjdpunkter

I denna studie avslöjades ett övergripande landskap av strukturella variationer (SVs) i mänskligt genom med hjälp av långläst sekvensering på Nanopore PromethION-plattformen, vilket fördjupar förståelsen av SVs i fenotyper, sjukdomar och evolution.

Experimentell design

Prover: Leukocyter från perifert blod från 405 obesläktade kinesiska individer (206 män och 199 kvinnor) med 68 fenotypiska och kliniska mätningar.Bland alla individer var förfädersregioner med 124 individer provinser i norr, de av 198 individer var söder, 53 var sydvästra och 30 var inte kända.
Sekvenseringsstrategi: Långläst sekvensering av hela genomet (LRS) med Nanopore 1D-läsningar och PacBio HiFi-läsningar.
Sekvenseringsplattform: Nanopore PromethION;PacBio uppföljare II

Anrop av strukturvariationer

2-1024x326

Figur 1. Arbetsflöde för SV-anrop och filtrering

Huvudsakliga prestationer

Upptäckt och validering av strukturvariationer

Nanopore datumuppsättning: Totalt 20,7 Tb rena avläsningar genererade på PromethION sekvenseringsplattform, vilket uppnår ett genomsnitt på 51 Gb data per prov, ca.17-faldigt på djupet.

Referensgenomanpassning (GRCh38): Genomsnittlig kartläggningshastighet på 94,1 % uppnåddes.Den genomsnittliga felfrekvensen (12,6 %) liknade en tidigare benchmarkingstudie (12,6 %) (Figur 2b och 2c)

Strukturvariation(SV)-anrop: SV-anropare som användes i denna studie var Sniffles, NanoVar och NanoSV.SV:er med hög konfidens definierades som SV:er som identifierats av minst två uppringare och passerade filtreringar på djup, längd och region.
I genomsnitt identifierades 18 489 (som sträcker sig från 15 439 till 22 505) med hög förtroende i varje prov.(Figur 2d, 2e och 2f)

3

Figur 2. Övergripande landskap av SVs identifierade av Nanopore dataset

Validering av PacBio: SVs identifierade i ett prov (HG002, barn) validerades av en PacBio HiFi-datauppsättning.Den totala falska upptäcktsfrekvensen (FDR) var 3,2 %, vilket illustrerar en relativt tillförlitlig SV-identifiering av Nanopore.

Icke-redundanta SVs och genomiska egenskaper

Icke-redundanta SV:er: En uppsättning av 132 312 icke-redundanta SV:er erhölls genom att slå samman SV:er i alla prover, vilket inkluderar 67 405 DEL:er, 60 182 INS:er, 3 956 DUP:er och 769 INV:er.(Figur 3a)

Jämförelse med existerande SV-datauppsättningar: Denna datauppsättning jämfördes med publicerade TGS- eller NGS-datauppsättningar.Inom de fyra datauppsättningarna som jämfördes, delade LRS15, som också är den enda datauppsättningen från långläst sekvenseringsplattform (PacBio), de största överlappningarna med denna datauppsättning.Dessutom rapporterades 53,3% (70 471) av SVs i denna datauppsättning för första gången.Genom att titta på varje SV-typ var antalet återställda INS med långlästa sekvenseringsdataset mycket större än de övriga kortlästa, vilket indikerar att långläst sekvensering är särskilt effektiv vid INS-detektion.(Figur 3b och 3c)

13

Figur 3. Egenskaper för icke-redundanta SV:er för varje SV-typ

Genomiska särdrag: Antalet SVs visade sig vara signifikant korrelerad med kromosomlängden.Distribution av gener, upprepningar, DELs(grön), INS(blå), DUP(gul) och INV(orange) visades på ett Circos-diagram, där en generell ökning av SV observerades i slutet av kromosomarmarna.(Figur 3d och 3e)

Längd på SV:er: Längder på INS och DEL:er visade sig vara betydligt kortare än de för DUP:er och INV:er, vilket överensstämde med de som identifierats av PacBio HiFi-dataset.Längden på alla identifierade SV: er adderade upp till 395,6 Mb, vilket upptog 13,2% av hela mänskligt genom.SVs påverkade 23,0 Mb (ca 0,8%) av genomet per individ i genomsnitt.(Figur 3f och 3g)

Funktionella, fenotypiska och kliniska effekter av SVs

Förutspådd funktionsförlust (pLoF) SV:er: pLoF SVs definierades som SV:er som interagerade med CDS, där kodande nukleotider raderades eller ORF:er ändrades.Totalt 1 929 pLoF SVs som påverkar CDS av 1 681 gener kommenterades.Inom dessa framhävde 38 gener "immunoglobulinreceptorbindning" i GO-anrikningsanalys.Dessa pLoF SVs kommenterades ytterligare av GWAS, OMIM respektive COSMIC.(Figur 4a och 4b)

Fenotypiskt och kliniskt relevanta SV:er: Ett antal SV i nanopore dataset visades vara fenotypiskt och kliniskt relevanta.En sällsynt heterozygot DEL på 19,3 kb, känd för att orsaka alfa-talassemi, identifierades hos tre individer, vilka störde generna av hemoglobinsubenhet Alpha 1 och 2 (HBA1 och HBA2).En annan DEL på 27,4 kb på gen som kodar Hemoglobin Subunit Beta(HBB) identifierades i en annan individ.Denna SV var känd för att orsaka allvarliga hemoglobinopatier.(Figur 4c)

14

Figur 4. pLoF SVs associerade med fenotyper och sjukdomar

En vanlig DEL på 2,4 kb observerades i 35 homozygota och 67 heterozygota bärare, som täcker hela regionen av den 3:e exonen av Growth Homone Receptor (GHR).De homozygota bärarna befanns signifikant kortare än heterzygota (p=0,033).(Figur 4d)

Dessutom bearbetades dessa SV:er för befolkningsutvecklingsstudier mellan två regionala grupper: norra och södra Kina.Signifikant differentiella SVs hittades fördelade på Chr 1, 2, 3, 6,10,12,14 och 19, inom vilka de översta var associerade med immunitetsregioner, såsom IGH, MHC, etc. Det är rimligt att spekulera att differentiering i dessa SVs kan bero på genetisk drift och långvarig exponering för olika miljöer för subpopulationer i Kina.

Referens

Wu, Zhikun, et al."Strukturella varianter i den kinesiska befolkningen och deras inverkan på fenotyper, sjukdomar och befolkningsanpassning."bioRxiv(2021).

Nyheter och höjdpunkter syftar till att dela de senaste framgångsrika fallen med Biomarker Technologies, fånga nya vetenskapliga landvinningar såväl som framstående tekniker som tillämpas under studien.


Posttid: Jan-06-2022

Skicka ditt meddelande till oss: