BMKCloud Log in
条形banner-03

Notícies

RESEQUÈNCIA TOTAL DEL GENOMA

srchttp___spider.ws_.126.net_21b922b6219133977833c7f1243b627d.jpegreferhttp___spider.ws_

Variants d'estructura de la població xinesa i el seu impacte en els fenotips, malalties i adaptació de la població

Nanopor |PacBio |Re-seqüenciació del genoma sencer |Crida de variació estructural

En aquest estudi, Biomarker Technologies va proporcionar la seqüenciació de Nanopore PromethION.

Destacats

En aquest estudi, es va revelar un paisatge global de variacions estructurals (SV) en el genoma humà amb l'ajuda de la seqüenciació de lectura llarga a la plataforma Nanopore PromethION, que aprofundeix en la comprensió dels SV en fenotips, malalties i evolució.

Disseny experimental

Mostres: leucòcits de sang perifèrica de 405 individus xinesos no relacionats (206 homes i 199 dones) amb 68 mesures fenotípiques i clíniques.Entre tots els individus, les regions ancestrals de 124 individus eren províncies del nord, les de 198 individus eren del sud, 53 eren del sud-oest i 30 eren desconegudes.
Estratègia de seqüenciació: seqüenciació de lectura llarga del genoma sencer (LRS) amb lectures Nanopore 1D i lectures PacBio HiFi.
Plataforma de seqüenciació: Nanopore PromethION;PacBio Seqüela II

Crida de variació d'estructura

2-1024 x 326

Figura 1. Flux de treball de trucades i filtratge de SV

Principals assoliments

Descobriment i validació de variacions d'estructura

Dataset Nanopore: En total, 20,7 Tb de lectures netes generades a la plataforma de seqüenciació PromethION, aconseguint una mitjana de 51 Gb de dades per mostra, aprox.17 vegades de profunditat.

Alineació del genoma de referència (GRCh38): es va aconseguir una taxa de cartografia mitjana del 94,1%.La taxa d'error mitjana (12,6%) era similar a un estudi de referència anterior (12,6%) (figura 2b i 2c)

Crida de variació de l'estructura (SV): els trucades SV aplicats en aquest estudi incloïen Sniffles, NanoVar i NanoSV.Els SV d'alta confiança es van definir com els SV identificats per almenys dues persones que van trucar i van passar filtracions en profunditat, longitud i regió.
Es va identificar una mitjana de 18.489 (entre 15.439 i 22.505) SV d'alta confiança a cada mostra.(Figura 2d, 2e i 2f)

3

Figura 2. Paisatge general dels SV identificats pel conjunt de dades Nanopore

Validació per PacBio: els SV identificats en una mostra (HG002, fill) van ser validats per un conjunt de dades PacBio HiFi.La taxa global de descoberta falsa (FDR) va ser del 3,2%, cosa que il·lustra una identificació SV relativament fiable per lectures de Nanopore.

SV no redundants i característiques genòmiques

SV no redundants: es va obtenir un conjunt de 132.312 SV no redundants combinant SV en totes les mostres, que inclou 67.405 DEL, 60.182 INS, 3.956 DUP i 769 INV.(Figura 3a)

Comparació amb conjunts de dades SV existents: aquest conjunt de dades es va comparar amb el conjunt de dades TGS o NGS publicat.Dins dels quatre conjunts de dades comparats, LRS15, que també és l'únic conjunt de dades de la plataforma de seqüenciació de lectura llarga (PacBio), va compartir les superposicions més grans amb aquest conjunt de dades.A més, es va informar per primera vegada del 53,3% (70.471) dels SV d'aquest conjunt de dades.En examinar cada tipus de SV, el nombre d'INS recuperats amb un conjunt de dades de seqüenciació de lectura llarga era molt més gran que la resta de lectura curta, cosa que indica que la seqüenciació de lectura llarga és particularment eficient en la detecció d'INS.(Figura 3b i 3c)

13

Figura 3. Propietats dels SV no redundants per a cada tipus de SV

Característiques genòmiques: el nombre de SV es va trobar correlacionat significativament amb la longitud del cromosoma.La distribució de gens, repeticions, DELs (verd), INS (blau), DUP (groc) i INV (taronja) es van mostrar en un diagrama Circos, on es va observar un augment general de SV al final dels braços cromosomics.(Figura 3d i 3e)

Durada dels SV: es va trobar que les longituds dels INS i DELs eren significativament més curtes que les dels DUP i INV, que coincidien amb les identificades pel conjunt de dades PacBio HiFi.La longitud de tots els SV identificats va sumar 395,6 Mb, que ocupaven el 13,2% de tot el genoma humà.Els SV van afectar 23,0 Mb (aproximadament un 0,8%) de genoma per individu de mitjana.(Figura 3f i 3g)

Impactes funcionals, fenotípics i clínics dels SV

Pèrdua prevista de SV de funció (pLoF): els SV de pLoF es van definir com els SV que van interactuar amb CDS, on es van suprimir els nucleòtids codificants o es van alterar els ORF.En total es van anotar 1.929 SV pLoF que afectaven CDS de 1.681 gens.Dins d'aquests, 38 gens van destacar la "unió al receptor d'immunoglobulina" en l'anàlisi d'enriquiment de GO.Aquests SV pLoF van ser anotats a més per GWAS, OMIM i COSMIC, respectivament.(Figura 4a i 4b)

SVs fenotípicament i clínicament rellevants: es va demostrar que una sèrie de SV del conjunt de dades de nanopores eren fenotípicament i clínicament rellevants.Es va identificar un rar DEL heterozigot de 19,3 kb, conegut per causar alfa-talassèmia, en tres individus, que van disfuncionar els gens de la subunitat d'hemoglobina Alpha 1 i 2 (HBA1 i HBA2).Es va identificar un altre DEL de 27,4 kb en el gen que codifica la subunitat beta de l'hemoglobina (HBB) en un altre individu.Se sabia que aquest SV provocava hemoglobinopaties greus.(Figura 4c)

14

Figura 4. SV pLoF associats a fenotips i malalties

Es va observar un DEL comú de 2, 4 kb en 35 portadors homozigots i 67 heterozigots, que cobreix la regió completa del tercer exó del receptor de l'homona de creixement (GHR).Els portadors homozigots es van trobar significativament més curts que els heterozigots (p = 0, 033).(Figura 4d)

A més, aquests SV es van processar per a estudis evolutius poblacionals entre dos grups regionals: el nord i el sud de la Xina.Es van trobar SV significativament diferencials distribuïts en Chr 1, 2, 3, 6,10,12,14 i 19, dins dels quals, els principals es van associar amb regions d'immunitat, com IGH, MHC, etc. És raonable especular que el La diferenciació en aquests SV es pot deure a la deriva genètica i a l'exposició a llarg termini a diversos entorns per a subpoblacions a la Xina.

Referència

Wu, Zhikun, et al."Les variants estructurals de la població xinesa i el seu impacte en els fenotips, les malalties i l'adaptació de la població".bioRxiv(2021).

Notícies i més destacats té com a objectiu compartir els últims casos d'èxit amb Biomarker Technologies, capturant nous èxits científics així com tècniques destacades aplicades durant l'estudi.


Hora de publicació: 06-gen-2022

Envia'ns el teu missatge: