•A’ lìbhrigeadh cruinneachaidhean genome telomere-gu-telomere aig ìre àrd de chruinneas, àrd-leantainneachd, agus àrd-iomlanachd.
•A’ faighinn thairis air dùbhlain cruinneachaidh ann an roinnean meadhan-cheàrnach agus roinnean a tha gu math ath-aithriseach.
•A’ dèanamh anailis air atharrachaidhean structarail ann an roinnean iom-fhillte leithid centromeres agus telomeres.
•A’ sgrùdadh tùs agus dachasadh chromosoman, agus a’ comharrachadh prìomh ghinean a tha a’ dearbhadh gnè.
•Sgioba proifeasanta thar-fhada a’ còmhdach às-tharraing gu sreath, le eòlas soirbheachail thar iomadh gnè.
•Cothrom air àrd-ùrlaran leughaidh fhada PacBio agus Nanopore le ro-innleachdan sreath àrd-toraidh agus sùbailte.
•Sgioba eòlach ann an cruinneachadh genome agus mion-sgrùdadh bith-fhiosrachaidh gnàthaichte, fileanta ann am pròiseactan genome T2T.
•Barrachd air 200 pròiseact genome soirbheachail agus còrr air 2000 factar buaidh cruinnichte.
•Fuasglaidhean deuchainneach is bith-fhiosrachaidh amalaichte le taic bho chòraichean-lethbhric agus peutantan.
| Suirbhidh genome | Cruinneachadh genome | Ìre cròmasom | Lìonadh beàrnan | Notaichean Ginòma |
| 50X Illumina NovaSeq PE150 | Leughaidhean 30X PacBio CCS HiFi | 100X Àrd-C | Leughaidhean fada ONT 40-100X | RNA-seq Illumina PE150 10 Gb + (roghainneil) RNA-seq làn-fhaid PacBio 40 Gb no Nanopore 12 Gb |
Airson sampallan sreath-sgrìobhaidh Survey, PacBio CCS, Hi-C, agus transcriptome (airson anotachadh), thoir sùil air an “ìre cròmasomanriatanasan sampall cruinneachaidh genome".
Airson sreathanachadh ultra-fhada ONT, thathas a’ moladh sampallan clò, le ìrean càileachd nas àirde gus taic a thoirt do thoirt a-mach DNA ultra-HMW.
Airson stiùireadh mionaideach agus riatanasan ullachaidh shampaill, cuir fios chun sgioba reic againn airson fuasgladh gnàthaichte stèidhichte air an gnè.
Am measg nam prìomh anailis tha:
1) Cruinneachadh Gìnom T2T
● Tha genome T2T a’ toirt iomradh air genome le “0 beàrnan” anns a bheil co-dhiù aon chromosome air a chruinneachadh gu tur bho telomere gu telomere.
● A’ cleachdadh leughaidhean CCS àrd-chruinneas agus leughaidhean ONT thar-fhada:
* Gineadh genome contig v1 tro chruinneachadh hibrid a’ cleachdadh hifiasm (v0.25.0).
* Thoir air falbh plastid agus sreathan truaillte le BLAST an aghaidh stòr-dàta NT.
* Bidh sgafaill a’ ceangal ri chèile ann an cruinneachadh air sgèile cròmosoman a’ cleachdadh dàta Hi-C le DNA 3D.
* Lìon telomeres a tha a dhìth tro chruinneachadh ionadail le leughaidhean ONT gus an genome T2T mu dheireadh fhaighinn.
2) Measadh Co-chruinneachaidh
● Measadh BUSCO
Bidh BUSCO v5.2.1 (Benchmarking Universal Single-Copy Orthologs) a’ togail seataichean gine aon-lethbhreac airson prìomh shliochdan mean-fhàsach stèidhichte air stòr-dàta OrthoDB 10. Tha am genome cruinnichte air a mheasadh le bhith ga cho-thaobhadh an aghaidh an t-seata gine seo, stèidhichte air a’ cho-mheas maidseadh agus ionracas.
Tha co-roinn nas àirde de “BUSCOan Coileanta” a’ comharrachadh coileantachd nas àirde ann an cruinneachadh genome.
● Mapaichean Leughaidh
Co-thaobhadh leughaidhean goirid bho shreathachadh an ath ghinealaich (m.e., Illumina) ris a’ ghineam cruinnichte a’ cleachdadh bwa. Co-thaobhadh leughaidhean fada an treas ginealaich ris a’ ghineam cruinnichte a’ cleachdadh Minimap2.
Tha iomlanachd a’ ghìoma a chaidh a chruinneachadh agus aonfhoirmeachd còmhdach sreathanachaidh air am measadh a rèir ìre mapadh, co-mheas còmhdach a’ ghìoma, agus sgaoileadh doimhneachd.
● Measadh QC a’ ghinòim
Dèan measadh air a’ chruinneachadh le bhith a’ cleachdadh Merqury le bhith a’ dèanamh coimeas eadar leughaidhean sreath-chrìochnachaidh k-mers aig ìre àrd agus cruinneachadh a’ ghìoma gus càileachd co-aontachd (QV) fhaighinn.
Tha luachan càileachd nas àirde a’ comharrachadh cruinneas nas àirde den genome cruinnichte.
● Measadh LAI a’ Ghìonaim
Bidh LAI (LTR Assembly Index) a’ measadh ionracas cruinneachaidh genome mar an co-mheas de shreathan retrotransposon LTR slàn ri sreathan LTR iomlan. Tha sreathan LTR-RT a tha nan tagraichean air an comharrachadh le bhith a’ cleachdadh LTR_FINDER (v1.0.7) agus LTRharvest (v1.5.9), an uairsin air an sìoladh agus air an amalachadh le bhith a’ cleachdadh LTR_retriever (v2.8) gus retrotransposons LTR àrd-mhisneachd fhaighinn agus LAI obrachadh a-mach.
A rèir foillseachadh leasaiche LAI, tha luachan LAI air an seòrsachadh ann an trì ìrean:
Dreach (0 ≤ LAI < 10), Iomradh (10 ≤ LAI < 20), agus Òr (LAI ≥ 20).
● Comharrachadh Telomeres agus Centromeres
Comharraich aonadan ath-aithris telomere a dh’fhaodadh a bhith ann anns a’ ghinòm le bhith a’ cleachdadh TIDK. Lorg sreathan telomere agus faigh fiosrachadh suidheachaidh le bhith a’ cleachdadh FindTelomeres stèidhichte air motifan ath-aithris.
Comharraich ath-aithrisean centromeric a dh’fhaodadh a bhith ann le bhith a’ cleachdadh Centromics le leughaidhean fada treas ginealach, agus an uairsin ath-mhapadh chun genome gus suidheachaidhean agus sreathan centromere fhaighinn.
1) Mapa Chromosoman a’ Ghìonaim
2)Suidheachadh Telomere anns a’ Ghineam
| Chr | Fad Chr (bp) | Tòisich_Suas_an_Aibhne(bp) | Deireadh_Suas_an_Aibhne(bp) | Fad_Suas_an_Aibhne(bp) | Tòisich_Sìos_an_Aibhne(bp) | Deireadh_Sìos_an_Aibhne(bp) | Fad_sìos_an_t-sruth(bp) |
| Chr01 | 55,340,768 | 53 | 2,036 | 1,984 | 55,338,794 | 55,340,768 | 1,975 |
| Chr02 | 56,588,289 | 1 | 2,760 | 2,760 | 56,584,191 | 56,588,289 | 4,099 |
| Chr03 | 46,886,733 | 20 | 3,001 | 2,982 | 46,881,994 | 46,886,733 | 4,740 |
| Chr04 | 49,401,798 | 1 | 2,143 | 2,143 | 49,399,160 | 49,401,798 | 2,639 |
| Chr05 | 45,855,317 | 10 | 3,043 | 3,034 | 45,852,809 | 45,855,317 | 2,509 |
| Chr06 | 45,285,625 | 1 | 3,268 | 3,268 | 45,283,427 | 45,285,625 | 2,199 |
| Chr07 | 48,122,726 | 1 | 2,317 | 2,317 | 48,120,519 | 48,122,726 | 2,208 |
Note:
Chr: ID Cròmasòm
Fad_Chr (bp): Fad a’ chromosoma
Upstream_Start (bp): Suidheachadh tòiseachaidh an telomere suas an abhainn air a’ chromosome
Upstream_End (bp): Suidheachadh crìochnachaidh an telomere suas an abhainn air a’ chromosome
Fad_Suas_an_t-sruth (bp): Fad an telomere suas an sruth air a’ chromosom
Tòiseachadh_Sìos_an_t-sruth (bp): Suidheachadh tòiseachaidh an telomere sìos an t-sruth air a’ chromosom
Deireadh_sìos_an_t-sruth (bp): Suidheachadh deireannach an telomere sìos an t-sruth air a’ chromosom
Fad_Sìos_an_t-sruth (bp): Fad an telomere sìos an t-sruth air a’ chromosom
3)Suidheachaidhean Centromere anns a’ Ghineam
| Chr | Fad_Chr(bp) | Tòisich_Centromach(bp) | Deireadh_Centromics(bp) |
| Chr01 | 55,340,768 | 18,943,204 | 23,005,555 |
| Chr02 | 56,588,289 | 28,114,720 | 30,677,916 |
| Chr03 | 46,886,733 | 24,487,558 | 24,929,326 |
| Chr04 | 49,401,798 | 20,976,875 | 22,563,388 |
| Chr05 | 45,855,317 | 18,578,095 | 19,715,924 |
| Chr06 | 45,285,625 | 19,398,436 | 19,950,173 |
| Chr07 | 48,122,726 | 26,390,720 | 27,913,284 |
Nota:
Chr: ID Cròmasòm
Fad_Chr (bp): Fad a’ chromosoma
Centromere_Start (bp): Suidheachadh tòiseachaidh a’ centromere air a’ chromosome
Centromere_End (bp): Suidheachadh crìochnachaidh a’ centromere air a’ chromosome
4) Staitistig Beàrn Toraidhean na Seanadh
| Buidheann | Àireamh_Beàrn | Len |
| Chr01 | 0 | 55,340,768 |
| Chr02 | 0 | 56,588,289 |
| Chr03 | 0 | 46,886,733 |
| Chr04 | 0 | 49,401,798 |
| Chr05 | 0 | 45,855,317 |
| Chr06 | 0 | 45,285,625 |
| Chr07 | 0 | 48,122,726 |
| Iomlan (Co-mheas %) | 0 | 347,481,256 (100.00) |
Note:
Buidheann: ID Chròmasòm
Àireamh_Beàrn: Àireamh nam beàrnan air a’ chromosom
Fad (bp): Fad cròmasom
5) Measadh LAI a’ ghinòim
| Chr | Fad Chr (bp) | Slàn | Iomlan | amh_LAI | LAI |
| làn-ghineamh | 347,481,256 | 0.046 | 0.36 | 12.94 | 15.18 |
Nota: A rèir an fhoillseachaidh le luchd-leasachaidh LAI, tha luachan LAI air an seòrsachadh ann an trì roinnean: Dreachd (0 ≤ LAI < 10), Iomradh (10 ≤ LAI < 20), agus Òr (LAI ≥ 20).
Fad Chr (bp): Fad cròmasom
Slàn: Co-roinn de LTR-RTan slàn anns a’ ghinòm
Iomlan: Co-roinn de LTRan iomlan anns a’ ghineamh
raw_LAI = Slàn / Iomlan × 100
LAI: Luach LAI ceartaichte
Rannsaich na h-adhartasan a tha air an comasachadh le seirbheisean cruinneachaidh genome de novo BMKGene tro chruinneachadh taghte de fhoillseachaidhean:
T2T Genome
Tha Liu, Shoucheng et al.“Tha cruinneachadh genome telomere-gu-telomere còmhla ri dàta ioma-omic a’ toirt sealladh air mean-fhàs cruithneachd arain hexaploid."Gintinneachd nàdair vol. 57,4 (2025): 1008-1020. doi: 10.1038/s41588-025-02137-x
Yao, Xue-Feng et al.“Cruinneachadh iomlan genome den ghnè rus japonica Zhonghua 11."Conaltradh planntrais imleabhar 6,10 (2025): 101463. doi:10.1016/j.xplc.2025.101463
Lv, Zhiyuan agus a chompanaich.“Cruinneachadh genome faisg air telomere-gu-telomere de Camellia pitardii."Dàta saidheansail vol. 12,1 1422. 14 Lùnastal 2025, doi: 10.1038/s41597-025-05764-5
Du, Haiyuan agus a chompanaich.“Cruinneachadh genome cha mhòr coileanta de Fragaria iinumae."Gineadachd BMC vol. 26,1 253. 14 Màrt 2025, doi: 10.1186/s12864-025-11440-0
Chen, Weikai et al.“Tha cruinneachadh iomlan genome Nicotiana benthamiana a’ nochdadh cruth-tìre ginteil agus epigenetic nan centromeres."Lusan nàdair vol. 10,12 (2024): 1928-1943. doi: 10.1038/s41477-024-01849-y
Gìneam T2T air a rèiteachadh le haplotype
Khan, Falak Sher et al. “Gineamaichean T2T gun bheàrn air an rèiteachadh le haplotype den cultivar fìon-dhearcan Cabernet Sauvignon.”Dàta saidheansail, 10.1038 / s41597-026-06910-3 . 26 Gearran 2026, doi: 10.1038/s41597-026-06910-3
Gìnom T2T + Gìnom Coimeasach
Hong, Lin et al. “Togail agus mion-sgrùdadh air genomes telomere-gu-telomere airson 2 orainds milis: Longhuihong agus Newhall (Citrus sinensis).”GigaSaidheansimleabhar 13 (2024): giae084. doi:10.1093/gigascience/giae084
Li, Xiao-Jie et al. “Tha mion-sgrùdadh air genome telomere-gu-telomere curran dearg TXH4 a’ soilleireachadh pàirt DcLCYE agus DcLCYB1 ann an cruinneachadh lycopene ann an curran.”Rannsachadh gàrradaireachdvol. 12,11 ugh 192. 29 Iuchar, 2025, doi: 10.1093/hr/uhaf192
Gìnom T2T + Pan-ghìnom
Wang, Xiaojing et al. “Genome T2T, mion-sgrùdadh pan-genome, agus ginean freagairt cuideam teas ann an gnèithean Rhododendron.”iMetavol. 4,2 e70010. 5 Màrt 2025, doi: 10.1002/imt2.70010