den komplette menneskelig genom sekvensen af de to X-kromosomer og autosomer fra den kvindelige vævs-afledte cellelinje er blevet afsluttet. Dette inkluderer de 8 % af genom sekvens, der manglede i det originale udkast, der blev udgivet i 2001.
den komplette menneskelig genom sekvensen af hele 3.055 milliarder basepar er blevet afsløret af Telomere-to-Telomere (T2T) Consortium. Dette repræsenterer den største forbedring af menneskelig henvisningen genom udgivet i 2001 af Celera Genomics and the International Human Genome Sekvenseringskonsortium. At genom sekvens dækkede de fleste af de eukromatiske regioner, mens enten heterochromatin-regionerne eller fejlagtig repræsentation udelod. Disse regioner udgør 8 % af menneskelig genom det er endelig blevet afsløret. Den nye T2T-CHM13 reference1 omfatter komplet sekvens for alle 22 autosomer plus kromosom X. Denne nye referencesekvens har også rettet adskillige fejl og har tilføjet ca. 200 millioner bp nye sekvenser indeholdende 2,226 genkopier, hvoraf 115 forventes at være proteinkodende.
Det nuværende GRCh38.p13-referencegenom er et resultat af to store opdateringer, en i 2013 og den anden i 2019 på 2001 Celera-genomsekvensen. Imidlertid havde den stadig 151 millioner basepar af ukendt sekvens fordelt over hele genom, herunder pericentromere og subtelomere regioner, duplikationer, gen- og ribosomale DNA (rDNA)-arrays, som alle er nødvendige for fundamentale cellulære processer. Den nye reference er blevet navngivet som T2T-CHM13, da den kommer fra sekventering af DNA'et fra CHM13 (Complete Hydatiform Mole) cellelinje og udføres af T2T-konsortiet. Cellelinjen er afledt af unormalt befrugtet æg eller en overvækst af væv fra moderkagen, hvor kvinder ser ud til at være gravide (falsk graviditet), og derfor repræsenterer sekvensen kun de to X-kromosomer og autosomer af hunnen. Flere sekvensteknologier er blevet taget i brug, såsom PacBio, Oxford Nanopore, 100X og 70X Illumina sequencere for at nævne nogle få. De teknologiske fremskridt inden for sekventering har ført til sekventering af de resterende 8% som nævnt ovenfor.
Den eneste begrænsning af T2T-CHM13-sekvensen er manglen på et Y-kromosom. Denne sekventering er i øjeblikket i gang ved at bruge DNA'et fra HG002-cellelinjen, som har en 46 (23 par) med en XY-karyotype. Sekvensen vil derefter blive samlet ved hjælp af de samme metoder udviklet til det homozygote CHM13-genom.
Tilgængeligheden af T2T-CHM13 som en ny reference genom repræsenterer et stort gennembrud, der vil hjælpe med at forstå rollen af heterochromatin-regioner og hjælpe med at forstå dets virkninger på de cellulære processer mere detaljeret. Indtil Y-kromosomsekventeringen er afsluttet, vil dette tjene som referencegenom for fremtidige undersøgelser i forståelsen af de cellulære processer og funktioner.
***
Referencer
- Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A et al. Den komplette sekvens af en menneskelig genom bioRxiv 2021.05.26.445798; DOI: https://doi.org/10.1101/2021.05.26.445798
***
