Haulikon sekvensointi

In genetiikka , haulikko sekvensointi (kirjaimellisesti "haulikko" sekvensointi) on menetelmä, jota käytetään sekvenssin satunnaisesti säikeiden DNA: n . Siksi sitä kutsutaan analogisesti haulikon nopeasti laajenevan lähes satunnaisen ampumismallin kanssa  : tämä metafora havainnollistaa genomisen DNA: n alkuperäisen pirstoutumisen satunnaista luonnetta, jossa koko genomi "ruiskutetaan"., Vähän kuin tämäntyyppiset pelletit ampuma-aseen leviämistä.

DNA-sekvensointiketjun lopetusmenetelmää ("Sanger-menetelmä") voidaan käyttää vain 100 - 1000 emäsparin lyhyille DNA-juosteille . Tämän kokorajoituksen vuoksi pidemmät sekvenssit jaetaan pienempiin fragmentteihin, jotka voidaan sekvensoida erikseen, ja nämä sekvenssit kootaan yhteen kokonaissekvenssin tuottamiseksi.

Tälle sirpaloitumis- ja sekvensointiprosessille on kaksi päämenetelmää. Kromosomikävelytekniikassa (tai "kromosomikävely") etenee kiinteään juosteessa pala palalta, kun taas sekvensointi haulikko on nopeampi mutta monimutkainen prosessi, joka käyttää satunnaisia fragmentteja.

Haulikon sekvensoinnissa DNA jaetaan satunnaisesti moniin pieniin segmentteihin, jotka sekvensoidaan ketjun lopetusmenetelmällä lukemien ( lukemien ) saamiseksi . Useita päällekkäisiä lukuja kohde-DNA: ssa saadaan suorittamalla tämän fragmentin ja sekvensoinnin useita iteraatioita . Tietokoneohjelmat käyttävät sitten eri lukujen päällekkäisiä päitä koottaakseen ne jatkuvaan jaksoon.

Haulikon sekvensointi oli yksi perustekniikoista koko genomin sekvensointiprojektien takana .

Esimerkki

Harkitse esimerkiksi seuraavia kahta haulikon lukemien sarjaa :

Strand Järjestys
Alkuperäinen AGCATGCTGCAGTCATGCTTAGGCTA
Ensimmäinen haulikkosarja AGCATGCTGCAGTCATGCT-------
-------------------TAGGCTA
Toinen haulikkosarja AGCATG--------------------
------CTGCAGTCATGCTTAGGCTA
Jälleenrakentaminen AGCATGCTGCAGTCATGCTTAGGCTA

Tässä erittäin yksinkertaistetussa esimerkissä mikään lukemista ei kata alkuperäisen sekvenssin koko pituutta, mutta neljä lukua voidaan koota alkuperäiseen sekvenssiin käyttämällä niiden päiden päällekkäisyyksiä niiden kohdistamiseksi ja järjestämiseksi. Todellisuudessa tämä prosessi käyttää valtavia määriä tietoa, joka on täynnä epäselvyyksiä ja sekvensointivirheitä. Monimutkaisten genomien kokoamista vaikeuttaa edelleen toistuvien sekvenssien suuri runsaus , mikä tarkoittaa, että samanlaiset lyhyet lukemat voivat tulla sekvenssin täysin eri osista.

Näiden vaikeuksien voittamiseksi ja sekvenssin tarkan kokoamiseksi tarvitaan monia päällekkäisiä lukuja alkuperäisen DNA: n jokaiselle segmentille. Esimerkiksi ihmisen genomiprojektin loppuunsaattamiseksi suurin osa ihmisen genomista sekvensoitiin 12 kertaa tai enemmän peitolla , toisin sanoen lopullisen sekvenssin kukin emäs oli läsnä keskimäärin 12 lukemassa. Tästä huolimatta vuonna 2004 käytettävissä olevilla menetelmillä ei pystytty eristämään tai muodostamaan luotettavaa sekvenssiä noin 1 prosentille ihmisen ( eukromaattisesta ) genomista .

Sekoittamalla haulikko koko genomi

Historia

Ajatusta käyttää koko genomin haulikko- sekvensointia pienille genomeille (4000-7000 emäsparia) ehdotettiin ensimmäisen kerran vuonna 1979. Ensimmäinen haulikon sekvensoinnilla sekvensoitu genomi oli mosaiikkiviruksen kukkakaali , julkaistu vuonna 1981.

Yhdistetty lopetussarja

Laajempi sovellus on hyötynyt pareittain tapahtuvasta sekvensoinnista, joka on yleisesti tunnettu kaksoisputkisena haulikkosekvenssinä . Kun sekvensointiprojekteissa alettiin harkita pidempiä ja monimutkaisempia DNA-sekvenssejä, useat tutkijaryhmät alkoivat ymmärtää, että hyödyllistä tietoa voitiin saada sekvensoimalla DNA-fragmentin molemmat päät. Vaikka saman fragmentin molempien päiden sekvensointi ja pariksi kytkettyjen tietojen seuranta on raskaampaa kuin kahden erillisen fragmentin yksittäisen pään sekvensointi, tietäen, että nämä kaksi sekvenssiä suuntautuivat vastakkaisiin suuntiin ja niiden suunnilleen sama pituus. on todettu olevan hyödyllisiä rekonstruoimalla alkuperäisen kohdefragmentin sekvenssi.

Ensimmäinen julkaistu kuvauksen käytöstä pariksi päätesekvensoinnilla vuodelta 1990 osana sekvensoinnin ihmisen HGPRT lokuksen , vaikka käyttö pariksi päättyy tässä tapauksessa rajoittui puutteiden jälkeen. Perinteisen haulikko sekvensointitapaa . Ensimmäinen teoreettinen kuvaus puhtaasta pariliitetystä loppusekvensointistrategiasta, olettaen, että fragmentit ovat vakiopituisia, on vuodelta 1991. Tuolloin vallitsi yhteisymmärrys siitä, että parillisen pään sekvensoinnin optimaalinen fragmentin pituus olisi kolme kertaa sekvenssin luettu pituus. Vuonna 1995 Roach et ai. innovoida käyttämällä erikokoisia fragmentteja ja osoittamaan, että sekvensointistrategia päättyy puhtaina pareina olisi mahdollista suuremmilla kohdegeeneillä. Strategian sitten hyväksyttiin genomiikkaa tutkimuslaitos (TIGR) sekvensoida bakteerin genomiin Haemophilus influenzae vuonna 1995, sitten Celera Genomics sekvenssin genomin Drosophila melanogaster (etikka Fly) vuonna 2000 sen jälkeen ihmisen genomin..

Lähestyä

Soveltaa tätä strategiaa, joka on korkean molekyylipainon DNA-säie leikataan satunnaisiin fragmentteja, valitaan koko (tavallisesti 2, 10, 50 ja 150 kb ) ja kloonattiin osaksi sopiva vektori . Kloonit sekvensoidaan sitten molemmista päistä käyttämällä ketjun lopetusmenetelmää, joka palauttaa kaksi lyhyttä sekvenssiä. Kukin sekvenssi kutsutaan pää lukea tai lukea 1 ja lukea 2, ja kaksi lukee saman kloonin kutsutaan pariutumisen paria . Koska ketjun lopetusmenetelmä voi tavallisesti tuottaa vain 500-1000 emäksen pituuden, kaikki paitsi pienimmät kloonit, jotka parittelevat paria, ovat harvoin päällekkäisiä.

Kokoaminen

Alkuperäinen sekvenssi rekonstruoidaan lukuista sekvenssin kokoamisohjelmiston avulla . Ensinnäkin päällekkäiset lukemat kerätään pidempiin komposiittisekvensseihin, joita kutsutaan jatkumiksi . Contigit voidaan liittää yhteen rakennustelineissä seuraamalla kumppaniparien välisiä yhteyksiä. Contigien välinen etäisyys voidaan päätellä paritteluparien sijainneista, jos kirjastossa olevien fragmenttien keskimääräinen pituus on tiedossa ja niillä on rajoitettu poikkeamaikkuna. Jatkojen välisen tilan koosta riippuen, sekvenssin löytämiseksi tiloista voidaan käyttää erilaisia ​​tekniikoita. Jos rako on pieni (5-20 kb), alueen monistamiseksi tulisi käyttää polymeraasiketjureaktiota (PCR), jota seuraa sekvensointi. Jos aukko on suuri (> 20 kb), suuri fragmentti kloonataan erityisiin vektoreihin, kuten bakteerien keinotekoisiin kromosomeihin (BAC), ja sitten vektori sekvensoidaan.

Hyödyt ja haitat

Tämän lähestymistavan kannattajat väittävät, että on mahdollista sekvensoida koko genomi kerralla käyttämällä suuria sekvenssoreita, mikä tekee koko prosessista paljon tehokkaamman kuin perinteisemmät lähestymistavat. Kriitikot väittävät, että vaikka tekniikka voi nopeasti sekvensoida suuria DNA-alueita, sen kyky yhdistää nämä alueet kunnolla jälkeenpäin on kyseenalainen, etenkin genomien kohdalla, joissa on toistuvia alueita . Kun sekvenssiompeluohjelmat ovat kehittyneempiä ja laskentateho halvempaa, voi olla mahdollista ylittää tämä rajoitus .

Viltti

Peitto (syvyys tai lukusyvyys) on keskimääräinen lukemien määrä, joka edustaa tiettyä nukleotidia rekonstruoidussa sekvenssissä. Se voidaan laskea alkuperäisen genomin pituudesta ( G ), lukemien lukumäärästä ( N ) ja keskimääräisestä lukupituudesta ( L ) laskennan avulla . Esimerkiksi hypoteettisella genomilla, jossa on 2000 emäsparia, jotka on rekonstruoitu 8 lukemasta, joiden keskimääräinen pituus on 500 nukleotidia, redundanssi on 2x (kahdesti). Tätä parametria voidaan käyttää myös muiden määrien, kuten lukemien kattaman genomin prosenttiosuuden arvioimiseen (joskus kutsutaan myös peittoalueeksi). Korkea kattavuus sekvensointi haulikko on haluttu, koska se voi poistaa virheitä puhelun ja kokoonpano emäkset . DNA-sekvensointiteorian kenttä käsittelee tällaisiin suureihin liittyviä suhteita.

Joskus tehdään ero sekvenssin kattavuuden ja fyysisen peiton välillä . Sekvenssipeitto on keskimääräinen lukemien määrä tukiasemalta (kuten yllä on kuvattu). Fyysinen kattavuus on keskimääräinen määrä kertoja, jolloin emäs luetaan tai peitetään parituslukujen avulla.

Hierarkkinen haulikon sekvensointi

Vaikka ampuma-aseiden sekvensointia voitiin teoriassa soveltaa kaiken kokoisiin genomeihin, sen suoraa soveltamista suurten genomien (esim. Ihmisen genomin) sekvensointiin rajoitettiin 1990-luvun loppupuolelle, jolloin tekniikan edistysaskel otti voimansa. prosessissa syntyvät valtavat määrät monimutkaisia ​​tietoja. Historiallisesti koko genomin haulikon sekvensoinnin uskottiin rajoittavan sekä suurten genomien koko että suurissa genomeissa esiintyvän toistuvan DNA: n suuren määrän (yli 50% ihmisen genomille) monimutkaisuus. Ei ollut yleisesti hyväksyttyä, että suurelle genomille sovellettu täysi genomin haulikon sekvensointi tuottaisi luotettavaa tietoa. Näistä syistä ennen haulikon sekvensointia oli käytettävä muita strategioita, jotka pienensivät sekvenssikokoonpanon laskennallista taakkaa . Hierarkkisessa sekvensoinnissa, joka tunnetaan myös nimellä ylhäältä alaspäin järjestäminen , genomin matalan resoluution geneettinen kartoitus vahvistetaan ennen varsinaista sekvensointia. Tästä kartasta sekvensointia varten valitaan vähimmäismäärä fragmentteja, jotka ulottuvat koko kromosomiin. Tällä tavoin vaaditaan vähimmäismäärä sekvensointia ja suuritehoinen kokoonpano.

Monistettu genomi leikataan ensin suuremmiksi paloiksi (50-200 kb) ja kloonataan sitten bakteeri-isäntään käyttäen BAC: ita tai Pl: stä johdettuja keinotekoisia kromosomeja (PAC). Koska monissa kopioissa genomista leikattiin satunnaisia ​​fragmentteja, joihin näihin klooneihin sisältyi eri päät, ja riittävällä peittävyydellä (katso yllä oleva osa), on teoreettisesti mahdollista löytää koko genomin kattava BAC-konttien teline ( teline ). Tätä telinettä kutsutaan laatoituspoluksi .

Kun laatan polku on löydetty, kyseisen polun muodostavat BAC: t leikataan satunnaisesti pienempiin fragmentteihin ja ne voidaan sekvensoida pienemmällä mittakaavalla varustetulla haulikkomenetelmällä .

Vaikka BAC-kontigien täydellisiä sekvenssejä ei tunneta, niiden toisaalta suuntaukset tunnetaan. On olemassa useita tapoja johtaa tämä järjestys ja valita ruutupolun muodostavat BAC: t. Yleisenä strategiana on tunnistaa kloonien sijainnit suhteessa toisiinsa ja valita sitten vähiten mahdollisia klooneja, jotka tarvitaan muodostamaan vierekkäinen teline, joka kattaa koko kiinnostavan alueen. Kloonien järjestys päätetään määrittämällä kuinka ne menevät päällekkäin. Päällekkäiset kloonit voidaan tunnistaa useilla tavoilla. Pieni radioaktiivisesti tai kemiallisesti leimattu koetin, joka sisältää sekvenssillä leimatun kohdan (STS), voidaan hybridisoida mikrosirulle , johon kloonit on painettu. Tällä tavalla voidaan tunnistaa kaikki kloonit, jotka sisältävät tietyn sekvenssin genomissa. Yhden näistä klooneista voidaan sitten sekvensoida uuden koettimen saamiseksi ja prosessi toistetaan menetelmässä, jota kutsutaan kromosomimittaukseksi.

Vaihtoehtoisesti BAC-kirjasto voidaan pilkkoa restriktioentsyymeillä . On päätelty, että kaksi kloonia, joilla on useita yhteisiä fragmenttikokoja, menevät päällekkäin, koska ne sisältävät yhdessä useita restriktiokohtia, jotka ovat erillään toisistaan. Tätä genomisen kartoituksen menetelmää kutsutaan restriktiosormenjälkien ottamiseksi, koska se tunnistaa joukon restriktiokohtia, jotka sisältyvät kuhunkin klooniin. Kun päällekkäisyys kloonien välillä on löydetty ja niiden järjestys suhteessa genomiin tunnetaan, scaffold minimaalisen osan näistä contig, joka kattaa koko genomin on haulikko sekvensoitiin .

Koska siihen liittyy ensin matalan resoluution kartan luominen genomista, hierarkkinen haulikon sekvensointi on hitaampaa kuin koko genomin haulikon sekvensointi , mutta se on kuitenkin vähemmän riippuvainen tietokonealgoritmeista. BAC-pankkien luomisprosessi ja laatan polun valinta tekevät kuitenkin hierarkkisen haulikon sekvensoinnin hitaaksi ja työlästä. Nyt kun oikea tekniikka on käytettävissä ja luotettava data on osoitettu, koko genomin haulikko- sekvensoinnin nopeus ja kustannustehokkuus ovat tehneet siitä ensisijaisen genomin sekvensointimenetelmän.

Uudet sekvensointitekniikat

Klassinen haulikon sekvensointi perustui Sangerin sekvensointimenetelmään  : se oli edistynein tekniikka genomien sekvensoimiseksi noin 1995–2005. Haulikon strategiaa sovelletaan edelleen nykyään, mutta se perustuu muihin. lukea sekvensointi.

Lyhytluettu tai "seuraavan sukupolven" sekvensointi tuottaa lyhyempiä lukemia (25-500 emäsparia ), mutta useita satoja tuhansia tai miljoonia lukuja suhteellisen lyhyessä ajassa (päivän järjestyksessä). Tämä johtaa korkeaan peittoon, mutta kokoonpanoprosessi on paljon laskennallisesti intensiivisempi. Nämä tekniikat ovat huomattavasti parempia kuin Sanger-sekvensointi, koska koko genomin sekvensointiin tarvitaan paljon dataa ja suhteellisen lyhyt aika.

Metagenominen haulikon sekvensointi

400-500 emäsparin lukemat ovat riittäviä sen lajin tai kannan määrittämiseksi, johon organismi, josta DNA on peräisin, kuuluu edellyttäen, että sen genomi on jo tiedossa, esimerkiksi käyttämällä luokitusohjelmistoja, jotka perustuvat K-meriin . Miljoonilla lukemilla ympäristönäytteen seuraavan sukupolven sekvensoinnista on mahdollista saada kattava yleiskatsaus mistä tahansa monimutkaisesta mikrobiomista, jossa on tuhansia lajeja, kuten suolistofloora . Etuja verrattuna sekvensointi amplikonin ja 16S rRNA: n ovat:

Metagenomisen sekvensoinnin herkkyys tekee siitä houkuttelevan valinnan kliiniseen käyttöön. Se korostaa kuitenkin näytteen tai sekvensointiputken saastumisen ongelmaa .

Katso myös

Huomautuksia

Viitteet

  1. Staden, ”  strategia DNA: n sekvensointi käyttämällä tietokoneohjelmia  ”, Nucleic Acids Research , voi.  6, n o  70,1979, s.  2601–10 ( PMID  461197 , PMCID  327874 , DOI  10.1093 / nar / 6.7.2601 )
  2. Anderson, "  Haulikon DNA-sekvensointi käyttämällä kloonattuja DNaasi I: n tuottamia fragmentteja  ", Nucleic Acids Research , voi.  9, n o  13,yhdeksäntoista kahdeksankymmentäyksi, s.  3015–27 ( PMID  6269069 , PMCID  327328 , DOI  10.1093 / nar / 9.13.3015 )
  3. Ihmisen genomin sekvensointikonsortio, "  Ihmisen genomin eukromaattisen sekvenssin viimeistely  ", Nature , voi.  431, n °  7011,21. lokakuuta 2004, s.  931-945 ( PMID  15496913 , DOI  10.1038 / nature03001 , Bibcode  2004Natur.431..931H )
  4. (in) Gardner, Howarth, Hahn ja Brown-Luedi, "  täydellinen nukleotidisekvenssi infektiivisen kloonin kukkakaalin mosaiikkivirus mukaan M13mp7 haulikko sekvensointi  " , Nucleic Acids Research , Voi.  9, n o  12,25. kesäkuuta 1981, s.  2871–2888 ( ISSN  0305-1048 , PMID  6269062 , PMCID  326899 , DOI  10.1093 / nar / 9.12.2871 , lue verkossa )
  5. (in) Doctrow, "  Joachim Messingin profiili  " , Proceedings of the National Academy of Sciences , voi.  113, n o  29,19. heinäkuuta 2016, s.  7935–7937 ( ISSN  0027-8424 , PMID  27382176 , PMCID  4961156 , DOI  10.1073 / pnas.1608857113 )
  6. Edwards ja Caskey, T, "  Closure strategiat satunnaiselle DNA-sekvensoinnille  ", Methods: A Companion to Methods in Enzymology , voi.  3, n o  1,1991, s.  41–47 ( DOI  10.1016 / S1046-2023 (05) 80162-8 )
  7. Edwards, Voss, H., Rice, P. ja Civitello, A., “  Automated DNA sequencing of the Human HPRT locus  ”, Genomics , voi.  6, n- o  4,1990, s.  593–608 ( PMID  2341149 , DOI  10.1016 / 0888-7543 (90) 90493-E )
  8. Roach, Boysen, C, Wang, K ja Hood, L, "  Parinvaiheen sekvensointi: yhtenäinen lähestymistapa genomiseen kartoitukseen ja sekvensointiin  ", Genomics , voi.  26, n °  21995, s.  345-353 ( PMID  7601461 , DOI  10,1016 / 0888-7543 (95) 80219-C )
  9. Fleischmann, ”  Haemophilus influenzae Rd: n koko genomin satunnainen sekvensointi ja kokoonpano  ”, Science , voi.  269, n °  5223,1995, s.  496-512 ( PMID  7542800 , DOI  10,1126 / science.7542800 , Bibcode  1995Sci ... 269..496F , lukea verkossa )
  10. Adams, "  Drosophila melanogasterin genomisekvenssi  ", Science , voi.  287, n °  5461,2000, s.  2185-95 ( PMID  10731132 , DOI  10,1126 / science.287.5461.2185 , Bibcode  2000Sci ... 287,2185. , Lukea verkossa )
  11. Meyerson, Gabriel ja Getz, "  Edistyksiä syövän genomien ymmärtämisessä toisen sukupolven sekvensoinnin avulla  ", Nature Reviews Genetics , voi.  11, n °  10,2010, s.  685–696 ( PMID  20847746 , DOI  10.1038 / nrg2841 )
  12. Dunham, I. genomin sekvensointi . Biotieteiden tietosanakirja, 2005. DOI : 10.1038 / npg.els.0005378
  13. Venter, JC '' Shotgunning the Human Genome: A Personal View. '' Elämäntieteiden tietosanakirja, 2006.
  14. Gibson, G. ja Muse, SV A Genome Science -alusta . 3. painos S.84
  15. Hyvä, PH- genomikartoitus . Biotieteiden tietosanakirja, 2005. DOI : 10.1038 / npg.els.0005353 .
  16. Karl, "  Uuden sukupolven sekvensointi: perustutkimuksesta diagnostiikkaan  ", kliininen kemia , voi.  55, n o  4,2009, s.  41–47 ( PMID  19246620 , DOI  10.1373 / clinchem.2008.112789 )
  17. Metzker, "  Sekvensointitekniikat - seuraava sukupolvi  ", Nat Rev Genet , voi.  11, n o  1,2010, s.  31–46 ( PMID  19997069 , DOI  10.1038 / nrg2626 , lue verkossa )
  18. Roumpeka, "  Katsaus bioinformatiikkatyökaluihin bio-etsimiseksi metagenomisista sekvenssitiedoista  ", Frontiers in Genetics , voi.  8,2017, s.  23 ( PMID  28321234 , PMCID  5337752 , DOI  10.3389 / fgene.2017.00023 )
  19. Gu, ”  Kliininen seuraavan sukupolven metagenominen sekvensointi patogeenien havaitsemiseksi  ”, Annual Review of Pathology: Mechanisms of Disease , voi.  14,2018, s.  319–338 ( PMID  30355154 , PMCID  6345613 , DOI  10.1146 / annurev-pathmechdis-012418-012751 )
  20. Thoendel, "  Kontaminoituvan DNA: n vaikutus kokonaisen genomin monistussarjaan, jota käytetään metagenomiseen haulikon sekvensointiin infektiodiagnoosissa  ", Journal of Clinical Microbiology , voi.  55, n °  6,2017, s.  1789–1801 ( PMID  28356418 , PMCID  5442535 , DOI  10.1128 / JCM.02402-16 )

Aiheeseen liittyvät artikkelit

Lisälukemista

Ulkoiset linkit