DNA-sekvensering
Ved DNA-sekvensering finner man rekkefølgen av nukleotider i et DNA-molekyl eller et helt genom. Biter av sekvenser ble først sekvensert i 1975 (fra bakteriofag Phi X 174).[1] Det første genomet til en frittlevende organisme ble sekvensert i 1995 (Haemophilus influenzae).
Metoder
redigerDe første metodene for DNA-sekvensering ble utviklet på midten av 1970-tallet. Maxam og Gilbert publiserte en metode som er basert på basespesifikk kjemisk spaltning, men denne metoden brukes nesten ikke lenger, fordi den trenger farlige kjemiske reagenser. Dessuten er den vanskeligere å automatisere enn Sanger metoden som ble publisert det samme året.
I dag er det flere biokjemiske og bioteknologiske metoder som er beskrevet nedenfor.
Sanger Sekvensering
redigerDideoxymetoden til Sanger er en såkalt enzymatisk sekvenseringsmetode som ble utviklet av Frederick Sanger og Alan Coulson omkring 1975. Med den første fullstendige genom sekvenseringen av bakteriofagen phi X 174 i 1977 ble metoden publisert[2], og Sanger mottok Nobelprisen i kjemi sammen med Walter Gilbert i 1980.
Pyrosekvensering («Sequencing-by-Synthesis»)
redigerPyrosekvensering bruker DNA-polymerase for syntesen av DNA-tråden. Forskjellen fra Sanger metoden er at man kan se at DNA-polymerasen henger på enkelt nukleotider på en nysyntetisert DNA-tråd. Dette blir omformet til en lysblits ved hjelp av enzymer.[3] Lysblitsene kan registreres, og hvert par av lysintensitet og nukleotid gir en eller flere sammenhengende nukleotider av samme type der lengden er proporsjonal til lysintensiteten (et såkalt "homopolymer run", f.eks. AAA for lysintensitet på 3 og nukleotid A).
Utfordringer
redigerDet egentlige problemet er ikke å bare lese sekvensen: På grunn av tekniske restriksjoner blir DNAet sekvensert i tusener av små enheter (engelsk: reads) og må settes sammen (engelsk: assemble) til en hel sekvens med bioinformatiske metoder fra sekvenssammenstillingen. Disse bitene (reads) er mindre enn 1000 bp (basepar). Et vanlig problem er store datamengder, som krever mye datakraft.
Pyrosekvenseringen blir mer og mer et alternativ til Sanger sekvensering. Read lengdene ligger på omtrent 400-500 basepar i den nyeste sekvenseringsgenerasjonen, "GS FLX Titanium", som ble publisert i 2008. Kvalitet av sekvenseringsdataene har blitt bedre i de siste årene, den er ofte målt i andel av feil nukleotider.
Hvilken teknologi man velger for et sekvenseringsprosjekt er ofte avhengig av problemstillingen (de-novo sekvensering [sekvensering av noe nytt], resekvensering av et kjent genom, metagenomiske anvendelser osv.), størrelsen av genomet eller delen av genomet som skal bli sekvensert, tids- og pengeressurser, leselengden som trenges for anvendelsen osv.
Historikk
rediger- 1953: Watson og Crick oppdager strukturen av DNAs dobbelheliks.
- 1972: Utvikling av rekombinant DNA-teknologi som tillater at man kan isolere enkeltfragmenter av DNA. Før dette kunne man bare sekvensere bakteriofag eller virus DNA.
- 1975: Det første fullstendige DNA-genomet blir sekvensert, fra bakteriofag phi X 174.
- 1977: Allan Maxam og Walter Gilbert publiserer artikkelen "DNA sekvensering ved kjemisk nedbryting", original tittel: "DNA sequencing by chemical degradation". Samtidig publiserer Frederick Sanger "DNA sequencing by enzymatic synthesis".
- 1980: Frederick Sanger og Walter Gilbert mottar Nobelprisen i kjemi
- 1984: Vitenskapsfolk fra det engelske medisinske forskningsrådet, (Medical Research Council) finner og setter sammen hele DNA sekvensen for Epstein-Barr viruset, 170 kilobaser
- 1986: Leroy E. Hood's laboratorium ved California Institute of Technology og Smith presenterer den første semi-automatiske DNA sekvenseringsmaskinen
- 1987: Applied Biosystems markedsfører den første helautomatiske DNA sekvenseringsmaskinen, modell ABI 370
- 1990: U.S. National Institutes of Health (NIH) starter med stor-skala sekvensering forsøk på Mycoplasma capricolum, Escherichia coli, Caenorhabditis elegans, og Saccharomyces cerevisiae. Kostnadene ligger på 75 US-cents/base.
- 1995: Richard Mathies et al. publiserer den såkalte dye-based (fargebaserte) sekvenseringen (der ulike farger blir brukt for å gjenkjenne de ulike basene).[4]
- 1996 Pål Nyrén og hans student Mostafa Ronaghi ved det Kungliga Tekniska högskolan i Stockholm publiserte deres metode for pyrosekvensering[5]
- 1998: Phil Green og Brent Ewing fra University of Washington publiserer «phred» for sekvensanalyse.[6]
- 2005: 454 Life Sciences presenterer GS20 pyrosekvensering maskinen.
- 2007: 454 Life Sciences presenterer GS FLX versjonen.
- 2008: 454 Life Sciences presenterer GS FLX Titanium versjonen.
Se også
redigerReferanser
rediger- ^ Air GM, Blackburn EH, Sanger F, Coulson AR (1975). «The nucleotide and amino acid sequences of the N (5') terminal region of gene G of bacteriophage phi X 174». Journal of Molecular Biology. 96 (4): 703–719.
- ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (1977). «Nucleotide sequence of bacteriophage phi X174 DNA». Nature. 265 (5596): 687-695.
- ^ Margulies M, Egholm M, Altman WE; m.fl. (2005). «Genome sequencing in microfabricated high-density picolitre reactors». Nature. 437 (7057): 376–80. PMC 1464427 . PMID 16056220. doi:10.1038/nature03959.
- ^ Ju J, Ruan C, Fuller CW, Glazer AN, Mathies RA (1995). «Fluorescence energy transfer dye-labeled primers for DNA sequencing and analysis». Proc. Natl. Acad. Sci. U.S.A.. 92 (10): 4347–51. PMC 41941 . PMID 7753809. doi:10.1073/pnas.92.10.4347.
- ^ M. Ronaghi, S. Karamohamed, B. Pettersson, M. Uhlen, and P. Nyren (1996). «Real-time DNA sequencing using detection of pyrophosphate release». Analytical Biochemistry. 242: 84–9. doi:10.1006/abio.1996.0432.
- ^ Ewing B, Green P (1998). «Base-calling of automated sequencer traces using phred. II. Error probabilities». Genome Res.. 8 (3): 186–94. PMID 9521922.
Eksterne lenker
redigerOm Maxam-Gilbert- og Sanger-sekvenseringen (engelsk):
Om pyrosekvenseringen (engelsk):