DNK sekvenciranje obuhvata nekoliko metoda i tehnologija koje se koriste za određivanje redosleda nukleotidnih baza — adenin, guanin, citozin, i timin — u molekulu DNK.

Poznavanje DNK sekvence je postalo neophodno za bazna biološka istraživanja, kao i u brojnim primenjenim poljima kao što je dijagnostika, biotehnologija, forenzika i biološka sistematika. Unapređenje DNK sekvencirana je znatno ubrzalo biološka istraživanja. Velika brzina sekvenciranja koji pruža moderna tehnologija je omogućila sekvenciranje ljudskog genoma u okviru projekta ljudskog genoma. Srodni projekti, često ostvareni putem naučnih kolaboracija širom sveta, su proizveli kompletne DNK sekvence mnogih životinjskih, biljnih, i mikrobnih genoma.

Prve DNK sekvence su dobijene tokom 1970-tih. Njih su proizveli akademski istraživači koristeći tegobne metode bazirane na dvodimenzionoj hromatografiji. Nakon razvoja automatizovanih metoda sekvenciranja baziranih na boji,[1] DNK sekvenciranje je postalo lakše i za nekoliko redova veličine brže.[2]

Uskoro se planira sekvencioniranje DNK 1,5 miliona eukariotskih organizama što će otvoriti prostor istraživačima širom sveta za nova saznanja.

Četiri kanonične baze

уреди

Kanonska struktura DNK ima četiri baze: timin (T), adenin (A), citozin (C) i gvanin (G). Sekvenciranje DNK je određivanje fizičkog reda ovih baza u molekulu DNK. Međutim, postoje mnoge druge baze koje mogu biti prisutne u molekulu. Kod nekih virusa (konkretno, bakteriofaga), citozin može biti zamenjen hidroksi metilom ili hidroksi metil glukoznim citozinom.[3] U DNK sisara mogu se naći varijante baza sa metil grupama ili fosfosulfatom.[4][5] U zavisnosti od tehnike sekvenciranja, određena modifikacija, na primer, 5mC (5 metil citozin) uobičajena kod ljudi, može ili ne mora biti otkrivena.[6]

Istorija

уреди

Otkriće strukture i funkcije DNK

уреди

Dezoksiribonukleinsku kiselinu (DNK) je prvi otkrio i izolovao Fridrih Mišer 1869. godine, ali je ostala nedovoljno proučavana mnogo decenija, jer se smatralo da proteini, a ne DNK, održavaju genetski plan za život. Ova situacija se promenila posle 1944. kao rezultat nekih eksperimenata Osvalda Ejverija, Kolina Meklauda i Meklina Makartija koji su pokazali da prečišćena DNK može da promeni jedan soj bakterija u drugi. Ovo je bio prvi put da se pokazalo da je DNK sposobna da transformiše svojstva ćelija.

Godine 1953, Džejms Votson i Frensis Krik izneli su svoj model DNK sa dvostrukom spiralom, zasnovan na kristalizovanim rendgenskim strukturama koje je proučavala Rosalind Frenklin. Prema tom modelu, DNK se sastoji od dva lanca nukleotida umotanih jedan oko drugog, povezanih vodoničnim vezama i koji se kreću u suprotnim smerovima. Svaki lanac se sastoji od četiri komplementarna nukleotida - adenina (A), citozina (C), gvanina (G) i timina (T) - sa A na jednom lancu koji je uvek uparen sa T na drugom, a C uvek uparen sa G. Oni su predložili da takva struktura omogućava da se svaki lanac koristi za rekonstrukciju drugog, što je ideja koja je centralna za prenošenje naslednih informacija između generacija.[7]

 
Frederik Sanger, pionir sekvenciranja. Sanger je jedan od retkih naučnika koji je dobio dve Nobelove nagrade, jednu za sekvenciranje proteina, a drugu za sekvencioniranje DNK.

Osnova za sekvencioniranje proteina je prvi put postavljena radom Frederika Sengera koji je do 1955. godine završio sekvencu svih aminokiselina u insulinu, malom proteinu koji luči pankreas. Ovo je pružilo prvi ubedljiv dokaz da su proteini hemijski entiteti sa specifičnim molekularnim uzorkom, a ne nasumična mešavina materijala suspendovanog u tečnosti. Sangerov uspeh u sekvenciranju insulina podstakao je rendgenske kristalografe, uključujući Votsona i Krika, koji su do tada pokušavali da shvate kako DNK usmerava formiranje proteina unutar ćelije. Ubrzo nakon što je prisustvovao nizu predavanja Frederika Sengera u oktobru 1954. godine, Krik je počeo da razvija teoriju koja je tvrdila da raspored nukleotida u DNK određuje redosled aminokiselina u proteinima, što je zauzvrat pomoglo da se odredi funkcija proteina. Ovu teoriju je objavio 1958. godine.[8]

RNK sekvenciranje

уреди

Sekvenciranje RNK bilo je jedan od najranijih oblika sekvenciranja nukleotida. Glavni orijentir sekvenciranja RNK je sekvenca prvog kompletnog gena i kompletnog genoma bakteriofaga MS2, koji su identifikovali i objavili Volter Fiers i njegovi saradnici na Univerzitetu u Gentu (Gent, Belgija), 1972.[9] i 1976. godine.[10] Tradicionalne metode sekvenciranja RNK zahtevaju stvaranje cDNK molekula koji se mora sekvencirati.[11]

Rane metode sekvenciranja DNK

уреди

Prvi metod za određivanje DNK sekvenci uključivao je strategiju proširenja prajmera specifičnu za lokaciju koju je uspostavio Rej Vu na Univerzitetu Kornel 1970. godine.[12] Kataliza DNK polimerazom i specifično obeležavanje nukleotida, od kojih su obe prominentne u trenutnim šemama sekvenciranja, korišćeni su za sekvenciranje kohezivnih krajeva DNK lambda faga.[13][14][15] Između 1970. i 1973. godine, Vu, R Padmanahan i nihovi saradnici su pokazali da se ovaj metod može koristiti za određivanje bilo koje DNK sekvence korišćenjem sintetičkih prajmera specifičnih za lokaciju.[16][17][18] Frederick Sanger je zatim usvojio ovu strategiju produžetka prajmera da bi razvio brže metode sekvenciranja DNK u MRC Centru, Kembridž, UK i objavio metodu za „sekvencionisanje DNK sa inhibitorima koji završavaju lanac“ 1977. godine.[19][20] Valter Gilbert i Allan Maksam sa Harvarda su takođe razvili metode sekvenciranja, uključujući i onu za „sekvencionisanje DNK hemijskom degradacijom“.[21][22] Godine 1973, Gilbert i Maksam su izvestili o sekvenci od 24 para baza koristeći metod poznat kao analiza lutajućih tačaka.[23] Napredak u sekvenciranju je potpomognut istovremenim razvojem tehnologije rekombinantne DNK, omogućavajući uzorcima DNK da se izoluju iz izvora koji nisu virusi.

Sekvenciranje punih genoma

уреди
 
Genom bakteriofaga φX174 sa 5.386 bp. Svaki obojeni blok predstavlja gen.

Prvi potpuni DNK genom koji je sekvencioniran bio je genom bakteriofaga φX174 1977. godine.[24] Naučnici Saveta za medicinska istraživanja dešifrovali su kompletnu DNK sekvencu Epštajn-Barovog virusa 1984. godine, otkrivši da sadrži 172.282 nukleotida. Završetak sekvence označio je značajnu prekretnicu u sekvenciranju DNK, jer je postignut bez prethodnog poznavanja genetskog profila virusa.[25]

Herbert Pol i saradnici su tokom ranih 1980-ih razvili su neradioaktivnu metodu za prenošenje molekula DNK reakcionih smeša za sekvencioniranje na imobilizujući matriks tokom elektroforeze.[26][27] Usledila je komercijalizacija DNK sekvencera „Direktno-blotirajuća-elektroforeza sistemom GATC 1500” od strane GATC Biotech, koji se intenzivno koristio u okviru EU programa za sekvenciranje genoma, kompletna DNK sekvenca hromozoma II kvasca Saccharomyces cerevisiae.[28] Laboratorija Leroja E. Huda na Kalifornijskom institutu za tehnologiju objavila je prvu poluautomatsku mašinu za sekvenciranje DNK 1986. godine.[29] Nakon toga je usledio marketing prve potpuno automatizovane mašine za sekvenciranje, ABI 370, od strane Applied Biosystems 1987. i Dupontov Genesis 2000[30] koji je koristio novu tehniku fluorescentnog obeležavanja koja omogućava da se sva četiri dideoksinukleotida identifikuju u jednoj traci. Do 1990. godine, američki Nacionalni instituti za zdravlje (NIH) započeli su opsežna ispitivanja sekvenciranja na Mycoplasma capricolum, Escherichia coli, Caenorhabditis elegans, i Saccharomyces cerevisiae po ceni od 0,75 USD po bazi. U međuvremenu, sekvencioniranje humanih cDNK sekvenci koje se nazivaju ekspresovane oznake sekvence počelo je u laboratoriji Krega Ventera, u pokušaju da se obuhvati deo kodiranja ljudskog genoma.[31] Godine 1995, Venter, Hamilton Smit i kolege sa Instituta za genomska istraživanja (TIGR) objavili su prvi kompletan genom slobodnog živog organizma, bakterije Haemophilus influenzae. Kružni hromozom sadrži 1.830.137 baza, a njegovo objavljivanje u časopisu Science[32] označilo je prvu objavljenu upotrebu obog vida sekvenciranja celog genoma, eliminišući potrebu za početnim naporima za mapiranje.

Reference

уреди
  1. ^ Olsvik O; Wahlberg J; Petterson B; et al. (1993). „Use of automated sequencing of polymerase chain reaction-generated amplicons to identify three types of cholera toxin subunit B in Vibrio cholerae O1 strains”. J. Clin. Microbiol. 31 (1): 22—5. PMC 262614 . PMID 7678018. Архивирано из оригинала 04. 06. 2020. г. Приступљено 08. 06. 2012. 
  2. ^ Pettersson E, Lundeberg J, Ahmadian A (2009). „Generations of sequencing technologies”. Genomics. 93 (2): 105—11. PMID 18992322. doi:10.1016/j.ygeno.2008.10.003. 
  3. ^ Moréra S, Larivière L, Kurzeck J, Aschke-Sonnenborn U, Freemont PS, Janin J, Rüger W (август 2001). „High resolution crystal structures of T4 phage beta-glucosyltransferase: induced fit and effect of substrate and metal binding”. Journal of Molecular Biology. 311 (3): 569—77. PMID 11493010. doi:10.1006/jmbi.2001.4905. 
  4. ^ Ehrlich M, Gama-Sosa MA, Huang LH, Midgett RM, Kuo KC, McCune RA, Gehrke C (април 1982). „Amount and distribution of 5-methylcytosine in human DNA from different types of tissues of cells”. Nucleic Acids Research. 10 (8): 2709—21. PMC 320645 . PMID 7079182. doi:10.1093/nar/10.8.2709. 
  5. ^ Ehrlich M, Wang RY (јун 1981). „5-Methylcytosine in eukaryotic DNA”. Science. 212 (4501): 1350—7. Bibcode:1981Sci...212.1350E. PMID 6262918. doi:10.1126/science.6262918. 
  6. ^ Song CX, Clark TA, Lu XY, Kislyuk A, Dai Q, Turner SW, et al. (новембар 2011). „Sensitive and specific single-molecule sequencing of 5-hydroxymethylcytosine”. Nature Methods. 9 (1): 75—7. PMC 3646335 . PMID 22101853. doi:10.1038/nmeth.1779. 
  7. ^ Watson JD, Crick FH (1953). „The structure of DNA”. Cold Spring Harb. Symp. Quant. Biol. 18: 123—31. PMID 13168976. doi:10.1101/SQB.1953.018.01.020. 
  8. ^ Marks, L. „The path to DNA sequencing: The life and work of Frederick Sanger”. What is Biotechnology? (на језику: енглески). Приступљено 2023-06-27. 
  9. ^ Min Jou W, Haegeman G, Ysebaert M, Fiers W (мај 1972). „Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein”. Nature. 237 (5350): 82—8. Bibcode:1972Natur.237...82J. PMID 4555447. S2CID 4153893. doi:10.1038/237082a0. 
  10. ^ Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A, Volckaert G, Ysebaert M (април 1976). „Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene”. Nature. 260 (5551): 500—7. Bibcode:1976Natur.260..500F. PMID 1264203. S2CID 4289674. doi:10.1038/260500a0. 
  11. ^ Ozsolak F, Milos PM (фебруар 2011). „RNA sequencing: advances, challenges and opportunities”. Nature Reviews Genetics. 12 (2): 87—98. PMC 3031867 . PMID 21191423. doi:10.1038/nrg2934. 
  12. ^ „Ray Wu Faculty Profile”. Cornell University. Архивирано из оригинала 2009-03-04. г. 
  13. ^ Padmanabhan R, Jay E, Wu R (јун 1974). „Chemical synthesis of a primer and its use in the sequence analysis of the lysozyme gene of bacteriophage T4”. Proceedings of the National Academy of Sciences of the United States of America. 71 (6): 2510—4. Bibcode:1974PNAS...71.2510P. PMC 388489 . PMID 4526223. doi:10.1073/pnas.71.6.2510 . 
  14. ^ Onaga LA (јун 2014). „Ray Wu as Fifth Business: Demonstrating Collective Memory in the History of DNA Sequencing”. Studies in the History and Philosophy of Science. Part C. 46: 1—14. PMID 24565976. doi:10.1016/j.shpsc.2013.12.006. 
  15. ^ Wu R (1972). „Nucleotide sequence analysis of DNA”. Nature New Biology. 236 (68): 198—200. PMID 4553110. doi:10.1038/newbio236198a0. 
  16. ^ Padmanabhan R, Wu R (1972). „Nucleotide sequence analysis of DNA. IX. Use of oligonucleotides of defined sequence as primers in DNA sequence analysis”. Biochem. Biophys. Res. Commun. 48 (5): 1295—302. PMID 4560009. doi:10.1016/0006-291X(72)90852-2. 
  17. ^ Wu R, Tu CD, Padmanabhan R (1973). „Nucleotide sequence analysis of DNA. XII. The chemical synthesis and sequence analysis of a dodecadeoxynucleotide which binds to the endolysin gene of bacteriophage lambda”. Biochem. Biophys. Res. Commun. 55 (4): 1092—99. PMID 4358929. doi:10.1016/S0006-291X(73)80007-5. 
  18. ^ Jay E, Bambara R, Padmanabhan R, Wu R (март 1974). „DNA sequence analysis: a general, simple and rapid method for sequencing large oligodeoxyribonucleotide fragments by mapping”. Nucleic Acids Research. 1 (3): 331—53. PMC 344020 . PMID 10793670. doi:10.1093/nar/1.3.331. 
  19. ^ Sanger F, Nicklen S, Coulson AR (децембар 1977). „DNA sequencing with chain-terminating inhibitors”. Proc. Natl. Acad. Sci. USA. 74 (12): 5463—77. Bibcode:1977PNAS...74.5463S. PMC 431765 . PMID 271968. doi:10.1073/pnas.74.12.5463 . 
  20. ^ Sanger F, Coulson AR (мај 1975). „A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase”. J. Mol. Biol. 94 (3): 441—48. PMID 1100841. doi:10.1016/0022-2836(75)90213-2. 
  21. ^ Maxam AM, Gilbert W (фебруар 1977). „A new method for sequencing DNA”. Proc. Natl. Acad. Sci. USA. 74 (2): 560—64. Bibcode:1977PNAS...74..560M. PMC 392330 . PMID 265521. doi:10.1073/pnas.74.2.560 . 
  22. ^ Gilbert, W. DNA sequencing and gene structure. Nobel lecture, 8 December 1980.
  23. ^ Gilbert W, Maxam A (децембар 1973). „The Nucleotide Sequence of the lac Operator”. Proc. Natl. Acad. Sci. U.S.A. 70 (12): 3581—84. Bibcode:1973PNAS...70.3581G. PMC 427284 . PMID 4587255. doi:10.1073/pnas.70.12.3581 . 
  24. ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (фебруар 1977). „Nucleotide sequence of bacteriophage phi X174 DNA”. Nature. 265 (5596): 687—95. Bibcode:1977Natur.265..687S. PMID 870828. S2CID 4206886. doi:10.1038/265687a0. 
  25. ^ Marks, L. „The next frontier: Human viruses”. What is Biotechnology? (на језику: енглески). Приступљено 2023-06-27. 
  26. ^ Beck S, Pohl FM (1984). „DNA sequencing with direct blotting electrophoresis”. EMBO J. 3 (12): 2905—09. PMC 557787 . PMID 6396083. doi:10.1002/j.1460-2075.1984.tb02230.x. 
  27. ^ United States Patent 4,631,122 (1986)
  28. ^ Feldmann H, et al. (1994). „Complete DNA sequence of yeast chromosome II”. EMBO J. 13 (24): 5795—809. PMC 395553 . PMID 7813418. doi:10.1002/j.1460-2075.1994.tb06923.x. 
  29. ^ Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE (12. 6. 1986). „Fluorescence Detection in Automated DNA Sequence Analysis”. Nature. 321 (6071): 674—79. Bibcode:1986Natur.321..674S. PMID 3713851. S2CID 27800972. doi:10.1038/321674a0. 
  30. ^ Prober JM, Trainor GL, Dam RJ, Hobbs FW, Robertson CW, Zagursky RJ, Cocuzza AJ, Jensen MA, Baumeister K (16. 10. 1987). „A system for rapid DNA sequencing with fluorescent chain-terminating dideoxynucleotides”. Science. 238 (4825): 336—41. Bibcode:1987Sci...238..336P. PMID 2443975. doi:10.1126/science.2443975. 
  31. ^ Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, Merril CR, Wu A, Olde B, Moreno RF (јун 1991). „Complementary DNA sequencing: expressed sequence tags and human genome project”. Science. 252 (5013): 1651—56. Bibcode:1991Sci...252.1651A. PMID 2047873. S2CID 13436211. doi:10.1126/science.2047873. 
  32. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM (јул 1995). „Whole-genome random sequencing and assembly of Haemophilus influenzae Rd”. Science. 269 (5223): 496—512. Bibcode:1995Sci...269..496F. PMID 7542800. doi:10.1126/science.7542800.