av trillioner celler som komponerer kroppen vår, fra nevroner som videresender signaler gjennom hjernen til immunceller som bidrar til å forsvare kroppene våre fra konstant eksternt angrep, inneholder nesten hver og en de samme 3 milliarder DNA – baseparene som utgjør det menneskelige genomet-hele vårt genetiske materiale. Det er bemerkelsesverdig at hver av de over 200 celletypene i kroppen tolker denne identiske informasjonen veldig annerledes for å utføre de funksjonene som er nødvendige for å holde oss i live. Dette viser at VI må se utover sekvensen AV DNA selv for å forstå hvordan en organisme og dens celler fungerer.
Studerer Genomet Som Helhet
så hvordan begynner vi å forstå genomet som helhet? I 2000 ga Human Genome Project den første fulle sekvensen av et menneskelig genom . DNA som utgjør alle genomer består av fire relaterte kjemikalier kalt nukleinsyrer-adenin (A), guanin (G), cytosin (C) og tymin (T). En sekvens AV DNA er en streng av disse nukleinsyrene (også kalt «baser» eller «basepar») som er kjemisk festet til hverandre, FOR EKSEMPEL AGATTCAG, som er «lest ut» lineært. Eksperimentelle metoder for å bestemme sekvensen AV DNA, sammen med hjelp fra noen kraftige datamaskiner, ga til slutt forskere en sekvens full Av A, G, C og T som var 3 milliarder bokstaver lang. På den tiden trodde forskerne at DE visste nok om HVORDAN DNA jobbet for å søke etter funksjonelle enheter av genomet, ellers kjent som gener. Et gen er en STRENG DNA som koder for informasjonen som er nødvendig for å lage et protein, som deretter fortsetter å utføre en funksjon i cellene våre.
etter Human Genome Project fant forskerne at det var rundt 20.000 gener i genomet, et tall som noen forskere allerede hadde spådd. Bemerkelsesverdig utgjør disse genene bare ca 1-2% AV DE 3 milliarder baseparene AV DNA . Dette betyr at alt fra 98-99% av hele vårt genom må gjøre noe annet enn koding for proteiner-forskere kaller DETTE ikke-kodende DNA. Tenk deg å bli gitt flere volumer av leksika som inneholdt en sammenhengende setning på engelsk hver 100 sider, hvor resten av plassen inneholdt en overfladisk kjennskap til uninterpretable tilfeldige bokstaver og tegn. Du vil nok begynne å lure på hvorfor alle de tilfeldige bokstavene og tegnene var der i utgangspunktet, noe som er det eksakte problemet som har plaget forskere i flere tiår.
Hvorfor brukes ikke så mye av genomet vårt til å kode for protein? Har denne EKSTRA DNA tjene noen funksjonelle formål? For å begynne å få en ide om vi trenger alt dette EKSTRA DNA, kan vi se på nært beslektede arter som har svært varierende genomstørrelser. For eksempel har slekten Allium, som inkluderer løk, sjalott og hvitløk, genomstørrelser som spenner fra 10 til 20 milliarder basepar. Det er svært lite sannsynlig at en så stor MENGDE EKSTRA DNA ville være nyttig i en art og ikke i sin genetiske fetter, kanskje hevder at mye av genomet ikke er nyttig . Videre er disse genomene mye større enn det menneskelige genomet, noe som indikerer enten at en løk er svært kompleks, eller mer sannsynlig at størrelsen på et genom ikke sier noe om hvor kompleks organismen er eller hvordan den fungerer.
Hvilke Deler Av Genomet Er Funksjonelle?
på grunn av fantastiske teknologiske fremskritt innen sekvensering AV DNA og ved bruk av datamaskiner for å analysere de resulterende sekvensene (kollektivt kjent som bioinformatikk), har store prosjekter som Ligner På Human Genome Project begynt å løse kompleksiteten og størrelsen på det menneskelige genomet. ET bestemt prosjekt, KODE Eller Encyclopedia OF DNA Elements, satt ut for å finne funksjonen til helheten av det menneskelige genom . Med Andre ord, Mens Human Genome Project satte seg for å lese tegningene i menneskelivet, var MÅLET MED ENCODE å finne ut hvilke deler av de blå utskriftene som faktisk gjør noe funksjonelt. EN gruppe laboratorier fra hele verden jobber med ENCODE-prosjektet, som startet i 2003 og er finansiert av National Human Genome Research Institute. Bare denne måneden publiserte konsortiet sine hovedresultater i over 30 vitenskapelige tidsskriftartikler, og det har fått betydelig oppmerksomhet av media .
Figur 1. De 46 kromosomene (øverst) som utgjør hele det menneskelige genomet. Hvert kromosom (midten) er en lang, kontinuerlig strekning AV DNA sprinklet med gener som koder for informasjonen som er nødvendig for å lage et protein. Gener utgjør bare en liten prosentandel av genomet, og resten består av intergeniske regioner (bunn) som ikke koder for proteiner. Dette er regionene SOM KODER er mest interessert i å studere. (Image Credit: Wikimedia Commons; User – Plociam)
for bedre å sette pris på MÅLET OM KODE, er det først nyttig å forstå hva vi mener med » funksjonell.»Husk at gener koder informasjonen som er nødvendig for å lage proteiner, som er molekylene som utfører funksjoner i cellen. Hvor mye protein et gitt gen til slutt produserer, eller om det er lov til å gjøre noe i det hele tatt, bestemmes av genuttrykket. Når det gjelder genomet, vil enhver ikke-proteinkodende sekvens som er funksjonell antagelig ha noen effekt på hvordan et gen uttrykkes; det vil si at en funksjonell sekvens på en eller annen måte regulerer hvor mye protein som er laget av en gitt kodende DNA-sekvens. Det er forskjellen i sammensetningen av proteiner som bidrar til å gi en celle sin identitet. Siden hver celle inneholder nøyaktig SAMME DNA og genom, er det derfor nivåene av genuttrykk som bestemmer om en celle vil være en nevron, hud eller til og med en immuncelle.
Mens Human Genome Project primært brukte teknikken FOR DNA-sekvensering for å lese ut det menneskelige genomet, krever det faktisk å tildele roller til OG karakterisere funksjonen til DISSE DNA-basene et mye bredere spekter av eksperimentelle teknikker. ENCODE-prosjektet brukte seks tilnærminger for å tildele funksjoner til bestemte sekvenser i genomet. Disse tilnærmingene inkluderte blant ANNET sekvensering AV RNA, et molekyl som ligner PÅ OG laget AV DNA som bærer instruksjoner for å lage proteiner, og identifisere DNA-REGIONER som kan kjemisk modifiseres eller bindes av proteiner . Forskere plukket disse metodene fordi de hver gir ledetråder om hvorvidt en gitt sekvens er funksjonell (dvs.om den påvirker genuttrykk). Hvis cellen bruker energi til å lage RNA FRA DNA, blir det sannsynligvis brukt til noe. I TILLEGG påvirker proteiner som binder SEG TIL DNA om et gen uttrykkes, og kjemiske modifikasjoner AV DNA kan også forhindre eller forbedre genuttrykk.
Hver av disse tilnærmingene kan identifisere sekvenser i genomet som har en slags biokjemisk aktivitet, og for å legge til nytten av dette prosjektet, utførte laboratoriene disse teknikkene i flere celletyper for å redegjøre for naturlig variabilitet. Så hva fant de til slutt? Ved hjelp av de seks tilnærmingene var prosjektet i stand til å identifisere biokjemisk aktivitet for 80% av basene i genomet . Selv om dette ikke nødvendigvis betyr at alle de forutsagte funksjonelle regionene faktisk tjener en hensikt, tyder det sterkt på at det er en biologisk rolle for mye mer enn 1% AV VÅRT DNA som danner gener. Mange forskere har allerede mistanke om dette, men MED ENCODE har vi nå et stort, standardisert datasett som kan brukes av individuelle laboratorier for å undersøke disse potensielt funksjonelle områdene. På samme måte, fordi det var et så stort prosjekt med strenge kvalitetskontroller, kan vi være sikre på at dataene er reproduserbare og pålitelige.
Nytte Og Kontrovers
selv om de viktigste fordelene som stammer fra dette prosjektet kanskje ikke realiseres i noen år (ligner På Human Genome Project), er det for øyeblikket allerede noen områder hvor dette enorme datasettet vil være nyttig. Det er en rekke sykdommer som synes å være forbundet med genetiske mutasjoner; imidlertid er mange av mutasjonene som har blitt oppdaget, ikke innenfor faktiske gener, noe som gjør det vanskelig å forstå hvilke funksjonelle endringer mutasjonene forårsaker. Ved hjelp av dataene FRA ENCODE-prosjektet vil forskerne kunne finpusse de sykdomsfremkallende mutasjonene raskere, siden de nå kan knytte mutasjonene med funksjonelle sekvenser som finnes i ENCODE-databasen. Ved å matche disse to, bør forskere og leger kunne begynne å forstå hvorfor en bestemt mutasjon forårsaker en sykdom, noe som vil bidra til utvikling av passende terapier.
SELV OM ENCODE-prosjektet var en bemerkelsesverdig prestasjon av vitenskapelig samarbeid, er det fortsatt kontroverser rundt prosjektet . Noen forskere har uttrykt sin bekymring for at pengene brukt på dette prosjektet (opp til $200-300 millioner) kunne ha vært mer nyttige for å forsyne enkelte forskere med tilskudd. Noen biologer har også uttrykt sine bekymringer om hvordan resultatene av prosjektet ble presentert for publikum, både når det gjelder hype rundt prosjektet og resultatene selv. På grunn av bekostning og kompleksitet av disse typer studier, er det viktig for forskere å presentere et upartisk perspektiv. Behovet for forsiktig presentasjon til publikum ble demonstrert av hype rundt ET nylig papir publisert AV NASA-forskere om bakterier som kunne bruke arsen på en måte som aldri hadde blitt observert før. Etter å ha kunngjort at de hadde oppdaget noe nytt og spennende, til og med for å ringe en pressekonferanse, imploderte den selvgenererte hype til slutt etter at funnene til slutt ble avvist . Som med ethvert nytt stort prosjekt, må både forskere og publikum være tålmodige i å tildele verdi til de sanne fordelene med prosjektet kan realiseres.
En annen stor kritikk av avisene utgitt AV ENCODE group fokusert på betydningen av uttrykket » biologisk funksjon.»I hoved KODE journal papir, forfatterne uttalt at de hadde tildelt en biologisk funksjon til ca 80% av det menneskelige genom . Som andre har nevnt, bare fordi EN gitt DNA-sekvens binder protein eller er forbundet med noen kjemisk modifikasjon, betyr det ikke nødvendigvis at det er funksjonelt eller tjener en nyttig rolle. Mange proteinbindende hendelser er tilfeldige og inkonsekvente. Det har også vært kjent for en stund at mye av DET ikke-kodende «junk» DNA egentlig ikke er søppel, så noen forskere har stilt spørsmål ved nyheten av RESULTATENE AV ENCODE. Alle disse bekymringene er absolutt berettiget, og faktisk viser samtalen rundt prosjektet nøyaktig hvordan vitenskapen skal fungere.
DET vil mest sannsynlig ta år å fullt ut forstå hvordan ENCODE har hjulpet det vitenskapelige samfunn, men likevel har dette prosjektet fremhevet hvor viktig det er å studere genomet som helhet, ikke bare for å forstå hvorfor vi har så mye ikke-kodende DNA i hver celle, men også å informere oss om emner som er relevante for flertallet av mennesker, spesielt hvor sjeldne eller flere genetiske mutasjoner fører til utvikling av sykdom.
Jonathan Henninger er utdannet student I Det Biologiske Og Biomedisinske Vitenskapsprogrammet Ved Harvard University.
Ytterligere Informasjon
Video – ENCODES lederkoordinator ewan Birney diskuterer prosjektets hovedmål.
Human Genome Project Hjemmeside <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
KODE Hjemmeside <http://www.genome.gov/10005107>
KODE artikler publisert I Nature <http://www.nature.com/encode/>
«Biter Av Mysterium DNA, Langt Fra «Søppel», Spiller Avgjørende Rolle, «Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com «Ask me Anything» med ENCODE prosjektbidragsytere <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
«Blindet Av Stor Vitenskap: Leksjonen jeg lærte AV ENCODE er at prosjekter som ENCODE ikke er en god ide, » Av Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
«KODE sier hva?»Av Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
«Nye Science Papers Bevise NASA Mislyktes Big Time I Å Fremme Angivelig Jord-Risting Funn Som Ikke Var,» Av Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
«Evolusjon av genomstørrelse over noen dyrkede Alliumarter.»Ricroch et al., Genome 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
«en integrert encyklopedi AV DNA-elementer i det menneskelige genom.»KODEPROSJEKTET Konsortium, Natur 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>