van de biljoenen cellen die ons lichaam vormen, van neuronen die signalen door de hersenen doorgeven tot immuuncellen die ons lichaam helpen te verdedigen tegen constante externe aanvallen, bevat bijna elk dezelfde 3 miljard DNA – basenparen die deel uitmaken van het menselijk genoom-het geheel van ons genetisch materiaal. Het is opmerkelijk dat elk van de meer dan 200 celtypes in het lichaam deze identieke informatie heel anders interpreteert om de functies uit te voeren die nodig zijn om ons in leven te houden. Dit toont aan dat we verder moeten kijken dan de sequentie van DNA zelf om te begrijpen hoe een organisme en zijn cellen functioneren.
het bestuderen van het genoom als geheel
dus hoe beginnen we het genoom als geheel te begrijpen? In 2000 leverde het Human Genome Project de eerste volledige sequentie van een menselijk genoom . Het DNA dat alle genomen maakt is samengesteld uit vier verwante chemische producten genoemd nucleic zuren – adenine (A), guanine (G), cytosine (C), en thymine (T). Een opeenvolging van DNA is een koord van deze nucleic zuren (ook genoemd “basen” of “basenparen”) die chemisch aan elkaar, zoals AGATTCAG in bijlage zijn, die lineair “wordt gelezen”. Experimentele methoden om de sequentie van DNA te bepalen, samen met hulp van enkele krachtige computers, gaven wetenschappers uiteindelijk een sequentie vol A ‘S, G’ S, C ’s en T’ s die 3 miljard letters lang was. Op dat moment dachten onderzoekers dat ze genoeg wisten over hoe DNA werkte om te zoeken naar de functionele eenheden van het genoom, ook wel bekend als genen. Een gen is een DNA-streng die de informatie codeert die nodig is om een eiwit te maken, dat vervolgens een bepaalde functie in onze cellen vervult.
na het Human Genome Project ontdekten wetenschappers dat er ongeveer 20.000 genen in het genoom zaten, een aantal dat sommige onderzoekers al hadden voorspeld. Opmerkelijk is dat deze genen slechts 1-2% van de 3 miljard basenparen van DNA uitmaken . Dit betekent dat overal van 98-99% van ons hele genoom iets anders moet doen dan coderen voor eiwitten – wetenschappers noemen dit niet-coderend DNA. Stel je voor dat je meerdere volumes encyclopedieën krijgt die elke 100 pagina ‘ s een samenhangende zin in het Engels bevatten, waar de rest van de ruimte een vleugje oninterpreteerbare willekeurige letters en tekens bevat. Je zou je waarschijnlijk beginnen af te vragen waarom al die willekeurige letters en karakters er in de eerste plaats waren, wat precies het probleem is dat wetenschappers al tientallen jaren teistert.
Waarom wordt zoveel van ons genoom niet gebruikt om eiwitten te coderen? Heeft dit extra DNA een functioneel doel? Om een idee te krijgen of we al dit extra DNA nodig hebben, kunnen we kijken naar nauw verwante soorten met enorm verschillende genoomgroottes. Bijvoorbeeld, het geslacht Allium, dat uien, sjalotten en knoflook omvat, heeft genoomgroottes variërend van 10 tot 20 miljard basenparen. Het is zeer onwaarschijnlijk dat zo ‘ n grote hoeveelheid extra DNA nuttig zou zijn in één soort en niet in zijn genetische neef, misschien met het argument dat veel van het genoom niet nuttig is . Bovendien zijn deze genomen veel groter dan het menselijke genoom, wat erop wijst dat een ui zeer complex is, of waarschijnlijker dat de grootte van een genoom niets zegt over hoe complex het organisme is of hoe het functioneert.
welke delen van het genoom zijn functioneel?Als gevolg van verbazingwekkende technologische vooruitgang in het sequencen van DNA en het gebruik van computers om de resulterende sequenties te helpen analyseren (gezamenlijk bekend als bio-informatica), zijn grootschalige projecten vergelijkbaar met het Human Genome Project begonnen met het ontrafelen van de complexiteit en de grootte van het menselijk genoom. Een specifiek project, coderen, of de Encyclopedie van DNA-elementen, op zoek naar de functie van het geheel van het menselijk genoom. Met andere woorden, terwijl het Human Genome Project de blauwdrukken van het menselijk leven wilde lezen, was het doel van ENCODE om uit te vinden welke delen van die blauwe afdrukken daadwerkelijk iets functioneel doen. Een groep labs uit de hele wereld werkt aan het ENCODE project, dat in 2003 is gestart en wordt gefinancierd door het National Human Genome Research Institute. Juist deze maand publiceerde het consortium zijn belangrijkste resultaten in meer dan 30 wetenschappelijke tijdschriftartikelen, en het heeft veel aandacht gekregen van de media .
figuur 1. De 46 chromosomen (boven) die het gehele menselijke genoom vormen. Elk chromosoom (midden) is een lange, continue strook van DNA besprenkeld met genen die de informatie coderen die nodig is om een eiwit te maken. De genen maken slechts omhoog een klein percentage van het genoom, en de rest is samengesteld uit intergenic gebieden (bodem) die niet voor proteã nen coderen. Dit zijn de regio ‘ s die coderen is het meest geïnteresseerd in het bestuderen. (Image Credit: Wikimedia Commons; User – Plociam)
om het doel van ENCODE beter te begrijpen, is het eerst nuttig om te begrijpen wat we bedoelen met “functioneel”.”Onthoud dat genen de informatie coderen die nodig is om eiwitten te maken, de moleculen die functies in de cel uitvoeren. Hoeveel eiwit een bepaald gen uiteindelijk produceert, of dat het überhaupt mag maken, wordt bepaald door zijn genexpressie. In het geval van het genoom, zou elke niet-eiwit-coderende sequentie die functioneel is vermoedelijk enig effect hebben op hoe een gen wordt uitgedrukt; dat wil zeggen, een functionele sequentie regelt op een of andere manier hoeveel eiwit wordt gemaakt van een bepaalde coderende DNA-sequentie. Het is het verschil in de samenstelling van eiwitten die helpt een cel zijn identiteit te geven. Aangezien elke cel exact hetzelfde DNA en genoom bevat, zijn het daarom de niveaus van genexpressie die bepalen of een cel een neuron, huid of zelfs een immuuncel zal zijn.
terwijl het Human Genome Project voornamelijk de techniek van DNA-sequencing gebruikte om het menselijk genoom uit te lezen, vereist het toekennen van rollen aan en het karakteriseren van de functie van deze DNA-basen een veel breder scala aan experimentele technieken. Het CodeProject gebruikte zes benaderingen om te helpen functies aan bepaalde opeenvolgingen binnen het genoom toe te wijzen. Deze benaderingen omvatten, onder anderen, het rangschikken van RNA, een molecule gelijkaardig aan en gemaakt van DNA dat instructies voor het maken van proteã nen draagt, en het identificeren van gebieden van DNA die chemisch zouden kunnen worden gewijzigd of door proteã nen worden gebonden . De onderzoekers kozen deze methodes omdat zij elk aanwijzingen geven over de vraag of een bepaalde opeenvolging functioneel is (d.w.z., of het genuitdrukking beà nvloedt). Als de cel energie verbruikt om RNA van DNA te maken, dan wordt het waarschijnlijk voor iets gebruikt. Bovendien, kunnen de proteã nen die aan de invloed van DNA binden of een gen wordt uitgedrukt, en de chemische wijzigingen van DNA genuitdrukking ook verhinderen of verbeteren.
elk van deze benaderingen kan sequenties in het genoom identificeren die een soort biochemische activiteit hebben, en om het nut van dit project te vergroten, voerden de laboratoria deze technieken uit in meerdere celtypes om rekening te houden met natuurlijke variabiliteit. Wat hebben ze uiteindelijk gevonden? Gebruikend de zes benaderingen, kon het project biochemische activiteit voor 80% van de basissen in het genoom identificeren . Hoewel dit niet noodzakelijkerwijs betekent dat al die voorspelde functionele gebieden daadwerkelijk een doel dienen, suggereert het sterk dat er een biologische rol is voor veel meer dan de 1% van ons DNA dat genen vormt. Veel wetenschappers vermoedden dit al, maar met ENCODE hebben we nu een grote, gestandaardiseerde dataset die door individuele laboratoria kan worden gebruikt om deze potentieel functionele gebieden te onderzoeken. Ook, omdat het zo ‘ n groot project met strenge kwaliteitscontroles was, kunnen we er zeker van zijn dat de gegevens reproduceerbaar en betrouwbaar zijn.
bruikbaarheid en controverse
hoewel de belangrijkste voordelen van dit project wellicht over enkele jaren niet worden gerealiseerd (vergelijkbaar met het Human Genome Project), zijn er op dit moment al enkele gebieden waar deze enorme gegevensverzameling nuttig zal zijn. Er zijn een gastheer van ziekten die om met genetische veranderingen lijken te worden geassocieerd; nochtans, zijn veel van de veranderingen die zijn ontdekt niet binnen daadwerkelijke genen, die het moeilijk maakt om te begrijpen welke functionele veranderingen de veranderingen veroorzaken. Met behulp van de gegevens van het encode-project zullen onderzoekers in staat zijn om sneller in te werken op de ziekteverwekkende mutaties, omdat ze de mutaties nu kunnen associëren met functionele sequenties die in de ENCODE-database worden gevonden. Door deze twee te matchen, zouden onderzoekers en artsen in staat moeten zijn om te beginnen begrijpen waarom een bepaalde mutatie een ziekte veroorzaakt, die met de ontwikkeling van geschikte therapie zal helpen.
hoewel het ENCODE-project een opmerkelijke prestatie van wetenschappelijke samenwerking was, is er nog steeds controverse rond het project . Sommige wetenschappers hebben hun bezorgdheid geuit dat het geld dat aan dit project is besteed (meer dan $200-300 miljoen) nuttiger had kunnen zijn voor het verstrekken van individuele onderzoekers met subsidies. Sommige biologen hebben ook hun bezorgdheid geuit over de manier waarop de resultaten van het project aan het publiek werden gepresenteerd, zowel in termen van de hype rond het project als de resultaten zelf. Vanwege de kosten en complexiteit van dit soort studies is het belangrijk voor wetenschappers om een onpartijdig perspectief te presenteren. De noodzaak voor een zorgvuldige presentatie aan het publiek werd aangetoond door de hype rond een recente paper gepubliceerd door NASA wetenschappers over bacteriën die arseen kon gebruiken op een manier die nooit eerder was waargenomen. Na de aankondiging dat ze iets nieuws en opwindends hadden ontdekt, zelfs tot het punt van het organiseren van een persconferentie, implodeerde de zelfgegenereerde hype uiteindelijk nadat de bevindingen uiteindelijk werden weerlegd . Zoals bij elk nieuw grootschalig project, moeten zowel wetenschappers als het publiek geduldig zijn in het toekennen van waarde totdat de werkelijke voordelen van het project kunnen worden gerealiseerd.
een andere belangrijke kritiek op de artikelen gepubliceerd door de ENCODE-groep richtte zich op de Betekenis van de uitdrukking “biologische functie.”In de belangrijkste codering journal paper, de auteurs verklaarden dat ze een biologische functie had toegewezen aan ongeveer 80% van het menselijk genoom . Zoals anderen hebben opgemerkt, enkel omdat een bepaalde opeenvolging van DNA proteã ne bindt of met één of andere chemische wijziging wordt geassocieerd betekent niet noodzakelijk dat het functioneel is of een nuttige rol dient. Veel eiwitbindingsgebeurtenissen zijn willekeurig en inconsequent. Het is ook bekend voor enige tijd dat veel van de niet-coderende “junk” DNA is eigenlijk geen junk, dus sommige onderzoekers hebben in vraag gesteld de nieuwheid van de resultaten van coderen. Al deze zorgen zijn zeker gerechtvaardigd, en, in feite, het gesprek rond het project laat precies zien hoe wetenschap verondersteld wordt te werken.
het zal waarschijnlijk jaren duren om volledig te begrijpen hoe ENCODE De wetenschappelijke gemeenschap heeft geholpen, maar niettemin heeft dit project aangetoond hoe belangrijk het is om het genoom als geheel te bestuderen, niet alleen om te begrijpen waarom we zoveel niet-coderend DNA in elke cel hebben, maar ook om ons te informeren over onderwerpen die relevant zijn voor de meerderheid van de mensen, met name hoe zeldzame of meervoudige genetische mutaties leiden tot de ontwikkeling van ziekte.Jonathan Henninger is afgestudeerd aan het Biological and Biomedical Sciences Program aan de Harvard University.
verdere informatie
de hoofdcoördinator van Video – ENCODE Ewan Birney bespreekt de belangrijkste doelstellingen van het project.
Human Genome Project Homepage <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
startpagina coderen<http://www.genome.gov/10005107>
artikelen in Nature coderen <http://www.nature.com/encode/>
“stukjes Mystery DNA, ver van ‘Junk’, spelen cruciale rol, “Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com “Ask me Anything” met encode Project bijdragers <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
“verblind door Big Science: De les die ik heb geleerd van ENCODE is dat projecten als ENCODE geen goed idee zijn, ” door Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
“ENCODE zegt wat?”door Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
“nieuwe wetenschappelijke Papers bewijzen NASA faalde Big Time in het bevorderen van zogenaamd aarde-schokkende ontdekking die niet was,” door Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
“evolutie van genoomgrootte bij sommige gecultiveerde Alliumsoorten.”Ricroch et al., Genome 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
“een geïntegreerde encyclopedie van DNA-elementen in het menselijk genoom.”The Encode Project Consortium, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>