Von den Billionen Zellen, aus denen unser Körper besteht, von Neuronen, die Signale im gesamten Gehirn weiterleiten, bis hin zu Immunzellen, die unseren Körper vor ständigen Angriffen von außen schützen, enthält fast jeder die gleichen 3 Milliarden DNA–Basenpaare, aus denen das menschliche Genom besteht – die Gesamtheit unseres genetischen Materials. Es ist bemerkenswert, dass jeder der über 200 Zelltypen im Körper diese identischen Informationen sehr unterschiedlich interpretiert, um die Funktionen zu erfüllen, die notwendig sind, um uns am Leben zu erhalten. Dies zeigt, dass wir über die DNA-Sequenz hinausblicken müssen, um zu verstehen, wie ein Organismus und seine Zellen funktionieren.
Das Genom als Ganzes studieren
Wie fangen wir also an, das Genom als Ganzes zu verstehen? Im Jahr 2000 lieferte das Humangenomprojekt die erste vollständige Sequenz eines menschlichen Genoms . Die DNA, aus der alle Genome bestehen, besteht aus vier verwandten Chemikalien, den sogenannten Nukleinsäuren – Adenin (A), Guanin (G), Cytosin (C) und Thymin (T). Eine DNA-Sequenz ist eine Reihe dieser Nukleinsäuren (auch „Basen“ oder „Basenpaare“ genannt), die chemisch aneinander gebunden sind, wie AGATTCAG, das linear „ausgelesen“ wird. Experimentelle Methoden zur Bestimmung der DNA-Sequenz, zusammen mit Hilfe einiger leistungsfähiger Computer, gaben den Wissenschaftlern letztendlich eine Sequenz voller A, G, C und T, die 3 Milliarden Buchstaben lang war. Zu dieser Zeit dachten die Forscher, sie wüssten genug darüber, wie DNA funktioniert, um nach den funktionellen Einheiten des Genoms zu suchen, die auch als Gene bekannt sind. Ein Gen ist eine DNA-Kette, die die Informationen kodiert, die zur Herstellung eines Proteins erforderlich sind, das dann eine Funktion in unseren Zellen ausführt.
Nach dem Humangenomprojekt fanden Wissenschaftler heraus, dass sich rund 20.000 Gene im Genom befanden, eine Zahl, die einige Forscher bereits vorhergesagt hatten. Bemerkenswerterweise umfassen diese Gene nur etwa 1-2% der 3 Milliarden Basenpaare der DNA . Dies bedeutet, dass 98-99% unseres gesamten Genoms etwas anderes tun müssen, als für Proteine zu kodieren – Wissenschaftler nennen dies nicht-kodierende DNA. Stellen Sie sich vor, Sie erhalten mehrere Bände von Enzyklopädien, die alle 100 Seiten einen zusammenhängenden Satz auf Englisch enthielten, wobei der Rest des Raums ein paar uninterpretierbare zufällige Buchstaben und Zeichen enthielt. Sie würden sich wahrscheinlich fragen, warum all diese zufälligen Buchstaben und Zeichen überhaupt da waren, was genau das Problem ist, das Wissenschaftler seit Jahrzehnten plagt.
Warum wird so viel von unserem Genom nicht verwendet, um für Protein zu kodieren? Dient diese zusätzliche DNA einem funktionalen Zweck? Um eine Vorstellung davon zu bekommen, ob wir all diese zusätzliche DNA brauchen, können wir uns eng verwandte Arten ansehen, die sehr unterschiedliche Genomgrößen haben. Zum Beispiel hat die Gattung Allium, zu der Zwiebeln, Schalotten und Knoblauch gehören, Genomgrößen zwischen 10 und 20 Milliarden Basenpaaren. Es ist sehr unwahrscheinlich, dass eine so große Menge zusätzlicher DNA in einer Spezies nützlich wäre und nicht in ihrem genetischen Cousin, vielleicht mit dem Argument, dass ein Großteil des Genoms nicht nützlich ist . Darüber hinaus sind diese Genome viel größer als das menschliche Genom, was entweder darauf hindeutet, dass eine Zwiebel hochkomplex ist, oder wahrscheinlicher, dass die Größe eines Genoms nichts darüber aussagt, wie komplex der Organismus ist oder wie er funktioniert.
Welche Teile des Genoms sind funktionsfähig?
Aufgrund erstaunlicher technologischer Fortschritte bei der Sequenzierung von DNA und bei der Verwendung von Computern zur Analyse der resultierenden Sequenzen (zusammen als Bioinformatik bekannt) haben groß angelegte Projekte ähnlich dem Humangenomprojekt begonnen, die Komplexität und Größe des menschlichen Genoms zu entschlüsseln. Ein bestimmtes Projekt, ENCODE oder die Enzyklopädie der DNA-Elemente, zielte darauf ab, die Funktion der Gesamtheit des menschlichen Genoms zu ermitteln . Mit anderen Worten, während das Humangenomprojekt die Blaupausen des menschlichen Lebens lesen wollte, war das Ziel von ENCODE herauszufinden, welche Teile dieser Blaupausen tatsächlich etwas Funktionales tun. Eine Gruppe von Labors aus der ganzen Welt arbeitet am ENCODE-Projekt, das 2003 begann und vom National Human Genome Research Institute finanziert wird. Erst in diesem Monat veröffentlichte das Konsortium seine wichtigsten Ergebnisse in über 30 wissenschaftlichen Zeitschriftenartikeln, und die Medien haben ihm große Aufmerksamkeit geschenkt .
Abbildung 1. Die 46 Chromosomen (oben), aus denen das gesamte menschliche Genom besteht. Jedes Chromosom (Mitte) ist ein langer, kontinuierlicher DNA-Abschnitt, der mit Genen bestreut ist, die die für die Herstellung eines Proteins erforderlichen Informationen codieren. Gene machen nur einen kleinen Prozentsatz des Genoms aus, und der Rest besteht aus intergenen Regionen (unten), die nicht für Proteine kodieren. Dies sind die Regionen, die ENCODE am meisten interessiert. (Bildnachweis: Wikimedia Commons; User – Plociam)
Um das Ziel von ENCODE besser zu verstehen, ist es zunächst hilfreich zu verstehen, was wir unter „funktional“ verstehen.“ Denken Sie daran, dass Gene die Informationen kodieren, die zur Herstellung von Proteinen erforderlich sind, die die Moleküle sind, die Funktionen in der Zelle ausführen. Wie viel Protein ein bestimmtes Gen letztendlich produziert oder ob es überhaupt hergestellt werden darf, wird durch seine Genexpression bestimmt. Im Falle des Genoms würde jede nicht-Protein-kodierende Sequenz, die funktional ist, vermutlich einen Einfluss darauf haben, wie ein Gen exprimiert wird; das heißt, eine funktionelle Sequenz reguliert in gewisser Weise, wie viel Protein aus einer gegebenen kodierenden DNA-Sequenz hergestellt wird. Es ist der Unterschied in der Zusammensetzung der Proteine, der einer Zelle ihre Identität verleiht. Da jede Zelle genau die gleiche DNA und das gleiche Genom enthält, bestimmen daher die Ebenen der Genexpression, ob eine Zelle ein Neuron, eine Haut oder sogar eine Immunzelle ist.
Während das Humangenomprojekt in erster Linie die Technik der DNA-Sequenzierung verwendete, um das menschliche Genom auszulesen, erfordert die tatsächliche Zuordnung von Rollen zu und die Charakterisierung der Funktion dieser DNA-Basen ein viel breiteres Spektrum experimenteller Techniken. Das ENCODE-Projekt verwendete sechs Ansätze, um bestimmten Sequenzen innerhalb des Genoms Funktionen zuzuweisen. Diese Ansätze umfassten unter anderem die Sequenzierung von RNA, einem Molekül ähnlich und aus DNA hergestellt, das Anweisungen zur Herstellung von Proteinen enthält, und die Identifizierung von DNA-Regionen, die chemisch modifiziert oder durch Proteine gebunden werden könnten . Die Forscher wählten diese Methoden, weil sie jeweils Hinweise darauf geben, ob eine bestimmte Sequenz funktionell ist (dh ob sie die Genexpression beeinflusst). Wenn die Zelle Energie aufwendet, um RNA aus DNA herzustellen, wird sie wahrscheinlich für etwas verwendet. Darüber hinaus beeinflussen Proteine, die an DNA binden, ob ein Gen exprimiert wird, und chemische Modifikationen der DNA können auch die Genexpression verhindern oder verbessern.
Jeder dieser Ansätze kann Sequenzen innerhalb des Genoms identifizieren, die eine Art biochemische Aktivität aufweisen, und um den Nutzen dieses Projekts zu erhöhen, führten die Labore diese Techniken in mehreren Zelltypen durch, um die natürliche Variabilität zu berücksichtigen. Was haben sie letztendlich gefunden? Mit den sechs Ansätzen konnte das Projekt die biochemische Aktivität für 80% der Basen im Genom identifizieren . Obwohl dies nicht unbedingt bedeutet, dass alle diese vorhergesagten funktionellen Regionen tatsächlich einen Zweck erfüllen, deutet es stark darauf hin, dass es eine biologische Rolle für viel mehr als die 1% unserer DNA gibt, die Gene bildet. Viele Wissenschaftler vermuteten dies bereits, aber mit ENCODE haben wir jetzt einen großen, standardisierten Datensatz, der von einzelnen Labors verwendet werden kann, um diese potenziell funktionalen Bereiche zu untersuchen. Da es sich um ein so großes Projekt mit strengen Qualitätskontrollen handelte, können wir sicher sein, dass die Daten reproduzierbar und zuverlässig sind.
Nützlichkeit und Kontroverse
Obwohl die Hauptvorteile dieses Projekts möglicherweise erst in einigen Jahren realisiert werden (ähnlich wie beim Humangenomprojekt), gibt es derzeit bereits einige Bereiche, in denen dieser enorme Datensatz nützlich sein wird. Es gibt eine Vielzahl von Krankheiten, die mit genetischen Mutationen assoziiert zu sein scheinen; Viele der Mutationen, die entdeckt wurden, befinden sich jedoch nicht in tatsächlichen Genen, was es schwierig macht zu verstehen, welche funktionellen Veränderungen die Mutationen verursachen. Mit den Daten aus dem ENCODE-Projekt können die Forscher die krankheitsverursachenden Mutationen schneller untersuchen, da sie die Mutationen nun mit funktionellen Sequenzen in der ENCODE-Datenbank verknüpfen können. Durch die Kombination dieser beiden sollten Forscher und Ärzte in der Lage sein zu verstehen, warum eine bestimmte Mutation eine Krankheit verursacht, was bei der Entwicklung geeigneter Therapien helfen wird.
Obwohl das ENCODE-Projekt eine bemerkenswerte Leistung der wissenschaftlichen Zusammenarbeit war, gibt es immer noch Kontroversen um das Projekt . Einige Wissenschaftler haben ihre Besorgnis darüber geäußert, dass das für dieses Projekt ausgegebene Geld (über 200 bis 300 Millionen US-Dollar) für die Bereitstellung von Zuschüssen für einzelne Forscher nützlicher gewesen sein könnte. Einige Biologen haben auch ihre Besorgnis darüber geäußert, wie die Ergebnisse des Projekts der Öffentlichkeit präsentiert wurden, sowohl in Bezug auf den Hype um das Projekt als auch auf die Ergebnisse selbst. Aufgrund des Aufwands und der Komplexität dieser Art von Studien ist es für Wissenschaftler wichtig, eine unparteiische Perspektive zu präsentieren. Die Notwendigkeit einer sorgfältigen Präsentation in der Öffentlichkeit wurde durch den Hype um ein kürzlich von NASA-Wissenschaftlern veröffentlichtes Papier über Bakterien demonstriert, die Arsen auf eine Weise verwenden könnten, die noch nie zuvor beobachtet worden war. Nach der Ankündigung, dass sie etwas Neues und Aufregendes entdeckt hatten, sogar bis zur Pressekonferenz, Der selbst erzeugte Hype implodierte schließlich, nachdem die Ergebnisse letztendlich widerlegt wurden . Wie bei jedem neuen Großprojekt müssen sowohl Wissenschaftler als auch die Öffentlichkeit geduldig Wert zuweisen, bis der wahre Nutzen des Projekts realisiert werden kann.
Eine weitere Hauptkritik an den von der ENCODE-Gruppe veröffentlichten Arbeiten konzentrierte sich auf die Bedeutung des Ausdrucks „biologische Funktion.“ In der Hauptarbeit der Zeitschrift ENCODE gaben die Autoren an, dass sie etwa 80% des menschlichen Genoms eine biologische Funktion zugewiesen hatten . Wie andere bemerkt haben, nur weil eine gegebene DNA-Sequenz Protein bindet oder mit einer chemischen Modifikation assoziiert ist, bedeutet dies nicht unbedingt, dass sie funktionell ist oder eine nützliche Rolle spielt. Viele Proteinbindungsereignisse sind zufällig und inkonsequent. Es ist auch seit einiger Zeit bekannt, dass ein Großteil der nicht kodierenden „Junk“ -DNA nicht wirklich Junk ist, so dass einige Forscher die Neuheit der Ergebnisse von in Frage gestellt haben KODIEREN. All diese Bedenken sind sicherlich berechtigt, und tatsächlich zeigt das Gespräch rund um das Projekt genau, wie Wissenschaft funktionieren soll.
Es wird wahrscheinlich Jahre dauern, um vollständig zu verstehen, wie ENCODE der wissenschaftlichen Gemeinschaft geholfen hat, aber dennoch hat dieses Projekt hervorgehoben, wie wichtig es ist, das Genom als Ganzes zu untersuchen, nicht nur um zu verstehen, warum wir so viel nicht kodierende DNA in jeder Zelle haben, sondern auch um uns über Themen zu informieren, die für die Mehrheit der Menschen relevant sind, insbesondere darüber, wie seltene oder multiple genetische Mutationen zur Entwicklung von Krankheiten führen.
Jonathan Henninger ist Doktorand im Programm für biologische und biomedizinische Wissenschaften an der Harvard University.
Weitere Informationen
Der leitende Koordinator von Video – ENCODE, Ewan Birney, erläutert die Hauptziele des Projekts.
Homepage des Humangenomprojekts <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
ENCODE Homepage <http://www.genome.gov/10005107>
In Nature veröffentlichte Artikel KODIEREN <http://www.nature.com/encode/>
“ Bits mysteriöser DNA, weit entfernt von „Müll“, Spielen eine entscheidende Rolle,“Gina Kolata, Die New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com „Frag mich etwas“ mit ENCODE Project Contributors <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
“ Geblendet von der großen Wissenschaft: Die Lektion, die ich von ENCODE gelernt habe, ist, dass Projekte wie ENCODE keine gute Idee sind.“ von Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
“ ENCODE sagt was?“ von Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
“ Neue wissenschaftliche Arbeiten beweisen, dass die NASA bei der Förderung einer angeblich erderschütternden Entdeckung, die es nicht war, versagt hat „von Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
“ Evolution der Genomgröße über einige kultivierte Allium-Arten.“ Ricroch et al., Genome 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
“ Eine integrierte Enzyklopädie der DNA-Elemente im menschlichen Genom.“ Das ENCODE-Projektkonsortium, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>