niistä biljoonista soluista, jotka muodostavat kehomme, neuroneista, jotka välittävät signaaleja läpi aivojen immuunisoluihin, jotka auttavat puolustamaan kehoamme jatkuvalta ulkoiselta hyökkäykseltä, lähes jokainen sisältää samat 3 miljardia DNA – emäsparia, jotka muodostavat ihmisen genomin-koko geneettisen materiaalimme. On merkille pantavaa, että jokainen elimistön yli 200 solutyypistä tulkitsee tämän identtisen tiedon hyvin eri tavalla suorittaakseen ne toiminnot, jotka ovat välttämättömiä pitääksemme meidät elossa. Tämä osoittaa, että meidän on katsottava itse DNA: n sekvenssiä pidemmälle ymmärtääksemme, miten organismi ja sen solut toimivat.

koko genomin tutkiminen

miten siis aletaan ymmärtää koko genomia? Vuonna 2000 Human Genome Project tarjosi ensimmäisen kokonaisen sekvenssin ihmisen genomista . Kaikki genomit muodostava DNA koostuu neljästä toisiinsa liittyvästä kemikaalista, joita kutsutaan nukleiinihapoiksi-adeniinista (a), guaniinista (G), sytosiinista (C) ja tymiinistä (T). DNA: n sekvenssi on ketju näistä nukleiinihapoista (joita kutsutaan myös ”emäsiksi” tai ”emäspareiksi”), jotka ovat kemiallisesti kiinnittyneet toisiinsa, kuten AGATTCAG, joka ”luetaan” lineaarisesti. Kokeelliset menetelmät DNA: n sekvenssin määrittämiseksi yhdessä joidenkin tehokkaiden tietokoneiden kanssa antoivat tiedemiehille lopulta 3 miljardin kirjaimen pituisen sarjan, joka oli täynnä A: ta, G: tä, C: tä ja T: tä. Tuolloin tutkijat luulivat tietävänsä tarpeeksi siitä, miten DNA toimii etsiessään genomin toiminnallisia yksiköitä eli geenejä. Geeni on DNA-ketju, joka koodaa proteiinin tekemiseen tarvittavan informaation, joka sitten jatkaa jonkin tehtävän suorittamista soluissamme.

ihmisen genomiprojektin jälkeen tutkijat havaitsivat, että genomissa oli noin 20 000 geeniä, minkä määrän jotkut tutkijat olivat jo ennustaneet. Huomattavaa on, että nämä geenit muodostavat vain noin 1-2% DNA: n 3 miljardista emäsparista . Tämä tarkoittaa, että 98-99% koko perimästämme on tehtävä jotain muuta kuin koodattava proteiineja – tutkijat kutsuvat tätä ei-koodaavaksi DNA: ksi. Kuvittele, että sinulle annetaan useita määriä tietosanakirjoja, jotka sisälsivät yhtenäisen lauseen englanniksi 100 sivun välein, ja loput tilasta sisälsi hitusen epäkäsiteltäviä satunnaisia kirjaimia ja merkkejä. Alkaisit luultavasti ihmetellä, miksi kaikki nuo satunnaiset kirjaimet ja merkit ylipäätään olivat siellä, mikä on juuri se ongelma, joka on vaivannut tutkijoita vuosikymmeniä.

miksi niin suurta osaa perimästämme ei käytetä proteiinin koodaamiseen? Onko ylimääräisellä DNA: lla mitään toiminnallista tarkoitusta? Saadaksemme käsityksen siitä, tarvitsemmeko kaiken tämän ylimääräisen DNA: n, voimme tarkastella läheistä sukua olevia lajeja, joiden genomikoot vaihtelevat hurjasti. Esimerkiksi sipuleita, salottisipuleja ja valkosipulia sisältävän Allium-suvun genomikoot vaihtelevat 10-20 miljardin emäsparin välillä. On hyvin epätodennäköistä, että näin suuri määrä ylimääräistä DNA: ta olisi hyödyllinen yhdessä lajissa eikä sen geneettisessä serkussa, ehkä väittäen, että suuri osa perimästä ei ole hyödyllinen . Lisäksi nämä genomit ovat paljon suurempia kuin ihmisen genomi, mikä osoittaa joko, että sipuli on erittäin monimutkainen, tai todennäköisemmin, että genomin koko ei kerro mitään siitä, kuinka monimutkainen organismi on tai miten se toimii.

mitkä genomin osat ovat toiminnallisia?

DNA: n sekvensoinnissa ja tietokoneiden käytössä syntyvien sekvenssien analysoinnissa (tunnetaan yhdessä nimellä bioinformatiikka) tapahtuneen hämmästyttävän teknologisen kehityksen ansiosta ihmisen genomiprojektia muistuttavissa laajamittaisissa hankkeissa on alettu selvittää ihmisen genomin monimutkaisuutta ja kokoa. Eräs erityinen projekti, ENCODE, tai Encyclopedia of DNA Elements, lähti etsimään koko ihmisen genomin toimintaa . Toisin sanoen, Kun Human Genome Project lähti lukemaan ihmisen elämän pohjapiirroksia, ENCODEN tavoitteena oli selvittää, mitkä osat näistä sinisistä tulosteista todella tekevät jotain toimivaa. Ryhmä laboratorioita eri puolilta maailmaa työskentelee vuonna 2003 alkaneessa ENCODE-hankkeessa, jota rahoittaa National Human Genome Research Institute. Juuri tässä kuussa konsortio julkaisi päätuloksensa yli 30 tieteellisessä lehdessä, ja media on kiinnittänyt siihen runsaasti huomiota .

Kuva 1. 46 kromosomia (top), jotka muodostavat koko ihmisen genomin. Jokainen kromosomi (keskellä) on pitkä, jatkuva DNA-pätkä, johon on ripoteltu geenejä, jotka koodaavat proteiinin tekemiseen tarvittavaa tietoa. Geenit muodostavat vain pienen osan perimästä, ja loppu koostuu geenien välisistä alueista (pohja), jotka eivät koodaa proteiineja. Näitä alueita koodaa kiinnostaa eniten opiskelu. (Image Credit: Wikimedia Commons; User – Plociam)

jotta koodauksen päämäärä ymmärrettäisiin paremmin, on ensin hyödyllistä ymmärtää, mitä tarkoitamme sanalla ”toiminnallinen.”Muista, että geenit koodaavat informaatiota, jota tarvitaan proteiinien, jotka ovat molekyylejä, jotka suorittavat toimintoja solussa. Se, kuinka paljon proteiinia tietty geeni lopulta tuottaa, vai saako sitä tehdä lainkaan, määräytyy sen geeniekspression perusteella. Genomin tapauksessa millä tahansa ei-proteiinia koodaavalla sekvenssillä, joka on funktionaalinen, olisi oletettavasti jonkinlainen vaikutus siihen, miten geeni ilmaistaan; toisin sanoen funktionaalinen sekvenssi jollain tavalla säätelee sitä, kuinka paljon proteiinia muodostuu tietystä koodaavasta DNA-sekvenssistä. Proteiinien koostumuksen ero auttaa antamaan solulle sen identiteetin. Koska jokainen solu sisältää täsmälleen saman DNA: n ja genomin, juuri geeniekspression tasot ratkaisevat, onko solu neuroni, iho vai jopa immuunisolu.

kun taas Human Genome Project käytti pääasiassa DNA-sekvensointitekniikkaa ihmisen genomin lukemiseen, itse asiassa näiden DNA-emästen tehtävien määrittäminen ja toiminnan luonnehtiminen vaatii paljon laajempaa valikoimaa kokeellisia tekniikoita. ENCODE-projektissa käytettiin kuutta lähestymistapaa, joiden avulla voitiin määrittää funktioita genomin sisällä oleviin sekvensseihin. Näitä lähestymistapoja olivat muun muassa RNA: n sekvensointi, DNA: ta muistuttava ja siitä valmistettu molekyyli, joka sisältää ohjeet proteiinien valmistamiseen, sekä DNA: n alueiden tunnistaminen, joita proteiinit voisivat kemiallisesti muokata tai sitoa . Tutkijat poimivat nämä menetelmät, koska ne kukin antaa vihjeitä siitä, onko tietty sekvenssi on toiminnallinen (eli, onko se vaikuttaa geenin ilmentymistä). Jos solu kuluttaa energiaa RNA: n tekemiseen DNA: sta, sitä todennäköisesti käytetään johonkin. Lisäksi DNA: han sitoutuvat proteiinit vaikuttavat siihen, ilmentyykö geeni, ja DNA: n kemialliset muunnokset voivat myös estää tai parantaa geenin ilmentymistä.

jokainen näistä lähestymistavoista voi tunnistaa genomissa olevia sekvenssejä, joilla on jonkinlaista biokemiallista toimintaa, ja lisätäkseen tämän hankkeen hyödyllisyyttä laboratoriot suorittivat näitä tekniikoita useissa solutyypeissä luonnollisen vaihtelun huomioon ottamiseksi. Mitä he lopulta löysivät? Kuuden menetelmän avulla hankkeessa pystyttiin tunnistamaan biokemiallinen aktiivisuus 80 prosentille genomin emäksistä . Vaikka tämä ei välttämättä tarkoita, että kaikki ennustetut toiminnalliset alueet todella palvelevat tarkoitusta, se viittaa vahvasti siihen, että on olemassa biologinen rooli paljon enemmän kuin 1% DNA: stamme, joka muodostaa geenejä. Monet tutkijat ovat jo epäilleet tätä, mutta ENCODEN avulla meillä on nyt suuri, standardoitu tietojoukko, jota yksittäiset labrat voivat käyttää näiden mahdollisesti toiminnallisten alueiden tutkimiseen. Samoin, koska kyseessä oli niin suuri hanke, jossa oli tiukat laadunvalvonnat, voimme olla varmoja siitä, että tiedot ovat toistettavissa ja luotettavia.

Hyödyllisyys ja kiista

vaikka tämän hankkeen tärkeimmät hyödyt eivät ehkä toteudu vielä vuosiin (kuten Human Genome Project), tällä hetkellä on jo joitakin alueita, joilla tästä valtavasta aineistosta on hyötyä. On olemassa monia sairauksia, jotka näyttävät liittyvän geneettisiä mutaatioita; kuitenkin, monet mutaatiot, jotka on löydetty eivät sisällä varsinaisten geenien, mikä vaikeuttaa ymmärtää, mitä toiminnallisia muutoksia mutaatiot aiheuttavat. ENCODE-projektin tietojen avulla tutkijat voivat hioa tautia aiheuttavia mutaatioita nopeammin, koska he voivat nyt yhdistää mutaatiot ENCODE-tietokannasta löytyviin toiminnallisiin sekvensseihin. Yhdistämällä nämä kaksi, tutkijoiden ja lääkäreiden pitäisi pystyä ymmärtämään, miksi tietty mutaatio aiheuttaa sairauden, joka auttaa kehittämään asianmukaisia hoitoja.

vaikka ENCODE-projekti oli merkittävä tieteellisen yhteistyön taidonnäyte, on hankkeen ympärillä edelleen kiistaa . Jotkut tutkijat ovat ilmaisseet huolensa siitä, että hankkeeseen käytetyt rahat (yli 200-300 miljoonaa dollaria) olisivat voineet olla hyödyllisempiä yksittäisille tutkijoille myönnettävien apurahojen kannalta. Jotkut biologit ovat myös ilmaisseet huolensa siitä, miten hankkeen tulokset esiteltiin yleisölle, sekä projektiin liittyvän hypen että itse tulosten osalta. Koska tämäntyyppiset tutkimukset ovat kalliita ja monimutkaisia, on tärkeää, että tutkijat esittävät puolueettoman näkökulman. Huolellisen yleisölle esittämisen tarpeellisuuden osoitti Nasan tutkijoiden äskettäin julkaiseman tutkielman aiheuttama hype bakteereista, jotka voisivat käyttää arseenia tavalla, jota ei ollut ennen havaittu. Ilmoitettuaan löytäneensä jotain uutta ja jännittävää, jopa siinä määrin, että piti lehdistötilaisuuden, itse syntynyt hype lopulta romahti löydösten kumottua . Kuten minkä tahansa uuden suuren mittakaavan hankkeen kohdalla, sekä tutkijoiden että yleisön on oltava kärsivällisiä arvon osoittamisessa, kunnes hankkeen todelliset hyödyt voidaan toteuttaa.

eräs toinen suuri kritiikki ENCODE-ryhmän julkaisemia tutkielmia kohtaan keskittyi lauseen ”biologinen funktio.”Main ENCODE-päiväkirjapaperissa kirjoittajat totesivat, että he olivat antaneet biologisen funktion noin 80 prosentille ihmisen perimästä . Kuten toiset ovat panneet merkille, vain se, että jokin tietty DNA-jakso sitoo proteiinia tai liittyy johonkin kemialliseen muunteluun, ei välttämättä merkitse, että se olisi toimiva tai hyödyllinen. Monet proteiineihin sitoutumistapahtumat ovat satunnaisia ja merkityksettömiä. On myös tiedetty jo jonkin aikaa, että suuri osa koodaamattomasta ”junk”-DNA: sta ei todellisuudessa ole roskaa, joten jotkut tutkijat ovat kyseenalaistaneet koodauksen tulosten uutuuden. Kaikki nämä huolenaiheet ovat varmasti perusteltuja, ja itse asiassa hankkeeseen liittyvä keskustelu osoittaa tarkasti, miten tieteen pitäisi toimia.

kestää todennäköisesti vuosia ymmärtää täysin, miten ENCODE on auttanut tiedeyhteisöä, mutta tämä hanke on kuitenkin korostanut, kuinka tärkeää on tutkia koko genomia, ei vain ymmärtää, miksi meillä on niin paljon ei-koodaavaa DNA: ta jokaisessa solussa, mutta myös kertoa meille aiheista, jotka ovat merkityksellisiä suurimmalle osalle ihmisistä, erityisesti siitä, miten harvinaiset tai moninkertaiset geneettiset mutaatiot johtavat sairauksien kehittymiseen.

Jonathan Henninger on Harvardin yliopiston biologisten ja biolääketieteellisten tieteiden ohjelman jatko-opiskelija.

lisätietoja

Videokoordinaattori Ewan Birney kertoo projektin päätavoitteista.

Human Genome Project Kotisivu <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>

koodaa Kotisivu <http://www.genome.gov/10005107>

koodaa Nature-lehdessä julkaistuja artikkeleita<http://www.nature.com/encode/>

”mystisen DNA: n palaset, jotka ovat kaukana ’roskasta’, ovat ratkaisevassa asemassa”, Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>

reddit.com ”Ask me Anything” koodaa projektin avustajat <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>

”suuren tieteen sokaisema: Opin ENCODE on, että projektit kuten ENCODE eivät ole hyvä idea, ” Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>

”mitä koodaus sanoo?”kirjoittanut Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>

”Uudet Tiedepaperit todistavat, että NASA epäonnistui pahasti edistäessään oletettavasti maata järisyttävää löytöä, joka ei ollut”, Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>

”perimän koon kehitys joillakin viljellyillä Allium-lajeilla.”Ricroch ym., Genomi 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>

”yhdennetty tietosanakirja DNA-elementeistä ihmisen genomissa.”The ENCODE Project Consortium, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>

Vastaa

Sähköpostiosoitettasi ei julkaista.