a testünket alkotó sejtek billióinak, az agyban jeleket továbbító neuronoktól az immunsejtekig, amelyek segítenek megvédeni testünket az állandó külső támadásoktól, szinte mindegyik ugyanazt a 3 milliárd DNS – bázispárt tartalmazza, amelyek az emberi genomot alkotják-genetikai anyagunk egészét. Figyelemre méltó, hogy a test több mint 200 sejttípusa nagyon eltérően értelmezi ezt az azonos információt az életben tartáshoz szükséges funkciók végrehajtása érdekében. Ez azt mutatja, hogy túl kell néznünk a DNS szekvenciáján, hogy megértsük, hogyan működik egy szervezet és sejtjei.
a genom egészének tanulmányozása
tehát hogyan kezdjük megérteni a genom egészét? 2000-ben az emberi genom projekt biztosította az emberi genom első teljes szekvenciáját . Az összes genomot alkotó DNS négy kapcsolódó vegyi anyagból áll, amelyek nukleinsavak – adenin (A), guanin (G), citozin (C) és timin (T). A DNS-szekvencia ezeknek a nukleinsavaknak (más néven “bázisoknak” vagy “bázispároknak”) a húrja, amelyek kémiailag kapcsolódnak egymáshoz, például agattcag, amelyet lineárisan “olvasnak ki”. A DNS szekvenciájának meghatározására szolgáló kísérleti módszerek, valamint néhány nagy teljesítményű számítógép segítségével végül a, G, C és T sorozatokkal teli szekvenciát adtak a tudósoknak, amelyek 3 milliárd betű hosszúak voltak. Abban az időben a kutatók úgy gondolták, hogy eleget tudnak arról, hogy a DNS hogyan működik a genom funkcionális egységeinek, más néven géneknek a keresésében. A gén egy DNS-karakterlánc, amely kódolja a fehérje előállításához szükséges információkat, amely ezután valamilyen funkciót végez a sejtjeinkben.
az emberi genom projekt után a tudósok megállapították, hogy a genomban körülbelül 20 000 gén található, ezt a számot néhány kutató már megjósolta. Figyelemre méltó, hogy ezek a gének csak körülbelül 1-2% – át teszik ki a 3 milliárd bázispár DNS-nek . Ez azt jelenti, hogy a teljes genomunk 98-99% – ának valami mást kell tennie, mint a fehérjék kódolását-a tudósok ezt nem kódoló DNS-nek hívják. Képzelje el, hogy több kötet enciklopédiát kapnak, amelyek 100 oldalanként egy koherens mondatot tartalmaznak angolul, ahol a tér többi része értelmezhetetlen véletlenszerű betűket és karaktereket tartalmazott. Valószínűleg elkezdene azon gondolkodni, hogy miért voltak ott azok a véletlenszerű betűk és karakterek, ami pontosan az a probléma, amely évtizedek óta sújtja a tudósokat.
miért nem használják genomunk nagy részét fehérje kódolására? Ez az extra DNS szolgál valamilyen funkcionális célt? Ahhoz, hogy képet kapjunk arról, hogy szükségünk van-e erre az extra DNS-re, megnézhetjük a közeli rokon fajokat, amelyek genommérete vadul változó. Például az Allium nemzetség, amely magában foglalja a hagymát, a mogyoróhagymát és a fokhagymát, genommérete 10-20 milliárd bázispár között mozog. Nagyon valószínűtlen, hogy ilyen nagy mennyiségű extra DNS hasznos lenne egy fajban, nem pedig genetikai unokatestvérében, talán azzal érvelve, hogy a genom nagy része nem hasznos . Ezenkívül ezek a genomok sokkal nagyobbak, mint az emberi genom, ami vagy azt jelzi, hogy a hagyma nagyon összetett, vagy valószínűbb, hogy a genom mérete nem mond semmit arról, hogy a szervezet mennyire összetett vagy hogyan működik.
a genom mely részei működnek?
a DNS szekvenálásának és a kapott szekvenciák elemzésére szolgáló számítógépek (együttesen bioinformatika) használatának elképesztő technológiai fejlődése miatt az emberi genom projekthez hasonló nagyszabású projektek elkezdték feltárni az emberi genom összetettségét és méretét. Egy konkrét projekt, kódolás, vagy a DNS-elemek enciklopédiája, az emberi genom egészének funkciójának felkutatására indult . Más szavakkal, míg az emberi genom projekt az emberi élet tervrajzainak elolvasását tűzte ki célul, a kódolás célja annak kiderítése volt, hogy e kék nyomatok mely részei csinálnak valami funkcionálisat. A világ minden tájáról származó laboratóriumok egy csoportja dolgozik a 2003-ban indult ENCODE projekten, amelyet a Nemzeti Humán Genom Kutatóintézet Finanszíroz. Csak ebben a hónapban a konzorcium több mint 30 tudományos folyóiratban publikálta főbb eredményeit, és a média jelentős figyelmet kapott .
1. ábra. A teljes emberi genomot alkotó 46 kromoszóma (felső). Minden kromoszóma (középső) egy hosszú, folyamatos DNS-szakasz, amelyet génekkel szórnak meg, amelyek kódolják a fehérje előállításához szükséges információkat. A gének csak a genom kis százalékát teszik ki, a többi pedig intergenikus régiókból (alul) áll, amelyek nem kódolják a fehérjéket. Ezek azok a régiók, amelyek a kódolást leginkább érdekli a tanulás. (Kép jóváírás: Wikimedia Commons; User – Plociam)
a kódolás céljának jobb megértése érdekében először hasznos megérteni, hogy mit értünk “funkcionális” alatt.”Ne feledje, hogy a gének kódolják a fehérjék előállításához szükséges információkat, amelyek azok a molekulák, amelyek a sejtben funkciókat látnak el. Az, hogy egy adott gén végül mennyi fehérjét termel, vagy hogy megengedett-e egyáltalán előállítani, a génexpressziója határozza meg. A genom esetében minden funkcionális, nem fehérjét kódoló szekvencia feltehetően valamilyen hatással lenne a gén expresszálódására; vagyis egy funkcionális szekvencia valamilyen módon szabályozza, hogy mennyi fehérje készül egy adott kódoló DNS-szekvenciából. A fehérjék összetételének különbsége segíti a sejt identitását. Mivel minden sejt pontosan ugyanazt a DNS-t és genomot tartalmazza, ezért a génexpresszió szintje határozza meg, hogy egy sejt neuron, bőr vagy akár immunsejt lesz-e.
míg a humán genom projekt elsősorban a DNS-szekvenálás technikáját használta az emberi genom kiolvasására, valójában ezeknek a DNS-bázisoknak a szerepeinek hozzárendelése és jellemzése sokkal szélesebb körű kísérleti technikákat igényel. Az ENCODE projekt hat megközelítést alkalmazott a funkciók hozzárendeléséhez a genom bizonyos szekvenciáihoz. Ezek a megközelítések magukban foglalták többek között az RNS szekvenálását, a DNS-hez hasonló és abból készült molekulát, amely utasításokat hordoz a fehérjék előállítására, valamint a DNS azon régióinak azonosítását, amelyek kémiailag módosíthatók vagy fehérjékhez köthetők . A kutatók azért választották ezeket a módszereket, mert mindegyik nyomot ad arról, hogy egy adott szekvencia funkcionális-e (azaz befolyásolja-e a génexpressziót). Ha a sejt energiát fordít arra, hogy RNS-t készítsen a DNS-ből, akkor valószínűleg valamire használják. Ezenkívül a DNS-hez kötődő fehérjék befolyásolják, hogy egy gén expresszálódik-e, és a DNS kémiai módosításai szintén megakadályozhatják vagy fokozhatják a génexpressziót.
ezek a megközelítések képesek azonosítani a genomban lévő szekvenciákat, amelyek valamilyen biokémiai aktivitással rendelkeznek, és a projekt hasznosságának növelése érdekében a laboratóriumok ezeket a technikákat több sejttípusban végezték, hogy figyelembe vegyék a természetes variabilitást. Végül mit találtak? A hat megközelítés alkalmazásával a projekt képes volt azonosítani a biokémiai aktivitást a genomban lévő bázisok 80% – ánál . Bár ez nem feltétlenül jelenti azt, hogy az összes előre jelzett funkcionális régió valóban célt szolgál, határozottan azt sugallja, hogy sokkal több biológiai szerepe van, mint a géneket alkotó DNS-ünk 1% – ának. Sok tudós már gyanította ezt, de a ENCODE segítségével most van egy nagy, szabványosított adatkészletünk, amelyet az egyes laboratóriumok felhasználhatnak ezeknek a potenciálisan funkcionális területeknek a vizsgálatára. Hasonlóképpen, mivel ez egy olyan nagy projekt volt, szigorú minőségellenőrzéssel, biztosak lehetünk abban, hogy az adatok reprodukálhatók és megbízhatóak.
hasznosság és ellentmondás
bár a projektből származó fő előnyök néhány évig nem valósulhatnak meg (hasonlóan az emberi genom projekthez), jelenleg már vannak olyan területek, ahol ez a hatalmas adatkészlet hasznos lesz. Számos olyan betegség létezik, amelyek látszólag genetikai mutációkkal társulnak; azonban a felfedezett mutációk közül sok nem a tényleges géneken belül található, ami megnehezíti annak megértését, hogy a mutációk milyen funkcionális változásokat okoznak. Az ENCODE projekt adatainak felhasználásával a kutatók gyorsabban tudják csiszolni a betegséget okozó mutációkat, mivel most már társíthatják a mutációkat a ENCODE adatbázisban található funkcionális szekvenciákkal. E kettő összehangolásával a kutatóknak és az orvosoknak meg kell tudniuk érteni, hogy egy adott mutáció miért okoz betegséget, ami segít a megfelelő terápiák kidolgozásában.
bár az ENCODE projekt a tudományos együttműködés figyelemre méltó bravúrja volt, még mindig vita folyik a projekt körül . Egyes tudósok aggodalmuknak adtak hangot amiatt, hogy a projektre fordított pénz (200-300 millió dollár felett) hasznosabb lehetett volna az egyes kutatók támogatásainak ellátásában. Egyes biológusok aggodalmuknak adtak hangot azzal kapcsolatban is, hogy a projekt eredményeit miként mutatták be a nyilvánosság számára, mind a projektet körülvevő hype, mind maguk az eredmények szempontjából. Az ilyen típusú tanulmányok költsége és összetettsége miatt fontos, hogy a tudósok pártatlan perspektívát mutassanak be. A nyilvánosság számára történő gondos bemutatás szükségességét a NASA tudósai által nemrégiben közzétett, olyan baktériumokról szóló cikk körüli hype bizonyította, amelyek az arzént olyan módon használhatják fel, amelyet még soha nem figyeltek meg. Miután bejelentették, hogy felfedeztek valami újat és izgalmasat, még a sajtótájékoztató összehívásáig is, az Ön által generált hype végül felrobbant, miután az eredményeket végül megcáfolták . Mint minden új nagyszabású projektnél, mind a tudósoknak, mind a nyilvánosságnak türelmesnek kell lennie az érték hozzárendelésében, amíg a projekt valódi előnyei meg nem valósulnak.
az ENCODE group által közzétett cikkek egy másik jelentős kritikája a “biológiai funkció” kifejezés jelentésére összpontosított.”A fő ENCODE folyóiratcikkben a szerzők kijelentették, hogy biológiai funkciót rendeltek az emberi genom körülbelül 80% – ára . Mint mások megjegyezték, csak azért, mert egy adott DNS-szekvencia megköti a fehérjét, vagy valamilyen kémiai módosítással társul, nem feltétlenül jelenti azt, hogy funkcionális vagy hasznos szerepet tölt be. Sok fehérjekötődési esemény véletlenszerű és következménytelen. Egy ideje ismert, hogy a nem kódoló “szemét” DNS nagy része valójában nem szemét, ezért egyes kutatók megkérdőjelezték a kódolás eredményeinek újdonságát. Mindezek az aggodalmak minden bizonnyal indokoltak, és valójában a projektet körülvevő beszélgetés pontosan megmutatja, hogy a tudománynak hogyan kell működnie.
valószínűleg évekbe telik, hogy teljes mértékben megértsük, hogyan segített a kódolás a tudományos közösségnek, Mindazonáltal ez a projekt rávilágított arra, hogy mennyire fontos a genom egészének tanulmányozása, nem csak annak megértése, hogy miért van olyan sok nem kódoló DNS minden egyes sejtben, hanem az emberek többsége számára releváns témákról is tájékoztatni minket, nevezetesen arról, hogy a ritka vagy többszörös genetikai mutációk hogyan vezetnek a betegségek kialakulásához.
Jonathan Henninger a Harvard Egyetem Biológiai és Biomedical Sciences programjának végzős hallgatója.
további információk
a Video – ENCODE vezető koordinátora, Ewan Birney ismerteti a projekt fő céljait.
Humán Genom projekt honlapja <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
kódolás honlap <http://www.genome.gov/10005107>
a Nature-ben megjelent cikkek kódolása<http://www.nature.com/encode/>
“a rejtélyes DNS darabjai, messze a “szeméttől”, döntő szerepet játszanak, “Gina Kolata, A New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com “kérdezz bármit” a ENCODE projekt közreműködőivel <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
“elvakította a nagy tudomány: A kódolásból megtanultam, hogy az olyan projektek, mint a kódolás, nem jó ötlet” – írta Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
“mit mond a kódolás?”Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
“az új tudományos dokumentumok bizonyítják, hogy a NASA nagy kudarcot vallott az állítólag Földrázó felfedezés előmozdításában, amely nem volt,” írta Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
“a genom méretének alakulása néhány termesztett Allium fajon.”Ricroch et al., Genom 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
“a DNS-elemek integrált enciklopédiája az emberi genomban.”Az ENCODE projekt konzorcium, Természet 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>