99 procent ... lidského genomu-věda ve zprávách

z bilionů buněk, které tvoří naše tělo, od neuronů, které přenášejí signály v celém mozku do imunitních buněk, které pomáhají bránit naše těla před neustálým vnějším útokem, téměř každý obsahuje stejné 3 miliardy párů dna bází, které tvoří lidský genom-celý náš genetický materiál. Je pozoruhodné, že každý z více než 200 typů buněk v těle interpretuje tuto identickou informaci velmi odlišně, aby mohl vykonávat funkce nezbytné k udržení nás naživu. To ukazuje, že se musíme dívat za sekvenci samotné DNA, abychom pochopili, jak organismus a jeho buňky fungují.

studium genomu jako celku

jak tedy začneme chápat genom jako celek? V roce 2000 projekt lidského genomu poskytl první úplnou sekvenci lidského genomu . DNA, která tvoří všechny genomy, se skládá ze čtyř příbuzných chemikálií nazývaných nukleové kyseliny-adenin (A), guanin (G), cytosin (C) a thymin (T). Sekvence DNA je řetězec těchto nukleových kyselin (nazývaných také „báze“ nebo „páry bází“), které jsou chemicky připojeny k sobě, jako je AGATTCAG, který je „přečten“ lineárně. Experimentální metody k určení sekvence DNA, spolu s pomocí některých výkonných počítačů, nakonec dal vědcům sekvenci plnou A, G, C, A T to bylo 3 miliardy písmen dlouhé. V době, kdy, vědci si mysleli, že vědí dost o tom, jak DNA pracuje při hledání funkčních jednotek genomu, jinak známý jako geny. Gen je řetězec DNA, který kóduje informace nezbytné k vytvoření proteinu, který pak pokračuje v provádění určité funkce v našich buňkách.

po Projektu lidského genomu vědci zjistili, že v genomu je asi 20 000 genů, což je číslo, které někteří vědci již předpovídali. Pozoruhodné je, že tyto geny obsahují pouze asi 1-2% z 3 miliard párů bází DNA . To znamená, že kdekoli od 98-99% celého našeho genomu musí dělat něco jiného než kódování proteinů-vědci nazývají tuto nekódující DNA. Představte si, že dostanete několik svazků encyklopedií, které obsahovaly souvislou větu v angličtině každých 100 stránek, kde zbytek prostoru obsahoval roztříštění nepřehledných náhodných písmen a znaků. Pravděpodobně byste se začali ptát, proč tam byla všechna ta náhodná písmena a znaky, což je přesný problém, který trápí vědce po celá desetiletí.

proč se tolik našeho genomu nepoužívá ke kódování bílkovin? Má tato DNA navíc nějaký funkční účel? Abychom získali představu o tom, zda potřebujeme všechny tyto další DNA, můžeme se podívat na úzce příbuzné druhy, které mají divoce různé velikosti genomu. Například rod Allium, který zahrnuje cibuli, šalotku a česnek, má velikosti genomu v rozmezí od 10 do 20 miliard párů bází. Je velmi nepravděpodobné, že by tak velké množství další DNA bylo užitečné u jednoho druhu a ne u jeho genetického bratrance, možná argumentovat, že velká část genomu není užitečná . Kromě toho jsou tyto genomy mnohem větší než lidský genom, což naznačuje, že cibule je vysoce složitá, nebo je pravděpodobnější, že velikost genomu neříká nic o tom, jak složitý je organismus nebo jak funguje.

které části genomu jsou funkční?

díky úžasnému technologickému pokroku v sekvenování DNA a používání počítačů k analýze výsledných sekvencí (souhrnně známých jako bioinformatika) začaly rozsáhlé projekty podobné Projektu lidského genomu odhalovat složitost a velikost lidského genomu. Jeden konkrétní projekt, ENCODE, nebo encyklopedie prvků DNA, stanovil najít funkci celého lidského genomu . Jinými slovy, zatímco Projekt lidského genomu si stanovil přečíst plány lidského života, cílem ENCODE bylo zjistit, které části těchto modrých otisků skutečně dělají něco funkčního. Skupina laboratoří z celého světa pracuje na projektu ENCODE, který začal v roce 2003 a je financován Národním institutem pro výzkum lidského genomu. Právě tento měsíc konsorcium zveřejnilo své hlavní výsledky ve více než 30 článcích vědeckých časopisů a média mu věnovala značnou pozornost .

Obrázek 1. 46 chromozomů (top), které tvoří celý lidský genom. Každý chromozom (střední) je dlouhý, nepřetržitý úsek DNA posypaný geny, které kódují informace nezbytné k vytvoření proteinu. Geny tvoří pouze malé procento genomu a zbytek se skládá z mezigenních oblastí (dole), které nekódují proteiny. Jedná se o regiony, které ENCODE je největší zájem o studium. (Image Credit: Wikimedia Commons; User – Plociam)

abychom lépe ocenili cíl ENCODE, je nejprve užitečné pochopit, co máme na mysli pod pojmem „funkční“.“Pamatujte, že geny kódují informace nezbytné k výrobě proteinů, což jsou molekuly, které plní funkce v buňce. Kolik proteinu daný gen nakonec vyprodukuje, nebo zda je vůbec možné nějaký vyrobit, je určeno jeho genovou expresí. V případě genomu by jakákoli funkční sekvence bez kódování proteinů pravděpodobně měla nějaký vliv na to, jak je gen exprimován; to znamená, že funkční sekvence nějakým způsobem reguluje, kolik proteinu je vyrobeno z dané kódující sekvence DNA. Je to rozdíl ve složení proteinů, který pomáhá dát buňce její identitu. Protože každá buňka obsahuje přesně stejnou DNA a genom, určují úrovně genové exprese, zda buňka bude neuron, kůže nebo dokonce imunitní buňka.

zatímco Projekt lidského genomu primárně používal techniku sekvenování DNA k přečtení lidského genomu, ve skutečnosti přiřazení rolí a charakterizace funkce těchto dna bází vyžaduje mnohem širší škálu experimentálních technik. Projekt ENCODE použil šest přístupů, které pomohly přiřadit funkce konkrétním sekvencím v genomu. Tyto přístupy zahrnovaly, mimo jiné, sekvenování RNA, molekula podobná a vyrobená z DNA, která nese pokyny pro výrobu proteinů, a identifikace oblastí DNA, které by mohly být chemicky modifikovány nebo vázány proteiny . Vědci si tyto metody vybrali, protože každý z nich dává vodítka, zda je daná sekvence funkční (tj. Pokud buňka vynakládá energii na výrobu RNA z DNA, je pravděpodobné, že se na něco použije. Proteiny, které se váží na DNA, navíc ovlivňují, zda je gen exprimován,a chemické modifikace DNA mohou také zabránit nebo zvýšit expresi genu.

každý z těchto přístupů může identifikovat sekvence v genomu, které mají nějakou biochemickou aktivitu, a aby se zvýšila užitečnost tohoto projektu, laboratoře provedly tyto techniky ve více typech buněk, aby se zohlednila přirozená variabilita. Co tedy nakonec našli? Pomocí šesti přístupů byl projekt schopen identifikovat biochemickou aktivitu pro 80% bází v genomu . I když to nutně neznamená, že všechny tyto předpovídané funkční oblasti skutečně slouží účelu, silně naznačuje, že existuje biologická role pro mnohem více než 1% naší DNA, která tvoří geny. Mnoho vědců to již tušilo, ale s ENCODE máme nyní velký, standardizovaný soubor dat, který mohou jednotlivé laboratoře použít ke zkoumání těchto potenciálně funkčních oblastí. Stejně tak, protože se jednalo o tak velký projekt s přísnými kontrolami kvality, můžeme si být jisti, že data jsou reprodukovatelná a spolehlivá.

užitečnost a kontroverze

ačkoli hlavní výhody vyplývající z tohoto projektu nemusí být realizovány po několik let (podobně jako projekt lidského genomu), v současné době již existují některé oblasti, kde bude tento obrovský soubor dat užitečný. Existuje řada nemocí, které se zdají být spojeny s genetickými mutacemi; mnoho z objevených mutací však není ve skutečných genech, což ztěžuje pochopení toho, jaké funkční změny mutace způsobují. Pomocí dat z projektu ENCODE budou vědci schopni rychleji se zaměřit na mutace způsobující onemocnění, protože nyní mohou mutace spojit s funkčními sekvencemi nalezenými v databázi ENCODE. Porovnáním těchto dvou by vědci a lékaři měli být schopni začít chápat, proč určitá mutace způsobuje onemocnění, což pomůže s vývojem vhodných terapií.

ačkoli projekt ENCODE byl pozoruhodným činem vědecké spolupráce, stále existuje diskuse kolem projektu . Někteří vědci vyjádřili své obavy, že peníze vynaložené na tento projekt (více než 200-300 milionů dolarů) by mohly být užitečnější při poskytování grantů jednotlivým výzkumníkům. Někteří biologové také vyjádřili své obavy ohledně toho, jak byly výsledky projektu prezentovány veřejnosti, a to jak z hlediska humbuku kolem projektu, tak samotných výsledků. Vzhledem k nákladům a složitosti těchto typů studií je důležité, aby vědci představili nestrannou perspektivu. Potřeba pečlivé prezentace veřejnosti byla prokázána humbukem kolem nedávného článku publikovaného vědci NASA o bakteriích, které by mohly používat arsen způsobem, který nikdy předtím nebyl pozorován. Poté, co oznámili, že objevili něco nového a vzrušujícího, a to i do té míry, že svolali tiskovou konferenci, se self-generovaný humbuk nakonec zhroutil poté, co byla zjištění nakonec vyvrácena . Stejně jako u každého nového rozsáhlého projektu musí být vědci i veřejnost trpěliví při přiřazování hodnoty, dokud nebudou realizovány skutečné přínosy projektu.

jedna další velká kritika článků publikovaných skupinou ENCODE se zaměřila na význam fráze “ biologická funkce.“V hlavním časopise ENCODE autoři uvedli, že přiřadili biologickou funkci asi 80% lidského genomu . Jak poznamenali jiní, jen proto, že daná sekvence DNA váže protein nebo je spojena s nějakou chemickou modifikací, nemusí nutně znamenat, že je funkční nebo slouží užitečné roli. Mnoho událostí vázajících proteiny je náhodných a bezvýznamných. Již nějakou dobu je také známo, že většina nekódující“ nevyžádané “ DNA není ve skutečnosti nevyžádaná, takže někteří vědci zpochybnili novost výsledků ENCODE. Všechny tyto obavy jsou jistě oprávněné a ve skutečnosti konverzace obklopující Projekt přesně ukazuje, jak má věda fungovat.

bude s největší pravděpodobností trvat roky, než plně pochopíme, jak ENCODE pomohl vědecké komunitě, ale tento projekt zdůraznil, jak důležité je studovat genom jako celek, nejen pochopit, proč máme v každé buňce tolik nekódující DNA, ale také nás informovat o tématech, která jsou relevantní pro většinu lidí, zejména o tom, jak vzácné nebo mnohočetné genetické mutace vedou k rozvoji onemocnění.

Jonathan Henninger je postgraduální student v programu biologických a biomedicínských věd na Harvardské univerzitě.

další informace

hlavní koordinátor Video – ENCODE Ewan Birney diskutuje o hlavních cílech projektu.

domovská stránka projektu lidský genom <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>

ENCODE Homepage <http://www.genome.gov/10005107>

kódování článků publikovaných v Nature <http://www.nature.com/encode/>

„kousky záhadné DNA, daleko od‘ nevyžádané, ‚hrají klíčovou roli,“ Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>

reddit.com „zeptejte se mě na cokoli“ s přispěvateli projektu ENCODE<http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>

„oslepen velkou vědou: Poučení, které jsem se naučil z ENCODE, je, že projekty jako ENCODE nejsou dobrý nápad, “ Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>

„ENCODE říká co?“od Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>

„nové vědecké dokumenty dokazují, že NASA selhala při propagaci údajně otřeseného objevu země, který nebyl,“ Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>

„vývoj velikosti genomu u některých kultivovaných druhů Allium.“Ricroch et al., Genom 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>

„integrovaná encyklopedie prvků DNA v lidském genomu.“Konsorcium projektu ENCODE, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>

studium genomu jako celku

které části genomu jsou funkční?

užitečnost a kontroverze

další informace

Napsat komentář Zrušit odpověď na komentář