bilionów komórek, które tworzą nasze ciało, od neuronów przekazujących sygnały w mózgu do komórek odpornościowych, które pomagają chronić nasze ciała przed ciągłym zewnętrznym atakiem, prawie każda z nich zawiera te same 3 miliardy par zasad DNA, które tworzą ludzki genom-całość naszego materiału genetycznego. To niezwykłe, że każdy z ponad 200 typów komórek w organizmie interpretuje tę identyczną informację zupełnie inaczej, aby wykonać funkcje niezbędne do utrzymania nas przy życiu. Pokazuje to, że musimy spojrzeć poza sekwencję samego DNA, aby zrozumieć, jak organizm i jego komórki funkcjonują.

badanie genomu jako całości

jak więc zacząć rozumieć Genom jako całość? W 2000 roku Human Genome Project dostarczył pierwszą pełną sekwencję ludzkiego genomu . DNA składające się na wszystkie genomy składa się z czterech powiązanych związków chemicznych zwanych kwasami nukleinowymi – adeniny (a), guaniny (G), cytozyny (C) i tyminy (T). Sekwencja DNA jest ciągiem tych kwasów nukleinowych (zwanych również „zasadami” lub „parami zasad”), które są chemicznie połączone ze sobą, takich jak AGATTCAG, który jest” odczytywany ” liniowo. Eksperymentalne metody określania sekwencji DNA, wraz z pomocą potężnych komputerów, ostatecznie dały naukowcom sekwencję pełną A, G, C i T, która miała 3 miliardy liter. W tym czasie naukowcy sądzili, że wiedzą wystarczająco dużo o tym, jak DNA działa w poszukiwaniu jednostek funkcjonalnych genomu, inaczej znanych jako geny. Gen to ciąg DNA, który koduje informacje niezbędne do wytworzenia białka, które następnie pełni pewne funkcje w naszych komórkach.

po projekcie ludzkiego genomu naukowcy odkryli, że w genomie znajduje się około 20 000 genów, liczba, którą niektórzy badacze już przewidzieli. Co ciekawe, geny te zawierają tylko około 1-2% z 3 miliardów par zasad DNA . Oznacza to, że od 98-99% całego naszego genomu musi robić coś innego niż kodowanie białek – naukowcy nazywają to niekodującym DNA. Wyobraźmy sobie, że otrzymujemy wiele tomów encyklopedii, które zawierały spójne zdanie w języku angielskim co 100 stron, gdzie reszta przestrzeni zawierała odrobinę niezrozumiałych losowych liter i znaków. Pewnie zaczniecie się zastanawiać, dlaczego wszystkie te przypadkowe litery i znaki były tam w pierwszej kolejności, co jest dokładnym problemem, który nękał naukowców od dziesięcioleci.

dlaczego tak wiele naszego genomu nie jest wykorzystywane do kodowania białka? Czy to dodatkowe DNA służy jakiemukolwiek funkcjonalnemu celowi? Aby zorientować się, czy potrzebujemy tego dodatkowego DNA, możemy przyjrzeć się blisko spokrewnionym gatunkom, które mają bardzo różne rozmiary genomu. Na przykład rodzaj Allium, który obejmuje cebulę, szalotki i czosnek, ma rozmiary genomu w zakresie od 10 do 20 miliardów par zasad. Jest bardzo mało prawdopodobne, że tak duża ilość dodatkowego DNA byłaby przydatna u jednego gatunku, a nie u jego genetycznego kuzyna, być może argumentując, że znaczna część genomu nie jest przydatna . Co więcej, te genomy są znacznie większe niż ludzki genom, co wskazuje, że cebula jest bardzo złożona, lub bardziej prawdopodobne, że rozmiar genomu nie mówi nic o tym, jak skomplikowany jest organizm lub jak funkcjonuje.

które części genomu funkcjonują?

ze względu na niesamowity postęp technologiczny w sekwencjonowaniu DNA i użyciu komputerów do analizy otrzymanych sekwencji (powszechnie znanych jako bioinformatyka), projekty na dużą skalę podobne do projektu ludzkiego genomu zaczęły odkrywać złożoność i rozmiar ludzkiego genomu. Jeden szczególny projekt, ENCODE, lub Encyklopedia elementów DNA, określone znaleźć funkcję całości ludzkiego genomu . Innymi słowy, podczas gdy projekt Human Genome miał na celu odczytanie planów ludzkiego życia, celem ENCODE było ustalenie, które części tych niebieskich odcisków rzeczywiście działają. Grupa laboratoriów z całego świata pracuje nad projektem ENCODE, który rozpoczął się w 2003 roku i jest finansowany przez National Human Genome Research Institute. Właśnie w tym miesiącu Konsorcjum opublikowało swoje główne wyniki w ponad 30 artykułach naukowych, a media poświęciły mu znaczną uwagę .

Rysunek 1. 46 chromosomów (Góra), które tworzą cały ludzki genom. Każdy chromosom (środkowy) jest długim, ciągłym odcinkiem DNA posypanym genami, które kodują informacje niezbędne do wytworzenia białka. Geny stanowią tylko niewielki procent genomu, a reszta składa się z regionów międzygenicznych (DNA), które nie kodują białek. Są to regiony, które kodują jest najbardziej zainteresowany studiowaniem. (Źródło: Wikimedia Commons; user-Plociam)

aby lepiej zrozumieć cel kodowania, najpierw pomocne jest zrozumienie, co rozumiemy przez „funkcjonalne.”Pamiętaj, że geny kodują informacje niezbędne do wytwarzania białek, które są cząsteczkami pełniącymi funkcje w komórce. Ile białka dany gen ostatecznie produkuje, lub czy w ogóle można je wyprodukować, zależy od ekspresji genu. W przypadku genomu, każda sekwencja kodująca białko, która jest funkcjonalna, prawdopodobnie miałaby pewien wpływ na sposób ekspresji genu; to znaczy, Sekwencja funkcjonalna w pewien sposób reguluje ilość białka wytwarzanego z danej kodującej sekwencji DNA. To różnica w składzie białek pomaga nadać komórce tożsamość. Ponieważ każda komórka zawiera dokładnie to samo DNA i Genom, to poziom ekspresji genów decyduje o tym, czy komórka będzie neuronem, skórą, czy nawet komórką odpornościową.

podczas gdy Human Genome Project wykorzystywał przede wszystkim technikę sekwencjonowania DNA do odczytu ludzkiego genomu, faktycznie przypisując role i charakteryzując funkcję tych zasad DNA wymaga znacznie szerszego zakresu technik eksperymentalnych. Projekt ENCODE wykorzystał sześć podejść, aby pomóc przypisać funkcje do poszczególnych sekwencji w genomie. Podejścia te obejmowały m.in. sekwencjonowanie RNA, cząsteczki podobnej do DNA i wytworzonej z DNA, która zawiera instrukcje tworzenia białek, oraz identyfikowanie regionów DNA, które mogą być chemicznie modyfikowane lub wiązane przez białka . Naukowcy wybrali te metody, ponieważ każdy z nich daje wskazówki, czy dana sekwencja jest funkcjonalna (to znaczy, czy wpływa na ekspresję genów). Jeśli komórka zużywa energię do produkcji RNA z DNA, prawdopodobnie jest do czegoś wykorzystywana. Dodatkowo, proteiny które oprawiaja DNA wplyw czy gen jest expression, i chemiczne modyfikacje DNA moga rowniez zapobiegac lub wzmacniac geny expression.

każdy z tych podejść może zidentyfikować sekwencje w genomie, które mają jakąś aktywność biochemiczną, i dodać do użyteczności tego projektu, laboratoria przeprowadziły te techniki w wielu typach komórek w celu uwzględnienia naturalnej zmienności. Więc co ostatecznie znaleźli? Wykorzystując sześć podejść, projekt był w stanie zidentyfikować aktywność biochemiczną dla 80% zasad w genomie . Chociaż niekoniecznie oznacza to, że wszystkie te przewidywane regiony funkcjonalne rzeczywiście służą celowi, zdecydowanie sugeruje to, że istnieje biologiczna rola dla znacznie więcej niż 1% naszego DNA, które tworzy geny. Wielu naukowców już to podejrzewało, ale dzięki kodowaniu mamy teraz duży, znormalizowany zestaw danych, który może być używany przez poszczególne laboratoria do badania tych potencjalnie funkcjonalnych obszarów. Podobnie, ponieważ był to tak duży projekt ze ścisłą kontrolą jakości, możemy być pewni, że dane są powtarzalne i wiarygodne.

przydatność i kontrowersje

chociaż główne korzyści wynikające z tego projektu mogą nie być realizowane przez kilka lat (podobnie jak w przypadku projektu ludzkiego genomu), w tej chwili istnieją już pewne obszary, w których ten ogromny zbiór danych będzie przydatny. Istnieje wiele chorób, które wydają się być związane z mutacjami genetycznymi; jednak wiele z mutacji, które zostały odkryte nie są w rzeczywistych genów, co sprawia, że trudno jest zrozumieć, jakie zmiany funkcjonalne powodują mutacje. Korzystając z danych z projektu ENCODE, naukowcy będą mogli szybciej doskonalić mutacje powodujące chorobę, ponieważ mogą teraz skojarzyć mutacje z sekwencjami funkcjonalnymi znajdującymi się w bazie danych ENCODE. Poprzez dopasowanie tych dwóch, naukowcy i lekarze powinni być w stanie zacząć rozumieć, dlaczego dana mutacja powoduje chorobę, co pomoże w opracowaniu odpowiednich terapii.

chociaż projekt ENCODE był niezwykłym wyczynem współpracy naukowej, nadal istnieją kontrowersje wokół projektu . Niektórzy naukowcy wyrazili zaniepokojenie, że pieniądze wydane na ten projekt (w wysokości 200-300 milionów dolarów) mogły być bardziej przydatne w zaopatrywaniu indywidualnych naukowców w granty. Niektórzy biolodzy wyrazili również swoje obawy dotyczące sposobu, w jaki wyniki projektu zostały przedstawione opinii publicznej, zarówno pod względem szumu wokół projektu, jak i samych rezultatów. Ze względu na koszty i złożoność tego typu badań, ważne jest, aby naukowcy przedstawili bezstronną perspektywę. Potrzeba starannej prezentacji opinii publicznej została zademonstrowana przez szum wokół niedawnego artykułu opublikowanego przez naukowców NASA na temat bakterii, które mogą wykorzystywać arsen w sposób, który nigdy wcześniej nie był obserwowany. Po ogłoszeniu, że odkryli coś nowego i ekscytującego, nawet do momentu zwołania konferencji prasowej, samo-wygenerowany hype ostatecznie implodował po tym, jak ustalenia zostały ostatecznie obalone . Podobnie jak w przypadku każdego nowego projektu na dużą skalę, zarówno naukowcy, jak i społeczeństwo muszą być cierpliwi w przypisywaniu wartości, dopóki prawdziwe korzyści z projektu nie zostaną zrealizowane.

kolejna poważna krytyka prac opublikowanych przez grupę ENCODE skupiła się na znaczeniu frazy ” funkcja biologiczna.”W głównym artykule ENCODE journal autorzy stwierdzili, że przypisali funkcję biologiczną około 80% ludzkiego genomu . Jak inni zauważyli, tylko dlatego, że dana sekwencja DNA wiąże białko lub jest związana z jakąś modyfikacją chemiczną, nie musi oznaczać, że jest funkcjonalna lub pełni użyteczną rolę. Wiele zdarzeń wiązania z białkami jest przypadkowych i nieistotnych. Od pewnego czasu wiadomo również, że wiele niekodującego „śmieciowego” DNA nie jest w rzeczywistości śmieciami, więc niektórzy badacze zakwestionowali nowość wyników kodowania. Wszystkie te obawy są z pewnością uzasadnione, a w rzeczywistości rozmowa wokół projektu pokazuje dokładnie, jak powinna działać nauka.

to najprawdopodobniej zajmie lata, aby w pełni zrozumieć, w jaki sposób kodowanie pomogło społeczności naukowej, ale mimo to, projekt ten podkreślił, jak ważne jest badanie genomu jako całości, nie tylko po to, aby zrozumieć, dlaczego mamy tak wiele niekodującego DNA w każdej komórce, ale także aby poinformować nas na tematy, które są istotne dla większości ludzi, zwłaszcza jak rzadkie lub wielokrotne mutacje genetyczne prowadzą do rozwoju choroby.

Jonathan Henninger jest absolwentem programu Nauk Biologicznych i Biomedycznych na Uniwersytecie Harvarda.

więcej informacji

główny koordynator Video – ENCODE Ewan Birney omawia główne cele projektu.

Strona domowa projektu Human Genome <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>

kodowanie strony głównej <http://www.genome.gov/10005107>

kodowanie artykułów opublikowanych w Nature <http://www.nature.com/encode/>

„fragmenty tajemniczego DNA, dalekie od „śmieci”, odgrywają kluczową rolę „Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>

reddit.com „Ask me Anything” with encode Project contributors <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>

„zaślepiony przez Big Science: Lekcja, jakiej nauczyłem się od ENCODE, jest taka, że projekty takie jak ENCODE nie są dobrym pomysłem”, Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>

„kodowanie mówi co?”Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>

„nowe prace naukowe udowadniają, że NASA nie udało się promować rzekomo wstrząsającego ziemią odkrycia, które nie było” Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>

„Ewolucja wielkości genomu w niektórych uprawianych gatunkach Allium.”Ricroch et al., Genome 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>

„zintegrowana encyklopedia elementów DNA w ludzkim genomie.”Konsorcjum projektu ENCODE, natura 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.