din trilioanele de celule care compun corpul nostru, de la neuronii care transmit semnale în creier până la celulele imune care ajută la apărarea corpului nostru de asaltul extern constant, aproape fiecare conține aceleași 3 miliarde de perechi de baze ADN care alcătuiesc genomul uman – întregul material genetic. Este remarcabil faptul că fiecare dintre cele peste 200 de tipuri de celule din organism interpretează această informație identică foarte diferit pentru a îndeplini funcțiile necesare pentru a ne menține în viață. Acest lucru demonstrează că trebuie să privim dincolo de secvența ADN-ului însuși pentru a înțelege cum funcționează un organism și celulele sale.
studierea genomului ca întreg
Deci, cum începem să înțelegem genomul ca întreg? În 2000, Proiectul genomului uman a furnizat prima secvență completă a unui genom uman . ADN – ul care alcătuiește toate genomurile este compus din patru substanțe chimice înrudite numite acizi nucleici-adenină (a), guanină (G), citozină (C) și timină (T). O secvență de ADN este un șir de acești acizi nucleici (numiți și „baze” sau „perechi de baze”) care sunt atașați chimic unul de celălalt, cum ar fi AGATTCAG, care este „citit” liniar. Metodele experimentale de determinare a secvenței ADN, împreună cu ajutorul unor computere puternice, au dat în cele din urmă oamenilor de știință o secvență plină de A, G, C și T, care avea o lungime de 3 miliarde de Litere. La acea vreme, cercetătorii au crezut că știu suficient despre modul în care ADN-ul funcționează pentru a căuta unitățile funcționale ale genomului, altfel cunoscute sub numele de gene. O genă este un șir de ADN care codifică informațiile necesare pentru a face o proteină, care apoi continuă să îndeplinească o anumită funcție în celulele noastre.
după proiectul genomului uman, oamenii de știință au descoperit că există aproximativ 20.000 de gene în genom, un număr pe care unii cercetători îl preziseseră deja. În mod remarcabil, aceste gene cuprind doar aproximativ 1-2% din cele 3 miliarde de perechi de baze de ADN . Aceasta înseamnă că oriunde între 98-99% din întregul nostru genom trebuie să facă altceva decât să codifice proteinele – oamenii de știință numesc acest ADN necodificator. Imaginați-vă că vi se oferă mai multe volume de enciclopedii care conțineau o propoziție coerentă în limba engleză la fiecare 100 de pagini, unde restul spațiului conținea o brumă de Litere și caractere aleatorii neinterpretabile. Probabil că ați începe să vă întrebați de ce toate acele litere și caractere aleatorii erau acolo în primul rând, care este problema exactă care a afectat oamenii de știință de zeci de ani.
de ce atât de mult din genomul nostru nu este folosit pentru a codifica proteinele? Acest ADN suplimentar are vreun scop funcțional? Pentru a începe să ne facem o idee dacă avem nevoie de tot acest ADN suplimentar, ne putem uita la specii strâns legate care au dimensiuni ale genomului extrem de variate. De exemplu, genul Allium, care include ceapă, ceapă eșalotă și usturoi, are dimensiuni ale genomului variind de la 10 la 20 de miliarde de perechi de baze. Este foarte puțin probabil ca o cantitate atât de mare de ADN suplimentar să fie utilă la o specie și nu la vărul său genetic, argumentând probabil că o mare parte din genom nu este utilă . Mai mult, acești genomi sunt mult mai mari decât genomul uman, ceea ce indică fie că o ceapă este extrem de complexă, fie mai probabil că dimensiunea unui genom nu spune nimic despre cât de complex este organismul sau cum funcționează.
ce părți ale genomului sunt funcționale?
datorită progreselor tehnologice uimitoare în secvențierea ADN-ului și în utilizarea computerelor pentru a ajuta la analiza secvențelor rezultate (cunoscute colectiv sub numele de bioinformatică), proiecte la scară largă similare cu Proiectul genomului uman au început să dezvăluie complexitatea și dimensiunea genomului uman. Un proiect special, ENCODE, sau enciclopedia elementelor ADN, și-a propus să găsească funcția întregului genom uman . Cu alte cuvinte, în timp ce proiectul genomului uman și-a propus să citească planurile vieții umane, scopul ENCODE a fost să afle care părți ale acestor amprente albastre fac de fapt ceva funcțional. Un grup de laboratoare din întreaga lume lucrează la proiectul ENCODE, care a început în 2003 și este finanțat de Institutul Național de cercetare a Genomului Uman. Chiar în această lună, consorțiul și-a publicat principalele rezultate în peste 30 de articole de revistă științifică și i s-a acordat o atenție semnificativă de către mass-media .
Figura 1. Cei 46 de cromozomi (de sus) care compun întregul genom uman. Fiecare cromozom (mijloc) este o întindere lungă și continuă de ADN presărată cu gene care codifică informațiile necesare pentru a face o proteină. Genele reprezintă doar un procent mic din genom, iar restul este compus din regiuni intergenice (partea de jos) care nu codifică proteinele. Acestea sunt regiunile care codifică este cel mai interesat de studiu. (Credit imagine: Wikimedia Commons; user-Plociam)
pentru a aprecia mai bine scopul ENCODE, este mai întâi util să înțelegem ce înțelegem prin „funcțional.”Amintiți-vă că genele codifică informațiile necesare pentru a produce proteine, care sunt moleculele care îndeplinesc funcții în celulă. Cantitatea de proteine pe care o anumită genă o produce în cele din urmă sau dacă este permisă să o producă deloc, este determinată de expresia genelor sale. În cazul genomului, orice secvență de codificare non-proteică care este funcțională ar avea probabil un anumit efect asupra modului în care este exprimată o genă; adică, o secvență funcțională reglează într-un fel cât de multă proteină este obținută dintr-o secvență ADN de codificare dată. Este diferența în compoziția proteinelor care ajută la conferirea identității unei celule. Deoarece fiecare celulă conține exact același ADN și genom, nivelurile de exprimare a genelor determină dacă o celulă va fi un neuron, o piele sau chiar o celulă imună.
întrucât proiectul genomului uman a folosit în primul rând tehnica secvențierii ADN pentru a citi genomul uman, atribuirea de roluri și caracterizarea funcției acestor baze ADN necesită o gamă mult mai largă de tehnici experimentale. Proiectul ENCODE a folosit șase abordări pentru a ajuta la atribuirea funcțiilor anumitor secvențe din genom. Aceste abordări au inclus, printre altele, secvențierea ARN, o moleculă similară și făcută din ADN care poartă instrucțiuni pentru fabricarea proteinelor și identificarea regiunilor ADN care ar putea fi modificate chimic sau legate de proteine . Cercetătorii au ales aceste metode deoarece fiecare oferă indicii dacă o anumită secvență este funcțională (adică dacă influențează expresia genelor). Dacă celula consumă energie pentru a face ARN din ADN, atunci este probabil să fie folosită pentru ceva. În plus, proteinele care se leagă de ADN influențează dacă o genă este exprimată, iar modificările chimice ale ADN-ului pot preveni sau îmbunătăți expresia genelor.
fiecare dintre aceste abordări poate identifica secvențe din genom care au un fel de activitate biochimică și, pentru a adăuga utilitatea acestui proiect, laboratoarele au efectuat aceste tehnici în mai multe tipuri de celule pentru a ține cont de variabilitatea naturală. Deci, ce au găsit în cele din urmă? Folosind cele șase abordări, proiectul a fost capabil să identifice activitatea biochimică pentru 80% din bazele din genom . Deși acest lucru nu înseamnă neapărat că toate aceste regiuni funcționale prezise servesc de fapt unui scop, sugerează cu tărie că există un rol biologic pentru mult mai mult decât 1% din ADN-ul nostru care formează gene. Mulți oameni de știință au suspectat deja acest lucru, dar cu ENCODE, avem acum un set mare de date standardizate care poate fi utilizat de laboratoare individuale pentru a cerceta aceste zone potențial funcționale. La fel, deoarece a fost un proiect atât de mare, cu controale stricte de calitate, putem fi siguri că datele sunt reproductibile și fiabile.
utilitate și controversă
deși principalele beneficii care decurg din acest proiect nu pot fi realizate de câțiva ani (similar cu Proiectul genomului uman), în acest moment există deja unele zone în care acest set enorm de date va fi util. Există o serie de boli care par a fi asociate cu mutații genetice; cu toate acestea, multe dintre mutațiile care au fost descoperite nu se încadrează în genele reale, ceea ce face dificilă înțelegerea modificărilor funcționale cauzate de mutații. Folosind datele din proiectul ENCODE, cercetătorii vor putea să se perfecționeze mai repede asupra mutațiilor cauzatoare de boli, deoarece acum pot asocia mutațiile cu secvențe funcționale găsite în baza de date ENCODE. Prin potrivirea acestor două, cercetătorii și medicii ar trebui să poată începe să înțeleagă de ce o anumită mutație provoacă o boală, ceea ce va ajuta la dezvoltarea terapiilor adecvate.
deși proiectul ENCODE a fost o realizare remarcabilă de colaborare științifică, există încă controverse în jurul proiectului . Unii oameni de știință și-au exprimat îngrijorarea că banii cheltuiți pentru acest proiect (peste 200-300 de milioane de dolari) ar fi putut fi mai utili în furnizarea de granturi cercetătorilor individuali. Unii biologi și-au exprimat, de asemenea, îngrijorarea cu privire la modul în care rezultatele proiectului au fost prezentate publicului, atât în ceea ce privește hype-ul din jurul proiectului, cât și rezultatele în sine. Datorită cheltuielilor și complexității acestor tipuri de studii, este important ca oamenii de știință să prezinte o perspectivă imparțială. Necesitatea unei prezentări atente către public a fost demonstrată de hype-ul din jurul unei lucrări recente publicate de oamenii de știință NASA despre bacteriile care ar putea folosi arsenicul într-un mod care nu a mai fost observat până acum. După ce au anunțat că au descoperit ceva nou și interesant, chiar până la punctul de a convoca o conferință de presă, hype-ul auto-generat a implodat în cele din urmă după ce constatările au fost în cele din urmă respinse . Ca și în cazul oricărui nou proiect la scară largă, atât oamenii de știință, cât și publicul trebuie să aibă răbdare în atribuirea valorii până când adevăratele beneficii ale proiectului pot fi realizate.
o altă critică majoră a lucrărilor publicate de grupul ENCODE s-a concentrat pe semnificația expresiei „funcția biologică.”În lucrarea principală ENCODE journal, autorii au declarat că au atribuit o funcție biologică la aproximativ 80% din genomul uman . După cum au remarcat alții, doar pentru că o anumită secvență de ADN leagă proteina sau este asociată cu unele modificări chimice nu înseamnă neapărat că este funcțională sau are un rol util. Multe evenimente de legare a proteinelor sunt aleatorii și neimportante. De asemenea, se știe de ceva timp că o mare parte din ADN-ul „junk” necodificat nu este de fapt junk, așa că unii cercetători au pus sub semnul întrebării noutatea rezultatelor ENCODE. Toate aceste preocupări sunt cu siguranță justificate și, de fapt, conversația din jurul proiectului demonstrează exact cum ar trebui să funcționeze știința.
cel mai probabil va dura ani de zile pentru a înțelege pe deplin modul în care ENCODE a ajutat comunitatea științifică, dar cu toate acestea, acest proiect a subliniat cât de important este studierea genomului în ansamblu, nu numai pentru a înțelege de ce avem atât de mult ADN necodificator în fiecare celulă, ci și pentru a ne informa despre subiecte relevante pentru majoritatea oamenilor, în special cât de rare sau multiple mutații genetice duc la dezvoltarea bolii.
Jonathan Henninger este absolvent al Programului de științe Biologice și Biomedicale de la Universitatea Harvard.
informații suplimentare
coordonatorul principal al Video – ENCODE, Ewan Birney, discută principalele obiective ale proiectului.
pagina principală a proiectului genomului uman <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
codifica pagina de start <http://www.genome.gov/10005107>
codificați articolele publicate în Nature <http://www.nature.com/encode/>
„bucăți de ADN misterios, departe de „Junk”, joacă un rol Crucial”, Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com „Întreabă-mă orice” cu colaboratorii proiectului ENCODE<http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
„orbit de marea știință: Lecția pe care am învățat-o de la ENCODE este că proiecte precum ENCODE nu sunt o idee bună”, de Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
„ENCODE spune ce?”de Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
„noile lucrări științifice dovedesc că NASA a eșuat în promovarea presupusei descoperiri cutremurătoare a Pământului care nu a fost”, de Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
„evoluția dimensiunii genomului la unele specii de Allium cultivate.”Ricroch și colab., Genom 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
„o enciclopedie integrată a elementelor ADN din genomul uman.”Consorțiul proiectului ENCODE, natura 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>