Dei trilioni di cellule che compongono il nostro corpo, dai neuroni che trasmettono segnali in tutto il cervello alle cellule immunitarie che aiutano a difendere i nostri corpi da continui attacchi esterni, quasi tutte contengono gli stessi 3 miliardi di coppie di basi di DNA che compongono il genoma umano – l’interezza del nostro materiale genetico. È notevole che ciascuno degli oltre 200 tipi di cellule nel corpo interpreta questa identica informazione in modo molto diverso al fine di svolgere le funzioni necessarie per tenerci in vita. Questo dimostra che dobbiamo guardare oltre la sequenza del DNA stesso per capire come funzionano un organismo e le sue cellule.

Studiare il genoma nel suo complesso

Quindi, come iniziamo a capire il genoma nel suo complesso? Nel 2000, il progetto Genoma umano ha fornito la prima sequenza completa di un genoma umano . Il DNA che compone tutti i genomi è composto da quattro sostanze chimiche correlate chiamate acidi nucleici-adenina (A), guanina (G), citosina (C) e timina (T). Una sequenza di DNA è una stringa di questi acidi nucleici (chiamati anche” basi “o” coppie di basi”) che sono chimicamente attaccati l’uno all’altro, come AGATTCAG, che viene” letto ” linearmente. I metodi sperimentali per determinare la sequenza di DNA, insieme all’aiuto di alcuni potenti computer, alla fine hanno dato agli scienziati una sequenza piena di A, G, C e T lunga 3 miliardi di lettere. A quel tempo, i ricercatori pensavano di sapere abbastanza su come il DNA ha lavorato per cercare le unità funzionali del genoma, altrimenti noti come geni. Un gene è una stringa di DNA che codifica le informazioni necessarie per produrre una proteina, che poi continua a svolgere alcune funzioni all’interno delle nostre cellule.

Dopo il progetto Genoma umano, gli scienziati hanno scoperto che c’erano circa 20.000 geni all’interno del genoma, un numero che alcuni ricercatori avevano già previsto. Sorprendentemente, questi geni comprendono solo circa l ‘ 1-2% dei 3 miliardi di coppie di basi del DNA . Ciò significa che ovunque dal 98-99% del nostro intero genoma deve fare qualcosa di diverso dalla codifica per le proteine – gli scienziati chiamano questo DNA non codificante. Immagina di ricevere più volumi di enciclopedie che contenevano una frase coerente in inglese ogni 100 pagine, dove il resto dello spazio conteneva un’infarinatura di lettere e caratteri casuali non interpretabili. Probabilmente inizieresti a chiederti perché tutte quelle lettere e caratteri casuali erano lì in primo luogo, che è il problema esatto che ha afflitto gli scienziati per decenni.

Perché così tanto del nostro genoma non viene utilizzato per codificare le proteine? Questo DNA extra serve a qualche scopo funzionale? Per iniziare ad avere un’idea se abbiamo bisogno di tutto questo DNA in più, possiamo guardare a specie strettamente correlate che hanno dimensioni del genoma selvaggiamente variabili. Ad esempio, il genere Allium, che comprende cipolle, scalogni e aglio, ha dimensioni del genoma che vanno da 10 a 20 miliardi di coppie di basi. E ‘ molto improbabile che una grande quantità di DNA in più sarebbe utile in una specie e non nel suo cugino genetico, forse sostenendo che gran parte del genoma non è utile . Inoltre, questi genomi sono molto più grandi del genoma umano, il che indica che una cipolla è altamente complessa, o più probabilmente che la dimensione di un genoma non dice nulla su quanto sia complesso l’organismo o come funzioni.

Quali parti del genoma sono funzionali?

A causa di incredibili progressi tecnologici nel sequenziamento del DNA e nell’utilizzo di computer per aiutare ad analizzare le sequenze risultanti (collettivamente note come bioinformatica), progetti su larga scala simili al progetto Genoma umano hanno iniziato a svelare la complessità e le dimensioni del genoma umano. Un progetto particolare, ENCODE, o l’Enciclopedia degli elementi del DNA, si proponeva di trovare la funzione della totalità del genoma umano . In altre parole, mentre il progetto Genoma umano si proponeva di leggere i progetti della vita umana, l’obiettivo di ENCODE era quello di scoprire quali parti di quelle stampe blu effettivamente fare qualcosa di funzionale. Un gruppo di laboratori provenienti da tutto il mondo lavora al progetto ENCODE, iniziato nel 2003 ed è finanziato dal National Human Genome Research Institute. Proprio questo mese, il consorzio ha pubblicato i suoi risultati principali in oltre 30 articoli di riviste scientifiche, ed è stato dato una notevole quantità di attenzione da parte dei media .

Figura 1. I 46 cromosomi (in alto) che compongono l’intero genoma umano. Ogni cromosoma (medio) è un lungo e continuo tratto di DNA cosparso di geni che codificano le informazioni necessarie per produrre una proteina. I geni costituiscono solo una piccola percentuale del genoma e il resto è composto da regioni intergeniche (in basso) che non codificano per le proteine. Queste sono le regioni che CODIFICANO è più interessato a studiare. (Immagine di credito: Wikimedia Commons; User-Plociam)

Per apprezzare meglio l’obiettivo di ENCODE, è prima utile capire cosa intendiamo per ” funzionale.”Ricorda che i geni codificano le informazioni necessarie per produrre proteine, che sono le molecole che svolgono funzioni nella cellula. Quanta proteina un dato gene produce in ultima analisi, o se è permesso di fare qualsiasi a tutti, è determinato dalla sua espressione genica. Nel caso del genoma, qualsiasi sequenza non codificante proteine che è funzionale avrebbe presumibilmente qualche effetto su come un gene è espresso; vale a dire, una sequenza funzionale in qualche modo regola la quantità di proteine è fatto da una data sequenza di DNA codificante. È la differenza nella composizione delle proteine che aiuta a dare a una cellula la sua identità. Poiché ogni cellula contiene esattamente lo stesso DNA e genoma, sono quindi i livelli di espressione genica a determinare se una cellula sarà un neurone, una pelle o addirittura una cellula immunitaria.

Mentre il progetto Genoma umano ha utilizzato principalmente la tecnica del sequenziamento del DNA per leggere il genoma umano, in realtà assegnare ruoli e caratterizzare la funzione di queste basi del DNA richiede una gamma molto più ampia di tecniche sperimentali. Il progetto ENCODE ha utilizzato sei approcci per aiutare ad assegnare funzioni a sequenze particolari all’interno del genoma. Questi approcci inclusi, tra gli altri, sequenziamento RNA, una molecola simile a e fatto da DNA che porta le istruzioni per fare proteine, e identificare le regioni di DNA che potrebbero essere chimicamente modificati o legati da proteine . I ricercatori hanno scelto questi metodi perché ognuno di essi fornisce indizi sul fatto che una data sequenza sia funzionale (cioè se influenza l’espressione genica). Se la cellula sta spendendo energia per produrre RNA dal DNA, allora è probabile che venga usato per qualcosa. Inoltre, le proteine che si legano al DNA influenzano se un gene è espresso e le modifiche chimiche del DNA possono anche prevenire o migliorare l’espressione genica.

Ciascuno di questi approcci può identificare sequenze all’interno del genoma che hanno una sorta di attività biochimica, e per aggiungere l’utilità di questo progetto, i laboratori hanno condotto queste tecniche in più tipi di cellule al fine di tenere conto della variabilità naturale. Quindi cosa hanno trovato alla fine? Utilizzando i sei approcci, il progetto è stato in grado di identificare l’attività biochimica per l ‘ 80% delle basi nel genoma . Sebbene ciò non significhi necessariamente che tutte quelle regioni funzionali previste abbiano effettivamente uno scopo, suggerisce fortemente che esiste un ruolo biologico per molto più dell ‘ 1% del nostro DNA che forma i geni. Molti scienziati già sospettavano questo, ma con ENCODE, ora abbiamo un ampio set di dati standardizzato che può essere utilizzato dai singoli laboratori per sondare queste aree potenzialmente funzionali. Allo stesso modo, poiché si trattava di un progetto così grande con severi controlli di qualità, possiamo essere sicuri che i dati siano riproducibili e affidabili.

Utilità e controversie

Sebbene i principali benefici derivanti da questo progetto possano non essere realizzati per alcuni anni (simile al progetto Genoma umano), al momento ci sono già alcune aree in cui questo enorme set di dati sarà utile. Ci sono una miriade di malattie che sembrano essere associate a mutazioni genetiche; tuttavia, molte delle mutazioni che sono state scoperte non sono all’interno di geni reali, il che rende difficile capire quali cambiamenti funzionali causano le mutazioni. Utilizzando i dati del progetto ENCODE, i ricercatori saranno in grado di affinare le mutazioni che causano malattie più rapidamente, dal momento che ora possono associare le mutazioni con sequenze funzionali trovate nel database ENCODE. Abbinando questi due, ricercatori e medici dovrebbero essere in grado di iniziare a capire perché una particolare mutazione causa una malattia, che aiuterà con lo sviluppo di terapie appropriate.

Anche se il progetto ENCODE è stato una notevole impresa di collaborazione scientifica, c’è ancora controversia che circonda il progetto . Alcuni scienziati hanno espresso la loro preoccupazione che il denaro speso per questo progetto (verso l’alto di million 200-300 milioni) avrebbe potuto essere più utile per fornire ai singoli ricercatori sovvenzioni. Alcuni biologi hanno anche espresso le loro preoccupazioni riguardo a come i risultati del progetto sono stati presentati al pubblico, sia in termini di hype che circonda il progetto che i risultati stessi. A causa della spesa e della complessità di questi tipi di studi, è importante che gli scienziati presentino una prospettiva imparziale. La necessità di un’attenta presentazione al pubblico è stata dimostrata dall’hype che circonda un recente articolo pubblicato dagli scienziati della NASA sui batteri che potrebbero utilizzare l’arsenico in un modo che non era mai stato osservato prima. Dopo aver annunciato di aver scoperto qualcosa di nuovo ed eccitante, fino al punto di chiamare una conferenza stampa, l’hype auto-generato alla fine è imploso dopo che i risultati sono stati infine confutati . Come con qualsiasi nuovo progetto su larga scala, sia gli scienziati che il pubblico devono essere pazienti nell’assegnare valore fino a quando i veri benefici del progetto non possono essere realizzati.

Un’altra critica importante dei documenti pubblicati dal gruppo ENCODE si è concentrata sul significato della frase ” funzione biologica.”Nel documento principale ENCODE journal, gli autori hanno dichiarato di aver assegnato una funzione biologica a circa l’ 80% del genoma umano . Come altri hanno notato, solo perché una data sequenza di DNA lega la proteina o è associata a qualche modifica chimica non significa necessariamente che sia funzionale o serva un ruolo utile. Molti eventi di legame proteico sono casuali e irrilevanti. È anche noto da tempo che gran parte del DNA “spazzatura” non codificante non è in realtà spazzatura, quindi alcuni ricercatori hanno messo in discussione la novità dei risultati di ENCODE. Tutte queste preoccupazioni sono certamente giustificate e, in effetti, la conversazione che circonda il progetto dimostra esattamente come la scienza dovrebbe funzionare.

sarà più probabile prendere anni per comprendere appieno come CODIFICARE ha aiutato la comunità scientifica, ma nonostante ciò, questo progetto ha evidenziato quanto sia importante studiare il genoma come un intero, non solo per capire perché abbiamo così tanto non codificanti del DNA all’interno di ogni singola cella, ma anche per informarci su argomenti che sono rilevanti per la maggioranza delle persone, in particolar modo, come rare o più mutazioni genetiche portano allo sviluppo della malattia.

Jonathan Henninger è uno studente laureato nel programma di scienze biologiche e biomediche presso l’Università di Harvard.

Ulteriori informazioni

Il coordinatore principale di Video – ENCODE Ewan Birney discute gli obiettivi principali del progetto.

Progetto Genoma Umano home page <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>

CODIFICARE home page <http://www.genome.gov/10005107>

CODIFICARE gli articoli pubblicati in Natura <http://www.nature.com/encode/>

“Bit di Mistero DNA, Lontano Da ‘Junk’ Gioca Ruolo Cruciale,” Gina Kolata, Il New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>

reddit.com “Ask me Anything” con il progetto ENCODE collaboratori <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>

“Accecato dalla Scienza: La lezione che ho imparato da ENCODE è che progetti come ENCODE non sono una buona idea”, di Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>

“CODIFICARE cosa dice?”di Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>

“Nuovi documenti scientifici dimostrano che la NASA ha fallito alla grande nel promuovere una scoperta apparentemente tremante che non lo era”, di Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>

“Evoluzione della dimensione del genoma attraverso alcune specie Allium coltivate.”Ricroch et al., Genoma 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>

“Un’enciclopedia integrata di elementi del DNA nel genoma umano.”Il Consorzio Progetto ENCODE, Natura 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.