De los billones de células que componen nuestro cuerpo, desde neuronas que transmiten señales a través del cerebro hasta células inmunitarias que ayudan a defender nuestro cuerpo de ataques externos constantes, casi todas contienen los mismos 3 mil millones de pares de bases de ADN que componen el genoma humano, la totalidad de nuestro material genético. Es notable que cada uno de los más de 200 tipos de células en el cuerpo interpreta esta información idéntica de manera muy diferente para realizar las funciones necesarias para mantenernos vivos. Esto demuestra que necesitamos mirar más allá de la secuencia del ADN para entender cómo funciona un organismo y sus células.

Estudiar el Genoma como un Todo

Entonces, ¿cómo empezamos a entender el genoma como un todo? En 2000, el Proyecto Genoma Humano proporcionó la primera secuencia completa de un genoma humano . El ADN que compone todos los genomas está compuesto de cuatro sustancias químicas relacionadas llamadas ácidos nucleicos: adenina (A), guanina (G), citosina (C) y timina (T). Una secuencia de ADN es una cadena de estos ácidos nucleicos (también llamados «bases» o «pares de bases») que están unidos químicamente entre sí, como AGATTCAG, que se «lee» linealmente. Los métodos experimentales para determinar la secuencia de ADN, junto con la ayuda de algunas computadoras poderosas, finalmente dieron a los científicos una secuencia llena de A, G, C y T que tenía 3 mil millones de letras. En ese momento, los investigadores pensaron que sabían lo suficiente sobre cómo funcionaba el ADN para buscar las unidades funcionales del genoma, también conocidas como genes. Un gen es una cadena de ADN que codifica la información necesaria para fabricar una proteína, que luego realiza alguna función dentro de nuestras células.

Después del Proyecto Genoma Humano, los científicos descubrieron que había alrededor de 20.000 genes dentro del genoma, un número que algunos investigadores ya habían predicho. Sorprendentemente, estos genes comprenden solo alrededor del 1-2% de los 3 mil millones de pares de bases de ADN . Esto significa que entre el 98 y el 99% de todo nuestro genoma debe estar haciendo algo más que codificar proteínas, lo que los científicos llaman ADN no codificante. Imagine recibir múltiples volúmenes de enciclopedias que contenían una oración coherente en inglés cada 100 páginas, donde el resto del espacio contenía un puñado de letras y caracteres aleatorios no interpretables. Probablemente empezaría a preguntarse por qué todas esas letras y caracteres aleatorios estaban allí en primer lugar, que es el problema exacto que ha plagado a los científicos durante décadas.

¿Por qué gran parte de nuestro genoma no se utiliza para codificar proteínas? ¿Este ADN extra sirve para algún propósito funcional? Para empezar a tener una idea de si necesitamos todo este ADN extra, podemos observar especies estrechamente relacionadas que tienen tamaños de genoma muy variables. Por ejemplo, el género Allium, que incluye cebollas, chalotes y ajo, tiene tamaños de genoma que van de 10 a 20 mil millones de pares de bases. Es muy poco probable que una cantidad tan grande de ADN extra sea útil en una especie y no en su primo genético, tal vez argumentando que gran parte del genoma no es útil . Además, estos genomas son mucho más grandes que el genoma humano, lo que indica que una cebolla es altamente compleja, o es más probable que el tamaño de un genoma no diga nada sobre cuán complejo es el organismo o cómo funciona.

Qué Partes del Genoma Son Funcionales?

Debido a los asombrosos avances tecnológicos en la secuenciación del ADN y en el uso de computadoras para ayudar a analizar las secuencias resultantes (conocidas colectivamente como bioinformática), proyectos a gran escala similares al Proyecto Genoma Humano han comenzado a desentrañar la complejidad y el tamaño del genoma humano. Un proyecto en particular, ENCODE, o la Enciclopedia de Elementos de ADN, se propuso encontrar la función de la totalidad del genoma humano . En otras palabras, mientras que el Proyecto Genoma Humano se propuso leer los planos de la vida humana, el objetivo de ENCODE era averiguar qué partes de esos planos azules realmente hacen algo funcional. Un grupo de laboratorios de todo el mundo trabaja en el proyecto ENCODE, que comenzó en 2003 y está financiado por el Instituto Nacional de Investigación del Genoma Humano. Este mismo mes, el consorcio ha publicado sus principales resultados en más de 30 artículos de revistas científicas, y ha recibido una importante atención de los medios de comunicación .

Figura 1. Los 46 cromosomas (arriba) que componen todo el genoma humano. Cada cromosoma (medio) es un tramo largo y continuo de ADN salpicado de genes que codifican la información necesaria para fabricar una proteína. Los genes solo constituyen un pequeño porcentaje del genoma, y el resto está compuesto por regiones intergénicas (parte inferior) que no codifican proteínas. Estas son las regiones que ENCODE está más interesada en estudiar. (Crédito de la imagen: Wikimedia Commons; User – Plociam)

Para apreciar mejor el objetivo de CODIFICAR, primero es útil entender lo que queremos decir con » funcional.»Recuerde que los genes codifican la información necesaria para producir proteínas, que son las moléculas que realizan funciones en la célula. La cantidad de proteína que un gen dado produce en última instancia, o si se le permite producir alguna, está determinada por su expresión génica. En el caso del genoma, cualquier secuencia no codificante de proteínas que sea funcional presumiblemente tendría algún efecto en cómo se expresa un gen; es decir, una secuencia funcional de alguna manera regula cuánta proteína se hace de una secuencia de ADN codificante dada. Es la diferencia en la composición de las proteínas lo que ayuda a dar a una célula su identidad. Dado que cada célula contiene exactamente el mismo ADN y genoma, son los niveles de expresión génica los que determinan si una célula será una neurona, piel o incluso una célula inmunitaria.

Mientras que el Proyecto Genoma Humano utilizó principalmente la técnica de secuenciación de ADN para leer el genoma humano, en realidad, asignar roles y caracterizar la función de estas bases de ADN requiere una gama mucho más amplia de técnicas experimentales. El proyecto ENCODE utilizó seis enfoques para ayudar a asignar funciones a secuencias particulares dentro del genoma. Estos enfoques incluyeron, entre otros, secuenciar el ARN, una molécula similar al ADN y hecha a partir de ÉL que lleva instrucciones para fabricar proteínas, e identificar regiones de ADN que podrían modificarse químicamente o unirse a proteínas . Los investigadores escogieron estos métodos porque cada uno de ellos da pistas sobre si una secuencia dada es funcional (es decir, si influye en la expresión génica). Si la célula está gastando energía para fabricar ARN a partir del ADN, es probable que se esté utilizando para algo. Además, las proteínas que se unen al ADN influyen en si se expresa un gen, y las modificaciones químicas del ADN también pueden prevenir o mejorar la expresión génica.

Cada uno de estos enfoques puede identificar secuencias dentro del genoma que tienen algún tipo de actividad bioquímica, y para agregar a la utilidad de este proyecto, los laboratorios llevaron a cabo estas técnicas en múltiples tipos celulares para tener en cuenta la variabilidad natural. Entonces, ¿qué encontraron al final? Utilizando los seis enfoques, el proyecto pudo identificar la actividad bioquímica del 80% de las bases del genoma . Aunque esto no significa necesariamente que todas esas regiones funcionales predichas realmente sirvan a un propósito, sugiere fuertemente que hay un papel biológico para mucho más del 1% de nuestro ADN que forma genes. Muchos científicos ya sospechaban esto, pero con ENCODE, ahora tenemos un gran conjunto de datos estandarizados que pueden ser utilizados por laboratorios individuales para investigar estas áreas potencialmente funcionales. Del mismo modo, debido a que se trataba de un proyecto tan grande con estrictos controles de calidad, podemos estar seguros de que los datos son reproducibles y confiables.

Utilidad y Controversia

Aunque los principales beneficios derivados de este proyecto pueden no realizarse durante algunos años (similar al Proyecto Genoma Humano), en este momento ya hay algunas áreas donde este enorme conjunto de datos será útil. Hay una gran cantidad de enfermedades que parecen estar asociadas con mutaciones genéticas; sin embargo, muchas de las mutaciones que se han descubierto no están dentro de los genes reales, lo que hace difícil entender qué cambios funcionales causan las mutaciones. Utilizando los datos del proyecto ENCODE, los investigadores podrán profundizar en las mutaciones causantes de enfermedades más rápidamente, ya que ahora pueden asociar las mutaciones con secuencias funcionales que se encuentran en la base de datos de ENCODE. Al hacer coincidir estos dos factores, los investigadores y los médicos deberían poder comenzar a comprender por qué una mutación en particular causa una enfermedad, lo que ayudará a desarrollar terapias adecuadas.

Aunque el proyecto ENCODE fue una hazaña notable de colaboración científica, todavía hay controversia en torno al proyecto . Algunos científicos han expresado su preocupación de que el dinero gastado en este proyecto (más de $200-300 millones) podría haber sido más útil para proporcionar becas a investigadores individuales. Algunos biólogos también han expresado su preocupación con respecto a cómo se presentaron al público los resultados del proyecto, tanto en términos de la publicidad que rodea al proyecto como de los propios resultados. Debido al costo y la complejidad de este tipo de estudios, es importante que los científicos presenten una perspectiva imparcial. La necesidad de una presentación cuidadosa al público quedó demostrada por el bombo que rodeó un artículo reciente publicado por científicos de la NASA sobre bacterias que podrían usar arsénico de una manera que nunca se había observado antes. Después de anunciar que habían descubierto algo nuevo y emocionante, incluso hasta el punto de convocar una conferencia de prensa, el bombo generado por ellos mismos finalmente implosionó después de que los hallazgos finalmente fueran refutados . Al igual que con cualquier nuevo proyecto a gran escala, tanto los científicos como el público deben ser pacientes en la asignación de valor hasta que se puedan realizar los verdaderos beneficios del proyecto.

Otra crítica importante de los artículos publicados por el grupo ENCODE se centró en el significado de la frase «función biológica».»En el artículo principal de la revista ENCODE, los autores afirmaron que habían asignado una función biológica a aproximadamente el 80% del genoma humano . Como otros han señalado, el hecho de que una secuencia de ADN determinada se una a la proteína o esté asociada con alguna modificación química no significa necesariamente que sea funcional o tenga un papel útil. Muchos eventos de unión a proteínas son aleatorios e intrascendentes. También se sabe desde hace algún tiempo que gran parte del ADN «basura» no codificado no es realmente basura, por lo que algunos investigadores han cuestionado la novedad de los resultados de ENCODE. Todas estas preocupaciones están justificadas y, de hecho, la conversación en torno al proyecto demuestra con precisión cómo se supone que funciona la ciencia.

Lo más probable es que lleve años comprender completamente cómo ENCODE ha ayudado a la comunidad científica, pero sin embargo, este proyecto ha destacado lo importante que es estudiar el genoma en su conjunto, no solo para comprender por qué tenemos tanto ADN no codificador dentro de cada célula, sino también para informarnos sobre temas que son relevantes para la mayoría de las personas, especialmente cómo las mutaciones genéticas raras o múltiples conducen al desarrollo de enfermedades.

Jonathan Henninger es un estudiante graduado en el Programa de Ciencias Biológicas y Biomédicas de la Universidad de Harvard.

Más información

El coordinador principal de Video – ENCODE, Ewan Birney, analiza los principales objetivos del proyecto.

Página de inicio del Proyecto Genoma Humano<http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>

Página de Inicio de CODIFICACIÓN<http://www.genome.gov/10005107>

CODIFICAR artículos publicados en Nature <http://www.nature.com/encode/>

«Trozos de ADN Misterioso, Lejos De Ser ‘Basura’, Juegan un Papel Crucial», Gina Kolata, The New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>

reddit.com «Pregúntame cualquier cosa» con los colaboradores de ENCODE project<http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>

«Cegados por la Gran Ciencia: La lección que aprendí de ENCODE es que proyectos como ENCODE no son una buena idea», por Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>

«¿CODIFICAR dice qué?»por Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>

«Nuevos Artículos Científicos Demuestran Que la NASA Fracasó A Lo Grande en Promover Descubrimientos Supuestamente Estremecedores de La Tierra Que No Lo Fueron», por Matthew Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>

«Evolución del tamaño del genoma en algunas especies de Allium cultivadas.»Ricroch et al., Genome 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>

«An integrated encyclopedia of DNA elements in the human genome (en inglés).»The ENCODE Project Consortium, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>

Deja una respuesta

Tu dirección de correo electrónico no será publicada.