De trilhões de células que compõem o nosso corpo, a partir de neurônios que transmitem sinais ao longo de todo o cérebro e as células do sistema imunológico que ajuda a defender o nosso corpo de constante agressão externa, quase cada um contém 3 bilhões de pares de bases de ADN que compõem o genoma humano – a totalidade de nosso material genético. É notável que cada um dos mais de 200 tipos de células do corpo interprete essa informação idêntica de maneira muito diferente para desempenhar as funções necessárias para nos manter vivos. Isso demonstra que precisamos olhar além da sequência do próprio DNA para entender como um organismo e suas células funcionam.
estudando o genoma como um todo
então, como começamos a entender o genoma como um todo? Em 2000, O Projeto Genoma Humano forneceu a primeira sequência completa de um genoma humano . O DNA que compõe todos os genomas é composto por quatro produtos químicos relacionados chamados ácidos nucléicos-adenina (a), guanina (G), citosina (C) e timina (T). Uma sequência de DNA é uma sequência desses ácidos nucléicos (também chamados de “bases” ou “pares de bases”) que são quimicamente ligados uns aos outros, como AGATTCAG, que é “lido” linearmente. Métodos experimentais para determinar a sequência de DNA, juntamente com a ajuda de alguns computadores poderosos, deram aos cientistas uma sequência cheia de A’s, g’s, c’s e t’s que tinha 3 bilhões de letras. Na época, os pesquisadores pensaram que sabiam o suficiente sobre como o DNA funcionava para procurar as unidades funcionais do genoma, também conhecidas como genes. Um gene é uma cadeia de DNA que codifica as informações necessárias para fazer uma proteína, que então passa a desempenhar alguma função dentro de nossas células.Após o Projeto Genoma Humano, Os cientistas descobriram que havia cerca de 20.000 genes dentro do genoma, um número que alguns pesquisadores já haviam previsto. Notavelmente, esses genes compreendem apenas cerca de 1-2% dos 3 bilhões de pares de bases de DNA . Isso significa que em qualquer lugar de 98-99% de todo o nosso genoma deve estar fazendo algo diferente de codificação para proteínas – os cientistas chamam isso de DNA não codificante. Imagine receber vários volumes de enciclopédias que continham uma frase coerente em inglês a cada 100 páginas, onde o resto do espaço continha um punhado de letras e caracteres aleatórios não interpretáveis. Você provavelmente começaria a se perguntar Por que todas essas letras e caracteres aleatórios estavam lá em primeiro lugar, que é o problema exato que atormenta os cientistas há décadas.Por que tanto do nosso genoma não está sendo usado para codificar proteínas? Esse DNA extra serve a algum propósito funcional? Para começar a ter uma ideia se precisamos de todo esse DNA extra, podemos olhar para espécies intimamente relacionadas que têm tamanhos de genoma muito variados. Por exemplo, o gênero Allium, que inclui cebolas, chalotas e alho, tem tamanhos de genoma que variam de 10 a 20 bilhões de pares de bases. É muito improvável que uma quantidade tão grande de DNA extra seja útil em uma espécie e não em seu primo genético, talvez argumentando que grande parte do genoma não é útil . Além disso, esses genomas são muito maiores que o genoma humano, o que indica que uma cebola é altamente complexa ou mais provável que o tamanho de um genoma não diga nada sobre o quão complexo é o organismo ou como ele funciona.
quais partes do genoma são funcionais?Devido aos incríveis avanços tecnológicos no sequenciamento de DNA e no uso de computadores para ajudar a analisar as sequências resultantes (coletivamente conhecidas como Bioinformática), projetos de grande escala semelhantes ao Projeto Genoma Humano começaram a desvendar a complexidade e o tamanho do genoma humano. Um projeto em particular, ENCODE, ou a Enciclopédia de elementos de DNA, partiu para encontrar a função da totalidade do genoma humano . Em outras palavras, enquanto o Projeto Genoma Humano se propôs a ler os projetos da vida humana, o objetivo da ENCODE era descobrir quais partes dessas impressões azuis realmente fazem algo funcional. Um grupo de laboratórios de todo o mundo trabalha no projeto ENCODE, que começou em 2003 e é financiado pelo Instituto Nacional de pesquisa do Genoma Humano. Apenas este mês, o consórcio publicou seus principais resultados em mais de 30 artigos de periódicos científicos, e recebeu uma atenção significativa da mídia .
Figura 1. Os 46 cromossomos (topo) que compõem todo o genoma humano. Cada cromossomo (médio) é um trecho longo e contínuo de DNA polvilhado com genes que codificam as informações necessárias para fazer uma proteína. Os Genes constituem apenas uma pequena porcentagem do genoma, e o restante é composto por regiões intergênicas (fundo) que não codificam proteínas. Estas são as regiões que codificam está mais interessado em estudar. (Crédito da imagem: Wikimedia Commons; User-Plociam)
para apreciar melhor o objetivo de codificar, primeiro é útil entender o que queremos dizer com “funcional.”Lembre-se de que os genes codificam as informações necessárias para produzir proteínas, que são as moléculas que desempenham funções na célula. A quantidade de proteína que um determinado gene produz, ou se é permitido produzir algum, é determinada por sua expressão gênica. No caso do genoma, qualquer sequência não codificadora de proteínas que seja funcional presumivelmente teria algum efeito sobre a forma como um gene é expresso; ou seja, uma sequência funcional de alguma forma regula a quantidade de proteína produzida a partir de uma determinada sequência de DNA codificante. É a diferença na composição das proteínas que ajuda a dar a uma célula sua identidade. Como cada célula contém exatamente o mesmo DNA e genoma, são, portanto, os níveis de expressão gênica que determinam se uma célula será um neurônio, pele ou mesmo uma célula imune. Considerando que o Projeto Genoma Humano usou principalmente a técnica de sequenciamento de DNA para ler o genoma humano, na verdade, atribuir papéis e caracterizar a função dessas bases de DNA requer uma gama muito mais ampla de técnicas experimentais. O projeto ENCODE usou seis abordagens para ajudar a atribuir funções a sequências específicas dentro do genoma. Essas abordagens incluíram, entre outras, sequenciamento de RNA, uma molécula semelhante e feita a partir de DNA que carrega instruções para a fabricação de proteínas e identificação de regiões de DNA que poderiam ser quimicamente modificadas ou ligadas por proteínas . Os pesquisadores escolheram esses métodos porque cada um deles dá pistas sobre se uma determinada sequência é funcional (ou seja, se influencia a expressão gênica). Se a célula está gastando energia para fazer RNA a partir do DNA, provavelmente está sendo usada para algo. Além disso, as proteínas que se ligam ao DNA influenciam se um gene é expresso e as modificações químicas do DNA também podem prevenir ou melhorar a expressão gênica.
Cada uma dessas abordagens pode identificar sequências dentro do genoma que tem algum tipo de actividade bioquímica, e para adicionar a utilidade deste projecto, os laboratórios realizados essas técnicas em vários tipos de células para dar conta da variabilidade natural. Então, o que eles finalmente encontraram? Usando as seis abordagens, o projeto foi capaz de identificar a atividade bioquímica para 80% das bases no genoma . Embora isso não signifique necessariamente que todas essas regiões funcionais previstas realmente sirvam a um propósito, sugere fortemente que há um papel biológico para muito mais do que 1% do nosso DNA que forma genes. Muitos cientistas já suspeitaram disso, mas com ENCODE, agora temos um grande conjunto de dados padronizado que pode ser usado por laboratórios individuais para investigar essas áreas potencialmente funcionais. Da mesma forma, por ser um projeto tão grande com controles rígidos de qualidade, podemos ter certeza de que os dados são reproduzíveis e confiáveis.
Utilidade e Controvérsia
Embora os principais benefícios decorrentes desse projeto não pode ser realizado por alguns anos (semelhante ao Projeto Genoma Humano), no momento, já existem algumas áreas onde este enorme conjunto de dados será útil. Há uma série de doenças que parecem estar associadas a mutações genéticas; no entanto, muitas das mutações que foram descobertas não estão dentro dos genes reais, o que dificulta a compreensão de quais mudanças funcionais as mutações causam. Usando os dados do projeto ENCODE, os pesquisadores poderão aprimorar as mutações causadoras de doenças mais rapidamente, uma vez que agora podem associar as mutações a sequências funcionais encontradas no banco de dados ENCODE. Ao combinar esses dois, pesquisadores e médicos devem ser capazes de começar a entender por que uma mutação específica causa uma doença, o que ajudará no desenvolvimento de terapias apropriadas. Embora o projeto ENCODE tenha sido um feito notável de colaboração científica, ainda há controvérsia em torno do projeto . Alguns cientistas expressaram sua preocupação de que o dinheiro gasto neste projeto (mais de US $200-300 milhões) poderia ter sido mais útil no fornecimento de bolsas a pesquisadores individuais. Alguns biólogos também expressaram suas preocupações sobre como os resultados do projeto foram apresentados ao público, tanto em termos do hype em torno do projeto quanto dos próprios resultados. Devido à despesa e complexidade desses tipos de estudos, é importante que os cientistas apresentem uma perspectiva imparcial. A necessidade de uma apresentação cuidadosa ao público foi demonstrada pelo hype em torno de um artigo recente publicado por cientistas da NASA sobre bactérias que poderiam usar arsênico de uma forma que nunca havia sido observada antes. Depois de anunciar que haviam descoberto algo novo e emocionante, a ponto de convocar uma coletiva de imprensa, o hype gerado por si mesmo acabou implodindo depois que as descobertas foram refutadas . Como acontece com qualquer novo projeto de grande escala, tanto os cientistas quanto o público devem ser pacientes na atribuição de valor até que os verdadeiros benefícios do projeto possam ser realizados.
uma outra crítica importante dos artigos publicados pelo grupo ENCODE focou no significado da frase “função biológica.”No artigo principal da ENCODE journal, os autores afirmaram que atribuíram uma função biológica a cerca de 80% do genoma humano . Como outros observaram, só porque uma determinada sequência de DNA se liga à proteína ou está associada a alguma modificação química não significa necessariamente que ela seja funcional ou desempenhe um papel útil. Muitos eventos de ligação de proteínas são aleatórios e inconsequentes. Também se sabe há algum tempo que grande parte do DNA “lixo” não codificante não é realmente lixo, então alguns pesquisadores questionaram a novidade dos resultados da codificação. Todas essas preocupações são certamente justificadas e, de fato, a conversa em torno do projeto demonstra precisamente como a ciência deve funcionar.
É mais provável levar anos para entender completamente como CODIFICAR, tem ajudado a comunidade científica, mas, no entanto, este projeto tem como destacou o quanto é importante para o estudo do genoma como um todo, não só para entender por que temos tanto não-codificantes de DNA dentro de cada um e de cada célula, mas também para nos informar sobre tópicos que são relevantes para a maioria das pessoas, especialmente como raras ou várias mutações genéticas levam ao desenvolvimento da doença.Jonathan Henninger é um estudante de pós-graduação no Programa de Ciências Biológicas e Biomédicas da Universidade de Harvard.
mais informações
o coordenador principal da Video – ENCODE, Ewan Birney, discute os principais objetivos do projeto.
Projeto Genoma Humano página inicial <http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml>
CODIFICAR página inicial <http://www.genome.gov/10005107>
CODIFICAR os artigos publicados na Nature <http://www.nature.com/encode/>
“Bits de Mistério DNA, Longe De ‘Lixo’ Jogar Papel Crucial,” Gina Kolata, O New York Times <http://www.nytimes.com/2012/09/06/science/far-from-junk-dna-dark-matter-proves-crucial-to-health.html?pagewanted=all>
reddit.com “Pergunte-me Qualquer coisa” com CODIFICAR os colaboradores do projeto <http://www.reddit.com/r/askscience/comments/znlk6/askscience_special_ama_we_are_the_encyclopedia_of/>
“Cegos pela Grande Ciência: A lição que aprendi com ENCODE é que projetos como ENCODE não são uma boa ideia”, de Michael Eisen <http://www.michaeleisen.org/blog/?p=1179>
“ENCODE diz O quê?”por Sean Eddy <http://selab.janelia.org/people/eddys/blog/?p=683>
“Nova Ciência Papéis de Provar a NASA Falha Grande Momento na Promoção, Supostamente, a Terra Tremer Descoberta de Que não Era,” por Mateus Herper <http://www.forbes.com/sites/matthewherper/2012/07/08/new-science-papers-prove-nasa-failed-big-time-in-promoting-supposedly-earth-shaking-discovery-that-wasnt/>
“Evolução do tamanho do genoma através de alguns cultivadas espécies de Allium.”Ricroch et al., Genoma 2005. <http://www.ncbi.nlm.nih.gov/pubmed/16121247>
“uma enciclopédia integrada de elementos de DNA no genoma humano.”The ENCODE Project Consortium, Nature 2012. <http://www.nature.com/nature/journal/v489/n7414/full/nature11247.html>