Vida é informação

O processo de transferência da informação presente nas moléculas de DNA para as proteínas é essencial para nossas células. As proteínas – moléculas envolvidas em todos os processos importantes da biologia da célula – são sintetizadas a partir de tijolos fundamentais conhecidos como aminoácidos. E a ordem em que eles são ‘montados’ depende da seqüência em que estão dispostas na molécula de DNA as diferentes bases nitrogenadas ou nucleotídeos – representados pelas letras A, C, T e G. 

Essa transferência de informação é regida pelo código genético, um conjunto de instruções que define a relação entre os aminoácidos adicionados e as seqüências de nucleotídeos. A cada grupo de três nucleotídeos – que chamamos de códon ou triplete – corresponde um aminoácido. Por isso, entender as regras que definem o código genético foi um dos marcos da ciência moderna.

Com um copo de champanhe na mão, o geneticista norte-americano Marshall Nirenberg comemora a notícia de que recebera o Nobel de Medicina ou Fisiologia de 1968. O prêmio, dividido com Robert Holley e Har Gobind Khorana, coroou descobertas sobre a interpretação do código genético e sua função na síntese protéica (foto: NIH).

A saga da decifração do código genético começou em 1954, quando o físico russo George Gamow (1904-1968) postulou que ele deveria empregar combinações de três nucleotídeos, pois esses agrupamentos seriam suficientes para codificar todos os vinte tipos de aminoácidos utilizados na síntese protéica. A proposta de Gamow foi demonstrada por um experimento conduzido por dois biólogos – o inglês Francis Crick (1916-2004) e o sul-africano Sydney Benner (1927-). 

O trabalho da dupla consistiu em realizar mutações pontuais no gene rIIB do vírus bacteriófago T4. Nesse experimento, Crick e Brenner mostraram que a retirada ou inserção de um ou dois nucleotídeos causava mutações não funcionais, mas que a retirada ou introdução de três deles restabelecia a funcionalidade do gene. 

Posteriormente, em 1961, o geneticista norte-americano Marshall Nirenberg (1927-) e o bioquímico alemão Heinrich Matthaei (1929-) realizaram um experimento em que demonstraram, com o uso de marcação radioativa, a correspondência da maioria dos códons existentes com os aminoácidos conhecidos. Em seguida, o biólogo molecular americano de origem indiana Har Gobind Khorana (1928-) identificou o resto do código. 

Ainda no inicio da década de 1960, o bioquímico norte-americano Robert Holley (1922-1993) determinou a estrutura do RNA de transferência – as moléculas que transportam os aminoácidos utilizados na síntese protéica. Em 1968, Khorana, Holley e Nirenberg levaram o Prêmio Nobel de Fisiologia ou Medicina por suas descobertas. 

Evolução do código 
O código genético ainda é envolto em mistérios, embora tenha sido decifrado há mais de trinta anos, logo após a descrição da estrutura em dupla hélice da molécula de DNA por Crick, pelo norte-americano James Watson (1928-) e pelos britânicos Maurice Wilkins (1916-2004) e Rosalind Franklin (1920-1958). Apesar de conhecermos a relação entre os diferentes códons e os aminoácidos por eles codificados e mesmo como essas instruções variam entre grupos taxonômicos, ainda não sabemos por que um triplete específico assumiu sua forma atual. 

A resposta mais simples para esse mistério é que a definição desses códons deveu-se a processos acidentais surgidos antes da evolução do RNA e do DNA como moléculas responsáveis pelo armazenamento da informação genética. Essa padronização, uma vez estabelecida, perdurou praticamente sem sofrer alterações até os dias atuais, como se fosse, segundo palavras de Francis Crick, “um acidente congelado”. Contudo, essa teoria não indica que motivos levaram ao estabelecimento do padrão atual do código genético. 

A solução para esse dilema talvez esteja nas mutações. Uma vez que elas causam, em sua imensa maioria, efeitos deletérios sobre as proteínas, o código genético deve ter sido selecionado evolutivamente de forma a minimizar o impacto desses erros. 

Acredita-se que o processo de acumulação de códons para os diversos aminoácidos deu-se gradualmente ao longo do tempo. Nesse caso, o padrão atual do código genético apenas refletiria esse incremento surgido por meio de um processo coevolutivo entre os códons e os aminoácidos por eles transportados. Outra possibilidade sugerida é que o padrão atual do código genético foi influenciado por interações químicas favoráveis entre aminoácidos e seqüências curtas de ácidos nucléicos.

A transferência da informação do DNA para a proteína se dá em duas etapas. Na primeira delas, o DNA, que é uma molécula de dupla fita, é transcrito em RNA mensageiro (RNAm), que é uma molécula de fita simples. Em seguida, cada códon – ou grupo de três nucleotídeos – do RNAm é traduzido em um aminoácido. A seqüência de aminoácidos é que forma a proteína. A ilustração acima representa o início da síntese da hemoglobina (arte: Madeleine Price Ball).

Além disso, como as pesquisas de Khorana, Holley e Nirenberg indicaram, o código genético apresenta redundância, mas não ambigüidade. Existem mais de um códon para alguns aminoácidos, mas um mesmo códon não codifica dois aminoácidos diferentes. Dessa forma, substituições em uma das três posições nos códons podem gerar um mesmo aminoácido. Por isso, o código genético é dito degenerado. 

Alguns códons permitem que sejam realizadas quatro mudanças em suas terceiras bases (por exemplo, os códons GGA, GGG, GGC e GGU para o aminoácido glicina). Outros permitem três ou apenas duas trocas de nucleotídeos. 

O padrão dos códons, portanto, poderia ser uma adaptação que reduziria os erros causados por mutações pontuais ou por erros de tradução. Portanto, uma conseqüência dessa redundância é que alguns erros no código genético podem causar apenas mutações silenciosas, sem afetar a estrutura e a função da proteína sintetizada. 

Como a vasta maioria das proteínas segue o mesmo padrão estabelecido pelo código genético, acreditou-se que ele seria universal. Contudo, a partir de 1979, passaram a ser descobertas variantes de alguns códons em diversos genomas mitocondriais (inclusive no homem) e nos núcleos de algumas bactérias (Mycoplasma), fungos (Candida), algas verdes (Acetabularia) e de diversos protozoários ciliados. Essas variações conhecidas parecem ter derivado do código genético padrão, mas os motivos que levaram esses seres a adotar versões alternativas ainda é um mistério. 

O melhor dos códigos 
O código genético não representa uma correlação casual entre códons e aminoácidos. Por exemplo, aminoácidos que estão associados com a mesma via biossintética tendem a apresentar a primeira base similar em seus códons e aminoácidos com as mesmas propriedades físicas têm códons similares. 

Análises de todas as alternativas possíveis para a configuração do código genético indicam que a sua conformação atual está muito próxima de um nível ótimo para a minimização de erros. Portanto, o código genético é talvez o melhor entre todos os possíveis. Isso sugere que o código atual reflete um arranjo adaptativo complexo e intrincado. 

As observações realizadas até hoje indicam que o estabelecimento do código genético atual não foi um artefato, mas um processo definido pela seleção natural. Há evidências consistentes de que sua estrutura padrão foi fortemente influenciada pela seleção para evitar possíveis erros e que seu surgimento foi altamente significativo durante a definição da aptidão das primeiras formas vivas. 

O código genético é, portanto, uma das maravilhas da evolução, uma prova viva do incessante trabalho da seleção natural sobre os seres vivos desde antes do surgimento da primeira célula em nosso planeta.  

Jerry Carvalho Borges 
Universidade do Estado de Minas Gerais 
12/09/2008

SUGESTÕES PARA LEITURA 
Caporaso, J.G., Yarus, M., e Knight,R. (2005). Error minimization and coding triplet/binding site associations are independent features of the canonical genetic code. J. Mol. Evol. 61, 597-607. 
Yarus,M., Caporaso,J.G., e Knight,R. (2005). Origins of the genetic code: the escaped triplet theory. Annu. Rev. Biochem. 74, 179-198. 
Knight, R.D., Freeland, S.J., e Landweber, L.F. (2001). Rewiring the keyboard: evolvability of the genetic code. Nat. Rev. Genet. 2, 49-58. 
Knight,R.D. e Landweber, L.F. (2000). The early evolution of the genetic code. Cell101, 569-572. 
Freeland, S.J., Knight, R.D., e Landweber, L.F. (2000). Measuring adaptation within the genetic code. Trends Biochem. Sci. 25, 44-45. 
Knight, R.D. e Landweber,L.F. (1999). Is the genetic code really a frozen accident? New evidence from in vitro selection. Ann. N. Y. Acad. Sci. 870, 408-410. 
Knight, R.D., Freeland, S.J., e Landweber, L.F. (1999). Selection, history and chemistry: the three faces of the genetic code. Trends Biochem. Sci. 24, 241-247.