Atualmente, sabe-se que a relação gene-proteína nem sempre é de um para um. Relacioná-los não é uma questão simples: em geral, o genoma de um organismo é idêntico em todas as suas células, enquanto o conjunto de proteínas de cada uma delas varia, dependendo de sua fase de desenvolvimento, do tecido analisado, do processamento do pré-RNA mensageiro (pré-mRNA) e, até, do ambiente a que o organismo está submetido.
Mas como genes e proteínas estão relacionados? Em organismos eucariotos, como é o caso da espécie humana, a informação genética armazenada no DNA é convertida em uma seqüência de aminoácidos, formando as proteínas — moléculas fundamentais na determinação das características dos organismos. Contudo, a informação genética está organizada da seguinte forma: os genes incluem regiões codificadoras da seqüência de aminoácidos, os exons , e regiões não-codificadoras, os introns. A primeira etapa na síntese de proteínas é a transcrição do gene em uma molécula de RNA, o pré-mRNA. Este inclui ambas as regiões e, quando é processado, os introns são removidos da molécula, transformando o pré-mRNA no mRNA maduro, que será, então, traduzido em proteína. Esse processamento de um pré-mRNA pode variar, resultando na formação de mais de um tipo de proteína, a partir de uma mesma seqüência de DNA.
Um exemplo extremo descrito recentemente na mosca-da-banana, a Drosophila melanoaster , revela que um mesmo gene desse inseto é capaz de codificar cerca de 38 mil proteínas. Na espécie humana, estima-se que o número de genes varie entre 50 mil e 150 mil e que existam milhões de proteínas diferentes.