Genealogia, linhagens ancestrais e DNA

Quadro intitulado D’où venons-nous? Qui sommes-nous? Où allons-nous? (“De onde viemos? Quem somos? Para onde vamos?”), obra-prima de Paul Gauguin. A pintura está no Museu de Belas Artes de Boston (1,39m x 3,74m).

Paul Gauguin (1848-1903) foi um genial pintor pós-impressionista francês. Em 1891, aos 43 anos, cansado da vida na França, que ele considerava artificial e convencional, mudou-se permanentemente para o Taiti. Em 1897 ele pintou sua obra-prima, um quadro intitulado D’où venons-nous? Qui sommes-nous? Où allons-nous? (“De onde viemos? Quem somos? Para onde vamos?” – ver figura acima).

Vale a pena discorrer um pouco sobre a pintura. O próprio Gauguin indicou que ela deveria ser lida da direita para a esquerda, com os três grupos principais de figuras ilustrando as três perguntas do título. As três mulheres com um bebê representam o início da vida, o grupo central simboliza o cotidiano dos adultos e o último grupo, à esquerda, focaliza uma idosa aguardando a morte.

Das três perguntas fundamentais de Gauguin, a única que podemos tentar responder com algum nível de confiança é “De onde viemos?”. De fato, ela tem obcecado a humanidade há milênios. Sempre houve grande interesse em saber sobre nossos antepassados e conhecer nossas genealogias, nossas linhagens ancestrais.

Cada ser humano tem dois pais, quatro avós, oito bisavós, 16 trisavós, 32 tetravós etc. O número de antepassados cresce exponencialmente, de maneira muito rápida.

É freqüente ler que a genealogia é o primeiro ou o segundo maior hobby nos Estados Unidos. Não consegui encontrar uma fonte confiável para corroborar essa afirmativa. Em todo caso, um texto de 1999 da revista McLean’s afirmou que a genealogia só perdia para a pornografia em número de páginas acessadas na internet.

Como estudar sua genealogia
Basicamente, existem duas maneiras principais de se estudar a genealogia de uma família. Uma é investigando de baixo para cima, ou seja, partindo de uma pessoa específica (que tal você mesmo?) e indo em direção ao passado, colhendo informações sobre seus pais, avós, bisavós, trisavós, tetravós etc.

O problema com esse método, já discutido em uma coluna anterior, é que o número de antepassados cresce exponencialmente, de maneira muito rápida (ver figura). Vinte gerações atrás (500 anos, se considerarmos 25 por geração), eu deveria ter um milhão de antepassados. Há meros 750 anos (30 gerações), eu deveria ter um bilhão de ascendentes. Obviamente, ninguém conseguiria retroceder em sua genealogia por mais de umas poucas gerações.

Tenho um sobrenome materno incomum – Junho – que deveria, assim, ter sua origem facilmente descoberta. Este sobrenome anda até em alta, pois meu primo, Antônio Augusto Junho Anastasia, é o atual vice-governador do estado de Minas Gerais. Pois bem: não consultei nenhum genealogista competente (apesar de haver muitos deles no Brasil), mas com a informação disponível na família só pude ir até os nomes do meu bisavô e bisavó – Dionísio Maria Junho e Etelvina Junho (née …?), que moravam em São Gonçalo do Sapucaí, no sul de Minas.

Foto do final do século 19 mostrando sentados meus bisavós, Dionísio Maria Junho e Etelvina Junho. Meu avô materno, Augusto Maria Junho, aparece ainda criança (seta). Os outros dois homens na foto são presumivelmente irmãos de Dionísio ou de Etelvina.

Consegui também uma foto deles, do final do século 19, com meu avô ainda criança (figura ao lado). Com uma pesquisa rápida na internet não consegui sequer descobrir a origem etimológica do sobrenome.

A segunda principal alternativa para estudar nossa genealogia é fazer o contrário, ou seja, tentar traçá-la de cima para baixo. Dessa maneira, iniciamos com uma figura histórica e traçamos sua descendência até chegar, esperamos, a nós mesmos.

Por exemplo, Amador Bueno (c.1584 – c.1649) foi um grande personagem histórico e o homem que, em 1641, apesar de aclamado pelo povo, não quis ser rei do Brasil. Podemos, então, tentar traçar a descendência de Amador Bueno.

Na verdade, acabaremos descobrindo que virtualmente todo mundo no Brasil descende dele, porque o número de descendentes cresce, não em potência de 2, como no caso dos antepassados, mas mais rapidamente ainda, por causa do grande número de filhos que as pessoas tinham no passado. A propósito, sei com confiança que sou parente de Amador Bueno, porque um livro chamado Amador Bueno, o Aclamado, na Família Lagoana, menciona o nome de minha avó paterna, Balbina Drummond Pena, como sua descendente.

Assim, pelas propriedades matemáticas das séries exponenciais, as pesquisas genealógicas rapidamente esbarram em números de magnitudes incontroláveis.

Em busca de um parente importante
Uma solução é tentar estabelecer metas menos ambiciosas e mais fáceis. Por exemplo, meu sobrenome Pena (que vem do meu pai, Danilo Drumond Pena, e de meu avô, José Martins Pena) é associado a uma cidade do interior de Minas Gerais chamada Santa Bárbara, onde nasceu Afonso Augusto Moreira Pena (1847-1909), presidente da República de 1906 a 1909, tendo falecido no cargo.

Eu que, como todo mundo, quero ser parente dos ricos ou famosos (de preferência ambos), decidi tentar garimpar a internet atrás do meu vínculo genealógico com o grande estadista, que inclusive dá nome à principal avenida de Belo Horizonte, onde está localizado meu laboratório de genética médica.

Rapidamente descobri fatos fascinantes sobre a família Pena. Ela procede da Galícia e seu nome original aparentemente era Penn, de origem celta. Daí transformou-se em Penha e depois assumiu sua forma final quando Dom Inácio da Pena, fidalgo espanhol, mudou-se para Portugal, a serviço do rei Dom Manoel, lá pelos 1500. Na década de 1790, imigrou para Santa Bárbara o pai de Afonso Pena, Domingos Teixeira Pena, que se casou duas vezes. Do primeiro casamento teve cinco filhas e um homem e, do segundo, uma filha e quatro filhos (incluindo Afonso Pena). Não consegui mais informações pela internet a partir daí.

Para achar minha conexão com Afonso Pena, creio que terei de fazer uma pesquisa muito mais séria, consultando o Dicionário das Famílias Brasileiras, a revista Brasil Genealógico, do Colégio Brasileiro de Genealogia, ou procurando um especialista em genealogia tradicional.

Mas imaginemos, por um momento, que eu tivesse conseguido estabelecer a conexão e que, hipoteticamente, descobrisse que meu avô, José Martins Pena, era sobrinho de Afonso Pena. Como poderia eu ter garantia de o vínculo ser biologicamente real? Afinal, sabemos que cerca de 10% das pessoas não têm o pai que acreditam ter (ou seja, ao redor de 10% dos filhos matrimoniais não são filhos biológicos).

Em minha conexão patrilínea com o ilustre parente haveria, então, cinco passos genealógicos, cada um com uma possibilidade de não paternidade e eu, como geneticista e cético, ficaria sempre em dúvida. Existiria algum método que me permitisse comprovar o vínculo de forma totalmente confiável? Sim: esse método é chamado genealogia por DNA e se baseia na genotipagem de marcadores do cromossomo Y.

Haplótipos do cromossomo Y
Apenas homens possuem o cromossomo Y, que determina o sexo masculino e é passado diretamente do pai para todos os seus filhos. O Y existe em uma única cópia (haplóide) no genoma masculino e, em mais de 95% de sua extensão, ele não troca genes com nenhum outro segmento genômico (isto é, não se ‘recombina’).

Assim, é transmitido de geração em geração como um bloco de genes, que é chamado “haplótipo”. Os diferentes haplótipos permanecem inalterados em patrilinhagens até que ocorra uma mutação, um evento incomum. Dessa maneira, o cromossomo Y fornece informações que permitem traçar vínculos genéticos que alcançam dezenas de gerações no passado.

No laboratório Gene – Núcleo de Genética Médica –, fazemos a determinação dos vários haplótipos do cromossomo Y usando 25 marcadores diferentes, do tipo microssatélite hipervariável. A probabilidade de que dois indivíduos não aparentados escolhidos ao acaso na população tenham perfis genéticos do Y idênticos é muito inferior a 1%.

Assim, se eu encontrasse em Santa Bárbara descendentes patrilíneos putativos de Afonso Pena, poderia comparar meu haplótipo de cromossomo Y com os deles. Se os haplótipos forem idênticos, isso vai indicar com altíssima confiabilidade que pertencemos à mesma patrilinhagem. Se forem muito diferentes, a conclusão forçosamente será de que não somos aparentados por via patrilínea.

A figura mostra uma linhagem de 10 gerações (cerca de 250 anos) de homens, que estão representados por círculos (uma patrilinhagem). A geração atual está representada pelos indivíduos numerados de 1 a 7, em vermelho. Ao longo do tempo, podem ter ocorrido uma ou mais mutações no haplótipo de Y. O ancestral comum mais recente (ACMR) entre o indivíduo 2 e os indivíduos 3 e 4 (que são irmãos) éstá marcado em verde. O ACMR entre 2, 3 e 4 por um lado e 5, 6 e 7 por outro, está marcado em azul. O ACMR entre o indivíduo 1 e os de 2 a 7 está marcado em vermelho. Sabendo a taxa de mutações dos microssatélites do DNA do cromossomo Y é possível estimar o tempo até o ACMR de qualquer par de homens.

Um exemplo concreto do alcance e utilidade dessa metodologia de genealogia por DNA foi o affair envolvendo Thomas Jefferson (1743-1826), presidente americano e principal autor da Declaração de Independência dos Estados Unidos. Apesar da sua adoção entusiástica dos princípios liberais dos iluministas franceses, Jefferson mantinha escravos em sua propriedade rural no estado da Virgínia.

Conversa vai, conversa vem, Jefferson tornou-se amante de uma escrava chamada Sally Hemmings, que durante sua vida teve seis filhos. Uma pergunta que sempre existiu na história americana era se Jefferson seria o pai biológico de algum (ou todos) desses seis filhos. Em 1998 foi publicada a comparação do haplótipo de cromossomo Y de um descendente patrilíneo direto de Thomas Jefferson com um descendente patrilíneo direto de Eston Hemmings, filho de Sally. Bingo! – os perfis haplotípicos foram idênticos.

Observe o leitor que essa identidade não garante que Thomas Jefferson fosse o pai de Eston, pois o mesmo haplótipo dele estava presente no seu irmão, Randolph Jefferson, e em sobrinhos, que freqüentavam a fazenda. Mas não há absolutamente qualquer dúvida de que Eston Hemmings era filho de um membro da família (patrilinhagem) Jefferson!

Da mesma forma, se eu estiver visitando a Galícia e encontrar por lá alguém com o sobrenome Penn ou Penha e quiser saber se somos aparentados por linhagem patrilínea, basta fazer os estudos de DNA do cromossomo Y, determinar os haplótipos e tentar estimar o número de gerações entre nós, hoje, e o nosso ancestral comum mais recente (ACMR – ver figura ao lado). Quanto menor for o tempo até o ACMR, mais próximos seremos do ponto de vista da linhagem do cromossomo Y, e vice-versa.

Haplogrupos do cromossomo Y
Além de possibilitar a determinação dos haplótipos, os estudos moleculares diretamente no DNA do cromossomo Y também nos permitem estabelecer o que chamamos de “haplogrupos”, ou seja, grandes grupos de vários haplótipos relacionados entre si. Para entender melhor esse conceito, temos de lembrar, como mencionado em nossa coluna anterior, que a espécie humana emergiu na África há menos de 200 mil anos e só saiu daquele continente há cerca de 60 mil anos para povoar o resto do mundo.

Naquele tempo, a população dos primeiros Homo sapiens provavelmente não excedia uns poucos milhares de indivíduos e a variabilidade dos haplótipos do cromossomo Y era discreta. Há evidências de que apenas uma linhagem de cromossomos Y sobreviveu e, como resultado de mutações, deu origem a todos os diversos cromossomos Y da humanidade atual.

À medida que os homens foram migrando para novas regiões geográficas, o haplogrupo ancestral único africano foi sendo modificado por mutações, estabelecendo novos haplogrupos, cada um deles passando a se comportar como uma linhagem evolutiva independente. Ao fazer a tipificação de diferentes cromossomos Y humanos, podemos estudar hierarquicamente os vários polimorfismos característicos dos haplogrupos.

Em síntese, ao fazer o estudo de ancestralidade paterna de uma pessoa (dos homens através de seu próprio DNA e de mulheres, através do DNA de seu pai ou de um irmão), estabelecemos dois níveis de resolução aninhados. Usamos alguns marcadores (de evolução mais lenta) para determinar o haplogrupo, que tem correlações geográficas muito amplas. Por exemplo, meu cromossomo Y pertence ao haplogrupo R1b, que é tipicamente europeu e encontrado em mais de 50% dos homens portugueses.

Determinamos também o haplótipo, que é muito mais restrito e específico para diferentes famílias. Uma analogia pode ser feita com endereços. O haplogrupo corresponderia à cidade, onde habitam centenas de milhares de pessoas, enquanto o haplótipo seria o endereço de uma residência (rua e número), onde habitam apenas familiares próximos.

Outras ferramentas da genealogia por DNA

A figura mostra uma fertilização humana. O óvulo está esquematizado mostrando o núcleo e, no citoplasma, as muitas mitocôndrias. Uma mitocôndria está ampliada à esquerda e seu DNA, pequeno e circular, mais ampliado ainda. No quadrante superior direito, em escala aproximadamente correta, está um espermatozóide, que contém pouquíssimas mitocôndrias, as quais podem penetrar no óvulo, mas são seletivamente destruídas.

O DNA mitocondrial é a contrapartida matrilínea do cromossomo Y. Isso ocorre porque ele está no citoplasma, dentro das mitocôndrias, as usinas energéticas das células (ver figura ao lado). Como herdamos as mitocôndrias apenas de nossas mães, as variações genéticas do DNA mitocondrial permitem também o estabelecimento de haplótipos e haplogrupos maternos. Maiores detalhes sobre a metodologia dos estudos de genealogia que usam o DNA mitocondrial podem ser obtidos aqui .

Meu DNA mitocondrial pertence ao haplogrupo A, que é um dos principais haplogrupos característicos de ameríndios. Compartilho o haplogrupo A com milhões de pessoas nas três Américas. Mas meu haplótipo mitocondrial é compartilhado apenas pelos indivíduos da minha matrilinhagem imediata. Assim, como no caso do cromossomo Y, podemos definir se existe ou não parentesco matrilíneo entre duas pessoas e, caso haja, estimar sua proximidade pelo cálculo do tempo até o ancestral comum mais recente (ACMR).

Finalmente, temos o terceiro tipo de genealogia por DNA, que estuda a ancestralidade genômica, baseada na genotipagem de 40 locos genéticos autossômicos de polimorfismos de inserção-deleção. Essa ferramenta nos permite distinguir, em brasileiros, as contribuições genômicas relativas de nossas três raízes ancestrais: européia, africana e ameríndia. O estudo do meu genoma revelou uma ancestralidade 88% européia, 6% ameríndia e 6% africana. Uma texto explicando as diferenças entre os vários tipos de ancestralidade estudados na genealogia por DNA pode ser acessado aqui.

Pelo exposto podemos, então, entender que a genealogia tradicional e a genealogia molecular se complementam e não competem. Cada uma responde perguntas próprias, utilizando ferramentas específicas. A existência e a disponibilidade de ambas no Brasil nos equipa, de maneira bastante completa, para responder à grande pergunta de Gauguin: D’où venons-nous?


Sergio Danilo Pena
Professor Titular do Departamento de Bioquímica e Imunologia
Universidade Federal de Minas Gerais
08/08/2008