Em 2017, enviei amostras de DNA para a Ancestry, bem como para outras duas empresas de DNA. Meus pais faleceram recentemente e eu tinha algumas dúvidas sobre meu histórico familiar que esperava que o DNA pudesse revelar.
No final das contas, a revelação do DNA gerou uma história bastante longa e dolorosa, que você pode ler aqui:
Desde então, tenho me envolvido com minha árvore genealógica. Gosto de vasculhar documentos e conexões, seguir pistas e atualizar gráficos.
Mas então, há algumas semanas, fui contactado por uma das minhas correspondências de ADN. Era um tipo estranho de conexão.
Com base nos dados de DNA, eu sabia exatamente o quanto éramos parentes (aproximadamente primos de terceiro grau), com cerca de 1% de DNA compartilhado. Mas eu não sabia (e ainda não sei) o sexo ou o nome da pessoa. O contato usava um nome de usuário Ancestry, que não indicava sexo nem nome. Também sei que a idade aproximada da pessoa é próxima da minha, pois ela me informou a idade na mensagem.
E então as coisas começaram a ficar interessantes. Meu primo (pois sei que a pessoa é meu primo, mesmo que não saiba o nome dela) pediu ao ChatGPT que fornecesse informações sobre nosso possível relacionamento com base nos dados de DNA. Isso incluiu a expectativa de vida média e os períodos de nascimento e morte de nossos ancestrais comuns.
Além disso: como o ChatGPT digitalizou 170 mil linhas de código em segundos, economizando horas de trabalho
Pedi permissão a esse primo misterioso para contar a você sobre o uso do ChatGPT, que eles concederam. Com base na transcrição da sessão, juntamente com algumas de minhas próprias perguntas, o ChatGPT conseguiu lançar alguma luz sobre a conexão familiar.
Neste artigo, vou mostrar como usei o ChatGPT (e, por extensão, como você pode usá-lo) para explorar conexões genealógicas entre parentes de DNA. Mostrarei as instruções, mas na maioria dos casos, apenas resumirei as respostas, porque elas podem ser bastante longas.
Como estamos relacionados?
Meu ponto de partida foram os próprios dados de DNA. De acordo com Ancestralidade:
- DNA compartilhado: 95 cM em 10 segmentos do meu lado materno
- DNA compartilhado não ponderado: 95 cM
- Segmento mais longo: 16 cm
A ancestralidade previu que éramos “meio primo em segundo grau 1x removidos”, mas a quantidade de DNA compartilhada não necessariamente coloca o relacionamento em uma árvore genealógica. Ele apenas informa a quantos saltos uma pessoa está da outra. Portanto, esses saltos podem subir e descer igualmente na árvore, ou subir parcialmente de um lado e descer uma geração extra do outro, ou alguma variedade dos dois.
Comecei a perguntar ao ChatGPT sobre os dados de DNA. Perguntei:
O que isto significa? DNA compartilhado: 95 cM em 10 segmentos DNA compartilhado não ponderado: 95 cM Segmento mais longo 16 cM
Também: Passei horas testando tarefas do ChatGPT – e sua recusa em seguir as instruções foi um pouco assustadora
Disseram-me que cM é uma unidade de medida para ligação genética. Ele mede o comprimento do DNA compartilhado entre dois indivíduos. O valor 95 indica primos de segundo grau ou superiores. O DNA é compartilhado em blocos ou segmentos. Quanto mais segmentos, mais próximo será o relacionamento. Segmentos maiores indicam relacionamentos mais próximos, enquanto segmentos menores indicam relacionamentos mais distantes.
Nosso DNA compartilhado tinha poucos segmentos compartilhados, e esses segmentos eram bem pequenos. Todos juntos, isso nos colocou a cerca de oito saltos geracionais um do outro.
Que tipo de primos?
Eu sabia que meu primo e eu temos quase a mesma idade, então perguntei:
Se ambas as partes tiverem idades semelhantes, seria mais provável que fossem primos de terceiro grau ou de segundo grau, uma vez removidos?
Nesse caso, provavelmente seríamos primos em terceiro grau. A frase “x removido” indica uma diferença de gerações. Como ambos temos aproximadamente a mesma idade, nosso rótulo geracional não incluiria “removidos”. Em vez disso, seríamos provavelmente primos em terceiro grau.
Desenhe-me um diagrama
Tive problemas para visualizar isso, então pedi ao ChatGPT que me desse um diagrama. Minha primeira solicitação foi: “Gostaria de ver isso. Por favor, use DALL·E.” Recebi de volta o que quer que isso deveria ser.
Então tentei: “Por favor, crie uma visualização usando um diagrama em vez de uma imagem”. Recebi um diagrama que listava “tataravô” em cada nó.
Então, corrigi o ChatGPT com: “Esse diagrama não parece correto. Você rotulou bisavós em cada nó.” Isso resultou neste diagrama, que deixa bastante clara a relação com meu primo, se estiver correta. Procurei corroboração em outro lugar e parece correto.
Então, agora eu pude ver que nossas famílias estavam conectadas através do avô do meu avô. Isso torna difícil para nós ver os laços familiares porque identifiquei apenas provisoriamente um tataravô em toda a minha árvore.
Quantos avós?
Isso me levou a outra pergunta: quantos possíveis avós existem no conjunto ancestral que meu primo e eu compartilhamos? Aqui está o que perguntei ao ChatGPT:
No nível dos primos de terceiro grau, qual é o tamanho do conjunto de bisavós?
A IA respondeu que, no nível do terceiro primo, cada um de nós tem um grupo de 16 tataravós. Compartilhamos um par de tataravós, o que significa que cada um de nós também tem 15 tataravós que são únicos para cada um de nós.
Também: A melhor IA para codificação (e o que não usar)
Identifiquei apenas um tataravó em toda a minha árvore. Tive dificuldade em confirmar quem são meus bisavós (aparentemente “Poppy”, que é a única maneira pela qual minha mãe se referiu ao avô, não é um bom termo de pesquisa). Isso aumenta as chances de que a pessoa que identifiquei (ou que possa ter identificado porque os dados são instáveis) seja o tataravô compartilhado.
Perguntas geracionais
Em uma breve conversa pela interface de mensagens do Ancestry, meu primo descreveu o ChatGPT como “meu novo melhor amigo”. Eles usaram o ChatGPT para tentar descobrir quando nosso ancestral mútuo poderia ter vivido. Como meu primo disse que “nosso ancestral comum provavelmente teria vivido na Rússia”, suponho que estamos trabalhando com a árvore da minha avó materna, já que a família dela veio da Rússia.
Além disso: 7 maneiras de escrever prompts ChatGPT melhores – e obter os resultados desejados com mais rapidez
Munido das informações acima, modifiquei ligeiramente o prompt do meu primo e enviei o seguinte para o ChatGPT:
Estou tentando identificar os possíveis anos de nascimento e morte de um ancestral comum. Meu primo compartilha 1% do meu DNA e já determinamos que provavelmente somos primos de terceiro grau. Também temos idades semelhantes, nascemos na década de 1960.
Sei que os pais da minha avó materna vieram de Ravna, que fica a meio caminho entre Moscou e São Petersburgo, na Rússia.
O pai da minha avó materna chegou à América em 1902, com cerca de 21 anos de idade. A esposa dele chegou em 1898 ou 1900 (dependendo da fonte em que você acredita), mas eles se casaram em 1905. Ela tinha 28 anos quando se casaram. Ele tinha 24 anos.
A família de meus primos chegou por volta de 1880. Com base na média de vida na época e no país de origem do ancestral, quais seriam os prováveis anos de nascimento e morte do ancestral?
A IA dividiu a resposta em quatro elementos: identificação da geração provável do ancestral comum, determinação dos anos de nascimento, estimativa dos anos de morte e referência cruzada com dados de migração. Na primeira execução, o ChatGPT estimou que nossos ancestrais comuns nasceram entre 1847 e 1861 e morreram entre 1870 e 1921.
ChatGPT então perguntou: “Você gostaria que eu refinasse isso ainda mais com contexto histórico adicional ou explorasse outros aspectos desta estimativa?” ao que respondi: “Sim”. Eu sei, estritamente falando, que “Sim” não responde a uma pergunta ou/ou, mas tentei. A IA entendeu que isso significava que eu queria mais informações, o que na verdade foi a escolha certa.
Também: Os melhores chatbots de IA
Foi necessária uma nova olhada nos cronogramas da família, levando em consideração os detalhes da migração. A partir daí, reduziu o intervalo de anos de nascimento para 1835-1861 e de anos de morte para 1870-1880.
Em seguida, perguntou: “Você gostaria de obter informações adicionais, como possíveis fatores culturais ou regionais que poderiam restringir ainda mais esse intervalo?” Neste caso, respondi: “Ambas as famílias eram judias”.
O ChatGPT reconheceu corretamente que este detalhe pode alterar as estimativas, porque “as famílias judias na Rússia do século XIX experimentaram padrões demográficos, culturais e migratórios únicos”. A vida não era fácil para os nossos antepassados naquela época, com os pogroms, a residência forçada em guetos étnicos e a estrutura comunitária única dos judeus russos no final do século XIX.
A partir disso, ChatGPT determinou:
- Faixa de ano de nascimento: ~1820–1840 (dependendo do momento geracional).
- Faixa de anos de morte: ~1870–1900 (possivelmente mais próximo de ~1880, se faleceram antes ou durante a emigração de seus filhos).
Se você quiser ver toda a sessão do ChatGPT, fique à vontade para clicar neste link.
A conexão do DNA
Acho algumas dessas coisas estranhamente fascinantes. O corpo humano contém cerca de 200-250 gramas de DNA, que equivale aproximadamente ao peso de uma maçã de tamanho médio. A quantidade de DNA que meu primo e eu compartilhamos é cerca de 1% disso, ou aproximadamente o peso de um pequeno clipe de papel.
Além disso: Os cinco maiores erros que as pessoas cometem ao solicitar uma IA
Esse “clipe de papel” é feito de grupos açúcar e fosfato, codificados com pares de adenina e timina usando duas ligações de hidrogênio, e pares de citosina e guanina usando três ligações de hidrogênio. Cada uma dessas quatro moléculas contém átomos de nitrogênio.
A partir disso, podemos descobrir que uma pessoa que nunca conheci e com quem compartilho um código equivalente a um clipe de papel, que nos identifica como descendentes de duas pessoas que viveram na Rússia na mesma época em que a América estava tendo sua Guerra Civil. .
Não conhecemos essas duas pessoas. Não conhecemos suas histórias. Não sabemos seus nomes. No entanto, existimos porque algo uniu esses dois antepassados, e uma série de acontecimentos improváveis e incognoscíveis ao longo dos últimos 150 anos levaram ao nascimento de dois estranhos no lado oposto do globo onde viveram os nossos tataravós.
Também: ChatGPT vs. ChatGPT Plus: uma assinatura paga ainda vale a pena?
Não falamos a língua que eles falavam e o planeta em que vivemos é muito diferente daquele em que viviam. E, no entanto, estamos aqui – e você está lendo isto – apenas por causa deles.
Você tem uma história interessante de DNA? Você já experimentou o ChatGPT como ferramenta para pesquisar seu patrimônio? Deixe-nos saber nos comentários abaixo.
Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de assinar meu boletim informativo semanal e siga-me no Twitter/X em @DavidGewirtzno Facebook em Facebook.com/DavidGewirtz, no Instagram em Instagram.com/DavidGewirtz, no Bluesky em @DavidGewirtz.com e no YouTube em YouTube.com/DavidGewirtzTV.