Por que a IA é tão ruim em gerar imagens de Kamala Harris?

Quando Elon Musk compartilhou uma imagem mostrando Kamala Harris vestida de “ditadora comunista” no X na semana passada, era obviamente uma farsa, visto que Harris não é comunista nem, até onde sabemos, uma cosplayer soviética. E, como muitos observadores notaram, a mulher na foto, presumivelmente gerada pela ferramenta Grok do X, tinha apenas uma semelhança passageira com o vice-presidente.

“A IA ainda não é capaz de retratar Kamala Harris com precisão”, um usuário X escreveu. “Parece que eles estão postando uma mulher latina aleatória.”

“Grok colocou a velha Eva Longoria em uma roupa elegante e encerrou o dia”, brincou outro, notando a semelhança do “ditador” retratado com o Donas de casa desesperadas estrela.

“A IA NÃO PODE replicar Kamala Harris,” um terceiro postou. “É assustador o quão falho o algoritmo é em um AMERICANO (de ascendência sul-indiana e jamaicana).”

Muitos IA imagens de Harris são igualmente ruins. Enquanto isso, um tweet com um Vídeo gerado por IA mostrando Harris e Donald Trump em um relacionamento romântico — que culmina com ela segurando seu filho amado, que se parece com Trump — tem quase 28 milhões de visualizações no X. Ao longo da montagem, Harris se transforma no que parecem ser pessoas diferentes, enquanto as imagens notavelmente melhores de Trump permanecem bastante consistentes.

Quando tentamos usar Grok para criar uma foto de Harris e Trump colocando suas diferenças de lado para ler uma cópia da WIRED, os resultados repetidamente retrataram o ex-presidente com precisão, enquanto erraram o vice-presidente. Harris apareceu com características, penteados e tons de pele variados. Em algumas ocasiões, ela parecia mais com a ex-primeira-dama Michelle Obama.

Grok é diferente de alguns geradores de imagens de IA de alto nível, pois permite que os usuários criem fotos falsas de figuras políticas. No início deste ano, Midjourney começou a bloquear seus usuários de criar imagens de Trump e do presidente Joe Biden. (A proibição se estende a Harris.) A medida ocorreu após a publicação de uma relatório pelo Centro de Combate ao Ódio Digital, que descobriu que a ferramenta poderia ser usada para gerar uma variedade de imagens com carga política.

Da mesma forma, o ChatGPT da OpenAI e o Gemini do Google se recusaram a produzir imagens de Harris ou Trump nos testes da WIRED. Enquanto isso, vários geradores de imagens de código aberto, como Grok, produzirão imagens de políticos. A WIRED descobriu que um desses modelos, Stable Diffusion, também produziu imagens não muito boas de Harris.

Os geradores de imagens de IA modernos usam o que é conhecido como modelos de difusão para gerar imagens a partir de prompts de texto. Esses modelos são alimentados com milhares de imagens rotuladas, normalmente raspadas da web ou coletadas de outras fontes. Joaquin Cuenca Abela, CEO da Freepikuma empresa que hospeda várias ferramentas de IA, incluindo vários geradores de imagens, disse à WIRED que a dificuldade que tais geradores têm em evocar Harris, em comparação a Trump, é que eles receberam menos imagens bem rotuladas.

Apesar de ser uma figura proeminente, Harris não foi tão amplamente fotografada quanto Trump. A busca da WIRED pelo fornecedor de fotos Getty Images confirma isso; retornou 63.295 imagens de Harris em comparação com 561.778 de Trump. Dada sua entrada relativamente recente na corrida presidencial, Harris é “uma nova celebridade”, no que diz respeito aos criadores de imagens de IA, de acordo com Cuenca Abela. “Sempre leva alguns meses para se atualizar”, diz ele.

Rolar para cima
Pular para o conteúdo