Há uma história dos primeiros dias do cinema que parece aplicável ao Sora, a ferramenta de criação de texto para vídeo lançada pela OpenAI esta semana. E dado que os servidores do Sora estão lutando com a demanda, com muitos assinantes do OpenAI ainda esperando para testá-lo, temos tempo para histórias.
Você provavelmente conhece Chegada de um trem na estação La Ciotat (1896) dos irmãos Lumière, mesmo que você nunca tenha visto. Assim como Sora, os Lumière criaram curtas-metragens que mostravam as tecnologias mais recentes. Estamos falando de cinematografia em vez de renderização de IA, e luxuosos 50 segundos de filme em vez dos 20 segundos máximos permitidos nos vídeos Sora.
Ainda assim, é o mesmo princípio: esta foi uma prévia de uma forma chocantemente nova de entretenimento. Segundo a lenda – uma lenda cimentada no encantador filme de Martin Scorcese sobre um menino da era Lumière, Hugo (2011) – Chegada de um trem o público correu aterrorizado por uma máquina a vapor que parecia estar indo direto para eles.
Uma sensação semelhante de pânico se apodera de Sora – especificamente, pânico sobre o que os vídeos de IA podem fazer para destruir ainda mais nosso cenário de mídia “pós-verdade”. O espectador médio já tem dificuldade em julgar o que é real e o que não é, e o problema é pior se estiver deprimido. Estamos vivendo uma era de ouro das teorias da conspiração. O homem mais rico do mundo já compartilhou um vídeo deepfake de IA para ajudar a influenciar uma eleição.
Um chatbot de IA poderia dissuadi-lo de acreditar em uma teoria da conspiração?
O que acontece quando Sora consegue fazer qualquer prompt parece tão real quanto algo que você pode ver no noticiário noturno – pronto para ser divulgado nas redes sociais?
A OpenAI parece pensar que suas marcas d’água, visíveis e invisíveis, impediriam qualquer travessura. Mas tendo baixado dezenas de vídeos do Sora agora, posso atestar que a marca d’água visível é pequena, ilegível e desaparece no fundo com mais frequência. Seria brincadeira de criança se um software de edição de vídeo o cortasse completamente.
Assim, um mundo de desinformação deliberada, quer por parte de maus actores políticos, quer de influenciadores que tentam estimular o seu envolvimento, está a aproximar-se de nós como um comboio. Certo?
Errado. Porque, como nos conta a história real do filme Lumiere, os humanos são, na verdade, muito mais espertos em relação ao novo entretenimento em vídeo do que imaginamos.
Aqui está o problema Chegada de um trem: a lenda quase certamente está errada. Não temos nenhuma evidência em primeira mão de que o público fugiu do cinema, ou mesmo estremeceu quando viu um trem se aproximando em um clipe de 50 segundos.
O professor de estudos de mídia Martin Loiperdinger chama o conto de pânico de “mito fundador do cinema” e observa que ele remonta a livros escritos na segunda metade do século XX. É possível que os autores o tenham confundido com a versão experimental 3-D posterior dos Lumière. Chegada de um tremque foi exibido algumas vezes em 1934 e foi – como muitos filmes 3-D que viriam – uma novidade e um fracasso comercial.
Portanto, não, o público inicial provavelmente não confundiu a imagem em movimento de um trem com um trem real. Pelo contrário, eles parecem ter se adaptado muito rapidamente a todo o conceito de cinema. Relatos contemporâneos dos curtas Lumière (dos quais havia dezenas; Chegada de um trem não foi visto como um destaque) estão entusiasmados com as possibilidades agora desbloqueadas.
Velocidade da luz mashável
“Ora, se isto continuar”, escreveu um jornal, O Correio de Parisem 1896, “quase conseguimos superar a perda de memória, quase acabar com a separação, quase abolir a própria morte”. (Alerta de spoiler: não o fizemos, embora pareça uma ótima premissa para um século XIX Espelho Negro episódio.)
Outro periódico, Ciência Francesaentusiasmado com a “feitiçaria mais inacreditavelmente maravilhosa” que criou a “fantasmagoria alucinatória” do cinematógrafo. Mesmo os impulsionadores de IA mais tecnológicos de hoje teriam dificuldade em endossar Sora nos mesmos termos.
Porque, como a maioria da IA, Sora costuma ser “alucinatório” – e não no bom sentido.
7 vídeos selvagens de Sora explodindo nas redes sociais após seu lançamento
Como descobri nos momentos em que os servidores OpenAI não foram bloqueados, quase todos os vídeos gerados pelo Sora têm alguns detalhes que parecem errados aos olhos humanos. Digitei um prompt para “jornalista bate na mesa de frustração por não conseguir acessar vídeos de IA” e notei uma caneta que aparece e desaparece na mão do jornalista.
Os erros continuaram e continuaram. O fator novidade diminuiu rapidamente. Os amigos se divertiram e ficaram um pouco assustados com a realidade dos ganhos em “artista de hip-hop modela um suéter de Natal aconchegante” – até que descobrimos que a corrente de ouro do rapper havia se tornado um rabo de cavalo dourado na parte de trás, e as renas no suéter tinha oito pernas.
A resposta de Sora a “uma missa fúnebre com palhaços de circo” acertou em cheio… exceto que a figura de peruca colorida e nariz vermelho no caixão estava sem seu corpo.
Isso não quer dizer que Sora não terá um impacto imediato na indústria de imagens em movimento. Dadas instruções menos bizarras, certamente poderia substituir muitos dos rolos B genéricos frequentemente vistos em explicadores do YouTube e vídeos de treinamento corporativo. (Isso presumindo que a OpenAI não será forçada a parar e desistir de treinar Sora em vídeos da Internet sem a permissão dos fabricantes.)
Isto é para dizer que há uma barreira significativa de entrada quando se trata de criar vídeos apresentando algo incomum, qualquer coisa sobre a qual você esteja tentando mentir, qualquer coisa na qual Sora não tenha sido especificamente treinado. Eliminar todos esses erros, a ponto de não percebermos imediatamente, pode ser um exercício de frustração.
E talvez esses primeiros vídeos de IA cheios de erros sirvam como uma espécie de inoculação em massa – uma pequena dose da doença pós-verdade, que efetivamente fornece aos nossos cérebros anticorpos resistentes à IA que podem nos preparar melhor para uma futura epidemia de falsificações visuais. .
O vídeo AI precisa embarcar no trem de pistas
Certamente estou menos impressionado com a IA depois que solicitei a Sora uma nova visão dos Lumières. Chegada de um trem. Pedi um vídeo onde uma locomotiva faz na verdade, rompe a tela de projeção no final, esmagando o público do cinematógrafo.
Mas Sora não conseguiu nem acessar o curta original de 50 segundos, que é caminho sem direitos autorais e amplamente disponível online (incluindo uma versão já aprimorada pela IA). Alucinava um filme chamado “Chegada de um trem tal (sic)”, aparentemente lançado no ano “18965”.
Quanto a quebrar uma quarta parede literal, esqueça: apesar das várias tentativas de reformulação imediata, Sora simplesmente não conseguiu grocar o que eu estava perguntando. A tela de projeção permaneceu intacta.
Ainda assim, esta versão de Sora ainda pode ser um prenúncio de alguma falsificação visual aterrorizante que está por vir – talvez quando uma tecnologia de vídeo de IA mais robusta cair nas mãos de um futuro DW Griffith.
Duas décadas se passaram entre Chegada de um trem e o infame filme de GriffithO nascimento de uma nação (1915)– o primeiro verdadeiro sucesso de bilheteria, um marco na história do cinema, que também passou a ser uma visão distorcida da história americana recente, recheada de mentiras racistas.
O filme de Griffith, protestado na época pela NAACP, foi extremamente influente na perpetuação da segregação e no renascimento da Ku Klux Klan.
Então, sim, talvez a libertação de Sora esteja lentamente nos empurrando ainda mais na direção de um mundo pós-verdade fragmentado. Mas mesmo num futuro dominado pela IA, os maus actores terão de trabalhar horas extraordinárias se quiserem causar mais danos à sociedade do que as mensagens mais perigosas do cinematógrafo.
Tópicos
Artificial Intelligence
OpenAI