Pular para o conteúdo

Sora da OpenAI não parece a virada de jogo que deveria ser

Tempo de leitura: 4 minutos

A interpretação de Sora da ginástica
OpenAI

A OpenAI provocou e atrasou repetidamente o lançamento do Sora por quase um ano. Na terça-feira, a empresa finalmente revelou uma versão totalmente funcional do novo modelo de geração de vídeo destinado ao uso público e, apesar do burburinho inicial, cada vez mais os primeiros usuários do lançamento não parecem muito impressionados. E eu também não.

Apresentando Sora, nosso modelo de texto para vídeo.

Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes.

Prompt: “Lindo, com neve… pic.twitter.com/ruTEWn87vf

– OpenAI (@OpenAI) 15 de fevereiro de 2024

A empresa apresentou Sora pela primeira vez em fevereiro passado, recebendo elogios da crítica por suas renderizações de vídeo hiper-realistas. “Sora pode gerar vídeos de até um minuto, mantendo a qualidade visual e a aderência às instruções do usuário”, escreveu a OpenAI em seu blog de anúncios na época. “O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.”

OpenAI continua lançando mais vídeos insanos de Sora

Estes são 100% gerados por IA

9 vídeos que distorcem a realidade

1. Elefante feito de folhas pic.twitter.com/tPsHNGbFPS

– Linus Ekenstam (@LinusEkenstam) 18 de março de 2024

A empresa divulgou mais imagens geradas por Sora em março, desta vez de um elefante feito de folhas, exaltando ainda mais as capacidades do modelo. O programa Sora posteriormente sofreu uma série de atrasos no desenvolvimento, que o diretor de produtos da OpenAI, Kevin Weil, atribuiu em um recente Reddit AMA à “necessidade de aperfeiçoar o modelo, acertar a segurança/representação/outras coisas e dimensionar a computação”. Ao mesmo tempo, A Informação relataram que as primeiras iterações do Sora sofriam de baixo desempenho e lutavam para manter o foco nas instruções do usuário, exigindo até 10 minutos do mundo real para gerar um clipe de um minuto. O modelo também vazou recentemente online por um grupo de testadores beta descontentes que se opuseram às práticas de “lavagem de arte” da OpenAI, no entanto, a empresa rapidamente removeu a interface não autorizada do grupo do Hugging Face em resposta.

Enquanto a OpenAI ajustava e refinava o desempenho do Sora, a concorrência da empresa comia o seu almoço. Firefly AI da Adobe, Gen 3 Alpha da Runway, Movie Gen da Meta e Kuaishou Technology (sem mencionar inúmeras opções gratuitas) proliferaram pela Internet no ano passado, com muitos oferecendo clipes de qualidade superior e tempos de inferência mais rápidos do que o que OpenAI havia prometido repetidamente.

Na terça-feira, a OpenAI revelou oficialmente a versão pronta para produção do Sora e a lançou para seus assinantes Plus de US$ 20 por mês e Pro de US$ 200 por mês (risos). Ou, pelo menos, a empresa fez isso por algumas horas. Como observou o comentarista de tecnologia Ed Zitron no Bluesky Wednesday, “poucas horas – talvez até menos – depois de dizer que Sora estava fora, a OpenAI parou de aceitar novos registros de contas sem um cronograma claro. OpenAI atraiu e trocou toda a mídia tecnológica. Não há como esta empresa ter condições de ter seu gerador de vídeo disponível ao público.”

Para quem conseguiu acesso, os vídeos que Sora conseguiu gerar não foram nada impressionantes. Como a personalidade do YouTube Marques Brownlee apontou durante seu vídeo prático com a modelo, foram necessários vários minutos para gerar um único clipe de 20 segundos de duração com resolução 1080p e houve dificuldade significativa em gerar as pernas de um sujeito e seus movimentos, com a frente e pernas traseiras trocando de posição de forma não natural ao longo do clipe. Basta olhar o vídeo gerado abaixo, de uma ginasta trocando braços, pernas e cabeça enquanto cai sobre um tapete para entender o que ele quis dizer.

aqui está um vídeo de ginástica gerado por Sora

-Peter Labuza (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z

O usuário do Bluesky Peter Labuza, que postou o vídeo da ginástica, não se conteve nas críticas à modelo, afirmando: “Sinto muito, mas se você fizer um gerador de texto para vídeo e disser “faça um gato correr através de um campo” e você dá a imagem inicial e o gato simplesmente PARA, seu gerador não funciona.

O usuário do Bluesky, Chris Offner, tinha uma opinião semelhante, observando sarcasticamente que “Sora é um mecanismo de física baseado em dados” enquanto compartilhava um clipe absolutamente maluco de um esquiador desafiando a maioria, senão todas, as leis da física conhecidas.

The Verge também testou o modelo, lamentando o fato de ainda não ter conseguido evitar inclusões desagradáveis, como “membros adicionais ou objetos distorcidos”.

“Sora é um mecanismo de física baseado em dados.”x.com/chrisoffner3…

-Chris Offner (@chrisoffner3d.bsky.social) 2024-12-10T12:42:53.674Z

Nem todo mundo odiou Sora à primeira vista, veja bem. O usuário do X, Nathan Shipley, exibiu o recurso “remix” do modelo, que permite aos usuários mascarar um vídeo gerado para os movimentos de objetos em uma amostra enviada. Nesse caso, ele fez a cabeça de um guindaste gerado se mover da mesma maneira que uma tesoura que ele filmou segurando.

Teste Sora Remix: Tesoura para guindaste

O prompt foi “Close up de um curioso pássaro guindaste olhando ao redor de uma bela cena natural perto de um lago. A cabeça do pássaro aparece na foto e depois sai.” pic.twitter.com/CvAkdkmFBQ

-Nathan Shipley (@CitizenPlain) 10 de dezembro de 2024

Ainda não há informações sobre quando a empresa poderá reabrir de forma confiável as inscrições de contas para usuários Sora interessados. Se a OpenAI pode cortejar Hollywood com Sora em seu estado atual, como a Runway fez recentemente com a Gen 3 e a Lionsgate, também resta saber.

Uma coisa permanece certa: a OpenAI, apesar de sua liderança inicial no boom da IA, está sendo rapidamente superada pelo resto da indústria, e lançamentos de produtos sem brilho como o que acabamos de ver com Sora só prejudicarão ainda mais a reputação da empresa.