Pular para o conteúdo

Os 10 anúncios que fizeram de 2024 um ano marcante para a IA

Tempo de leitura: 7 minutos

Passamos oficialmente do segundo aniversário do início do boom da IA ​​e as coisas não desaceleraram. Exatamente o oposto. A IA generativa está crescendo em um ritmo que parece quase esmagador, expandindo-se para novas plataformas, mídias e até mesmo dispositivos em um ritmo implacável.

Aqui estão os 10 anúncios que fizeram de 2024 um ano monumental no mundo da IA.

OpenAI lança GPT-4o

Mira Murati anunciando GPT-4o.
OpenAI

Quando ChatGPT (executando GPT-3.5) chegou pela primeira vez em novembro de 2022, era basicamente um jogo sofisticado de Mad Libs controlado por computador. Não me interpretem mal, mesmo essa capacidade era revolucionária na época, mas foi só com o lançamento do GPT-4o em maio de 2024 que os sistemas generativos de IA realmente se destacaram.

Com base na capacidade do seu antecessor de analisar e gerar texto e imagens, o GPT-4o fornece uma compreensão contextual mais abrangente em comparação com o GPT-4 sozinho. TIsso se traduz em melhor desempenho em tudo, desde legenda de imagens e análise visual até a geração de conteúdo criativo e analítico, como gráficos, tabelas e imagens.

O Modo de Voz Avançado ajuda os computadores a falar como humanos

Aplicativo de desktop ChatGPT Advanced Voice Mode
OpenAI

Em setembro, a OpenAI mostrou mais uma vez porque é a empresa líder em inteligência artificial ao lançar seu Modo de voz avançado para assinantes do ChatGPT. Esse recurso eliminou a necessidade de os usuários digitarem suas perguntas em uma janela de prompt, permitindo-lhes conversar com a IA como fariam com outra pessoa.

Aproveitando os tempos de resposta equivalentes a humanos do GPT-4o, o Advanced Voice Mode mudou fundamentalmente a forma como as pessoas podem interagir com a inteligência da máquina e ajudou os usuários a liberar toda a capacidade criativa da IA.

A IA generativa chega ao limite

Usando Inteligência Visual em um iPhone 16 Pro mostrando a resposta do ChatGPT.
A inteligência visual em iPhones depende da câmera para entender o mundo ao redor.Christine Romero-Chan / Tendências Digitais

Quando ChatGPT estreou em 2022, era a única IA da cidade e estava disponível exatamente em um só lugar: ChatGPT.com. Oh, que diferença dois anos fazem. Hoje em dia, você pode encontrar IA generativa em tudo, desde smartphones e dispositivos domésticos inteligentes até veículos autônomos e dispositivos de monitoramento de saúde. O ChatGPT, por exemplo, está disponível como aplicativo de desktop, API, aplicativo móvel e até mesmo por meio de um número 0800. A Microsoft, por sua vez, integrou a IA diretamente em sua linha de laptops Copilot+.

Talvez o exemplo mais significativo, claro, seja o Apple Intelligence. Pode não ter sido o lançamento de maior sucesso (muitos dos recursos que ainda esperamos), mas em termos de tornar os poderes da IA ​​generativa tão acessíveis quanto possível, nada foi tão importante quanto a Apple Intelligence.

Agora, nem os PCs Copilot+ nem a Apple Intelligence revelaram o que as empresas envolvidas provavelmente queriam – especialmente para a Microsoft – mas como todos sabemos, isso é apenas o começo.

O ressurgimento da produção de energia nuclear

ilha de três milhas
Energia da Constelação

Antes deste ano, a energia nuclear era vista como uma proposta perdida na América. Considerado não confiável e inseguro, em grande parte devido ao incidente de Three Mile Island em 1979, no qual um dos reatores primários da usina derreteu parcialmente e expeliu material radioativo e tóxico na atmosfera. No entanto, com o rápido aumento da quantidade de energia eléctrica que os modelos modernos de grandes linguagens exigem — e a enorme pressão que colocam nas redes eléctricas regionais — muitas empresas líderes de IA estão a analisar mais de perto a gestão dos seus centros de dados utilizando a energia do átomo.

A Amazon, por exemplo, comprou um data center de IA movido a energia nuclear da Talen em março e, em seguida, assinou um acordo para adquirir pequenos reatores modulares (SMRs) miniaturizados e independentes da Energy Northwest em outubro. A Microsoft, para não ficar atrás, comprou a própria capacidade de produção de Three Mile Island e atualmente está trabalhando para colocar o Reactor One novamente online e gerando eletricidade.

Os agentes estão preparados para ser a próxima grande novidade na IA generativa

óculos e chatgpt
Matheus Bertelli / Pexels

Acontece que há um limite de dados de treinamento, poder e água que você pode usar na tarefa de desenvolver seu grande modelo de linguagem até se deparar com a questão dos retornos decrescentes. A indústria de IA experimentou isso em primeira mão em 2024 e, em resposta, começou a se afastar dos enormes LLMs que originalmente definiram a experiência generativa de IA em favor dos Agentes; modelos menores e mais responsivos, projetados para executar tarefas específicas, em vez de tentar fazer tudo o que o usuário pode solicitar.

A Anthropic estreou seu agente, batizado de Computer Use, em outubro. A Microsoft seguiu o exemplo com o Copilot Actions em novembro, enquanto a OpenAI está supostamente preparada para lançar seu recurso de agente em janeiro.

A ascensão dos modelos de raciocínio

The openAI o1 logo
OpenAI

Muitos dos grandes modelos de linguagem atuais são mais voltados para a geração de respostas o mais rápido possível, muitas vezes às custas da precisão e da correção. O modelo de raciocínio o1 da OpenAI, que a empresa lançou como uma prévia em setembro e como um modelo totalmente funcional em dezembro, adota a abordagem oposta: sacrifica a velocidade de resposta para verificar internamente sua justificativa para uma determinada resposta, garantindo que seja tão precisa e completa possível.

Embora esta tecnologia ainda não tenha sido totalmente adotada pelo público (atualmente o1 está disponível apenas para assinantes dos níveis Plus e Pro), as principais empresas de IA estão avançando com versões próprias. O Google anunciou sua resposta a o1, apelidada Gemini 2.0 Flash Thinking Experimental, em 19 de dezembro, enquanto a OpenAI revelou que já está trabalhando no sucessor do o1, que chama de o3, durante seu evento de transmissão ao vivo de 12 dias de OpenAI em 20 de dezembro.

A pesquisa com tecnologia de IA se espalha pela Internet

Aplicativo Perplexity AI em execução em um iPhone 14 Pro.
Joe Maring/Tendências Digitais

A IA generativa está aparentemente em toda parte hoje em dia, então por que não seria integrada a um dos recursos mais básicos da Internet? O Google vem brincando com a tecnologia nos últimos dois anos, primeiro lançando o Search Generative Experience em maio de 2023, antes de lançar seu recurso AI Overview em maio passado. Visão geral do AI gera um resumo das informações que um usuário solicita na parte superior da página de resultados de pesquisa.

Perplexity AI leva essa técnica um passo adiante. Seu “mecanismo de resposta” vasculha a Internet em busca das informações solicitadas pelos usuários e, em seguida, sintetiza esses dados em uma resposta coerente, coloquial (e citada), eliminando efetivamente a necessidade de clicar em uma lista de links. A OpenAI, sempre inovadora, desenvolveu um sistema quase idêntico para seu chatbot, denominado ChatGPT Search, que estreou em outubro.

Artifact da Anthropic dá início a uma revolução colaborativa

O logotipo da Antrópico sobre fundo vermelho.
Antrópico

Tentar gerar, analisar e editar arquivos grandes – sejam eles ensaios criativos longos ou trechos de código de computador – diretamente no fluxo de bate-papo pode ser cansativo, exigindo que você role indefinidamente para frente e para trás para visualizar o documento inteiro.

O recurso Artefatos da Anthropic, que estreou em junho, ajuda a mitigar esse problema, fornecendo aos usuários uma janela de visualização separada para visualizar o texto criado por IA fora da conversa principal. O recurso provou ser um sucesso tão grande que a OpenAI rapidamente seguiu o exemplo com sua própria versão.

Seus modelos e recursos mais recentes transformaram o Anthropic em um oponente formidável do OpenAI e do Google este ano, o que por si só parece significativo.

Geradores de imagem e vídeo finalmente descobrem os dedos

Use o Controle da Câmera para direcionar cada foto com intenção.

Aprenda como com a Runway Academy de hoje. pic.twitter.com/vCGMkkhKds

– Pista (@runwayml) 2 de novembro de 2024

Antigamente, detectar uma imagem ou vídeo gerado por IA era tão simples quanto contar o número de apêndices que o sujeito mostra – qualquer coisa além de dois braços, duas pernas e 10 dedos eram obviamente gerados, como as imagens no estilo Cronenberg do Stable Diffusion 3 demonstraram em Junho. No entanto, à medida que 2024 chega ao fim, a diferenciação entre conteúdo produzido por humanos e por máquinas tornou-se significativamente mais difícil, à medida que os geradores de imagem e vídeo melhoraram rapidamente a qualidade e a precisão fisiológica dos seus resultados.

Sistemas de vídeo AI como Kling, Gen 3 Alpha e Movie Gen agora são capazes de gerar clipes fotorrealistas com distorção mínima e controle de câmera refinado, enquanto sistemas como Midjourney, Dall-E 3 e Imagen 3 podem criar imagens estáticas com um grau surpreendente de realismo (e artefatos alucinados mínimos) em uma miríade de estilos artísticos.

Ah, sim, e Sora da OpenAI finalmente fez sua estreia como parte dos anúncios de dezembro. A batalha pelos modelos de vídeo gerados por IA está esquentando e eles se tornaram surpreendentemente impressionantes em 2024.

Esforço de US$ 10 bilhões de Elon Musk para construir o maior cluster de treinamento de IA do mundo

Elon Musk no Tesla Cyber ​​Rodeo.
Tendências Digitais

xAI lançou o Grok 2.0 este ano, o modelo mais recente integrado ao X. Mas a maior novidade em torno do empreendimento de IA de Elon Musk é sobre o rumo que isso levará no futuro. Em 2024, Elon Musk começou a construir o “o maior supercomputador do mundo” perto de Memphis, Tennessee, que ficou online às 4h20 do dia 22 de julho. Impulsionado por 100.000 GPUs Nvidia H100, o supercluster tem a tarefa de treinar novas versões do modelo de IA generativo Grok da xAI, que Musk afirma que se tornará “a IA mais poderosa do mundo.”

Espera-se que Musk gaste cerca de US$ 10 bilhões em custos de capital e inferência somente em 2024, mas está supostamente trabalhando para dobrar o número de GPUs que alimentam o supercomputador no novo ano.