Desde que a OpenAI lançou o ChatGPT no final de 2022, a indústria de tecnologia tem perseguido a inteligência artificial. Nos últimos anos, as empresas de tecnologia têm acelerado o desenvolvimento da IA – e você poderia argumentar que todo mundo está tentando pegar o OpenAI. Ainda assim, parece que ninguém descobriu o “aplicativo matador” para IA ainda. O ano de 2024 pode ser caracterizado pela indústria de tecnologia colocando a IA em todos os lugares possíveis, tentando descobrir o que funcionaria.
O novo ano marcará uma mudança significativa e a forma como os consumidores interagem com a IA em 2025 está prestes a mudar. Atualmente, você precisa se esforçar para usá-lo. É necessário carregar o site ChatGPT ou recorrer ao assistente Gemini para conversar com ajudantes de IA. No próximo ano, provavelmente não será o caso. A IA será incorporada aos sistemas operacionais e softwares que você usa e se tornará capaz o suficiente para começar a fazer as coisas completamente em seu nome.
O final deste ano trouxe alguns vislumbres do que está por vir em 2025. O Projeto Astra está sendo testado por pessoas fora do Google, o Android XR é o primeiro sistema operacional construído com Gemini no núcleo e o Apple Intelligence agora está disponível com ChatGPT integração.
Não precisamos adivinhar o que a IA trará em 2025 – as empresas de tecnologia e os seus executivos já traçaram muitos dos seus planos. Ainda há perguntas a serem respondidas. Que empresas podem realmente cumprir as suas promessas, como irão mudar a forma como utilizamos dispositivos móveis e wearables e que implicações para a privacidade terão estas mudanças?
A IA se tornará o coração dos sistemas operacionais móveis
Até agora, a inteligência artificial potencializou muitos recursos e aplicativos individuais. Alguns tiveram grande sucesso – a OpenAI informou que o ChatGPT tinha 200 milhões de usuários semanais em agosto de 2024 – e outros nem tanto. Gemini, por exemplo, foi baixado cerca de 780 mil vezes em setembro de 2024, segundo Statista. O número do ChatGPT? Seriam 4,2 milhões de downloads no mesmo mês, apesar do aplicativo ChatGPT já estar disponível para iOS e Android há mais de um ano.
Enquanto isso, os dispositivos de hardware criados com IA em seu centro falharam definitivamente, e o Rabbit R1 e o Humane AI Pin são dois exemplos importantes deste ano. Especificamente, o Rabbit R1 era um pequeno dispositivo de IA que apresentava um “Grande Modelo de Ação” que poderia realizar ações em seu nome. Pedir ao Rabbit R1 para tocar uma música exigiria que ele usasse o Spotify para você, e pedir comida faria com que o Rabbit literalmente usasse um cliente DoorDash em um servidor remoto para você.
A razão pela qual esses dispositivos falharam é porque, bem, as pessoas já têm ótimos telefones. Eles são mais poderosos e mais adequados para tarefas de IA do que dispositivos de hardware especializados. Em 2025, estes dispositivos convencionais tornar-se-ão mais parecidos com os produtos fracassados de IA. O Rabbit R1 e o Humane AI Pin visam usar IA para concluir tarefas para você e, em breve, seus smartphones, tablets e wearables farão o mesmo.
A ideia fracassada de Rabbit em relação ao LAM é o que o Google e outros estão tentando fazer certo com modelos de IA de agência.
“Durante o último ano, investimos no desenvolvimento de mais modelos de agentes, o que significa que eles podem entender mais sobre o mundo ao seu redor, pensar vários passos à frente e agir em seu nome, com sua supervisão”, disse o CEO do Google, Sundar Pichai, em uma postagem no blog anunciando o Gemini 2.0. “Com novos avanços em multimodalidade – como imagem nativa e saída de áudio – e uso de ferramentas nativas, isso nos permitirá construir novos agentes de IA que nos aproximam de nossa visão de um assistente universal.”
Como é isso? Depende da empresa. O Google está construindo o Projeto Astra, um auxiliar de IA multimodal que experimentei no Google I/O 2024. Ele é capaz de absorver o ambiente ao seu redor e usar fontes externas para processar consultas e depois responder com saída multimodal. Por exemplo, você pode fazer uma pergunta verbalmente ao Projeto Astra usando uma câmera ou um mecanismo de pesquisa para obter o contexto adequado. Em seguida, ele pode responder com texto escrito, uma imagem gerada ou palavra falada – ou uma combinação dos itens acima.
Embora o Projeto Astra esteja sendo testado apenas por meio do “programa de teste confiável” do Google, a empresa exibiu o software em telefones, óculos e fones de ouvido. Ela também anunciou o Android XR, um novo sistema operacional para fones de ouvido e wearables com o Gemini no centro. É seguro dizer que o Projeto Astra chegará em hardware no próximo ano, e isso pode incluir telefones Pixel e um fone de ouvido Samsung inédito.
Separadamente, o Google tem o Project Mariner, um protótipo de pesquisa que irá literalmente navegar no Chrome para você em andamento. Meta AI já possui suporte multimodal nos óculos Ray-Ban Meta, e a Apple possui Visual Intelligence no iOS 18.2. Por último, mas não menos importante, a OpenAI possui o ChatGPT-4o, um assistente multimodal muito parecido com o Projeto Astra.
Assistir ligado
Há algo que todos esses recursos têm em comum: todos eles se tornarão profundamente integrados aos sistemas operacionais de smartphones, tablets e wearables. Quando disponível, o Projeto Astra certamente estreará no hardware Pixel em 2025. Da mesma forma, o ChatGPT-4o já está disponível no iOS 18.2, uma vez que o Apple Intelligence apresenta integração com ChatGPT.
ChatGPT está disponível em todo o sistema no iOS 18.2, pois você pode invocá-lo em qualquer lugar com o Siri. É assim que os usuários do Android podem definir o Gemini como seu assistente padrão. Além disso, as ferramentas de escrita do Apple Intelligence estão disponíveis em qualquer lugar onde você possa acessar o teclado. A Samsung seguirá o exemplo com One UI 7.
Portanto, duas coisas acontecerão com a IA em 2025. Por um lado, serviços de IA como Project Astra, ChatGPT-4o e Visual Intelligence usarão processamento e ações multimodais para controlar seus dispositivos móveis para você. Por outro lado, recursos menores de IA serão incorporados ao sistema operacional, para que você não precise acessar aplicativos individuais para acessar serviços como Gemini ou ChatGPT.
Demis Hassabis, CEO do Google DeepMind, disse ao The Verge em entrevista: “Realmente vemos 2025 como o verdadeiro início da era baseada em agentes”.
Google, Apple, OpenAI e outros competirão para construir os melhores modelos
Uma das principais incógnitas para a IA em 2025 é se o progresso está destinado a estagnar. Alguns especialistas acreditam que o progresso da IA foi alcançado tão rapidamente em 2023 e 2024 que deverá estagnar em 2025. Os principais executivos reconheceram, ocasionalmente, um potencial abrandamento. No entanto, eles estão unidos contra a ideia de um “muro” ou de que atingimos os limites do progresso da IA por enquanto.
“Quando você começa a expandir rapidamente, pode lançar mais computação e fazer muito progresso, mas definitivamente precisará de avanços mais profundos à medida que avançamos para o próximo estágio”, disse Pichai no Dealbook Summit no início deste ano. mês. “Então você pode perceber isso como se houvesse uma parede ou algumas pequenas barreiras.”
Em uma de suas clássicas postagens enigmáticas no X (antigo Twitter), o CEO da OpenAI, Sam Altman, expressou um sentimento semelhante, dizendo: “Não há parede”.
Independentemente de haver ou não uma desaceleração, empresas como Apple, OpenAI, Anthropic e Google estarão todas competindo para construir os modelos de IA mais rápidos e eficientes. Embora empresas como o Google tenham melhorado enormemente seus modelos de IA, a vantagem inicial da OpenAI e o reconhecimento da marca ChatGPT têm sido obstáculos significativos para os concorrentes. Mesmo que outras empresas sejam melhores que a OpenAI, os usuários podem não se importar o suficiente para mudar.
Eles também navegarão por águas legais desconhecidas enquanto o governo e a sociedade decidem o que está disponível em termos de material de treinamento em IA. O New York Times é apenas um exemplo de entidade que atualmente está processando a OpenAI pelo que alega ser uma violação da lei de direitos autorais.
Muitos destes casos estão atualmente em curso e podemos esperar que alguns cheguem ao auge em 2025. Além disso, é apenas uma questão de tempo até que mais governos e reguladores tentem instituir salvaguardas e proteções em torno do desenvolvimento e utilização da IA.
A privacidade e as salvaguardas da IA serão algo a ser observado em 2025
Por fim, encerraremos nossa prévia da IA em 2025 com uma análise dos tipos de esforços e salvaguardas de privacidade que serão implementados no próximo ano. Infelizmente, acho que os limites podem ficar confusos quanto ao que é público e privado quando se trata de IA.
A Apple Intelligence é comumente referida como o padrão da indústria para privacidade de IA – a empresa desenvolveu servidores personalizados de computação em nuvem privada que executam um sistema operacional reforçado, e a Apple desafia hackers a tentar quebrá-lo. Se o fizerem, haverá uma recompensa de até um milhão de dólares.
O problema é que existem três tipos de níveis de segurança incorporados ao Apple Intelligence. Algumas tarefas são executadas no dispositivo usando o NPU dentro dos chips de silício da Apple, e outras são terceirizadas para servidores de computação em nuvem privada da Apple. Você não saberá se uma tarefa do Apple Intelligence está sendo executada no dispositivo ou não. Isso depende da Apple e você tem que confiar nela.
Depois, há a integração do ChatGPT, que a Apple vê separadamente do Apple Intelligence – existem algumas proteções de privacidade para os usuários, mas suas solicitações ainda são compartilhadas com o OpenAI, mesmo que não sejam armazenadas. Se você vincular sua conta ChatGPT ao iOS 18, algo necessário para usar ChatGPT Plus e Pro, você concorda com as políticas de privacidade da OpenAI, não com as da Apple.
Em 2025, acho que haverá tantos recursos de IA integrados em nossos dispositivos essenciais que será impossível pensar verdadeiramente sobre as políticas e salvaguardas de privacidade de cada um. Será como concordar com os “termos e condições” antes de configurar um novo dispositivo. Teremos que confiar que as empresas de IA estão agindo no nosso melhor interesse. A única forma de sabermos que as empresas não estão a cumprir as suas promessas é quando inevitavelmente não cumprem.