O crescimento da IA generativa (gen AI) foi impulsionado por grandes modelos de linguagem (LLMs) de alto perfil, como o GPT-4o da Open AI, o Gemini do Google e o Claude da Anthropic.
No entanto, enquanto estes modelos maiores monopolizam as manchetes, outro conjunto de modelos tem vindo a ganhar força. Alguns especialistas acreditam que os modelos de linguagem pequena (SLMs) podem ser o futuro da geração AI.
Além disso: Asana lança uma ferramenta sem código para projetar agentes de IA – também conhecidos como seus novos ‘companheiros de equipe’
De acordo com a empresa de pesquisa Gartner, embora os LLMs tenham tradicionalmente dominado o desenvolvimento de modelos de linguagem, os SLMs oferecem soluções potenciais para os principais desafios identificados pelos líderes funcionais, incluindo restrições orçamentárias, proteção de dados, preocupações com privacidade e mitigação de riscos associados à IA. Os líderes empresariais podem ter que escolher entre modelos maiores e menores à medida que exploram a geração de IA.
Então, qual vencerá a batalha? Cinco líderes empresariais nos dão suas opiniões.
1. Considere oportunidades específicas de domínio
Claire Thompson, diretora de dados e análise de grupo da gigante de serviços financeiros L&G, disse esperar que modelos pequenos e grandes tenham um lugar nas atividades empresariais. No entanto, ela também acha que os modelos de destaque atuais poderiam ser ajustados para novos casos de uso.
“Posso ver uma situação em que alguns dos LLMs poderiam começar a ser treinados em tópicos específicos para obter mais detalhes deles, e posso ver que isso está começando a acontecer cada vez mais”, disse ela.
Embora exista uma lacuna para modelos específicos de domínio, Thompson disse à ZDNET que não tem certeza se muitas empresas dedicariam recursos humanos e financeiros ao desenvolvimento interno.
“Não sei se você construiria o seu próprio”, disse ela. “Quando falo sobre construção de modelos, estou mais falando de aproveitar modelos existentes internamente e usar seus dados em um ambiente seguro para alcançar resultados.”
Além disso: o tecnólogo Bruce Schneier sobre segurança, sociedade e por que precisamos de modelos de ‘IA pública’
No entanto, sejam eles grandes ou pequenos, Thompson disse que o futuro depende de modelos específicos de domínio.
“Acho que começaremos a obter modelos mais personalizados”, disse ela. “Você poderia ver, por exemplo, como você pode adaptar um modelo em torno de informações médicas, tópicos climáticos e ESG, e mercados de ativos. É nesses casos de uso específicos que você poderia obter modelos mais personalizados”.
2. Escolha o cavalo certo para o percurso
Nick Woods, CIO do MAG Airports Group, é outro líder digital que disse que o futuro da geração AI é provavelmente uma mistura de modelos grandes e pequenos.
“Não acho que seja tamanho único”, disse ele. “E acho que o modelo que você seleciona depende do caso de uso do seu negócio.”
Woods disse à ZDNET que não é incomum ouvir profissionais dizerem que a organização deveria criar um programa de IA. Sua resposta? “Não, é a última coisa que devemos fazer.”
Além disso: as tendências tecnológicas do Gartner para 2025 mostram como sua empresa precisa se adaptar – e rapidamente
Woods disse que os executivos devem concentrar-se na agenda de transformação empresarial e decidir quais ferramentas, incluindo a geração de IA, podem ajudar a produzir os resultados certos. “Então, por exemplo, podemos querer executar um modelo pequeno e específico no limite para resolver um caso de uso específico em torno de algo como detectar quando uma ponte aérea atracou”, disse ele.
“Eu poderia executar algo diferente ao tentar criar um modelo para uma pergunta como: ‘Como é o tráfego aéreo global e como ele reagirá às mudanças climáticas?'”
Resumindo, disse Woods, escolher um modelo é escolher o cavalo certo para o percurso.
“Acho que você verá muitos modelos pequenos implantados na borda em escala para casos de uso específicos”, disse ele. “Isso é quase inevitável. No entanto, ainda acho que veremos alguns grandes modelos prevalecendo.”
3. Considere o contexto
Gabriela Vogel, analista diretora sênior da prática de Liderança Executiva de Negócios Digitais do Gartner, disse que suas conversas com CIOs sugerem que modelos pequenos e específicos de domínio têm um papel importante a desempenhar – pelo menos no curto prazo.
“Os clientes com quem converso estão tentando encontrar e criar modelos aplicados a um contexto específico”, disse ela. “Eles não são necessariamente modelos grandes e gerais, mas sim modelos especificamente vinculados a pequenos bancos de dados para uma aplicação específica”.
Além disso: a nova ferramenta do Perplexity AI torna a pesquisa do mercado de ações ‘delicioso’. Veja como
Vogel disse à ZDNET que mais e mais empresas estão migrando da exploração para a produção de serviços de geração de IA usando SLMs.
“Eles estão fazendo essa mudança porque fizeram muitos testes”, disse ela. “Eles viram o que funciona e o que não funciona com modelos maiores e então estão tentando ser mais específicos e aplicar essa abordagem. Foi isso que vi pessoalmente com meus clientes.”
4. Seja pequeno para reduzir as alucinações
Ollie Wildeman, que lidera a satisfação do cliente na Big Bus Tours, disse que a escolha de SLM ou LLM depende do caso de uso – e para muitas empresas, a seleção provavelmente será menor em vez de maior.
Ele contou à ZDNET como a Big Bus Tours usa o Freshworks Customer Service Suite, um software de suporte omnicanal que inclui chatbots e emissão de bilhetes com tecnologia de IA. A empresa também usa um assistente virtual habilitado para IA da Satisfi Labs que se conecta ao seu site e lida com dúvidas básicas dos clientes.
“A tecnologia de IA da Satisfi coleta dados apenas de empresas específicas com as quais trabalham”, disse ele. “A tecnologia da empresa não está conectada a IAs de grande escala, como ChatGPT ou outras ferramentas – eles próprios fazem isso.”
Além disso: o ecossistema de IA de hoje é insustentável para quase todo mundo, exceto para a Nvidia, alerta um importante estudioso
Wildeman disse que esta abordagem contida cria benefícios para os negócios – os executivos podem ter certeza de como seus dados são usados cuidadosamente para produzir resultados.
“Dessa forma, seus dados ficam mais seguros porque você sabe de onde eles vêm e quais processos estão usando”, disse ele. “Além disso, você tem menos alucinações porque sabe que o modelo que está usando foi projetado para o tipo de negócio em que atua.”
Estes resultados levam Wildeman a concluir que modelos menores e específicos de domínio serão importantes para as empresas.
“Acho que para as empresas, a escolha do modelo será mais específica, enquanto, provavelmente, para o usuário em geral, esses enormes modelos gratuitos que você vê em todos os lugares serão populares”.
5. Concentre-se em seus dados próprios
Rahul Todkar, chefe de dados e IA do Tripadvisor, disse que o modelo certo para uma empresa pode não ser apenas uma questão de ser grande ou pequena.
Os profissionais podem experimentar os dois modelos. No entanto, Todkar disse à ZDNET que modelos personalizados e desenvolvidos especificamente são o futuro da IA, sejam eles definidos como grandes ou pequenos.
“Tomemos o exemplo do Mistral 7B, que é um modelo relativamente pequeno no contexto de outros LLMs, mas funciona fantasticamente bem quando você olha para tarefas específicas”, disse ele. “Então, para mim, o futuro envolve modelos personalizáveis.”
Além disso: o modelo de IA mais recente da Anthropic pode usar um computador como você – com erros e tudo
Todkar sugere que a chave para o sucesso da IA é garantir que o modelo use seus dados de forma segura e eficaz.
“Não é o tamanho do treinamento ou os recursos do modelo que importam, mas sim pegar esse modelo e aplicá-lo em seu contexto com seus dados próprios”, disse ele. “É quando você vai além dos modelos prontos para uso e pode usar os insights de seus dados. Portanto, a resposta estará em algum lugar no meio.”