As preocupações com os custos colocam as estratégias de IA dos CIOs no limite

As preocupações com os custos colocam as estratégias de IA dos CIOs no limite

Os resultados questionáveis ​​e a falta de confiança nos benefícios prometidos pela IA generativa estão a revelar-se barreiras importantes à adoção empresarial da tecnologia.

Mas, de acordo com uma pesquisa recente da IDC, as preocupações com custos são outro grande obstáculo à IA de geração, com 46% dos mais de 1.000 profissionais de TI entrevistados dizendo que a falta de previsibilidade nos preços é o principal obstáculo à implementação da IA ​​de geração em suas organizações.

Para amenizar essas preocupações, os entrevistados da pesquisa da IDC “relatam uma preferência pelo consumo pré-pago, que está fora de sincronia com a maioria dos fornecedores que desejam um compromisso antecipado”, de acordo com um resumo executivo baseado na pesquisa de outubro de TI. profissionais e executivos de linha de negócios.

Sastry Durvasula, diretor operacional, de informações e digital da TIAA, acredita firmemente que a precificação baseada no consumo é o melhor modelo para as estratégias de IA das organizações empresariais.

“A maioria das organizações ainda está descobrindo seus padrões de uso de IA, portanto, comprometer-se com grandes custos iniciais é arriscado. O pagamento conforme o uso oferece melhor visibilidade e controle de custos, além da flexibilidade de escalar com base no uso real”, afirma ele. “Estamos menos preocupados com custos únicos de treinamento/ajuste e mais preocupados com o gerenciamento de despesas operacionais contínuas. Dessa forma, podemos vincular diretamente os custos ao valor e ajustá-los conforme necessário.”

Chris Nardecchia, CIO da Rockwell Automation, concorda que o pagamento conforme o uso é o modelo de precificação preferido dos CIOs.

“A maioria das empresas, especialmente fora do setor tecnológico, enfrenta barreiras significativas à implementação de infraestruturas internas de IA que sejam capazes de executar modelos altamente avançados”, diz ele. “Embora construir do zero esteja fora do alcance da maioria, os modelos baseados em consumo permitem que os CIOs implementem IA de forma incremental com um ROI mais mensurável.”

Os líderes de TI estão entendendo melhor as abordagens de preços de IA dos fornecedores, mas em geral eles não gostam disso. Dave McCarthy, vice-presidente de pesquisa da IDC e um dos autores da pesquisa, destaca que os CIOs ainda estão lidando com a melhor forma de gerenciar custos inesperados na nuvem e aprenderam que estimar custos para novas cargas de trabalho é um desafio sem dados históricos.

“Como a IA é nova para a maioria das empresas, isto cria um desafio orçamental para as suas iniciativas de IA. Para piorar a situação, muitos fornecedores ainda estão experimentando diversos modelos de preços que estão sujeitos a alterações”, diz McCarthy. “Essa incerteza cria um desafio para as empresas avessas ao risco que devem trabalhar dentro de restrições orçamentais. O preço pré-pago é uma forma de reduzir o risco financeiro ao não se prender a contratos de longo prazo.”

Adnan Masood, arquiteto-chefe de IA da UST, diz que “preços imprevisíveis” tornam difícil até mesmo para os CFOs gerenciar os gastos com IA.

“Custos que flutuam de uma forma que mesmo um CFO que utiliza uma estratégia avançada baseada em dados não consegue prever totalmente, … isso representa uma enorme ameaça à solvência e pode inviabilizar as competências essenciais que estes executivos devem proteger”, afirma ele.

Na opinião de Masood, “o verdadeiro medo não é o poder da tecnologia, mas a falta de controle de custos em tempo real e métricas de desempenho claras para justificar investimentos audaciosos em IA”.

Resultados questionáveis, benefícios duvidosos

Além dos temores sobre preços, a IDC encontrou preocupações sobre resultados ruins (51,3%) — incluindo preconceitos não intencionais, uso não autorizado da propriedade intelectual de outra pessoa ou vazamento não intencional de informações confidenciais — e falta de confiança nos benefícios (46,1%) da IA ​​generativa. como principais obstáculos à adoção.

Aqui, um antídoto pode ser usar agentes SaaS e buscar casos de uso básicos de IA de geração, como resumo automatizado de documentos, em vez de tentar construir e treinar um modelo básico, diz Paul Beswick, CIO da Marsh McLennan. Fazer isso também pode ser uma incursão consciente dos custos na IA, acrescenta.

“Existe um ponto ideal de capacidade relativamente fácil de acessar a um preço modesto que muitas organizações de tecnologia são perfeitamente capazes de alcançar. Acho que o maior risco é que eles se distraiam tentando buscar coisas com menos probabilidade de sucesso ou comprando tecnologias que não oferecem uma boa relação preço/desempenho”, diz ele.

“A maioria das organizações deve evitar tentar construir seus próprios modelos generativos de IA sob medida, a menos que trabalhem em casos de uso de alto valor e de nicho”, acrescenta Beswick. “Para a maioria das empresas, acho que há um retorno muito melhor em aproveitar as vantagens do ecossistema que está sendo construído e que é relativamente fácil de comprar ou alugar.”

Masood, da UST, concorda que o custo potencial do treinamento de modelos não é para os fracos de coração.

Os líderes de TI “parecem mais alarmados com o espectro de projetos de lei de treinamento descontrolados: quando você pressiona ‘avançar’ em um modelo generativo em grande escala, ele pode ser um poço sem fundo sem transparência operacional e estratégias robustas de mitigação de riscos”, diz ele. “Ao mesmo tempo, um choque diário de cobranças incrementais causa estragos na legitimidade institucional – ninguém quer explicar ao conselho o aumento da noite passada no uso de IA sem uma forte estrutura de inovação em governança.”

As restrições orçamentárias também desempenham um papel na prevenção da construção de infraestrutura de IA, dado o custo das GPUs, diz Nardecchia da Rockwell. A escassez de arquitetos de IA e cientistas de dados experientes, a complexidade técnica e a prontidão dos dados também são obstáculos importantes, acrescenta.

“Os modelos básicos exigem dados vastos, limpos e estruturados – e a maioria das organizações ainda está lutando contra silos legados e dados de baixa qualidade. Esta é, em grande parte, a principal restrição que ouço dos colegas”, diz ele, relativamente às preocupações sobre maus resultados.

Os fornecedores estão trabalhando para superar esses obstáculos, abordando questões de preços e tentando melhorar os resultados. Por exemplo, a Microsoft introduziu esta semana preços baseados no consumo para o Copilot Chat. E a Amazon revelou recentemente recursos para sua plataforma de IA generativa Bedrock, projetada para melhorar os resultados.

No AWS re:Invent, Chaitanya Hari da Doordash disse que o novo recurso de bases de conhecimento do Amazon Bedrock permitiu que a empresa implementasse todo o fluxo de trabalho de geração aumentada de recuperação (RAG), da ingestão à recuperação, sem a necessidade de muitas integrações de dados personalizadas ou dados complexos de volta -gestão final.

“Mesmo que um modelo seja rápido e bastante preciso, como podemos garantir que ele extrai informações do contexto que fornecemos e não apenas inventa coisas? Passamos por várias iterações de engenharia imediata e ajuste fino para garantir que nossos modelos de IA referenciassem de forma confiável apenas as bases de conhecimento que fornecemos com o Amazon Bedrock”, disse Hari, proprietário de produto de soluções empresariais de IA da DoorDash.

“Conseguimos mitigar uma grande parte de nossas alucinações, prevenir coisas como ataques de injeção imediata e detectar coisas como linguagem abusiva”, disse Hari. “Isso nos deu confiança para escalar sem comprometer a qualidade ou a confiança.”

Custos de troca de dados, prêmios de geração de IA

A pesquisa da IDC também revelou preocupações adicionais com preços que estão dificultando a adoção da geração AI, incluindo os custos muitas vezes ocultos associados à troca de dados entre sistemas.

A maioria das organizações espera que a IaaS na nuvem pública seja sua principal fonte de infraestrutura de geração de IA, mostra a pesquisa da IDC. Mas muitos podem querer usar sistemas locais em conjunto com IaaS para maior privacidade, observam os redatores do relatório. Esta preferência por uma arquitetura de IA de geração híbrida “exigirá modelos de preços bem definidos que levem em conta os custos associados à transferência de dados entre locais de implantação”, de acordo com o resumo executivo da IDC.

O preço premium para serviços de IA de geração é outra preocupação dos CIOs, observam a IDC e os CIOs.

“Os custos premium da IA ​​de agência – agentes sofisticados de IA agindo de forma autônoma – são racionalmente aterrorizantes quando o ROI é confuso”, diz Masood da UST.

O preço final do uso da IA ​​pelos fornecedores é uma questão de debate e confusão. A Salesforce, por exemplo, que anunciou recentemente o Agentforce 2.0, está adotando uma abordagem de preços por conversa. A plataforma está sendo usada, por exemplo, pela FedEx para agilizar as operações e pela Saks Fifth Avenue para responder às perguntas dos clientes sobre itens de varejo.

Tais capacidades avançadas poderão não ser acessíveis a todas as empresas durante algum tempo. De acordo com a pesquisa da IDC, modelos variados de preços para serviços baseados em IA de geração são um dado adquirido – mas a estabilização está prevista dentro de alguns anos.

“A maioria dos compradores de serviços infundidos com GenAI mostram expectativas de preços premium para entrega de serviços usando GenAI hoje”, observa o resumo executivo. “No entanto, em três anos, as organizações esperam modelos de preços equilibrados e variados para a entrega de serviços infundidos pela GenAI.”

Superando obstáculos da geração AI

Embora quase todas as empresas estejam considerando ou implementando alguma forma de IA, poucas fazem isso certo na primeira vez, como evidenciado pelas altas taxas de falha dos pilotos de IA. Mas não precisa ser assim.

“Os CIOs e proprietários de empresas precisam adotar uma abordagem diferente para implementar novos processos orientados por IA e existem múltiplas estratégias para aumentar o sucesso dos pilotos de IA”, afirma Chris Stephenson, diretor administrativo de automação inteligente e IA da Alliant.

“Às vezes, mesmo com funcionalidade ideal, um piloto de IA pode falhar por falta de adesão das principais partes interessadas que financiam o projeto ou dos funcionários que deveriam usá-lo”, acrescenta. “No início de um piloto de IA, os líderes do projeto devem… identificar antecipadamente as principais medidas de ROI do projeto para mostrar às partes interessadas como o projeto está acompanhando cada etapa.”

O provedor de data center Digital Realty instrui os CIOs a começarem pequenos com pilotos direcionados para provar o ROI, construindo confiança em toda a organização, alinhando a IA com os objetivos de negócios e usando métricas claras para mostrar como ela gera receita, corta custos ou mitiga riscos.

“Aconselhamos os clientes empresariais a manter a visibilidade em toda a sua pilha de infraestrutura. Uma abordagem simples, mas eficaz, é rastrear a relação entre tokens, watts e dólares”, afirma Chris Sharp, CTO da Digital Realty. “Este modelo monitora a produção de tokens em implantações de IA, a energia necessária para apoiar a infraestrutura – levando em conta a dinâmica de densidade e capacidade – e os custos operacionais associados ao longo do tempo.”

Bryan Muehlberger, CIO da Lumiyo e ex-CIO e CTO da Vuori e Red Bull, aconselha os CIOs a considerar todos os custos relacionados à IA – modelos de preços incertos, custos de energia e condições econômicas – em qualquer equação antes de prosseguir.

“Neste momento, o aumento dos custos dos chips, o consumo de energia relacionado com eles e as tensões macroeconómicas com a China e dentro da cadeia de abastecimento (são as principais preocupações)”, diz ele. “Isso terá um grande impacto para o futuro da IA ​​nos próximos um ou dois anos. Até mesmo a OpenAI está enfrentando alguns problemas ao implantar suas versões mais recentes devido a essas complexidades.”

Rolar para cima