A conferência anual de desenvolvedores re:Invent da AWS foi concluída na semana passada. Além dos avanços técnicos, o evento destacou iniciativas estratégicas que repercutem nos CIOs, incluindo otimização de custos, eficiência de fluxo de trabalho e desenvolvimento acelerado de aplicações de IA.
A gigante da nuvem apresentou vários novos recursos e atualizações para suas ofertas populares, incluindo Amazon SageMaker, Amazon Q Developer, Amazon Bedrock, bancos de dados, infraestrutura e Q Business.
Embora houvesse uma longa lista de anúncios, aqui estão os principais que impactam diretamente os CIOs.
Otimizando despesas de TI
No que diz respeito à infraestrutura, a AWS anunciou que as instâncias P6 do Amazon EC2 apresentarão os novos chips Blackwell da Nvidia. Ele disponibilizou ao público instâncias EC2 com tecnologia Trainium2 e revelou planos para o chip Trainium3. Os anúncios focaram não apenas em fornecer mais capacidade computacional, mas também em melhor desempenho de preço quando comparado aos rivais.
Por exemplo, diz-se que as instâncias EC2 com tecnologia AWS Trainium2 são quatro vezes mais rápidas, com quatro vezes mais largura de banda de memória e três vezes mais capacidade de memória do que a geração anterior com tecnologia Tranium1 – espera-se que todas combinadas ofereçam latência 35% menor do que instâncias com tecnologia Trainium1.
Outro esforço na direção de preço-desempenho-eficiência foi o chip Tranium3 – que deverá fornecer duas vezes mais computação que o Tranium2 e 40% mais eficiência energética.
Na frente de modelos e desenvolvimento de modelos, o CEO da AWS, Matt Garman, revelou novos modelos básicos da Nova, que ele disse que ofereceriam melhor valor, especialmente em termos de custo, do que a maioria dos modelos rivais.
As atualizações do Bedrock incluíram Model Distillation – um serviço gerenciado que visa ajudar as empresas a reduzir seus custos de execução de LLMs e cache de prompt no Bedrock – projetado para reduzir o custo de prompt de um LLM armazenando prompts em uma memória em cache.
O módulo de IA do Amazon SageMaker também recebeu recursos de economia de custos, incluindo planos de treinamento flexíveis e governança de tarefas do SageMaker Hyperpod. As atualizações foram projetadas para permitir que as empresas utilizem pelo menos 90% de seus clusters e instâncias adquiridos, reduzindo ao mesmo tempo o tempo necessário para concluir o treinamento LLM, inferência LLM e tarefas de desenvolvimento de modelo de IA.
Simplificando fluxos de trabalho e aumentando a produtividade
O próximo conjunto de anúncios re:Invent focou na simplificação de fluxos de trabalho para empresas e em ajudar as empresas a aumentar a produtividade de desenvolvedores e profissionais de dados.
A AWS anunciou que unificará serviços analíticos e de IA em seu serviço SageMaker. Essa unificação poderia ajudar as empresas a reduzir a sobrecarga e a complexidade da integração de TI.
Essa unificação talvez seja melhor exemplificada por uma nova oferta dentro do Amazon SageMaker, o Unified Studio, que combina análise SQL, processamento de dados, desenvolvimento de IA, streaming de dados, inteligência de negócios e análise de pesquisa.
Outra oferta anunciada pela AWS para apoiar a integração é o SageMaker Data Lakehouse, que visa ajudar as empresas a unificar dados em data lakes Amazon S3 e data warehouses Amazon Redshift.
A AWS também lançou cinco novas ferramentas e serviços de armazenamento com o objetivo de tornar suas ofertas mais fáceis de trabalhar, se não mais baratas ou melhores.
Acelerando o desenvolvimento de aplicativos de IA
Como a adoção da IA não é mais uma questão, chegar lá com rapidez suficiente costuma ser um desafio. Para resolver isso, a Amazon anunciou uma série de atualizações durante a conferência de desenvolvedores.
A primeira série de atualizações projetadas para facilitar as tarefas do desenvolvedor foi feita no Amazon Q Developer – a resposta da empresa ao assistente de IA generativo Copilot da Microsoft, orientado por GPT.
Os novos recursos expandidos do Q Developer incluem automatização de revisões de código, testes unitários e geração de documentação – todos com o objetivo de ajudar os desenvolvedores a acelerar suas tarefas.
Além disso, a AWS revelou vários recursos de tradução de código para Q em versão prévia, incluindo a capacidade de modernizar aplicativos .Net do Windows para Linux, modernização de código de mainframe e a capacidade de ajudar a migrar cargas de trabalho VMware.
Com o Q Developer assumindo as tarefas de tradução, os desenvolvedores ficariam livres para se concentrar em outras tarefas, aumentando a produtividade, disse Garman.
Outras atualizações adicionadas à plataforma generativa de IA da AWS – Bedrock – incluíram Bedrock Intelligent Prompt Routing, Amazon Kendra GenAI Index, suporte Bedrock Knowledge Bases para dados estruturados, GraphRAG e Bedrock Data Automation para recuperação de dados não estruturados.
No que diz respeito ao armazenamento, a AWS revelou os S3 Table Buckets e os recursos S3 Metadata.
Embora o S3 Table Buckets tenha como objetivo facilitar a implementação de tabelas Apache Iceber dentro do serviço de armazenamento, o recurso S3 Metadata permitirá que as empresas gerem automaticamente metadados de objetos armazenados no S3 para que a localização de dados se torne mais fácil, eventualmente reduzindo o tempo para uma variedade de cargas de trabalho. incluindo análise e IA.