A Anthropic, fornecedora de IA que perde apenas em tamanho para a OpenAI, tem uma poderosa família de modelos generativos de IA chamada Claude. Esses modelos podem realizar uma série de tarefas, desde legendar imagens e escrever e-mails até resolver desafios matemáticos e de codificação.
Com o ecossistema de modelos da Anthropic crescendo tão rapidamente, pode ser difícil acompanhar quais modelos de Claude fazem o quê. Para ajudar, elaboramos um guia para Claude, que manteremos atualizado à medida que novos modelos e atualizações chegarem.
Modelos Claude
Os modelos de Claude recebem nomes de obras de arte literárias: Haiku, Sonnet e Opus. Os mais recentes são:
- Claude 3.5 Haikuum modelo leve.
- Soneto de Cláudio 3.5um modelo de médio porte.
- Fechar 3 trabalhosmodelo carro-chefe da Antrópico.
Contraintuitivamente, o Claude 3.5 Sonnet – o modelo “médio” – é o modelo Claude mais capaz no momento. É quase certo que isso mudará quando a próxima versão do Opus, Claude 3.5 Opus, for lançada.
Todos os modelos Claude podem analisar texto, bem como imagens, tabelas, gráficos e diagramas técnicos de documentos. Os modelos – que possuem uma janela de contexto padrão de 200.000 tokens – também podem seguir instruções de várias etapas, usar ferramentas (por exemplo, rastreadores de cotações de ações) e produzir resultados estruturados em formatos como JSON.
Uma janela de contexto é a quantidade de dados que um modelo como Claude pode analisar antes de gerar novos dados, enquanto os tokens são pedaços subdivididos de dados brutos (como as sílabas “fan”, “tas” e “tic” na palavra “fantástico”) . Duzentos mil tokens equivalem a cerca de 150.000 palavras ou um romance de 600 páginas.
Ao contrário de muitos modelos importantes de IA generativa, os da Anthropic não podem acessar a Internet, o que significa que não são particularmente bons em responder a perguntas sobre eventos atuais. Eles também não podem gerar imagens – apenas diagramas de linhas simples.
Quanto às principais diferenças entre os modelos de Claude, o Claude 3.5 Sonnet é mais rápido que o Claude 3 Opus e compreende melhor instruções diferenciadas e complexas. O Haiku luta com instruções sofisticadas, mas é o mais rápido dos três modelos.
Preços do modelo Claude
Os modelos Claude estão disponíveis por meio da API da Anthropic e de plataformas gerenciadas como Amazon Bedrock e Vertex AI do Google Cloud.
Aqui está o preço da API Antrópica:
- Claude 3.5 Haiku custa 25 centavos por milhão de tokens de entrada (~750.000 palavras) ou US$ 1,25 por milhão de tokens de saída
- Soneto de Cláudio 3.5 custa US$ 3 por milhão de tokens de entrada ou US$ 15 por milhão de tokens de saída
- Fechar 3 trabalhos custa US$ 15 por milhão de tokens de entrada ou US$ 75 por milhão de tokens de saída
A Anthropic oferece cache e lote imediatos para gerar economia adicional no tempo de execução.
O cache de prompt permite que os desenvolvedores armazenem “contextos de prompt” específicos que podem ser reutilizados em chamadas de API para um modelo, enquanto o processamento em lote processa grupos assíncronos de solicitações de inferência de modelo de baixa prioridade (e subsequentemente mais baratas).
Planos e aplicativos de Claude
Para usuários individuais e empresas que desejam simplesmente interagir com os modelos Claude por meio de aplicativos para web, Android e iOS, a Anthropic oferece um plano Claude gratuito com limites de taxas e outras restrições de uso.
A atualização para uma das assinaturas da empresa remove esses limites e desbloqueia novas funcionalidades. Os planos atuais são:
Claude Pro, que custa US$ 20 por mês, vem com limites de taxa 5x mais altos, acesso prioritário e prévias dos próximos recursos.
Sendo focado nos negócios, o Team – que custa US$ 30 por usuário por mês – adiciona um painel para controlar o faturamento e o gerenciamento de usuários e integrações com repositórios de dados, como bases de código e plataformas de gerenciamento de relacionamento com o cliente (por exemplo, Salesforce). Uma alternância ativa ou desativa citações para verificar afirmações geradas por IA. (Como todos os modelos, Claude tem alucinações de vez em quando.)
Tanto os assinantes Pro quanto Team recebem Projetos, um recurso que fundamenta os resultados de Claude em bases de conhecimento, que podem ser guias de estilo, transcrições de entrevistas e assim por diante. Esses clientes, junto com os usuários de nível gratuito, também podem acessar o Artifacts, um espaço de trabalho onde os usuários podem editar e adicionar conteúdo como código, aplicativos, designs de sites e outros documentos gerados por Claude.
Para clientes que precisam ainda mais, existe o Claude Enterprise, que permite que as empresas carreguem dados proprietários no Claude para que Claude possa analisar as informações e responder perguntas sobre elas. Claude Enterprise também vem com uma janela de contexto maior (500.000 tokens), integração GitHub para equipes de engenharia sincronizarem seus repositórios GitHub com Claude e Projetos e Artefatos.
Uma palavra de cautela
Tal como acontece com todos os modelos generativos de IA, existem riscos associados ao uso de Claude.
Os modelos ocasionalmente cometem erros ao resumir ou responder perguntas devido à sua tendência a alucinar. Eles também são treinados em dados públicos da web, alguns dos quais podem estar protegidos por direitos autorais ou sob uma licença restritiva. A Anthropic e muitos outros fornecedores de IA argumentam que a doutrina do uso justo os protege de reivindicações de direitos autorais. Mas isso não impediu que os proprietários de dados entrassem com ações judiciais.
A Anthropic oferece políticas para proteger determinados clientes de batalhas judiciais decorrentes de desafios de uso justo. No entanto, eles não resolvem o dilema ético de usar modelos treinados em dados sem permissão.
TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo em sua caixa de entrada todas as quartas-feiras.