O que é e o que pode fazer?

Por Memória Virtual / 02/10/2024

GPT-4 é um grande sistema de modelo de linguagem de inteligência artificial que pode imitar a fala e o raciocínio humanos.

A IA processa tarefas baseadas em texto, como escrever, resumir e responder perguntas, com raciocínio e habilidades de conversação aprimorados. A tecnologia baseia-se nos recursos do GPT-3, usando conjuntos de dados maiores para maior precisão e fluência.

Esta folha de dicas explora o GPT-4 em alto nível: como acessar o GPT-4 para uso consumidor ou comercial, quem o criou e como funciona.

O que você vai ler:

O que é GPT-4?

GPT-4 é um grande modelo multimodal que pode imitar prosa, arte, vídeo ou áudio produzido por um ser humano. GPT-4 é capaz de resolver problemas escritos ou gerar textos ou imagens originais. GPT-4 é a quarta geração do modelo básico da OpenAI.

Quem é o dono do GPT-4?

O GPT-4 é propriedade da OpenAI, uma empresa de tecnologia independente com sede em São Francisco. Fundada em 2015, a OpenAI começou como uma organização sem fins lucrativos, mas desde então mudou para um modelo com fins lucrativos. OpenAI recebeu financiamento de Elon Musk, Microsoft, Amazon Web Services, Infosys e outros patrocinadores corporativos e individuais.

A OpenAI também produziu o ChatGPT, um chatbot gratuito derivado do modelo da geração anterior, GPT-3.5, e o DALL-E, um modelo de aprendizagem profunda de geração de imagens. À medida que a tecnologia melhora e aumenta as suas capacidades, a OpenAI revela menos sobre como as suas soluções de IA são treinadas.

Quando o GPT-4 foi lançado?

OpenAI anunciou o lançamento do GPT-4 em 14 de março de 2023. Ele ficou imediatamente disponível para assinantes do ChatGPT Plus, enquanto outros usuários interessados precisavam entrar em uma lista de espera para acesso.

VEJA: A Salesforce incorporou IA generativa em seus produtos de vendas e serviços de campo.

Como você pode acessar o GPT-4?

A versão pública do GPT-4 está disponível no portal ChatGPT.

A OpenAI observou que esse acesso pode ser lento, pois espera ser “severamente com capacidade limitada”. Eles planejam lançar um novo nível de assinatura para pessoas que usam o GPT-4 com frequência e um portal de acesso gratuito ao GPT-4 com um número limitado de consultas permitidas. Nenhuma informação foi divulgada ainda sobre quando eles estarão disponíveis.

Quanto custa para usar o GPT-4?

Para um indivíduo, a assinatura do ChatGPT Plus custa US$ 20 por mês para usar.

Os clientes empresariais que desejam usar a API GPT-4 podem entrar na lista de espera. O acesso é limitado; até o momento, a OpenAI concedeu a apenas uma empresa – o grupo de software de acessibilidade Be My Eyes – acesso parceiro aos seus recursos visuais.

O preço da API GPT-4 somente texto começa em US$ 0,03 por mil tokens de prompt (um token tem cerca de quatro caracteres em inglês) e US$ 0,06 por mil tokens de conclusão (saída), disse a OpenAI. (OpenAI explica mais sobre como os tokens são contados aqui.)

Uma segunda opção com maior extensão de contexto – cerca de 50 páginas de texto – conhecida como gpt-4-32k também está disponível. Esta opção custa US$ 0,06 por 1 mil tokens de prompt e US$ 0,12 por 1 mil tokens de conclusão.

Outros serviços de assistência de IA, como o Copilot X do GitHub, agora integram o GPT-4.

Capacidades do GPT-4

Tal como o seu antecessor, GPT-3.5, a principal vantagem do GPT-4 é o seu resultado em resposta a questões de linguagem natural e outras solicitações.

A OpenAI afirma que o GPT-4 pode “seguir instruções complexas em linguagem natural e resolver problemas difíceis com precisão”. Especificamente, o GPT-4 pode resolver problemas matemáticos, responder perguntas, fazer inferências ou contar histórias. Além disso, o GPT-4 pode resumir grandes partes de conteúdo, úteis tanto para referência do consumidor quanto para casos de uso comercial, como uma enfermeira resumindo os resultados de sua visita a um cliente.

A OpenAI testou a capacidade do GPT-4 de repetir informações em uma ordem coerente usando diversas avaliações de habilidades, incluindo exames AP e Olympiad e o Uniform Bar Examination. Ele obteve pontuação no 90º percentil no Exame da Ordem e no 93º percentil no exame SAT de Leitura e Escrita Baseada em Evidências. GPT-4 obteve pontuações variadas em exames AP.

Estes resultados não são verdadeiros indicadores de conhecimento. Em vez disso, executar o GPT-4 por meio de testes padronizados mostra a capacidade do modelo de formar respostas que parecem corretas a partir da escrita e da arte preexistentes nas quais foi treinado.

Embora a OpenAI permaneça de boca fechada sobre as especificidades do treinamento do GPT-4, os LLMs são normalmente treinados primeiro traduzindo as informações de um conjunto de dados em tokens. O conjunto de dados é então limpo para remover dados distorcidos ou repetitivos.

Em seguida, as empresas de IA normalmente empregam pessoas para aplicar a aprendizagem por reforço ao modelo, empurrando o modelo para respostas que façam sentido comum. Os pesos, ou parâmetros que informam à IA quais conceitos estão relacionados entre si, podem ser ajustados nesta etapa.

O que é o Bate-papo do Bing?

O Bing Chat da Microsoft é um assistente de IA implantado como uma barra lateral ao lado do mecanismo de busca Bing. Os usuários podem pedir para responder perguntas ou gerar imagens. O Bing Chat é executado em GPT-4. Distingue-se do ChatGPT pela capacidade de lembrar conversas anteriores, embora haja casos em que esta funcionalidade não corresponde às expectativas do usuário.

VEJO: Como consultar o Bing Chat para obter os resultados desejados (TechRepublic)

O Bing Chat requer um navegador Microsoft e Edge para ser usado.

Além disso, a Microsoft oferece o Bing Chat Enterprise, que adiciona proteções de dados e funcionalidades adicionais ao Bing Chat. Os administradores podem fornecer acesso gerenciado ao Bing Chat Enterprise por meio do Microsoft Entra ID (Azure Active Directory).

Limitações do GPT-4 para empresas

Como outras ferramentas de IA desse tipo, o GPT-4 tem limitações.

Por exemplo, o GPT-4 não verifica se suas declarações são precisas. Seu treinamento em textos e imagens de toda a Internet pode tornar suas respostas absurdas ou inflamatórias. No entanto, a OpenAI possui controles digitais e treinadores humanos para tentar manter o resultado o mais útil e adequado aos negócios possível.

Além disso, o GPT-4 tende a criar “alucinações” ou imprecisões. Suas palavras podem fazer sentido em sequência, uma vez que são baseadas em probabilidades estabelecidas pelo que o sistema foi treinado, mas não são verificadas ou diretamente conectadas a eventos reais. Pode ocorrer viés de confirmação. A OpenAI está trabalhando para reduzir o número de falsidades que o modelo produz.

Outra limitação importante é a questão de saber se as informações corporativas confidenciais inseridas no GPT-4 serão usadas para treinar o modelo e expor esses dados a partes externas. A Microsoft, que tem um acordo de revenda com a OpenAI, planeja oferecer instâncias privadas do ChatGPT para empresas no final do segundo trimestre de 2023, de acordo com um relatório de abril.

Nenhum dos modelos incorpora informações mais recentes do que setembro de 2021. Um dos concorrentes do GPT-4, o Google Gemini, possui informações atualizadas porque é treinado na Internet contemporânea.

A IA pode sofrer o colapso do modelo quando treinada em dados criados pela IA. Este problema está se tornando mais comum à medida que os modelos de IA proliferam.

GPT-4 vs GPT-3.5 Turbo ou OpenAI o1

A partir de outubro, a OpenAI adicionou opções e modelos aprimorados à família GPT-4. Os usuários do GPT-4 agora podem escolher entre o GPT-4 Turbo maior ou o GPT-4o e o GPT-4o mini menores. A versão pública e gratuita do ChatGPT usa ChatGPT-4o mini.

VEJO: Aprenda como usar o ChatGPT.

O GPT-4 pode lidar com imagens, destacando uma diferença significativa entre o GPT-4 e o GPT-3.5 Turbo. Pode servir como auxílio visual, descrevendo objetos do mundo real ou determinando os elementos mais importantes de um site e descrevendo-os.

“Em uma variedade de domínios – incluindo documentos com texto e fotografias, diagramas ou capturas de tela – o GPT-4 exibe recursos semelhantes aos de entradas somente de texto”, escreveu OpenAI em sua documentação do GPT-4.

Enquanto isso, OpenAI o1 é especializado em digerir consultas complexas lentamente, produzindo resultados complexos.

Vale a pena atualizar para GPT-4?

Se os novos recursos oferecidos por meio do GPT-4 são apropriados para o seu negócio depende dos seus casos de uso e se você obteve sucesso com a IA de linguagem natural.

Revise os recursos e limitações da IA e considere onde o GPT-4 pode economizar tempo ou reduzir custos. Por outro lado, considere quais tarefas podem se beneficiar materialmente do conhecimento, habilidade e bom senso humanos.

As últimas tendências do GPT-4

Em agosto de 2023, o GPT-4 foi empacotado como parte do ChatGPT Enterprise. Os usuários da assinatura voltada para negócios recebem uso ilimitado de um pipeline de alta velocidade para GPT-4.

A Microsoft anunciou no início de agosto de 2023 que a disponibilidade do GPT-4 no Azure OpenAI Service foi expandida para várias novas regiões de cobertura.

Espera-se que o ajuste fino para GPT-4, que permite aos usuários personalizar modelos, esteja disponível no outono, disse OpenAI.

Atualizações do OpenAI DevDay 2024

A OpenAI atualiza regularmente as ferramentas que fornece aos desenvolvedores. Em outubro, a empresa divulgou o seguinte:

A API em tempo real: Este recurso permite que os desenvolvedores criem aplicativos de IA baseados em voz e de baixa latência. Disponível em versão beta para desenvolvedores nas camadas pagas do OpenAI, a API Realtime simplifica a criação de bots de atendimento ao cliente ou outras ferramentas com vozes naturais, sem a necessidade de sair do ecossistema GPT-4o. A OpenAI também liberou entrada e saída de voz para a API Chat Completions, embora não tenha baixa latência.
Ajuste com imagens: Os desenvolvedores em qualquer nível GPT-4o pago agora podem ajustar suas versões do modelo com imagens, não apenas texto. Isso ajuda a treinar modelos para tarefas como reconhecimento de imagem e movimento autônomo.
Destilação modelo: Os desenvolvedores podem “destilar” os resultados de modelos maiores, como o1-preview e GPT-4o, em modelos menores, como GPT-4o mini. Isso ajuda os modelos menores a se aproximarem do desempenho dos modelos maiores em determinadas tarefas sem inflacionar o custo proporcionalmente. Todos os desenvolvedores podem usar o conjunto de destilação de modelo, que tem o mesmo preço do processo de ajuste fino do modelo padrão da OpenAI.

Além disso, os desenvolvedores que trabalham com GPT-4o, GPT-4o mini, o1-preview ou o1-mini terão acesso automaticamente ao cache de prompt. Este é um método de reutilização de tokens que pode reduzir o custo e a latência de alguns prompts.