Dhruv Butani / Autoridade Android
O ChatGPT da OpenAI dominou a conversa do chatbot de IA desde sua estreia em 2022. No entanto, se você seguir o mundo da IA, terá encontrado o nome Deepseek divulgado nas últimas semanas. O modelo chinês de grande linguagem afirma negociar golpes com o ChatGPT por sua velocidade, precisão e, o mais importante, natureza de código aberto. Mas o que é verdadeiramente surpreendente é a eficiência de treinamento do R1. Baseando-se no puro aprendizado por reforço versus o ajuste fino supervisionado do GPT-4, todo o modelo custou apenas US$ 12 milhões em treinamento, versus os US$ 500 milhões necessários para o próximo GPT-5.
Claro, nada disso importa realmente para o consumidor final. O que importa é se é bom para o propósito pretendido. Passei os últimos dias testando o Deepseek R1 como parte do meu fluxo de trabalho – idealização, codificação, execução de tarefas como verificações gramaticais e muito mais. Minha lição? A OpenAI precisa estar seriamente preocupada.
Pensamento racional: uma abordagem semelhante à humana
Dhruv Butani / Autoridade Android
O maior diferencial do Deepseek é sua linha de pensamento semelhante à humana. Ao contrário do ChatGPT, que apresenta apenas o resultado final da sua consulta, o Deepseek R1 mostra como está chegando à resposta. Esse monólogo interno notavelmente humano é a forma como o LLM pode apresentar respostas que correspondam ao processo de pensamento humano.
Em vez de executar benchmarks ou formas tradicionais de avaliar o desempenho de um LLM, decidi colocar o Deepseek R1 em minha rotina diária.
O diálogo interno do Deepseek explica seu processo de raciocínio. A primeira vez que vi isso, fiquei impressionado.
Como jornalista, oponho-me veementemente à escrita baseada em IA. No entanto, a ferramenta pode ser uma adição valiosa ao seu arsenal para brainstorming, idealização de pontos de discussão e indicação de lacunas. Para fins de teste, pedi ao Deepseek e ao ChatGPT que elaborassem um esboço para um artigo comparando dois modelos diferentes de LLM. Minha pergunta exata foi: “Estou escrevendo um artigo comparando dois modelos diferentes de LLM da perspectiva de um usuário comum. Que pontos de discussão devo incluir? Ajude-me a elaborar um esboço.
Os resultados foram surpreendentes. Embora os dois modelos abordassem os mesmos indicadores essenciais, Deepseek deu um passo além e dividiu-os em uma estrutura que era notavelmente semelhante à forma como eu abordaria o tópico. Além disso, incluía pontos muito relevantes, como considerações éticas de preconceito, justiça e transparência, que o ChatGPT ignorou totalmente.
Deepseek inclui o processo de pensamento lógico pelo qual passou até chegar à solução e, acredite, a primeira vez que vi isso, fiquei impressionado. Podemos estar longe da inteligência artificial geral, mas observar um computador pensar assim mostra até onde chegamos. O diálogo interno é interessante o suficiente para incluir uma breve transcrição abaixo.
“Ok, preciso ajudar alguém a criar um esboço para um artigo comparando dois modelos de LLM da perspectiva de um usuário comum. Vamos começar detalhando o que eles estão pedindo. Eles querem pontos de discussão com os quais um usuário médio se importaria, e não muito técnicos.
Primeiro, a introdução deve definir o cenário. Talvez explique o que são LLMs em termos simples e por que compará-los é importante para usuários regulares. Depois, as seções principais. A experiência do usuário é provavelmente um grande problema. Isso pode incluir a facilidade de acesso de cada modelo – por exemplo, eles são gratuitos, pagos ou freemium? Além disso, o design da interface. Eles têm um aplicativo ou site fácil de usar? Talvez compare os processos de inscrição.”
Em seguida, coloquei isso em uma tarefa de codificação. LLMs como ChatGPT e Claude podem ainda não ser capazes de codificação completa, mas podem ser ferramentas úteis para aprender como codificar. Para esta tarefa, dei ao Deepseek e ao ChatGPT o mesmo aviso – “Sou novo em programação. Ajude-me a escrever um jogo de Tic Tac Toe. Deve ser executado em pyscript.” Mais uma vez, a diferença na produção foi gritante.
Dhruv Butani / Autoridade Android
ChatGPT me apresentou uma solução de código, um breve detalhamento das linguagens usadas e como rodar o jogo. Enquanto isso, Deepseek me explorou todo o processo de pensamento sobre quais componentes eram necessários para criar o jogo – por exemplo, uma tela de tabuleiro de jogo, manipulação de cliques do usuário, turnos alternados entre X e O e muito mais.
A seguir, detalhou a estrutura HTML para desenhar os elementos da interface e a lógica Python do jogo. Ele também validou suas escolhas e fez considerações de estilo, como centralizar o texto. Em seguida, detalhou não apenas os recursos do jogo, mas também como executá-lo e como modificá-lo ainda mais. Esta é uma informação inestimável para alguém novo em codificação, e a resposta do ChatGPT simplesmente não se compara.
Dhruv Butani / Autoridade Android
Captura de tela
Tudo bem, de volta às tarefas de escrita. Para este, eu queria testar a funcionalidade integrada de pesquisa na web em ambos os LLMs. Então, pedi ao Deepseek e ao ChatGPT que escrevessem uma análise do OnePlus 13. Escolhi este telefone específico porque já havia passado da data de atualização de conhecimento de ambos os LLMs e, bem, eu estava com o telefone em mãos para validar o resultado. Embora nenhum dos LLM aceite meu trabalho tão cedo, este é outro exemplo em que a produção do Deepseek foi muito à frente do ChatGPT.
Quando o ChatGPT apresentou uma estrutura de revisão, ele apenas se concentrou nas especificações, sem acrescentar muitas explicações e nenhum contexto. Deepseek, por outro lado, fez comparações com a concorrência e até destacou áreas onde faltava o OnePlus 13. Como alguém que tem o telefone em mãos, as observações de Deepseek, obviamente extraídas de análises existentes, foram precisas e bem posicionadas.
Deepseek vs ChatGPT: Qual você deve escolher?
Dhruv Butani / Autoridade Android
Depois de apenas alguns dias de uso, estou convencido de que Deepseek é uma excelente alternativa ao ChatGPT por mais de um motivo. Claro, em meus testes, Deepseek venceu consistentemente em termos de qualidade do resultado – tanto em termos de contexto e compreensão, mas também na explicação de seu raciocínio. No entanto, com alguns ajustes, o ChatGPT também pode fornecer resultados semelhantes. Dito isto, Deepseek também tem outras coisas acontecendo.
Por um lado, o uso do Deepseek é em geral gratuito para os clientes finais no momento, em comparação com os caros US$ 20 por mês que o ChatGPT cobra por seus modelos mais sofisticados. Isso é uma grande vantagem. Além disso, a natureza de código aberto do Deepseek significa que você pode executá-lo localmente em seu próprio computador usando aplicativos como o Ollama, ignorando completamente todos os custos e preocupações com privacidade. Isso simplesmente não é possível com ChatGPT. Se você é um desenvolvedor ávido que deseja integrar LLMs em seus aplicativos, o Deepseek oferece outro benefício: custos de acesso à API significativamente mais baratos.
Embora ainda não haja um vencedor definitivo, o Deepseek é praticamente gratuito para testar e pode ser executado localmente em seu próprio computador, evitando questões de privacidade.
Dito isso, ainda é cedo para o Deepseek especificamente e para os modelos LLM em geral. Na verdade, o advento de um novo modelo que possa competir com os melhores e mais financiados do ramo fala muito sobre o estado nascente da indústria. A engenharia inteligente muitas vezes pode contornar a força computacional bruta, e Deepseek aponta para tal instância. Qual é melhor para você? Eu recomendo experimentar ambos e escolher o que melhor se adapta às suas necessidades. Meu? Acho que usarei o Deepseek por mais algum tempo, até que a próxima melhor opção seja lançada.