Um novo jogador entrou na vila da IA e está criando uma interrupção significativa.
A startup de IA chinesa Deepseek fez ondas na semana passada, quando lançou a versão completa do R1, o modelo de raciocínio de código aberto da empresa que pode superar o Open O1. Na segunda -feira, os downloads da App Store do assistente de AI da Deepseek – que executa o V3, um modelo de Deepseek lançado em dezembro – liderou o ChatGPT, que já havia sido o aplicativo gratuito mais baixado.
Além disso: testei as habilidades de codificação R1 e V3 da Deepseek – e não estamos todos condenados (ainda)
O Deepseek R1 também já subiu para o terceiro lugar no geral na Arena de Chatbot da Huggingface, sob vários modelos de Gemini e ChatGPT-4O. Assim que destronou o Openai, a Deepseek começou a limitar as inscrições devido a um suposto ataque cibernético e depois acompanhou seu grande respingo com um novo modelo de imagem promissor.
O que é Deepseek?
Fundada por Liang Wenfeng em maio de 2023 (e, portanto, nem mesmo dois anos), a startup chinesa desafiou as empresas de IA estabelecidas com sua abordagem de código aberto. Segundo a Forbes, a vantagem de Deepseek pode estar no fato de ser financiada apenas pela High-Flyer, um fundo de hedge também administrado por Wenfeng, que oferece à empresa um modelo de financiamento que suporta rápido crescimento e pesquisa.
O que é Deepseek R1?
Lançado na semana passada, o R1 é o Modelo de Raciocínio de Deepseek, que se apresenta no modelo O1 elogiado do Openai em vários benchmarks de matemática, codificação e raciocínio. O que torna o R1 o mais interessante é que, diferentemente de outros modelos principais de gigantes da tecnologia, é de código aberto, o que significa que qualquer um pode baixar e usá-lo. Dito isto, a Deepseek não divulgou o conjunto de dados de treinamento da R1. Até agora, todos os outros modelos lançados também são de código aberto.
De acordo com a DeepSeek, o R1 também custou menos de US $ 6 milhões para treinar – significativamente menos do que as opções comparáveis - o que torna mais barato acessar. Para referência, o acesso API R1 começa em US $ 0,14 por um milhão de tokens, que é uma fração dos US $ 7,50 que o OpenAI cobra pelo nível equivalente.
Além disso: as empresas estão atingindo um ‘limite de velocidade’ na implantação da Gen AI – eis o porquê
A Deepseek afirma em um artigo de pesquisa da empresa que seu modelo V3 custou US $ 5,6 milhões para treinar, um número que está sendo divulgado (e contestado) como todo o custo de desenvolvimento do modelo. Como relatou a AP, alguns especialistas em laboratório acreditam que o artigo se refere apenas à execução final de treinamento para a V3, não a todo o seu custo de desenvolvimento (que seria uma fração do que os gigantes da tecnologia gastaram para criar modelos competitivos). Alguns sugerem que os custos da Deepseek não incluem infraestrutura anterior, P&D, dados e custos de pessoal.
Uma desvantagem que poderia afetar sua concorrência de longo prazo com a O1 e outros modelos fabricados nos EUA é a censura. Os modelos chineses geralmente incluem blocos em determinado assunto, o que significa que, embora funcionem comparativamente com outros modelos, eles podem não responder a algumas consultas (veja como o assistente de IA da Deepseek responde a perguntas sobre a Praça da Tiananmen e Taiwan aqui).
Em dezembro, o Ray Tiernan da ZDNET comparou a capacidade da R1-Lite de explicar sua cadeia de pensamento à de O1, e os resultados foram misturados.
Além disso: as empresas estão atingindo um ‘limite de velocidade’ na implantação da Gen AI – eis o porquê
Obviamente, todos os modelos populares vêm com seus próprios antecedentes, diretrizes comunitárias e corrimãos de conteúdo-mas pelo menos nesta fase, é improvável que os chatbots fabricados nos americanos se abstenham de responder a perguntas sobre eventos históricos.
Preocupações de privacidade
A privacidade dos dados preocupações que circulam em torno de Tiktok-o aplicativo de mídia social de propriedade chinesa que agora é um pouco proibida nos EUA-também estão surgindo sobre o Deepseek.
“As informações pessoais que coletamos de você podem ser armazenadas em um servidor localizado fora do país onde você mora”, afirma a política de privacidade da Deepseek. “Armazenamos as informações que coletamos em servidores seguros localizados na República Popular da China”.
Além disso: a referência do último exame da ‘Humanity’ está tocando os melhores modelos de IA – você pode fazer melhor?
A política descreve que a Deepseek coleta muitas informações, incluindo, entre outros,:
-
“Endereço IP, identificadores de dispositivo exclusivos e cookies”
-
“Data de nascimento (quando aplicável), nome de usuário, endereço de e -mail e/ou número de telefone e senha”
- “Seu texto ou entrada de áudio, prompt, enviou arquivos, feedback, histórico de bate -papo ou outro conteúdo que você fornece ao nosso modelo e serviços”
- “Prova de identidade ou idade, feedback ou consultas sobre o uso do serviço” Se você entrar em contato com Deepseek
A política continua: “Onde transferimos qualquer informação pessoal para fora do país onde você mora, inclusive para um ou mais dos propósitos estabelecidos nesta política, faremos isso de acordo com os requisitos das leis de proteção de dados aplicáveis”. Não menciona a conformidade com o GDPR.
“Os usuários precisam estar cientes de que quaisquer dados compartilhados com a plataforma podem estar sujeitos ao acesso do governo sob as leis de segurança cibernética da China, que exigem que as empresas forneçam acesso aos dados mediante solicitação pelas autoridades”, disse Adrianus Warenhoven, membro do Conselho Consultivo de Segurança da Nordvpn, Disse ao ZDNet por e -mail.
“O modelo de AI da Deepseek enfrentou uma reação crescente por sua recusa em lidar com os tópicos políticos”, acrescentou. “Isso provocou preocupações sobre possíveis vieses e influência externa nas políticas de moderação de conteúdo da plataforma”.
Além disso: como proteger sua privacidade do Facebook – e o que não funciona
De acordo com alguns observadores, o fato de o R1 ser de código aberto significa maior transparência, dando aos usuários a oportunidade de inspecionar o código-fonte do modelo para obter sinais de atividade relacionada à privacidade. Independentemente disso, a DeepSeek também lançou versões menores do R1, que podem ser baixadas e executadas localmente para evitar preocupações sobre os dados de volta à empresa (em vez de acessar o chatbot online). Todos os chatbots, incluindo o ChatGPT, estão coletando algum grau de dados do usuário quando consultados através do navegador.
O que isso significa para a IA em geral
O sucesso do R1 destaca uma mudança no mar na IA que pode capacitar laboratórios e pesquisadores menores a criar modelos competitivos e diversificar o campo das opções disponíveis. Por exemplo, organizações sem financiamento ou equipe do OpenAI podem baixar o R1 e ajustá-lo para competir com modelos como O1. Pouco antes do lançamento do R1, os pesquisadores da UC Berkeley criaram um modelo de código aberto que está em pé de igualdade com o O1-Preview, uma versão inicial da O1, em apenas 19 horas e por aproximadamente US $ 450.
Dado como o investimento exorbitante da IA se tornou, muitos estão especulando que esse desenvolvimento pode estourar a bolha da IA. Vários relatórios indicam que o mercado de ações já está em pânico.
Além disso: US $ 450 e 19 horas são o suficiente para rivalizar com a previsão O1 OpenAI
A ascensão de Deepseek ocorre em um momento crítico para as relações de tecnologia chinesa-americanas, apenas alguns dias após a longa disputa de Tiktok ter um efeito parcial. Ironicamente, o Deepseek se depara com a linguagem simples a forragem para preocupações de segurança que os EUA lutaram para provar sobre Tiktok em seu esforço prolongado para promulgar uma proibição.