As sanções impediram que a Deepseek comprasse as GPUs da NVIDIA necessária para treinar os modelos de IA tão poderosos quanto o modelo de raciocínio Chatgpt O1 da OpenAI. Incapaz de comprar o hardware de IA necessário, a startup chinesa desenvolveu um método diferente para treinar o modelo de raciocínio Deepseek R1, enviando ondas de choque em todo o mundo.

O treinamento do DeepSeek R1 custa 3% a 5% do que o treinamento Chatgpt O1 custa. Os modelos da Deepseek também são mais baratos de operar, reduzindo ainda mais os custos de acesso. Além disso, você pode instalar o DeepSeek no seu computador e executá-lo localmente, pois a empresa fabricou a IA de código aberto. Bem, pelo menos o produto comercial, pois o conjunto de dados de treinamento e as instruções ainda são secretas.

Esses desenvolvimentos diminuíram o mercado, com nvidia sendo os mais impactados. De repente, os investidores perceberam que empresas de IA como o OpenAI não precisariam necessariamente acumular mais poder de computação para desenvolver melhores versões de IA.

Mas há um estoque que superou o mercado, e isso é a Apple. Pode parecer um desenvolvimento surpreendente, considerando o quão atrás a Apple Intelligence parece estar agora em comparação com os gostos de Chatgpt O1, Operator, Gemini e Deepseek R1.

No entanto, a Apple tem uma abordagem única para a IA, e as inovações da Deepseek podem ajudá -la a fornecer o futuro da IA que deseja oferecer aos usuários do iPhone. E não estou sugerindo que a Apple incorpore a Deepseek como uma alternativa ao ChatGPT na Apple Intelligence. Em vez disso, a Apple pode aprender com as inovações da Deepseek e copiá -las.

Enquanto o mercado estava em queda livre na segunda-feira, eu disse que as preocupações com o hardware da GPU da NVIDIA de repente se tornando obsoletas estão mal colocadas. Sim, a Deepseek pode ter criado uma maneira mais eficiente de treinar a IA para ser tão inteligente e capaz quanto o chatgpt. Mas isso não significa que você não precisa de acesso a hardware de IA rápido e confiável.

O fato de os registros Deepseek serem temporariamente limitados, presumivelmente devido a um ataque cibernético, me diz que outra explicação é possível. A infraestrutura da Deepseek pode estar muito limitada para acomodar a demanda. Culpar tudo em um ataque cibernético parece muito melhor do que admitir que a IA precisa de toneladas de poder para decolar.

Isso é tudo especulação, mas o tempo em breve responderá a esse mistério. Os ataques cibernéticos serão repelidos e os registros serão retomados, ou testemunharemos limitações prolongadas indicativas de outras questões.

Aplicativo do iPhone Deepseek. Fonte da imagem: App Store

Eu também disse na segunda -feira que a China nos superou as empresas de IA é temporária. As inovações que a Deepseek introduziu serão replicadas em todo o setor. Eles provavelmente já foram. O que acontece se uma entidade como OpenAI ou Google adota treinamento de IA semelhante ao Deepseek? Veremos uma inovação ainda mais rápida.

Novamente, é especulação. Mas todo mundo copia todo mundo em tecnologia.

Então, como isso beneficia a inteligência da Apple no iPhone? Vamos começar com o básico.

Lembre -se de que a Apple é a única gigante da tecnologia a ter anunciado um enorme projeto de IA com privacidade no núcleo. A Apple Intelligence deve correr principalmente no dispositivo. Quando isso for impossível, a Apple Intelligence moverá informações para os servidores da Apple no que a Apple chama de computação em nuvem privada.

A atualização do iOS 18.4 da Apple entregará a grande atualização do Siri que vimos no WWDC no ano passado. A Siri poderá analisar mais dados do usuário armazenados no dispositivo para oferecer aos usuários do iPhone um assistente ainda melhor. O problema com este Siri é que não é um chatbot. A Apple não possui uma alternativa de chatgpt, por isso construiu o acesso do ChatGPT na Apple Intelligence. Um Siri Chatbot provavelmente está vindo com o iOS 19 no próximo ano.

Sempre que a Apple estiver pronta para oferecer chatbots semelhantes ao ChatGpt O1 e Deepseek R1, terá que encontrar maneiras de executá -los em iPhones. É aí que a tecnologia Deepseek pode ser útil, especificamente o processo de destilação. Ben Thompson explicou tudo em uma FAQ profunda. Refere-se ao uso de um modelo ou modelo de IA de ponta sangrando para treinar modelos menores:

A destilação é um meio de extrair o entendimento de outro modelo; Você pode enviar entradas para o modelo do professor e registrar as saídas e usá -las para treinar o modelo do aluno. É assim que você obtém modelos como o GPT-4 Turbo do GPT-4. A destilação é mais fácil para uma empresa fazer em seus próprios modelos, porque eles têm acesso total, mas você ainda pode fazer destilação de uma maneira um pouco mais pesada via API, ou mesmo, se você for criativo, através de clientes de bate -papo.

A destilação obviamente viola os termos de serviço de vários modelos, mas a única maneira de impedi -la é realmente cortar o acesso, por meio de proibição de IP, limitação de taxa, etc. Supõe -se que seja generalizado em termos de treinamento de modelo, e é por isso que existem Um número cada vez maior de modelos convergindo para a qualidade GPT-4O. Isso não significa que sabemos que Deepseek destilou 4o ou Claude, mas, francamente, seria estranho se eles não o fizessem.

A Apple poderia usar essa tecnologia para treinar modelos especializados de inteligência da Apple que são executados em iPhones. Pense em um modelo AI “Siri Mini” que apenas lida com interações conversacionais via texto e voz no iPhone. Um modelo MINI diferente pode ser usado para outras tarefas específicas no iPhone para garantir que essas tarefas sejam executadas no iPhone.

Modo de convidado do iPhone 16 — iPhone 16 Pro. Fonte da imagem: Jonathan S. Geller

Isso fará inferência de IA, o processo de receber um comando do usuário e fornecer uma resposta, mais barato, mais rápido e mais privado no iPhone do que em outros dispositivos. Thompson identificou os grandes vencedores após a pesquisa do Deepseek R1, e a Apple é uma delas:

A Apple também é um grande vencedor. Os requisitos de memória diminuídos dramaticamente para a inferência tornam a inferência de borda muito mais viável, e a Apple tem o melhor hardware para exatamente isso. A Apple Silicon usa memória unificada, o que significa que a CPU, a GPU e a NPU (unidade de processamento neural) têm acesso a um pool compartilhado de memória; Isso significa que o hardware sofisticado da Apple na verdade tem o melhor chip de consumidor para inferência (o NVIDIA Gaming GPUS Max Out a 32 GB de VRAM, enquanto os chips da Apple vão até 192 GB de RAM).

Há também o fato de que a DeepSeek fez o que sabemos que a Apple faz há anos: otimizar o software para executar em hardware mais limitado. O iPhone nunca correspondeu ao Android em termos de especificações, embora tenha liderado o mercado com seus chips de alta qualidade. A Apple otimizou a experiência do iOS para executar em quantidades mais limitadas de RAM, oferecendo uma experiência móvel rápida que não afetou a vida útil da bateria.

Deepseek alcançou algo semelhante na IA. Ele usou otimizações de software para treinar um rival ChatGPT O1 usando hardware de IA menos capaz do que o OpenAI. Todos estarão interessados em replicar isso, especialmente empresas com acesso ao mais recente hardware da NVIDIA.

A Apple provavelmente está prestando atenção a todos esses desenvolvimentos, e podemos ver resultados em um futuro próximo. Estou especulando, é claro, mas quem em sã consciência pode ignorar as inovações de AI da Deepseek agora? Especialmente se a IA estiver no centro de todos os produtos que você fabrica.

Finalmente, também vou apontar que a Deepseek fez notícias para completar a loja de aplicativos nesta semana, transformando o iPhone no dispositivo preferido para provar novas inovações de IA, mesmo aquelas que não estão ligadas à Apple Intelligence. Além disso, diferentemente da Apple Intelligence, o DeepSeek trabalha no seu iPhone atual, assim como o aplicativo Standalone.

(Tagstotranslate) Apple

Tecnologia. Entretenimento. Ciência. Sua caixa de entrada.

Últimas Notícias de Tecnologia