M4 Mac minis em um cluster são legais, mas não muito eficazes

Tempo de leitura: 4 minutos

Um conjunto de Mac minis M4 – Crédito da imagem: Alex Ziskind/YouTube

M4 Mac minis em um cluster são legais, mas não muito eficazes

Existe uma maneira de usar uma coleção de Mac minis M4 em um cluster, mas os benefícios só existem realmente quando você usa Macs de última geração.

Embora a maioria das pessoas pense que ter um computador mais potente significa comprar um único dispositivo caro, existem outras maneiras de realizar grandes quantidades de processamento de números. Em um conceito que existe há décadas, você poderia usar vários computadores para lidar com o processamento de um projeto.

O conceito de computação em cluster gira em torno de uma tarefa com muitos cálculos compartilhados entre duas ou mais unidades de processamento. Trabalhando juntos para concluir tarefas em paralelo, o resultado é uma redução significativa no tempo de processamento.

Em um vídeo publicado no YouTube no domingo, Alex Ziskind demonstra uma configuração de computação em cluster usando o M4 Mac mini. Usando uma coleção de cinco Mac minis empilhados em uma moldura de plástico, ele define uma tarefa que é então distribuída entre eles para processamento.

Embora as configurações típicas de computação em cluster doméstico dependam de redes Ethernet para comunicações entre os nós, a Ziskind está aproveitando a velocidade do Thunderbolt usando o Thunderbolt Bridge. Isso acelera consideravelmente a comunicação entre os nós, além de permitir o envio de pacotes maiores de dados, economizando desempenho de processamento.

A Ethernet pode funcionar normalmente a 1 Gb/s ou até 10 Gb/s se você pagou pela atualização da Ethernet em alguns modelos de Mac. Em vez disso, o método Thunderbolt Bridge pode ser executado a 40 Gb/s para portas Thunderbolt 4 ou 80 Gb/s no Thunderbolt 5 nos modelos M4 Pro e M4 Max quando executado bidirecionalmente.

Melhor que o processamento de GPU

Ziskind aponta que pode haver benefícios em usar Apple Silicon em vez de um PC usando uma placa gráfica poderosa para computação em cluster.

Para começar, o processamento usando uma GPU depende de quantidades consideráveis ​​de memória de vídeo disponíveis. Em uma placa gráfica, isso pode ser 8 GB na própria placa, por exemplo.

O uso de memória unificada pela Apple no Apple Silicon significa que a memória do Mac é usada pela CPU e pela GPU. A GPU Apple Silicon, portanto, tem acesso a muito mais memória, especialmente quando se trata de configurações de Mac com 32 GB ou mais.

Depois, há o consumo de energia, que pode ser considerável para uma placa gráfica. O alto uso de energia pode ser equiparado a um custo operacional contínuo mais alto.

Por outro lado, descobriu-se que os Mac minis consumiam muito pouca energia, e um cluster de cinco Mac minis funcionando com capacidade total consumia menos energia do que uma placa gráfica de alto desempenho.

MLX, não Xgrid

Para colocar o cluster em funcionamento, Ziskind usa um projeto do qual já falamos. Ele usa MLX, um projeto de código aberto da Apple descrito como uma “estrutura de array projetada para pesquisas de aprendizado de máquina eficientes e flexíveis no Apple Silicon”.

Isso lembra vagamente o Xgrid, a solução de computação distribuída da Apple, há muito morta, que poderia controlar vários Macs para computação em cluster. Esse sistema também permitiu que um servidor Mac OS X aproveitasse as vantagens dos Macs de grupos de trabalho em uma rede para realizar o processamento quando não estivessem sendo usados ​​para mais nada.

No entanto, embora o Xgrid funcionasse para operações de grande escala que eram muito bem financiadas a nível corporativo ou federal, como AppleInsiderMike Wuerthele pode atestar que isso não se traduziu bem em projetos menores. Em situações perfeitas e específicas, e em códigos específicos, funcionava de maneira fantástica, mas clusters caseiros tendiam a não funcionar muito bem e, às vezes, mais lentos do que um único computador fazendo o trabalho.

O MLX muda bastante isso, pois está usando a metodologia padrão de computação distribuída MPI para funcionar. Também é possível rodar em alguns Macs de desempenho variado, sem necessariamente gastar centenas ou milhares deles.

Ao contrário do Xgrid, o MLX parece ser muito mais voltado para clusters menores, ou seja, o público que queria usar o Xgrid, mas continuava enfrentando problemas.

Um cluster útil pelos motivos certos

Embora somar o desempenho de vários Mac minis em um cluster pareça atraente, não é algo de que todos possam se beneficiar.

Para começar, você não verá benefícios no uso típico do Mac, como executar um aplicativo ou jogar um jogo. Destina-se ao processamento de conjuntos de dados massivos ou a tarefas de alta intensidade que se beneficiam do processamento paralelo.

Isso o torna ideal para fins como a criação de LLMs para pesquisa de aprendizado de máquina, por exemplo.

Também não é exatamente fácil de usar pelo usuário típico de Mac.

Além disso, os ganhos de desempenho não serão necessariamente tão benéficos para o proprietário habitual de Mac. Ziskind descobriu em testes que simplesmente comprar um modelo M4 Pro oferece mais desempenho do que duas unidades M4 trabalhando juntas ao usar LLMs.

Duas unidades de computador prateadas empilhadas com um design minimalista estão sobre uma mesa branca contra um fundo desfocado.

Os clusters podem realmente valer a pena ao usar vários Macs de alta especificação juntos

Um cluster como esse entra em ação quando você precisa de mais desempenho do que pode obter com um único Mac poderoso. Se um modelo for muito grande para funcionar em um único Mac, como restrições de memória, um cluster poderá oferecer mais memória total para o modelo usar.

Ziskind afirma que, neste estágio, um M4 Max Mac de última geração com grandes quantidades de memória é melhor do que um cluster de máquinas de baixo desempenho. Mas mesmo assim, se seus requisitos vão além da configuração mais alta do Mac, um cluster pode ajudar aqui.

No entanto, ainda existem algumas limitações a serem consideradas. Embora o Thunderbolt seja rápido, Ziskind teve que recorrer ao uso de um hub Thunderbolt para conectar os nós ao Mac host, o que reduziu a largura de banda disponível.

Conectar diretamente os Macs resolveu isso, mas depois houve problemas como o número de portas Thunderbolt disponíveis para conectar vários Macs. Isso pode tornar problemático o dimensionamento do cluster.

Ele também encontrou estranhezas térmicas, onde o Mac mini host estava funcionando especialmente quente, enquanto os nós funcionavam em um nível mais razoável.

No final das contas, Ziskind achou o experimento da torre cluster do Mac mini interessante, mas ele não pretende usá-lo a longo prazo. No entanto, ainda é relativamente cedo para a tecnologia e, nos casos em que você usa vários Macs de última geração para um modelo suficientemente resistente, ela ainda pode funcionar muito bem.

Rolar para cima
Pular para o conteúdo