Pular para o conteúdo

DeepMind do Google aborda previsão do tempo, com ótimo desempenho

Tempo de leitura: 5 minutos

DeepMind do Google aborda previsão do tempo, com ótimo desempenho

Segundo algumas medidas, os sistemas de IA são agora competitivos com os métodos de computação tradicionais para gerar previsões meteorológicas. No entanto, como o seu treinamento penaliza os erros, as previsões tendem a ficar “embaçadas” – à medida que avançamos no tempo, os modelos fazem menos previsões específicas, uma vez que é mais provável que estejam erradas. Como resultado, você começa a ver coisas como rastros de tempestades se alargando e as próprias tempestades perdendo bordas claramente definidas.

Mas usar IA ainda é extremamente tentador porque a alternativa é um modelo computacional de circulação atmosférica, que exige muita computação. Ainda assim, é um grande sucesso, sendo o modelo conjunto do Centro Europeu de Previsões Meteorológicas de Médio Prazo considerado o melhor da sua classe.

Num artigo divulgado hoje, a DeepMind do Google afirma que o seu novo sistema de IA consegue superar o modelo europeu em previsões de pelo menos uma semana e muitas vezes mais. O sistema da DeepMind, chamado GenCast, mescla algumas abordagens computacionais usadas por cientistas atmosféricos com um modelo de difusão, comumente usado em IA generativa. O resultado é um sistema que mantém alta resolução enquanto reduz significativamente o custo computacional.

Previsão de conjunto

Os métodos computacionais tradicionais têm duas vantagens principais sobre os sistemas de IA. A primeira é que eles se baseiam diretamente na física atmosférica, incorporando as regras que sabemos que governam o comportamento do nosso clima real, e calculam alguns dos detalhes de uma forma que é diretamente informada por dados empíricos. Eles também são executados como conjuntos, o que significa que múltiplas instâncias do modelo são executadas. Devido à natureza caótica do clima, estas diferentes execuções irão divergir gradualmente, fornecendo uma medida da incerteza da previsão.

Foi feita pelo menos uma tentativa de fundir alguns dos aspectos dos modelos meteorológicos tradicionais com sistemas de IA. Um projeto interno do Google usou um modelo tradicional de circulação atmosférica que dividiu a superfície da Terra em uma grade de células, mas usou uma IA para prever o comportamento de cada célula. Isto proporcionou um desempenho computacional muito melhor, mas às custas de células de grade relativamente grandes, o que resultou em uma resolução relativamente baixa.

Para sua abordagem às previsões meteorológicas de IA, a DeepMind decidiu pular a física e, em vez disso, adotar a capacidade de executar um conjunto.

Gen Cast é baseado em modelos de difusão, que possuem um recurso importante que é útil aqui. Em essência, esses modelos são treinados iniciando-os com uma mistura de um original – imagem, texto, padrão climático – e depois uma variação onde o ruído é injetado. O sistema deve criar uma variação da versão ruidosa mais próxima do original. Uma vez treinado, ele pode receber ruído puro e evoluir o ruído para ficar mais próximo do alvo.

Neste caso, o alvo são dados meteorológicos realistas, e o sistema recebe uma entrada de ruído puro e a desenvolve com base no estado atual da atmosfera e na sua história recente. Para previsões de longo prazo, o “histórico” inclui tanto os dados reais como os dados previstos de previsões anteriores. O sistema avança em passos de 12 horas, portanto a previsão para o terceiro dia incorporará as condições iniciais, o histórico anterior e as duas previsões dos dias um e dois.

Isso é útil para criar uma previsão de conjunto porque você pode alimentá-la com diferentes padrões de ruído como entrada, e cada um produzirá uma saída ligeiramente diferente de dados meteorológicos. Isto tem o mesmo propósito que um modelo meteorológico tradicional: fornecer uma medida da incerteza da previsão.

Para cada quadrado da grade, o GenCast trabalha com seis medidas meteorológicas na superfície, juntamente com seis que rastreiam o estado da atmosfera e 13 altitudes diferentes nas quais estima a pressão do ar. Cada um destes quadrados da grelha tem 0,2 graus de lado, uma resolução mais elevada do que a que o modelo europeu utiliza para as suas previsões. Apesar dessa resolução, a DeepMind estima que uma única instância (ou seja, não um conjunto completo) pode durar até 15 dias em um dos sistemas de processamento de tensores do Google em apenas oito minutos.

É possível fazer uma previsão conjunta executando múltiplas versões em paralelo e depois integrando os resultados. Dada a quantidade de hardware que o Google tem à disposição, todo o processo do início ao fim provavelmente levará menos de 20 minutos. Os dados de origem e de treinamento serão colocados na página GitHub do projeto GraphCast da DeepMind. Dados os requisitos computacionais relativamente baixos, provavelmente podemos esperar que equipes de pesquisa acadêmica individuais comecem a experimentá-lo.

Medidas de sucesso

DeepMind relata que o GenCast supera dramaticamente o melhor modelo de previsão tradicional. Usando um benchmark padrão na área, a DeepMind descobriu que o GenCast era mais preciso do que o modelo europeu em 97% dos testes que utilizou, que verificaram diferentes valores de saída em diferentes momentos no futuro. Além disso, os valores de confiança, baseados na incerteza obtida do conjunto, foram geralmente razoáveis.

Os meteorologistas de IA anteriores, tendo sido treinados com dados do mundo real, geralmente não são bons em lidar com condições climáticas extremas, uma vez que aparecem muito raramente no conjunto de treinamento. Mas o GenCast se saiu muito bem, muitas vezes superando o modelo europeu em coisas como temperaturas e pressão do ar anormalmente altas e baixas (frequência de um por cento ou menos, inclusive no percentil 0,01).

A DeepMind também foi além dos testes padrão para determinar se o GenCast poderia ser útil. Essa pesquisa incluiu a projeção de trajetórias de ciclones tropicais, um trabalho importante para modelos de previsão. Durante os primeiros quatro dias, o GenCast foi significativamente mais preciso do que o modelo europeu e manteve a sua liderança durante cerca de uma semana.

Um dos testes mais interessantes da DeepMind foi verificar a previsão global da produção de energia eólica com base nas informações do Global Powerplant Database. Isso envolveu usá-lo para prever a velocidade do vento a 10 metros acima da superfície (que na verdade é mais baixa do que onde reside a maioria das turbinas, mas é a melhor aproximação possível) e depois usar esse número para descobrir quanta energia seria gerada. O sistema superou o modelo climático tradicional em 20% nos primeiros dois dias e permaneceu na frente com uma vantagem decrescente durante uma semana.

Os pesquisadores não gastam muito tempo examinando por que o desempenho parece diminuir gradualmente durante cerca de uma semana. Idealmente, mais detalhes sobre as limitações do GenCast ajudariam a informar futuras melhorias, então os pesquisadores provavelmente estão pensando nisso. Em qualquer caso, o artigo de hoje marca o segundo caso em que foi relatado que a adoção de algo semelhante a uma abordagem híbrida – misturando aspectos dos sistemas de previsão tradicionais com IA – melhora as previsões. E ambos os casos adoptaram abordagens muito diferentes, levantando a perspectiva de que será possível combinar algumas das suas características.

Natureza, 2024. DOI: 10.1038/s41586-024-08252-9 (Sobre DOIs).