'Onde estamos hoje em biologia, a IA é semelhante à GPT em 2020': Uma entrevista com o CEO da maior startup de IA de África

Tempo de leitura: 7 minutos

Em janeiro do ano passado, a empresa alemã de biotecnologia BioNTech adquiriu a startup africana de IA Instadeep por mais de US$ 550 milhões, um acordo finalizado em julho do mesmo ano. A Instadeep, cuja saída é atualmente a maior da África, opera sob a égide da indústria farmacêutica alemã há pouco mais de um ano. Agora é um bom momento para ver como tem se saído desde a aquisição.

Instadeep usa técnicas avançadas de aprendizado de máquina para trazer IA para aplicativos empresariais. Seus produtos variam de insights acelerados por GPU a sistemas de tomada de decisão com autoaprendizagem. Antes da aquisição do ano passado, a startup de IA empresarial nascida em Tunis e com sede em Paris, Londres, levantou mais de US$ 108 milhões de vários investidores globais, incluindo Google, Deutsche Bahn e BioNTech. Essas três estratégias também estiveram entre os maiores parceiros e clientes da startup.

Notavelmente, a startup com uma década colaborou com a BioNTech para desenvolver um sistema de alerta precoce que pudesse detectar variantes de alto risco da COVID-19 com meses de antecedência durante a pandemia. A Instadeep trabalhou com o Google DeepMind para criar um sistema de detecção precoce de surtos de gafanhotos do deserto na África. Também colaborou num projeto lunar para automatizar a programação ferroviária da Deutsche Bahn, a maior operadora ferroviária da Europa.

Embora estas parcerias apresentem várias aplicações para as soluções da Instadeep, o seu adquirente tinha um caso de utilização claro: utilizar a IA para desenvolver terapêuticas e vacinas para vários tipos de cancro e doenças infecciosas – algo que está agora a duplicar sob o seu novo proprietário.

Quinze meses após a conclusão da aquisição da BioNTech, o cofundador e CEO Karim Beguir disse ao TechCrunch em uma entrevista que a Instadeep fez um progresso significativo nessa frente, mesmo que a empresa de IA – que continua a operar de forma independente – ainda forneça soluções para clientes externos. biotecnologia.

“Estamos estrategicamente alinhados com a BioNTech nos objetivos a serem perseguidos em biologia e capacidades de bio IA”, disse o chefe da Instadeep. “Mas também temos espaço de manobra e continuamos a ser uma força na IA em África e em geral, ao mesmo tempo que continuamos a desenvolver tecnologias que expandem a fronteira da inovação noutros setores, como a otimização industrial.”

Aumentando as capacidades dentro da biotecnologia

Beguir observa que o objetivo da Instadeep no ano passado, desde a sua aquisição, foi implantar IA em cada etapa do pipeline da BioNTech para melhorar os processos existentes.

Ele compartilha um exemplo na histologia, que envolve análise de tecidos e a tarefa visual de rotular diferentes tecidos, como identificar células tumorais ou células saudáveis. Segundo ele, especialistas da BioNTech tradicionalmente realizavam esse trabalho manualmente. No entanto, a tecnologia da Instadeep ajudou a acelerar o processo, implantando IA visual e sistemas de segmentação, acelerando o fluxo de trabalho de rotulagem de tecidos em 5x.

Outra é a conclusão do seu projecto RiboMab, que envolve anticorpos codificados por mRNA que agora se tornaram parte do kit de ferramentas da BioNTech como uma empresa de imunoterapia para combater o cancro e outras doenças. InstaDeep apresentou este projeto em sua plataforma DeepChain, que projeta proteínas e analisa dados biológicos, durante sua primeira colaboração em 2020.

A biotecnologia envolve uma riqueza de dados confidenciais de saúde. Coletá-los e analisá-los é uma coisa. Mantê-los seguros é outra. Basta perguntar à 23andMe, que já foi considerada um disruptor no espaço da biotecnologia antes de se tornar vítima de uma violação massiva que expôs os dados de quase 7 milhões de pessoas, metade da sua base de clientes.

Curiosamente, a BioNTech conhece bem esses eventos. Em 2020, hackers acederam ilegalmente a documentos relacionados com a sua vacina contra a COVID-19, desenvolvida com a Pfizer, atacando a Agência Europeia de Medicamentos (EMA), o regulador europeu de medicamentos, que avalia medicamentos e vacinas. Embora a Pfizer e a BioNTech tenham confirmado que os seus sistemas e dados de testes permaneceram seguros, o incidente destaca como as organizações, mesmo as regulatórias, podem ser vulneráveis ​​a ataques cibernéticos.

Como qualquer CEO diria, Beguir me disse que a Instadeep e a BioNTech são altamente cautelosas com os dados de saúde, especialmente porque a parceria está atualmente usando IA para aumentar os ativos de dados, permitindo-lhes identificar sequências de proteínas precisas e potencialmente desbloquear novos alvos para o câncer e outras imunoterapias. casos de uso.

Mas há uma segmentação nos dados que ambas as empresas usam. A BioNTech lida com dados pessoais e reais de pacientes, e a Instadeep normalmente desenvolve modelos e os treina em dados disponíveis publicamente. Foi assim que, por exemplo, treinou seu Nucleotide Transformer, uma série de modelos em genômica de IA, que hoje é o modelo de genômica de IA mais baixado e popular do mundo. (Graças em parte a este acordo de código aberto.)

“A Instadeep desenvolveu e treinou o modelo de nucleotídeos em dados públicos”, observa Beguir. “No entanto, quando quisemos implantar o modelo em casos de uso específicos e dados de pacientes da vida real, fizemos isso no nível da BioNTech, com todas as garantias de privacidade que advêm de sua posição como um dos principais players do setor biofarmacêutico operando sob estrita regulamentos e seguindo rigorosos protocolos de qualidade.

Desenvolvimento de novas tecnologias dentro da BioNTech e fora da biotecnologia

Quando questionado sobre quais são os próximos marcos da Instadeep dentro da BioNTech, Beguir menciona o “último avanço” da startup: redes de fluxo bayesianas (BFN), um novo modelo generativo de IA para proteínas que supera significativamente os modelos autorregressivos e de difusão, de acordo com a empresa. O CEO da BioNTech, Ugur Sahin, em comunicado, descreve-a como uma “tecnologia de última geração”.

De acordo com Beguir, o modelo produz as proteínas proteicas com aparência mais natural e mais bem comportadas do mercado, permitindo que os sistemas pesquisem propriedades específicas na cadeia pesada de um anticorpo, incluindo características químicas, hidrofobicidade ou comprimento de sequência. Tais modelos são cruciais para a compreensão de funções proteicas complexas e para a engenharia de novas proteínas terapêuticas.

“Estamos entusiasmados com o potencial de inovações de IA como a nossa para identificar casos de uso reais, colaborar estreitamente com a BioNTech e construir produtos que serão testados em laboratórios e clínicas, salvando vidas de pacientes”, disse Beguir. “Se você considerar onde estamos hoje em biologia e IA, é semelhante a onde estávamos com o processamento de linguagem natural em 2020 com GPT-3. Os sistemas estavam começando a funcionar e suas capacidades eram impressionantes, mas ainda havia espaço para melhorias.”

A Instadeep lançou o novo modelo de IA na semana passada junto com um novo supercomputador quase exascale, que, segundo as empresas, coloca a parceria entre os 100 melhores em computação e infraestrutura e entre os 20 melhores clusters de GPU H100 em todo o mundo.

Ambos os desenvolvimentos destacam onde a Instadeep, sob a direção da BioNTech, implanta IA em vários casos de uso de ciências biológicas. Por outro lado, administra de forma independente sua outra linha de negócios, que envolve IA e aprendizagem por reforço profundo para otimização industrial.

Um exemplo é o seu projecto em curso de 12 anos para automatizar o planeamento e expedição ferroviária para a Deutsche Bahn, um dos seus parceiros de longa data e o maior operador ferroviário da Europa. Da mesma forma, a empresa de IA sediada em Túnis e Londres reforçou os esforços para desenvolver outros casos de utilização de otimização industrial, como a colaboração com a Fraport na Alemanha para otimizar operações aeroportuárias complexas com IA.

“Em geral, também vemos o potencial dos agentes de IA como muito atraente para o futuro. Acreditamos que a otimização industrial e os sistemas baseados em agentes, trabalhando lado a lado com colegas humanos, revolucionarão a eficiência industrial. Portanto, esta é também outra área em que estamos há muitos anos e onde continuamos a investir”, observou Beguir.

Enquanto isso, a Instadeep, no início deste mês, lançou a versão pro de seu produto DeepPCB (Deep Impresso Circuit Board), um design de hardware ou placa de circuito impresso inteiramente assistido por IA autônoma alimentada por aprendizado por reforço, em São Francisco. Beguir diz que os concorrentes da empresa são startups menores de IA em áreas específicas em que atua, como a Intelmatix, sediada em Riad.

O chefe da Instadeep se orgulha do trabalho de sua empresa na resolução de casos de uso mais complexos de IA – por exemplo, Gen AI para DNA ou proteômica ou fluxos de trabalho de agentes para otimização combinatória – e evitando casos simples como Gen AI para PNL. Ele afirma que, além da aquisição da BioNTech, esta engenhosidade desempenha um papel considerável no aumento do interesse de clientes nos EUA, onde a empresa de IA tem agora dois escritórios, e também em toda a Europa: Berlim, Paris e Reino Unido, em particular.

Embora a BioNTech tenha gasto 500 milhões de dólares na Instadeep para aumentar as suas capacidades de biotecnologia, mantém a empresa de IA operacionalmente independente por razões como esta, ao mesmo tempo que financia as suas atividades para servir clientes além da indústria de biotecnologia.”

“Porque contribuímos com valor por sermos líderes em IA, e as habilidades de IA podem ser melhoradas em vários setores”, respondeu Beguir quando questionado por que a BioNTech ainda permite que a empresa de IA trabalhe em projetos não biotecnológicos. “É a mesma pilha de tecnologia, então o tempo de trabalho em IA fora da biotecnologia não é tempo perdido. A BioNTech também implanta o InstaDeep em tarefas fora da pesquisa e desenvolvimento de biotecnologia, como na otimização de operações.”

Beguir explica que embora a InstaDeep não tenha sido forçada a vender, foi a visão compartilhada e os projetos bem-sucedidos com a BioNTech desde 2019, muito antes da aquisição, que convenceram a empresa de IA a avançar com o negócio. Ele acredita que a confiança construída ao longo de anos de colaboração é a razão pela qual a InstaDeep permanecerá independente sob a BioNTech. A chave para o InstaDeep agora é manter seu impulso, manter resultados de alta qualidade e continuar inovando pelo maior tempo possível.”

Desde a aquisição, a InstaDeep cresceu para mais de 400 funcionários em todo o mundo. Isto inclui a sua equipa em África, baseada num novo escritório em Kigali, que lidera o trabalho de inteligência geoespacial da empresa.

Inicialmente um esforço local em parceria com o Google para detectar locais de reprodução de gafanhotos na África, o Instadeep agora usa dados de rótulos anteriores e imagens de satélite para inferir com alta qualidade e uma precisão de 80-85% onde os locais de ligação de gafanhotos estarão no próximos 30 dias. Beguir diz que InstaGeo, a estrutura da empresa que utiliza imagens multiespectrais de satélite da NASA ou da Agência Espacial Europeia (ESA), é de código aberto e está disponível para outras empresas desenvolverem soluções escaláveis ​​em todo o continente.

“Este é um exemplo real de como a tecnologia e a capacidade da IA ​​estão tendo impacto. Em vez de recolher amostras no terreno ou depender de infra-estruturas terrestres, podemos fornecer essas informações através de satélites em grande escala e notificar vários governos e intervenientes para enfrentar um desafio crescente à segurança alimentar, especialmente tendo em conta as questões climáticas do continente.”

Rolar para cima
Pular para o conteúdo