Os dados são praticamente tudo quando se trata de treinar sistemas de IA, mas acessar dados suficientes para produzir produtos de qualidade que cumpram suas promessas é um grande desafio, mesmo para empresas com os bolsos mais fundos.
Este é um problema que a Advex AI pretende resolver, usando IA generativa e dados sintéticos para “resolver o problema dos dados”, como diz a empresa. Mais especificamente, a Advex permite que os clientes treinem seus sistemas de visão computacional usando uma pequena amostra de imagens, com a Advex gerando milhares de imagens “falsas” a partir dessa amostra.
Hoje sinaliza o lançamento formal da Advex no TechCrunch Disrupt 2024 no estágio Startup Battlefield, embora já tenha garantido um punhado de clientes durante sua fase furtiva. Isto inclui o que chama de “sete grandes” clientes empresariais, que afirma não ter liberdade de divulgar. O TechCrunch também pode revelar que a startup com sede em São Francisco arrecadou US$ 3,6 milhões em financiamento, a maior parte dos quais veio por meio de uma parcela inicial de US$ 3,1 milhões em dezembro passado, com patrocinadores notáveis, incluindo Construct Capital, Pear VC e Emerson Collective de Laurene Powell Jobs.
O CEO Pedro Pachuca iniciou a Advex com seu cofundador CTO, Qasim Wani, há pouco mais de um ano, e a empresa tem seis funcionários. É notável que uma startup tão esbelta já tenha entrado no setor com clientes pagantes reais, com Pachuca atribuindo pelo menos parte disso ao seu histórico, bem como ao bom e velho networking e contatos frios. Na verdade, Pachuca foi anteriormente pesquisador de aprendizado de máquina em Berkeley e mais tarde juntou-se à equipe de pesquisa do Google Brain antes de se fundir com a DeepMind.
“Se o ROI (retorno sobre o investimento) fizer sentido, eles (os clientes) confiarão um pouco em nós”, disse Pachuca. “Fiz muitas pesquisas neste espaço – estar no Google Brain antes me dá um pouco de credibilidade. Mas no início eram e-mails frios, e isso nos rendeu nossos dois primeiros grandes clientes. Depois vieram as conferências – é por isso que vou a tantas delas!”
Pachuca estava prestes a viajar para a Europa logo após concluir sua entrevista ao TechCrunch, onde planejava participar de diversas reuniões e conferências, incluindo a Conferência Europeia sobre Visão Computacional (ECCV) em Milão (Itália) e a Vision em Stuttgart (Alemanha).
“Há muitas conferências na Europa”, disse Pachuca. “Vamos para a ECCV para aprender e contratar, basicamente”, acrescentou Pachuca. “E a Vision está mais voltada para o lado industrial, então estamos lá para vender.”
Os clientes potenciais incluem desenvolvedores legados de sistemas de visão mecânica, nos moldes da Cognex ou Keyence, que estão se esforçando para reforçar seus produtos com melhor IA. Mas, por outro lado, a Advex pode vender diretamente para empresas de usuários finais, como fabricantes de automóveis ou empresas de logística que constroem suas próprias ferramentas internas.
Por exemplo, um fabricante de automóveis pode precisar ensinar seu sistema de visão computacional a reconhecer defeitos no material dos assentos de seus automóveis. Porém, mesmo que a empresa pudesse acessar centenas de imagens distintas, o fato é que não existem dois defeitos iguais. Então, em vez disso, o fabricante pode fazer upload de uma dúzia de fotos de assentos com rasgos, com a Advex extrapolando isso para gerar milhares de fotos de assentos “defectados” para construir um conjunto muito mais extenso e diversificado de dados de treinamento.
O mesmo pode ser aplicado a praticamente qualquer setor industrial, desde petróleo e gás até móveis de madeira — trata-se de reduzir o tempo e os custos de coleta de dados através da criação artificial de imagens de treinamento.
Os dados sintéticos não são um conceito novo, é claro, mas com a revolução da IA em pleno andamento, as empresas estão a tentar colmatar as lacunas de dados – isto inclui áreas como a investigação de mercado, onde as amostras dos inquéritos podem ser demasiado pequenas, bem como os dados informáticos. visão como estamos vendo com empresas como Advex, entre outras startups apoiadas por VC, como Synthesis AI e Parallel Domain.
Em termos gerais, existem dois tipos de modelos com os quais a Advex lida. O modelo implantado no local do cliente, aquele que as próprias imagens do cliente treinam, é apenas “coisa de código aberto” padrão e pronto para uso, como diz Pachuca. “Isso porque eles precisam ser pequenos, e também não acreditamos que os ganhos venham da arquitetura do modelo – eles vêm do treinamento com os dados corretos”, disse ele.
Mas o verdadeiro ingrediente secreto está no modelo de difusão proprietário da empresa, semelhante a algo como Midjourney ou Dall-E, e é o que é usado para criar os dados sintéticos. “Esse é personalizado e altamente complicado – é onde colocamos todos os nossos esforços”, acrescentou Pachuca.
Embora o foco na fabricação da Advex seja uma forma de diferenciação, é realmente a abordagem do modelo de difusão onde a empresa se vê como se destacando.
Em comparação com outras técnicas de simulação e modelagem, como aquelas alinhadas com motores de jogo/física (por exemplo, Unity), Pachuca diz que usar difusão significa que não há necessidade de configuração e a geração leva apenas alguns segundos por par imagem/rótulo – além de ser muito mais próximo para dados da vida real.
“Não estamos apenas criando imagens, estamos criando imagens que você não tem – especificamente tentando entender o que está faltando e criando isso”, disse Pachuca. “E essa parte do ‘o que está faltando’ é muito difícil e muito invisível, mas é uma das maiores inovações que fizemos.”