Os aplicativos de visão computacional estão recebendo um grande impulso com os avanços nos smartphones combinados com a IA, que ajuda a preencher as lacunas daquilo que os dispositivos do dia a dia não conseguem ver. Usando essas ferramentas, uma startup de Munique chamada Beyond Presence acredita ter a chave para o que está por vir: avatares hiper-realistas que se parecem e soam exatamente como seus equivalentes humanos e podem ser usados em situações de conversação em tempo real.
A startup disse hoje que levantou seu primeiro financiamento externo, uma rodada pré-semente de US$ 3,1 milhões. A empresa alemã HV Capital lidera a rodada, com a participação de 10x Founders, Alba VC e indivíduos da Meta, DeepMind e Zalando.
A Beyond Presence ainda não lançou sua tecnologia ao mundo, mas está perto, disse Awais Shafique, CEO e cofundador da startup, ao TechCrunch.
Parte do novo capital será usada para continuar a desenvolver os modelos fundamentais da empresa, disse ele, e parte financiará o lançamento de sua versão beta pública até o final deste mês.
Até agora, cerca de 300 empresas estão na lista de espera pelo produto, que provavelmente terá aplicações iniciais em áreas como atendimento e suporte ao cliente, recrutamento, vendas e e-learning. Todas essas são áreas nas quais as empresas buscam ampliar as interações com os usuários sem precisar contratar e treinar mais pessoas.
Então, como uma startup conseguiu levantar uma rodada multimilionária antes mesmo de lançar um produto e chegar tão longe como uma empresa de IA com uso intensivo de recursos, sem qualquer financiamento externo? A resposta está na formação dos fundadores.
Shafique foi cofundador da Presize, uma startup de visão computacional que pode fazer medições precisas de um usuário gravando um clipe do usuário se virando uma vez na frente da câmera de um smartphone. Essas medidas poderiam então ser usadas para ajudar a comprar roupas online. A startup sediada em Munique tinha um perfil descomunal no seu país de origem porque os fundadores participaram na versão televisiva alemã de “Dragons Den”/“Shark Tank” em 2020, onde angariaram um valor recorde de 650.000 euros.
Então, em abril de 2022, descobriu-se que a Meta havia adquirido a Presize. O preço e a data exata da transação nunca foram divulgados, mas alguns sinais fortes apontam para uma ótima saída.
Os registros da SEC mostram que a Meta gastou entre US$ 774 milhões de janeiro a março de 2022 e US$ 1,15 bilhão nos primeiros seis meses de 2022, em aquisições. Presize foi o único negócio divulgado publicamente naquela época. A lista de aquisições da Meta da Wikipédia, entretanto, foi editada com uma estimativa muito mais modesta: US$ 100 milhões.
Fontes familiarizadas com o assunto disseram ao TechCrunch que um valor de negócio na faixa inferior de nove dígitos era mais preciso do que dez dígitos neste caso.
Independentemente de onde Presize se enquadrasse nessa faixa, dado que a startup havia arrecadado apenas “alguns milhões”, na estimativa de Shafique, ele e seus cofundadores saíram muito bem.
“É suficientemente lucrativo para que não tenhamos de trabalhar”, disse ele numa entrevista.
(Eles ainda estão trabalhando de qualquer maneira. Além da última startup da Shafique, os outros cofundadores da Presize, Leon Szeli e Tomislav Tomov, ainda estão na Meta, trabalhando em seus projetos generativos de IA. No entanto, eles permanecem em contato com a Shafique: ambos estão investindo em Beyond Presence.)
Em sua essência, o Presize pretendia resolver um problema espinhoso de visão computacional, e é isso que Beyond Presence também pretende fazer.
É certo que meus pensamentos iniciais sobre a proposta do Beyond Presence foram céticos.
Os avatares digitais não são exatamente um território desconhecido. Eles não apenas existem há décadas, mas também têm recebido um aumento de atenção mais recentemente – e talvez algum entusiasmo – com as mais recentes inovações em IA e processamento, sem mencionar a mania por todas as coisas relacionadas ao chatbot.
Também não há ideias claras sobre o que funcionará no domínio dos avatares como um negócio de longo prazo. Alguns, como Hyper e Ready Player Me (apoiados respectivamente pela Amazon e A16Z), baseiam-se na cultura dos jogos e na teoria de que os avatares deveriam não ser versões realistas das pessoas que os utilizam. Aqueles que desejam ocultar suas identidades para preservar sua privacidade podem optar por essas abordagens em vez daquelas que reproduzem sua semelhança exata.
Outros, como Synthesia, pode criar semelhanças de pessoas. Mas exigem visitas ao estúdio e não são a base do produto principal, que utiliza dispositivos modestos, como câmeras de telefone, para capturar suas expressões e potencializar avatares que fazem isso. não parece com você.
E alguns outros estão tentando construir ferramentas com as quais você possa interagir usando dispositivos do dia a dia – incluindo Veed e Deepbrain.
Beyond Presence visa não apenas um avatar que possa ser criado instantaneamente usando seu telefone, mas também um que se pareça com você e possa ser usado em situações de conversa improvisadas em tempo real. Algo como uma versão em vídeo dos chatbots baseados em texto oferecidos pela OpenAI, Anthropic, Meta e muitos outros.
A startup não é a única nesse espaço, claro. O Zoom parece estar trabalhando em avatares personalizados hiper-realistas, e o CommonGround também está desenvolvendo algo semelhante.
Por enquanto, a Beyond Presence está se concentrando em construir algo único no componente de vídeo de seu produto.
A Eleven Labs está potencializando a parte de voz da experiência, e o GPT da OpenAI é o modelo generativo de IA que alimenta o conteúdo. Os clientes empresariais podem alterar com flexibilidade o modelo que usam.
“Você também pode deixar tudo conosco (ou usar) qualquer LLM que desejar ou qualquer agente de voz que desejar. E então fazemos a cara em cima”, disse ele. Este recurso aborda o fato de que os clientes corporativos podem já estar trabalhando com determinados provedores de LLM, por exemplo, ou não quererem compartilhar quaisquer dados proprietários externamente, observou ele.
Há um detalhe interessante sobre as primeiras decisões da Beyond Presence em relação ao financiamento: Acontece que a empresa foi aceita para participar do Y Combinator no início deste ano, mas optou por sair da prestigiada incubadora.
Embora YC definitivamente dê acesso a grandes redes, Shafique e seu cofundador Felix Altenberger (CTO; e ex-especialista em aprendizagem profunda na Presize) optaram por não abrir mão da equidade e da autonomia para acessá-las.
Embora os parceiros da YC possam ter dado a sua própria opinião sobre como fazer a empresa crescer com vendas, Shafique disse que ele e Altenberger tinham uma abordagem “horizontal” que queriam seguir.
“Queríamos avançar mais na tecnologia central e na camada do modelo básico”, disse ele.