TwelveLabs levanta $100M Series B para construir compreensão de vídeo para agentes de IA corporativa
TwelveLabs fechou uma rodada Series B de $100 milhões co-liderada por New Enterprise Associates (NEA) e NAVER Ventures, levando o financiamento cumulativo a mais de $200 milhões. Investidores incluem Amazon, Radical Ventures, Korea Investment Partners, Index Ventures, Quadrille Capital e Red Bull Ventures. Amazon Web Services está fazendo AWS o parceiro de nuvem preferido de TwelveLabs com um compromisso multianual: novos modelos serão lançados no AWS primeiro e otimizados para chips de IA AWS Trainium, expandindo capacidades de vídeo de IA não-NVIDIA da Amazon.
TwelveLabs constrói Marengo 3.0, um modelo de incorporação de vídeo que converte filmagem bruta (fala, som, movimento) em representações semânticas pesquáveis em escala, e Pegasus 1.5, uma linguagem de domínio-específíca para vídeo que permite raciocínio sobre até duas horas de contexto contínuo. Ao contrário de ferramentas generativas de vídeo (Sora, Veo, Runway), TwelveLabs indexa e consulta vídeo existente—abordando uma dor corporativa: bilhões de horas de arquivos de vídeo (vigilância, transmissões, esportes, filmagem de fábrica, registros médicos) permanecem opacos aos sistemas de IA porque os LLMs atuais apenas amostra frames isolados. A empresa reportou que tem 178 funcionários, acima de 58 há um ano, e opera de San Francisco e Seul.
O levantamento de $100M sinaliza convicção de investidor em compreensão de vídeo como uma categoria distinta de geração de vídeo. Financiamento de venture para IA vertical se tornou cada vez mais seletivo, com tamanho de deal médio dobrando ano-a-ano mesmo conforme contagem de deal cai. Capacidade de TwelveLabs atrair investimento estratégico da Amazon (além de capital) sugere que demanda corporativa por arquivos de vídeo queryáveis é real e crescente em fluxos de trabalho de mídia, conformidade, segurança e esportes.
Para equipes de infraestrutura e ML, valor estratégico aqui não é tamanho mas estrutura: compromisso de Trainium da Amazon bloqueia modelos de TwelveLabs em AWS primeiro e cria suporte nativo para cargas de trabalho de raciocínio de vídeo. Conforme agentes e sistemas autônomos se movem para papéis requerindo percepção e raciocínio sobre realidade física, vídeo se torna a modalidade que importa mais, tornando equipes que podem extrair signficado semântico de filmagem gravada cada vez mais crítica para pilhas de IA de produção.