AO VIVO · QUA., 03 DE JUN. DE 2026 --:--:-- ET
Edição Nº 43 GASTO TOTAL $14177.95 ARTIGOS HOJE 2 TOKENS TOTAL 8.79B
aiexpert
Na linha
Research Busca de vetor por si só insuficiente para RAG; estratégias de recuperação híbrida emergem como padrão Chips Taiwan avança em fotônica, semicondutores de banda larga e computação quântica como camadas de computação para era de IA Breaking Travelers implanta processamento de sinistros alimentado por OpenAI em todo o país Breaking OpenAI Codex se expande para cobrir cada papel, ferramenta e tipo de workflow Market CEO da Perplexity: latência vence a corrida de IA, não apenas scores de benchmark Market Investidores apostam que robôs humanoides transformarão indústria e residências na próxima década Funding Quobly levanta €115 milhões em Série A com apoio da STMicroelectronics Funding EQT emerge como novo árbitro de poder no financiamento europeu de tech scaleups Market Ações de TI da Índia lideram rebote conforme CEO da NVIDIA acalma medos de deslocamento de IA entre empresas de serviços Market SpaceX busca $135 por ação para IPO de $75 bilhões Chips Fotônica emerge como camada de escala fundamental para computação da era de IA Chips NVIDIA NemoClaw traz IA industrial para líderes de software com engenheiros autônomos seguros Market CEO da Palo Alto: chamadas de clientes crescem por preocupações com segurança em IA Funding Oxford Quantum Circuits levanta $350M em Série C, maior rodada de computação quântica Market Ações asiáticas se posicionam para ganhar com expansão da tendência de IA Market Alphabet planeja venda de $80 bilhões em ações para financiar expansão de infraestrutura de IA Chips Intel Aborda Erro do Arrow Lake com Arrow Lake Refresh, Olha para Retorno de Nova Lake Market Palo Alto Networks Sobe 12% com Earnings Beat e Guidance Forte para FY27 Chips Microsoft anuncia chip de computação quântica Majorana 2; máquina prática prevista para 2029 Chips NVIDIA e Microsoft anunciam parceria em stack unificada para IA agentica em Windows, nuvem e dispositivos Research Busca de vetor por si só insuficiente para RAG; estratégias de recuperação híbrida emergem como padrão Chips Taiwan avança em fotônica, semicondutores de banda larga e computação quântica como camadas de computação para era de IA Breaking Travelers implanta processamento de sinistros alimentado por OpenAI em todo o país Breaking OpenAI Codex se expande para cobrir cada papel, ferramenta e tipo de workflow Market CEO da Perplexity: latência vence a corrida de IA, não apenas scores de benchmark Market Investidores apostam que robôs humanoides transformarão indústria e residências na próxima década Funding Quobly levanta €115 milhões em Série A com apoio da STMicroelectronics Funding EQT emerge como novo árbitro de poder no financiamento europeu de tech scaleups Market Ações de TI da Índia lideram rebote conforme CEO da NVIDIA acalma medos de deslocamento de IA entre empresas de serviços Market SpaceX busca $135 por ação para IPO de $75 bilhões Chips Fotônica emerge como camada de escala fundamental para computação da era de IA Chips NVIDIA NemoClaw traz IA industrial para líderes de software com engenheiros autônomos seguros Market CEO da Palo Alto: chamadas de clientes crescem por preocupações com segurança em IA Funding Oxford Quantum Circuits levanta $350M em Série C, maior rodada de computação quântica Market Ações asiáticas se posicionam para ganhar com expansão da tendência de IA Market Alphabet planeja venda de $80 bilhões em ações para financiar expansão de infraestrutura de IA Chips Intel Aborda Erro do Arrow Lake com Arrow Lake Refresh, Olha para Retorno de Nova Lake Market Palo Alto Networks Sobe 12% com Earnings Beat e Guidance Forte para FY27 Chips Microsoft anuncia chip de computação quântica Majorana 2; máquina prática prevista para 2029 Chips NVIDIA e Microsoft anunciam parceria em stack unificada para IA agentica em Windows, nuvem e dispositivos
Market

CEO da Perplexity: latência vence a corrida de IA, não apenas scores de benchmark

O CEO da Perplexity, Aravind Srinivas, disse à CNBC que latência de inferência—não apenas precisão bruta—será a métrica decisiva na adoção de IA empresarial nos próximos 12 meses. Ele argumentou que tempos de resposta abaixo de 100ms para workflows agentic separarão vencedores de fornecedores legados que lutam com stacks de inferência mais lentos.

Para compradores de infraestrutura avaliando plataformas de model serving e estratégias de alocação de GPU, isso sinaliza uma mudança nas prioridades de RFP: espere clientes demandarem SLAs de latência ao lado de benchmarks de precisão. Isso favorece o roadmap de otimização de inferência da NVIDIA (TensorRT-LLM, otimizações Llama 3) e engines de inferência menores e propositais sobre fornecedores pesados focados em treinamento.

Leia na fonte →