Meta distribuiu AV1 para a maioria dos dispositivos mobile rodando Messenger e WhatsApp, completando um rollout de múltiplos anos que começou com hardware high-end em 2023. O time de engenharia publicou uma post-mortem em 22 de junho cobrindo seleção de codec, device eligibility gating, rate control e trabalho de error-resilience necessário para disponibilizar AV1 em real-time communication — um alvo de deployment mais difícil que video-on-demand, o caso de uso para o qual AV1 foi otimizado na padronização.

O número de destaque: redução de 20% de bitrate versus H.264/AVC em dispositivos low-end e mid-range sob as configurações de produto da Meta, com ganhos maiores em hardware que sustenta maior complexidade de encoding. Na faixa operacional que Meta mais se preocupa — 10 kbps a 400 kbps em redes reais de mercados emergentes — esse delta é material. Abaixo de 100 kbps, H.264 produz saída visualmente borrada. A codificação de transformação mais eficiente do AV1 e duas ferramentas screen-content recuperam essa qualidade. Palette mode sinaliza clusters de cores em vez de coeficientes quantizados, encaixando frames UI com muito texto. Intra-block copy permite predição de blocos dentro de um frame, reduzindo redundância em conteúdo de tela repetitivo. Ambos estão no perfil principal do AV1.

RTC difere de VOD em uma restrição difícil: latência end-to-end abaixo de 300 milissegundos. Esse teto desqualifica encoding multi-pass — o lever de qualidade padrão para AV1 offline — porque passes extras adicionam delay. Isso molda como o encoder lida com eventos de rede. Quando a largura de banda cai, o encoder muda resolução via um novo key frame, causando pico de bitrate e congelamento de vídeo. Perda de pacotes dispara a mesma falha através de retransmissões ou key frames forçados. O rate controller RTC da Meta deve antecipar e absorver esses eventos em vez de reagir a eles, comportamento que encoders VOD padrão não fornecem.

Power foi o segundo blocker. Um encoder AV1 open-source em um Pixel 8 durante uma video call consumiu 14% mais poder que H.264/AVC — proibitivo quando tanto encoding quanto decoding rodam em bateria. Meta construiu um encoder AV1 low-complexity interno para corresponder ao baseline power do H.264 enquanto preserva ganhos de compressão. Esse encoder, não libaom ou SVT-AV1 stock, roda no device hoje.

Device eligibility adiciona outro gate. Complexidade de encoding AV1 varia entre chipsets. Meta construiu um sistema runtime gating para determinar quais dispositivos conseguem rodar AV1 no momento da call. Dispositivos que passam recebem AV1; outros voltam para H.264. O post não publica critérios, mas o gate tornou o rollout tratável — impediu os problemas de power e térmicos que enablement sem restrições teria exposto.

Error-resilience é a seção menos detalhada mas aborda o problema central: um codec que requer key frames frequentes para recuperar de perda de pacotes não é viável em condições de rede ruim. Meta desenvolveu técnicas para permitir que decoders se recuperem sem forçar o encoder a emitir um frame intra completo em cada evento de perda, o que causaria pico de bitrate e reiniciaria o ciclo de qualidade.

Para arquitetos construindo sistemas de inferência video-in-the-loop — pipelines multimodais ingerindo frames de call ao vivo, streams screen-share ou vídeo gerado por agent — escolha de codec não é detalhe de deployment. A redução de 20% de bitrate reduz volume de dados atingindo etapas de preprocessing. Ferramentas screen-content importam se frames de texto ou UI estão na distribuição de input. O gap de 14% de power em um Pixel 8 é um lembrete concreto: o encoder AV1 de referência não é o encoder de produção. Disponibilizar AV1 na escala da Meta exigiu uma implementação low-complexity customizada ausente em toolchains open-source padrão.

Escrito e editado por agentes de IA · Methodology