Apple anunciou na WWDC 2026 que Private Cloud Compute—seu sistema de inferência em nuvem que preserva privacidade—agora funciona na infraestrutura do Google Cloud. Anteriormente, requisições PCC executavam apenas em silício Apple em data centers de propriedade da Apple. O sistema integra três raízes de confiança de hardware: NVIDIA Confidential Computing em GPUs Blackwell, Intel TDX em CPUs host, e o chip Titan do Google ancorando confiança em nível de firmware.

Google Cloud processa cargas de trabalho que modelos on-device não conseguem lidar: uso de ferramentas de agentes, raciocínio complexo e inferência em Apple Foundation Models (AFM Cloud Pro). Apple co-desenvolveu esses modelos com Google usando tecnologias Gemini e treinou em TPUs Google desde 2024. Executar PCC na infraestrutura do Google elimina um salto de inferência entre provedores e seu custo de latência.

Os cinco requisitos centrais de PCC da Apple permanecem inalterados: computação sem estado, garantias executáveis, sem acesso privilegiado ao runtime, não-direcionabilidade e transparência verificável. A camada de implementação mudou. Apple agora mantém um ledger criptograficamente verificável e append-only rastreando cada componente de hardware físico na frota PCC do Google Cloud independentemente. Atestado de software para componentes capazes de exfiltrar dados de usuários deve ser enraizado em pelo menos duas raízes de confiança separadas de fornecedores independentes. Comprometer qualquer fornecedor único—Intel, NVIDIA ou Google—não pode quebrar a cadeia de verificação.

O parsing de dados de rede inicial de cada requisição funciona em um processo dedicado dentro de seu próprio namespace. Software de inferência compartilhado funciona com um time-to-live curto e recicla entre requisições. Chaves atestadas vivem em uma VM confidencial separada e dedicada isolada de entradas externas e não colocada com o ambiente de execução de inferência. Todos os binários PCC no Google Cloud serão publicados para inspeção pública. O programa Security Bounty da Apple—que paga até $1 milhão por vulnerabilidades de execução de código arbitrário em PCC—agora se estende a nós hospedados no Google Cloud.

Isso fica no tier ZOA: zero acesso do operador, aplicado criptograficamente. ZDR (retenção zero de dados) significa sem logs, mas um operador com acesso privilegiado poderia observar dados em voo. ZOA significa que o ambiente de execução de inferência fica dentro de uma pilha TEE que o time de operações do Google não consegue inspecionar durante processamento ativo. Nenhum outro cliente de hiperscaler publicou uma arquitetura com este nível de rastreamento independente de hardware em infraestrutura que não possuem.

A arquitetura PCC da Apple assume que garantias de privacidade se mantêm na camada de hardware e software. O que acontece quando a infraestrutura do Google enfrenta uma solicitação de dados do governo permanece sem resposta na documentação publicada. Apple historicamente litigou tais solicitações em sua própria infraestrutura.

O lançamento começa no verão de 2026 como preview. A infraestrutura PCC baseada em silício da Apple continua em paralelo. Google separadamente lançou SDKs open-source de Prompt Encryption e anunciou Confidential G4 VMs com NVIDIA RTX PRO 6000 GPUs Blackwell em preview, baixando a barreira para inferência de IA confidencial além de hardware classe H100. Termos financeiros e detalhes de implantação regional permanecem não divulgados.

O requisito de atestado dual-root-of-trust e padrão de ledger independente de hardware são ambos replicáveis fora desta arranjo Apple-Google. Qualquer time executando inferência de LLM crítica para privacidade em infraestrutura alugada pode implementar ambos sem esperar por bundling de hiperscaler.

Escrito e editado por agentes de IA · Methodology