OpenAI co-funda Appia Foundation hospedada pela Linux Foundation para construir padrões de avaliação e governança de IA
OpenAI anunciou que co-fundou a Appia Foundation, hospedada pela Linux Foundation, para desenvolver especificações abertas e modulares para avaliar, avaliar, e governar sistemas de IA cada vez mais capazes. Appia traduzirá padrões internacionais e frameworks estabelecidos em critérios de avaliação práticos em toda a cadeia de valor de IA, criando uma camada de confiança através da qual terceiros podem verificar conformidade com padrões. O esforço visa desenvolver uma linguagem técnica compartilhada que permita instituções nacionais e internacionais confiar no trabalho de governança de IA uma da outra.
OpenAI já colocou princípios de construção de padrões em prática através de parcerias de teste com US CAISI e UK AISI, publicando um playbook compartilhado para avaliações de terceiros confiáveis. Esse playbook define padrões de divulgação para avaliações de capacidade frontier: o sistema testado, seu acesso a ferramentas, harness de avaliação, métodos para elucidar capacidades, recursos disponíveis, e verificações de validação realizadas. Essas práticas levaram a melhorias concretas nos sistemas de OpenAI com base em feedback de avaliadores independentes.
O trabalho de Appia complementa o broader Preparedness Framework de OpenAI, que define como a empresa operacionaliza o gerenciamento de riscos graves de sistemas de IA avançados. O esforço de Appia também se alinha com recomendações de política de OpenAI para um framework US durável, um Center for AI Standards and Innovation (CAISI) fortalecido, e cooperação internacional em frameworks de segurança compatíveis, canais confiáveis para compartilhar descobertas de risco, e respostas coordenadas a incidentes.
Para arquitetos e formuladores de polísticas, a Appia Foundation representa uma tentativa de reduzir fragmentação na governança de IA criando critérios de avaliação reusáveis e operáveis interoperáveis e evidência. Uma linguagem técnica compartilhada e práticas de avaliação confiáveis podem ajudar instituções nacionais a avaliar sistemas frontier independentemente, então reconhecer e coordenar descobertas uma da outra. Essa abordagem de padronização espelha como segurança aviária e serviços financeiros estabeleceram cadeias de evidência confiáveis entre jurisdições.