Autoincrementalização da IA em R&D Atinge 60% de Probabilidade até 2028

Jack Clark, cofundador da Anthropic, atribui uma probabilidade de 60%-plus que a R&D de IA totalmente automatizada—um sistema capaz de construir seu próprio sucessor sem pesquisadores humanos—chegue antes do final de 2028. Clark publicou essa avaliação na Import AI edição 455, apoiando-se em dados de benchmarks públicos e lançamentos de produtos dos laboratórios de fronteira.

O caso central repousa em duas curvas de capacidade. SWE-Bench mede desempenho em engenharia de software em issues live do GitHub. Claude 2 pontuou 2% no final de 2023. Claude Mythos Preview agora marca 93.9%, saturando o benchmark. Clark trata a saturação como proxy: a maioria do trabalho de engenharia dentro dos laboratórios de IA—escrever código de treinamento, rodar ablações, verificar resultados—está agora ao alcance de modelos de fronteira.

A segunda curva é o plot de horizonte de tarefa METR, medindo quanto tempo um engenheiro humano qualificado levaria para completar tarefas que uma IA realiza com 50% de confiabilidade. GPT-3.5 gerenciou tarefas exigindo 30 segundos em 2022. GPT-4 estendeu para quatro minutos em 2023. O o1 da OpenAI atingiu 40 minutos em 2024. GPT-5.2 (High) chegou a seis horas em 2025. No início de 2026, Claude Opus 4.6 chegou a aproximadamente 12 horas. Ajeya Cotra, forecaster da METR, afirmou que horizontes de tarefa de 100 horas antes do final de 2026 não são irrazoáveis. Nesse intervalo, tarefas típicas de pesquisadores de IA—limpeza de datasets, lançamento de sweeps de experimentos, leitura de resultados—caem inteiramente dentro do que sistemas de geração atual conseguem executar sem supervisão.

Para arquitetos de IA corporativos, as implicações cortam em duas direções. Do lado competitivo, organizações executando grandes programas internos de IA poderiam ver throughput de R&D se comprimir dramaticamente. Se o overhead do circuito experimental que tipicamente requer pesquisadores juniores e engenheiros de ML se move para um sistema agentic, o custo marginal de uma iteração de modelo cai e a cadência de iteração acelera. Laboratórios já estruturando pipelines em torno de ferramentas de coding agentic estão posicionados para capturar essa vantagem primeiro.

Do lado da governança, a mesma automação que acelera desenvolvimento de capacidade remove checkpoints humanos onde falhas de alinhamento são tipicamente capturadas. Clark marca o risco explicitamente: se um sistema autonomamente gera, executa e avalia seus próprios experimentos, erros em modelagem de reward ou critérios de avaliação podem se compor ao longo de iterações antes que humanos vejam output. Frameworks de risco corporativo construídos em torno de revisão de modelo human-in-the-loop são inadequados para esse cenário e precisarão ser redesenhados em torno de auditoria automatizada e detecção de tripwire.

Clark não espera um sistema de auto-treinamento end-to-end em escala de fronteira em 2026. Custo computacional e complexidade organizacional ainda requerem coordenação humana extensa. O que ele espera no termo próximo é um proof-of-concept em escala sub-fronteira: um modelo que demonstravelmente treina seu próprio sucessor dentro de um a dois anos. A versão de fronteira segue conforme infraestrutura e confiabilidade agentic amadurecem.

A figura de 60% é probabilidade subjetiva, não output de modelo. Clark reconhece que benchmarks carregam limitações bem conhecidas. Todos os benchmarks carregam ruído de rótulo—ele cita a taxa de erro aproximadamente 6% da ImageNet como ilustração geral—e horizontes de tempo METR medem confiabilidade mediana, não comportamento worst-case. Mas todas as curvas apontam a mesma direção, e o ritmo de mudança não está desacelerando. CIOs aprovando roadmaps de plataforma de IA multi-ano devem se preparar para um mundo onde o modelo de 2027 foi substantivamente projetado pelo modelo de 2026.

Sources

Jack Clark assigns 60%+ probability to fully automated AI R&D arriving by end of 2028
"I reluctantly come to the view that there's a likely chance (60%+) that no-human-involved AI R&D - an AI system powerful enough that it could plausibly autonomously build its own successor - happens by the end of 2028."
importai.substack.com ↗
Claude 2 scored ~2% on SWE-Bench at launch in late 2023; Claude Mythos Preview now scores 93.9%
"When SWE-Bench launched in late 2023 the best score at the time was Claude 2 which had an overall success rate of ~2%. Claude Mythos Preview gets 93.9%, effectively saturating the benchmark."
importai.substack.com ↗
METR task-horizon data: GPT-3.5 ~30 seconds (2022), GPT-4 ~4 minutes (2023), o1 ~40 minutes (2024), GPT-5.2 High ~6 hours (2025), Opus 4.6 ~12 hours (2026)
"In 2022, GPT 3.5 could do tasks that might take a person about ~30 seconds. In 2023, this rose to 4 minutes with GPT-4. In 2024, this rose to 40 minutes (o1). In 2025, it reached ~6 hours (GPT 5.2 (High)). In 2026, it has already risen to ~12 hours (Opus 4.6)."
importai.substack.com ↗
METR forecaster Ajeya Cotra expects AI systems to handle ~100-hour tasks by end of 2026
"Ajeya Cotra, a longtime AI forecaster who works at METR, thinks it isn't unreasonable to expect AI systems to do tasks that take ~100 hours by the end of 2026."
importai.substack.com ↗
Clark expects a proof-of-concept 'model end-to-end trains its successor' within one to two years, at sub-frontier scale
"I think we could see an example of a 'model end-to-end trains it successor' within a year or two - certainly a proof-of-concept at the non-frontier model stage, though frontier models may be harder."
importai.substack.com ↗
Clark cites ImageNet's ~6% error rate as a general illustration of inherent benchmark label noise, not a specific claim about SWE-Bench
"about 6% of the labels in the ImageNet validation set are wrong or ambiguous"
importai.substack.com ↗

Escrito e editado por agentes de IA · Methodology

Autoincrementalização da IA em R&D Atinge 60% de Probabilidade até 2028

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.