Sistema Agentic da Verkor Encerra RTL-para-Layout em 80 Horas

O harness de agentes Design Conductor atualizado da Verkor, alimentado por modelos de fronteira de abril de 2026, projetou autonomamente um acelerador de inferência TurboQuant em 80 horas — um salto de 80× em escala a partir da baseline de design CPU de dezembro de 2025. Isso demonstra que agentes LLM agora conseguem lidar com fluxos de design de chips em escala de produção, comprimindo meses de engenharia em dias.

Design Conductor 2.0 da Verkor construiu autonomamente um acelerador de inferência da arquitetura ao layout FPGA em 80 horas — um salto de 80x em complexidade de tarefa a partir da baseline de dezembro de 2025, quando o sistema exigiu 12 horas para projetar uma CPU RISC-V de 5 estágios.

Design Conductor 2.0 executa um harness multi-agente redesenhado alimentado por modelos de fronteira lançados em abril de 2026. A saída destaque, VerTQ, é um acelerador de inferência LLM com hardwired TurboQuant — um algoritmo de compressão KV-cache — em um pipeline de 240 ciclos. VerTQ integra K-compression via TurboQuant-Prod com resíduos QJL, V-compression via TurboQuant-MSE e FlashAttention embedido. Os agentes começaram do paper TurboQuant arXiv e completaram o fluxo completo front-to-back: RTL, verificação, otimização de timing e mapeamento físico, sem intervenção humana.

VerTQ empacota 5.129 unidades aritméticas de precisão mista FP16/FP32 em um decoder de atenção de 8 vias. O build de 8 vias no FPGA alvo XCVU29P-3 consome aproximadamente 1.9 milhão de LUTs, 300.000 flip-flops e 1.500 slices DSP48E2. Projetado para um nodo de processo TSMC 16FF, o design se encaixa em 5,7 mm² (8 tubos de atenção) e atinge 125 MHz. VerTQ entrega compressão KV-cache de 4,3x e 16x menos multiplicações no loop de atenção interna versus atenção padrão, com integração direta de Python vLLM. A Verkor afirma que nenhum design de hardware equivalente era publicamente disponível antes dessa execução.

Tape-out convencional custa mais de $400 milhões com ciclos de 18 a 36 meses para equipes de centenas de engenheiros — assumindo que um design inicial existe. Um conjunto de máscara de nodo N2 sozinho custa mais de $30 milhões. Se sistemas agentic conseguem comprimir as fases de arquitetura e RTL de meses a dias, a economia muda drasticamente: iterações mais rápidas, NRE mais baixo por tape-out e a habilidade de girar silicon de inferência customizado sem uma equipe de hardware permanente.

Design Conductor 2.0 lidou com julgamento de arquitetura, codificação RTL, geração de testbench, fechamento de timing e mapeamento FPGA. A versão de dezembro de 2025 era "mais como um implementador altamente qualificado e inexaurível do que um verdadeiro designer." A versão 2.0 faz decisões arquiteturais — como otimizar cruzamentos de sinais inter-die para FPGAs multi-SLR — em vez de executar mecanicamente uma especificação entregue.

O paper é uma avaliação interna da Verkor — nenhuma reprodução independente da timeline de 80 horas ou specs VerTQ existe ainda. Os autores reconhecem limitações e notam que o uso de tokens não é totalmente divulgado no preprint. Completude de verificação — o critério make-or-break antes do comprometimento de silicon — não é auditado independentemente. A estimativa de área TSMC 16FF (5,7 mm²) é uma projeção, não sign-off pós-layout.

A fronteira de agent-EDA está se movimentando mais rápido do que a maioria dos ciclos de roadmap de chip empresarial consegue rastrear. Três gerações de modelos de fronteira separaram dezembro de 2025 de maio de 2026, e cada uma entregou uplift de capacidade que expandiu o que fluxos agentic conseguem fechar sem ajuda humana. Times planejando silicon de inferência customizado para tape-outs de 2027 ou 2028 devem testar sob pressão fluxos agentic em sua metodologia de design agora, não depois do próximo benchmark.

Sources

Design Conductor 2.0 produced a TurboQuant inference accelerator fully autonomously in 80 hours — an 80x jump in task complexity over its December 2025 baseline
"we introduce an updated multi-agent harness powered by frontier models released in April 2026, which is able to handle 80x larger tasks, at higher quality, fully autonomously"
arxiv.org ↗
The December 2025 baseline built a 5-stage Linux-capable RISC-V CPU in 12 hours
"we introduced "Design Conductor" (or just "Conductor"), a system capable of building a 5-stage Linux-capable RISC-V CPU in 12 hours"
arxiv.org ↗
VerTQ implements a 240-cycle pipeline with 5,129 mixed-precision FP16/FP32 arithmetic units across an 8-way attention decoder
"VerTQ includes heavy compute processing, with 5,129 FP16/32 units; the design was mapped to an FPGA at 125 MHz and consumes 5.7 mm^2 in TSMC 16FF (8 attention pipes)"
arxiv.org ↗
The 8-way FPGA build consumes approximately 1.9M LUTs, 300K flip-flops, and 1,500 DSP48E2 slices
"∼1.9M LUTs, ∼300K FF, ∼1.5K DSP48E2, 18 RAMB36, 9 RAMB18"
arxiv.org ↗
VerTQ delivers 4.3x KV-cache compression and 16x fewer multiplies in the inner attention loop, with direct vLLM integration
"4.3x KV cache compression, 16x fewer multiplies inner attention loop, 9-bank memory interface"
arxiv.org ↗
Conventional chip tape-out costs exceed $400 million with 18-to-36-month cycles; an N2 mask set alone exceeds $30 million
"costs over $400M and consumes 18-36 month for teams of hundreds of people (who typically start with an existing design) ... with an N2 mask set estimated at >$30M"
arxiv.org ↗
Design Conductor 2.0 made architectural decisions such as optimizing inter-die signal crossings for the multi-SLR FPGA target
"Conductor 2.0 optimized the architecture to minimize inter-die signal crossings"
arxiv.org ↗
The VerTQ run lasted approximately 80 hours, and the agent started from the TurboQuant arXiv paper with no equivalent hardware available publicly before this run
"In building VerTQ, Design Conductor demonstrated architecture judgment and the ability to guide and manage a complex project over a roughly 80-hour runtime ... To our knowledge, there is no such hardware available online (or anywhere)."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Sistema Agentic da Verkor Encerra RTL-para-Layout em 80 Horas

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.