Sistema Agentic de Verkor Cierra RTL-a-Layout en 80 Horas

El harness de agentes Design Conductor actualizado de Verkor, impulsado por modelos frontera de abril de 2026, diseñó autónomamente un acelerador de inferencia TurboQuant en 80 horas — un salto de 80× en escala respecto a la línea base de diseño CPU de diciembre de 2025. Esto demuestra que los agentes LLM ahora pueden manejar flujos de diseño de chips a escala de producción, comprimiendo meses de ingeniería en días.

Design Conductor 2.0 de Verkor construyó autónomamente un acelerador de inferencia desde arquitectura hasta layout FPGA en 80 horas — un salto de 80x en complejidad de tarea respecto a la línea base de diciembre de 2025, cuando el sistema requirió 12 horas para diseñar una CPU RISC-V de 5 etapas.

Design Conductor 2.0 ejecuta un harness multi-agente rediseñado impulsado por modelos frontera lanzados en abril de 2026. El resultado destacado, VerTQ, es un acelerador de inferencia LLM con TurboQuant integrado en hardware — un algoritmo de compresión KV-cache — en un pipeline de 240 ciclos. VerTQ integra K-compression mediante TurboQuant-Prod con residuos QJL, V-compression mediante TurboQuant-MSE y FlashAttention embebido. Los agentes comenzaron desde el paper TurboQuant arXiv y completaron el flujo completo front-to-back: RTL, verificación, optimización de timing y mapeo físico, sin intervención humana.

VerTQ empaqueta 5.129 unidades aritméticas de precisión mixta FP16/FP32 en un decodificador de atención de 8 vías. La compilación de 8 vías en el FPGA objetivo XCVU29P-3 consume aproximadamente 1,9 millones de LUTs, 300.000 flip-flops y 1.500 slices DSP48E2. Proyectado a un nodo de proceso TSMC 16FF, el diseño cabe en 5,7 mm² (8 tuberías de atención) y logra 125 MHz. VerTQ entrega compresión KV-cache de 4,3x y 16x menos multiplicaciones en el bucle de atención interno versus atención estándar, con integración directa de Python vLLM. Verkor afirma que ningún diseño de hardware equivalente estaba disponible públicamente antes de esta ejecución.

El tape-out convencional cuesta más de $400 millones con ciclos de 18 a 36 meses para equipos de cientos de ingenieros — asumiendo que existe un diseño inicial. Un conjunto de máscaras de nodo N2 solo cuesta más de $30 millones. Si los sistemas agentic pueden comprimir las fases de arquitectura y RTL de meses a días, la economía cambia drásticamente: iteraciones más rápidas, NRE más bajo por tape-out y la capacidad de girar silicio de inferencia personalizado sin un equipo de hardware permanente.

Design Conductor 2.0 manejó juicio arquitectónico, codificación RTL, generación de testbench, cierre de timing y mapeo FPGA. La versión de diciembre de 2025 era "más como un implementador altamente calificado e inagotable que como un verdadero diseñador." La versión 2.0 toma decisiones arquitectónicas — como optimizar cruces de señales inter-die para FPGAs multi-SLR — en lugar de ejecutar mecánicamente una especificación entregada.

El paper es una evaluación interna de Verkor — no existe aún reproducción independiente de la línea de tiempo de 80 horas o especificaciones de VerTQ. Los autores reconocen limitaciones y notan que el uso de tokens no se divulga completamente en el preprint. La completitud de verificación — el criterio de hacer-o-romper antes del compromiso de silicio — no se audita independientemente. La estimación de área TSMC 16FF (5,7 mm²) es una proyección, no una aprobación post-layout.

La frontera agent-EDA se mueve más rápido que la mayoría de los ciclos de roadmap de chips empresariales pueden rastrear. Tres generaciones de modelos frontera separaron diciembre de 2025 de mayo de 2026, y cada una entregó un aumento de capacidad que expandió lo que los flujos agentic pueden cerrar sin ayuda humana. Los equipos que planean silicio de inferencia personalizado para tape-outs de 2027 o 2028 deben probar bajo presión flujos agentic en su metodología de diseño ahora, no después del siguiente benchmark.

Sources

Design Conductor 2.0 produced a TurboQuant inference accelerator fully autonomously in 80 hours — an 80x jump in task complexity over its December 2025 baseline
"we introduce an updated multi-agent harness powered by frontier models released in April 2026, which is able to handle 80x larger tasks, at higher quality, fully autonomously"
arxiv.org ↗
The December 2025 baseline built a 5-stage Linux-capable RISC-V CPU in 12 hours
"we introduced "Design Conductor" (or just "Conductor"), a system capable of building a 5-stage Linux-capable RISC-V CPU in 12 hours"
arxiv.org ↗
VerTQ implements a 240-cycle pipeline with 5,129 mixed-precision FP16/FP32 arithmetic units across an 8-way attention decoder
"VerTQ includes heavy compute processing, with 5,129 FP16/32 units; the design was mapped to an FPGA at 125 MHz and consumes 5.7 mm^2 in TSMC 16FF (8 attention pipes)"
arxiv.org ↗
The 8-way FPGA build consumes approximately 1.9M LUTs, 300K flip-flops, and 1,500 DSP48E2 slices
"∼1.9M LUTs, ∼300K FF, ∼1.5K DSP48E2, 18 RAMB36, 9 RAMB18"
arxiv.org ↗
VerTQ delivers 4.3x KV-cache compression and 16x fewer multiplies in the inner attention loop, with direct vLLM integration
"4.3x KV cache compression, 16x fewer multiplies inner attention loop, 9-bank memory interface"
arxiv.org ↗
Conventional chip tape-out costs exceed $400 million with 18-to-36-month cycles; an N2 mask set alone exceeds $30 million
"costs over $400M and consumes 18-36 month for teams of hundreds of people (who typically start with an existing design) ... with an N2 mask set estimated at >$30M"
arxiv.org ↗
Design Conductor 2.0 made architectural decisions such as optimizing inter-die signal crossings for the multi-SLR FPGA target
"Conductor 2.0 optimized the architecture to minimize inter-die signal crossings"
arxiv.org ↗
The VerTQ run lasted approximately 80 hours, and the agent started from the TurboQuant arXiv paper with no equivalent hardware available publicly before this run
"In building VerTQ, Design Conductor demonstrated architecture judgment and the ability to guide and manage a complex project over a roughly 80-hour runtime ... To our knowledge, there is no such hardware available online (or anywhere)."
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Sistema Agentic de Verkor Cierra RTL-a-Layout en 80 Horas

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.