El cuello de botella del chip de IA se ha desplazado: el empaque CoWoS ahora es la restricción vinculante hasta 2026
La restricción vinculante en la construcción de computación de IA se ha desplazado del suministro de obleas a empaque avanzado. Chip-on-Wafer-on-Substrate (CoWoS) — el proceso que co-empaca High-Bandwidth Memory (HBM) con aceleradores de IA a la densidad que las cargas de trabajo modernas requieren — es ahora el cuello de botella principal de TSMC. El CEO C.C. Wei declaró públicamente que la capacidad CoWoS está 'vendida hasta 2025 y en 2026,' con TrendForce proyectando aproximadamente 120.000–130.000 obleas mensuales para fines de 2026, arriba de 75.000 en 2025. Sin embargo, analistas observan que la expansión es poco probable que cierre la brecha con la demanda. NVIDIA aparentemente aseguró más del 70% de la capacidad CoWoS-L de TSMC, dejando la asignación restante dividida entre AMD, Broadcom, Marvell y otros — creando un cuello de botella estructural que se agrava con la escasez de HBM3E. Sin capacidad CoWoS, una oblea no es un acelerador de IA terminado; es silício esperando un proceso más restringido que el silício mismo.
El cuello de botella se comprime aún más por controles de exportación geopoliticos. En marzo de 2026, la incertidumbre regulatoria sobre ventas de H200 a China forzó a NVIDIA a redirigir la capacidad de TSMC de producción H200 a chips Vera Rubin de próxima generación con órdenes confirmadas de EE.UU. de OpenAI, Google y otras firmas estadounidenses. Chips de IA menos avanzados como el H200 consumen la misma capacidad CoWoS y HBM limitada que los chips fronterizos, creando competencia directa. El CEO de OpenAI, Sam Altman, lo expresó claramente: 'El cuello de botella va y viene. Ahora, de nuevo, son chips.' Los hiperscalers están respondiendo desarrollando silício personalizado (TPUs de Google, Trainium de AWS, Maia de Meta), pero esto acelera la fragmentación del mercado en lugar de resolver la escasez subyacente.
Para arquitectos planeando capacidad de 2026–2027, la asignación de CoWoS es ahora la restricción final, no la demanda de cómputo o el capital. Los compradores a largo plazo (Microsoft, Google, Amazon, Meta) están asegurando asignaciones multiaño, dejando a jugadores más pequeños y startups en una cola de espera. Incluso la capacidad de potencia y red eléctrica — la restricción anterior — es menos escasa que los slots de empaque. Las decisiones de diseño entre optimizadas para NVIDIA vs. silício personalizado ahora conllevan implicaciones de ROI impulsadas por la cadeia de suministro que empalidecen comparadas con métricas de desempeño tradicionales. Se espera que la falta de suministro estructural persista a través de 2027–2028, ya que el 30–50% de la capacidad de centro de datos planificada para 2026 se ha retrasado a 2028 debido a colas de interconexidad de red eléctrica, extendiendo la presión de demanda de componentes en años posteriores.