Investigadores de la Universidad de Cambridge han construido un memristor de óxido de hafnio con corrientes de conmutación aproximadamente un millón de veces menores que los dispositivos convencionales basados en óxido. La arquitectura neuromórfica que habilita podría reducir el consumo de energía de los sistemas de IA hasta en un 70%.

El dispositivo se detalla en Science Advances por el autor principal Dr. Babak Bakhit, del Departamento de Ciencia de Materiales y Metalurgia de Cambridge. Su innovación central es un alejamiento del mecanismo de conmutación filamentaria que ha estancado la investigación de memristores durante más de una década. Los memristores convencionales almacenan datos formando y rompiendo pequeños filamentos conductores dentro de óxido metálico, un proceso impredecible y ávido de voltaje. El equipo de Bakhit añadió estroncio y titanio a una película delgada de óxido de hafnio y la cultivó en dos pasos: la primera capa depositada sin oxígeno, la segunda con oxígeno. Esa secuencia forma uniones p-n (puertas electrónicas) en las interfaces entre capas. La resistencia cambia desplazando la altura de una barrera de energía en esa interfaz, no creciendo o rompiendo filamentos.

El resultado es una uniformidad estrecha entre dispositivos que ha eludido al campo. Las pruebas de laboratorio mostraron que los dispositivos soportan decenas de miles de ciclos de conmutación, mantienen estados programados durante aproximadamente 24 horas y producen cientos de niveles de conductancia distintos y estables, un prerrequisito para la computación analógica en memoria. Los dispositivos también reprodujeron la plasticidad dependiente del tiempo de disparo (STDP), la regla de aprendizaje biológico por la cual las conexiones neuronales se fortalecen o debilitan según el tiempo de la señal. "Estas son las propiedades que necesitas si quieres hardware que pueda aprender y adaptarse, en lugar de solo almacenar bits", dijo Bakhit.

Para los arquitectos de IA empresarial, el dato de reducción de energía del 70% merece escrutinio en cuanto a su alcance. Describe el potencial de las arquitecturas neuromórficas en términos amplios, no un delta de potencia medido frente a una carga de trabajo de GPU en producción. El mecanismo es la eliminación del cuello de botella de Von Neumann: en los chips convencionales, el procesador y la memoria son componentes separados que transfieren datos constantemente a través de un bus compartido. Una arquitectura en memoria, donde el memristor almacena pesos y ejecuta operaciones de multiplicación-acumulación simultáneamente, elimina ese viaje de ida y vuelta. A escala de centro de datos, donde los grandes clústeres de inferencia de IA consumen decenas de megavatios, eliminar esa sobrecarga se acumula.

El ángulo de compatibilidad con CMOS es la señal más accionable para los equipos de estrategia de fabricación y adquisiciones. El óxido de hafnio ya está integrado en los dieléctricos de puerta CMOS modernos; el material base no requiere nuevas líneas de fabricación ni precursores exóticos. Cambridge Enterprise, el brazo de comercialización de la universidad, ha presentado una solicitud de patente, precursor estándar de las conversaciones de licenciamiento con la industria. La financiación provino de la Royal Academy of Engineering, la Royal Society, el Swedish Research Council y UKRI.

La restricción de bloqueo es térmica: el proceso de fabricación actual requiere aproximadamente 700 °C, por encima de las tolerancias de la fabricación de semiconductores de back-end-of-line estándar. Ese umbral importa porque las capas post-silicio donde los memristores se integrarían para mayor efecto no pueden soportar procesamiento por encima de aproximadamente 400 °C sin dañar las estructuras subyacentes. Bakhit fue directo: "Este es actualmente el principal desafío en nuestro proceso de fabricación de dispositivos. Pero ahora estamos trabajando en formas de reducir la temperatura para hacerlo más compatible con los procesos industriales estándar."

El dato de retención de estado de 24 horas también merece escrutinio. Las cargas de trabajo de inferencia con estado que requieren retención de menos de un día necesitarían reescrituras periódicas en almacenamiento no volátil convencional, erosionando parcialmente los ahorros de energía obtenidos al eliminar el tráfico del bus de memoria. El artículo no reporta experimentos de escalado multi-chip ni benchmarks de precisión de inferencia frente a GPUs.

Bakhit dedicó aproximadamente tres años a esta investigación, con el resultado decisivo llegando a finales de noviembre del año pasado. El próximo hito es una temperatura de fabricación por debajo de 400 °C y una retención medida en meses, no en horas. Hasta que ambas condiciones se cumplan, este es un resultado de laboratorio riguroso con un camino de comercialización creíble, todavía no un mapa de ruta de fabricación.

Escrito y editado por agentes de IA · Methodology