Memristor de Óxido de Háfnio de Cambridge Mira Redução de 70% no Consumo de Energia de Sistemas de IA

Pesquisadores da Universidade de Cambridge construíram um memristor de óxido de háfnio com correntes de comutação aproximadamente um milhão de vezes menores do que dispositivos convencionais baseados em óxido. A arquitetura neuromórfica que ele viabiliza pode reduzir o consumo de energia de sistemas de IA em até 70%.

O dispositivo é detalhado na Science Advances pelo autor principal Dr. Babak Bakhit, do Departamento de Ciência dos Materiais e Metalurgia de Cambridge. Sua inovação central é um afastamento do mecanismo de comutação filamentar que paralisou a pesquisa de memristores por mais de uma década. Memristores convencionais armazenam dados formando e rompendo pequenos filamentos condutores dentro de óxido metálico, um processo imprevisível e de alta demanda de tensão. A equipe de Bakhit adicionou estrôncio e titânio a um filme fino de óxido de háfnio e o cresceu em duas etapas: a primeira camada depositada sem oxigênio, a segunda com oxigênio. Essa sequência forma junções p-n (portas eletrônicas) nas interfaces entre as camadas. A resistência muda deslocando a altura de uma barreira de energia nessa interface, não crescendo ou quebrando filamentos.

O resultado é uma uniformidade estreita entre dispositivos que o campo não havia conseguido. Testes laboratoriais mostraram que os dispositivos suportam dezenas de milhares de ciclos de comutação, mantêm estados programados por aproximadamente 24 horas e produzem centenas de níveis de condutância distintos e estáveis, um pré-requisito para a computação analógica in-memory. Os dispositivos também reproduziram a plasticidade dependente de temporização de spikes (STDP), a regra de aprendizado biológico pela qual as conexões neurais se fortalecem ou enfraquecem com base no tempo do sinal. "Essas são as propriedades que você precisa se quiser hardware capaz de aprender e se adaptar, em vez de apenas armazenar bits", disse Bakhit.

Para arquitetos de IA empresarial, o número de redução de energia de 70% merece escrutínio quanto ao escopo. Ele descreve o potencial de arquiteturas neuromórficas em termos amplos, não um delta de potência medido em relação a uma carga de trabalho de GPU em produção. O mecanismo é a eliminação do gargalo de Von Neumann: em chips convencionais, o processador e a memória são componentes separados que transferem dados constantemente por um barramento compartilhado. Uma arquitetura in-memory, em que o memristor simultaneamente armazena pesos e executa operações de multiplicação-acumulação, elimina essa ida e volta. Na escala de data centers, onde grandes clusters de inferência de IA consomem dezenas de megawatts, eliminar essa sobrecarga se compõe.

O ângulo de compatibilidade com CMOS é o sinal mais acionável para equipes de estratégia de fab e compras. O óxido de háfnio já está incorporado em dielétricos de porta CMOS modernos; o material base não requer novas linhas de fab ou precursores exóticos. A Cambridge Enterprise, o braço de comercialização da universidade, protocolou um pedido de patente, precursor padrão de discussões de licenciamento com a indústria. O financiamento veio da Royal Academy of Engineering, da Royal Society, do Swedish Research Council e da UKRI.

A restrição de bloqueio é térmica: o processo de fabricação atual requer aproximadamente 700 °C, acima das tolerâncias da fabricação de semicondutores de back-end-of-line padrão. Esse limite importa porque as camadas pós-silício, onde os memristores se integrariam para máximo efeito, não suportam processamento acima de aproximadamente 400 °C sem danificar estruturas subjacentes. Bakhit foi direto: "Este é atualmente o principal desafio em nosso processo de fabricação de dispositivos. Mas estamos trabalhando em formas de reduzir a temperatura para torná-lo mais compatível com processos industriais padrão."

O dado de retenção de estado de 24 horas também merece escrutínio. Cargas de trabalho de inferência com estado que exigem retenção subdiária precisariam de reescrita periódica em armazenamento não volátil convencional, corroendo parcialmente as economias de energia obtidas com a eliminação do tráfego do barramento de memória. O artigo não reporta experimentos de escalonamento multi-chip ou benchmarks de precisão de inferência em comparação com GPUs.

Bakhit dedicou aproximadamente três anos a essa pesquisa, com o resultado decisivo chegando no final de novembro do ano passado. O próximo marco é uma temperatura de fabricação abaixo de 400 °C e retenção medida em meses, não em horas. Até que ambas as condições sejam atendidas, este é um resultado laboratorial rigoroso com um caminho de comercialização crível, ainda não um roteiro de fab.

Sources

Neuromorphic computing could reduce AI energy use by as much as 70% by storing and processing information in the same place
"Brain-inspired, or neuromorphic, computing is an alternative way to process information that could reduce energy use by as much as 70% by storing and processing information in the same place, and doing so with extremely low power."
eng.cam.ac.uk ↗
Switching currents roughly one million times lower than conventional oxide-based devices
"Using the hafnium-based devices, the researchers achieved switching currents about a million times lower than those of some conventional oxide-based devices."
eng.cam.ac.uk ↗
Devices produce hundreds of distinct, stable conductance levels
"The memristors also produced hundreds of distinct, stable conductance levels, a key requirement for analogue 'in-memory' computing."
eng.cam.ac.uk ↗
Devices endure tens of thousands of switching cycles
"Laboratory tests showed the devices could reliably endure tens of thousands of switching cycles and store their programmed states for around a day."
eng.cam.ac.uk ↗
Devices maintain programmed states for approximately 24 hours
"Laboratory tests showed the devices could reliably endure tens of thousands of switching cycles and store their programmed states for around a day."
eng.cam.ac.uk ↗
Devices reproduced spike-timing dependent plasticity (STDP)
"They also reproduced fundamental learning rules observed in biology, such as spike-timing dependent plasticity: the mechanism by which neurons strengthen or weaken their connections depending on when signals arrive."
eng.cam.ac.uk ↗
Bakhit quote: hardware that can learn and adapt, rather than just store bits
"These are the properties you need if you want hardware that can learn and adapt, rather than just store bits."
eng.cam.ac.uk ↗
Fabrication process requires approximately 700°C, above standard semiconductor manufacturing tolerances
"The current fabrication process requires temperatures of around 700°C – higher than standard semiconductor manufacturing tolerances."
eng.cam.ac.uk ↗
Bakhit quote on temperature being the main challenge and working on solutions
"This is currently the main challenge in our device fabrication process. But we're now working on ways to bring the temperature down to make it more compatible with standard industry processes."
eng.cam.ac.uk ↗
Cambridge Enterprise has filed a patent application
"A patent application has been filed by Cambridge Enterprise, the University's innovation arm."
eng.cam.ac.uk ↗
Research supported by Swedish Research Council, Royal Academy of Engineering, Royal Society, and UKRI
"The research was supported in part by the Swedish Research Council (VR), the Royal Academy of Engineering, the Royal Society, and UK Research and Innovation (UKRI)."
eng.cam.ac.uk ↗
Bakhit spent approximately three years on the research, with decisive results arriving at end of November
"I spent almost three years on this. There were a huge number of failures. But at the end of November, we saw the first really good results."
eng.cam.ac.uk ↗
Paper published in Science Advances with DOI 10.1126/sciadv.aec2324
"Babak Bakhit et al. 'HfO2-based memristive synapses with asymmetrically extended p-n heterointerfaces for highly energy-efficient neuromorphic hardware'. Science Advances (2026). DOI: 10.1126/sciadv.aec2324"
eng.cam.ac.uk ↗
Filamentary devices suffer from random behaviour; the new interface-switching mechanism overcomes this
"Filamentary devices suffer from random behaviour. But because our devices switch at the interface, they show outstanding uniformity from cycle to cycle and from device to device."
eng.cam.ac.uk ↗

Escrito e editado por agentes de IA · Methodology