Pesquisadores da Universidade de Cambridge construíram um memristor de óxido de háfnio com correntes de comutação aproximadamente um milhão de vezes menores do que dispositivos convencionais baseados em óxido. A arquitetura neuromórfica que ele viabiliza pode reduzir o consumo de energia de sistemas de IA em até 70%.
O dispositivo é detalhado na Science Advances pelo autor principal Dr. Babak Bakhit, do Departamento de Ciência dos Materiais e Metalurgia de Cambridge. Sua inovação central é um afastamento do mecanismo de comutação filamentar que paralisou a pesquisa de memristores por mais de uma década. Memristores convencionais armazenam dados formando e rompendo pequenos filamentos condutores dentro de óxido metálico, um processo imprevisível e de alta demanda de tensão. A equipe de Bakhit adicionou estrôncio e titânio a um filme fino de óxido de háfnio e o cresceu em duas etapas: a primeira camada depositada sem oxigênio, a segunda com oxigênio. Essa sequência forma junções p-n (portas eletrônicas) nas interfaces entre as camadas. A resistência muda deslocando a altura de uma barreira de energia nessa interface, não crescendo ou quebrando filamentos.
O resultado é uma uniformidade estreita entre dispositivos que o campo não havia conseguido. Testes laboratoriais mostraram que os dispositivos suportam dezenas de milhares de ciclos de comutação, mantêm estados programados por aproximadamente 24 horas e produzem centenas de níveis de condutância distintos e estáveis, um pré-requisito para a computação analógica in-memory. Os dispositivos também reproduziram a plasticidade dependente de temporização de spikes (STDP), a regra de aprendizado biológico pela qual as conexões neurais se fortalecem ou enfraquecem com base no tempo do sinal. "Essas são as propriedades que você precisa se quiser hardware capaz de aprender e se adaptar, em vez de apenas armazenar bits", disse Bakhit.
Para arquitetos de IA empresarial, o número de redução de energia de 70% merece escrutínio quanto ao escopo. Ele descreve o potencial de arquiteturas neuromórficas em termos amplos, não um delta de potência medido em relação a uma carga de trabalho de GPU em produção. O mecanismo é a eliminação do gargalo de Von Neumann: em chips convencionais, o processador e a memória são componentes separados que transferem dados constantemente por um barramento compartilhado. Uma arquitetura in-memory, em que o memristor simultaneamente armazena pesos e executa operações de multiplicação-acumulação, elimina essa ida e volta. Na escala de data centers, onde grandes clusters de inferência de IA consomem dezenas de megawatts, eliminar essa sobrecarga se compõe.
O ângulo de compatibilidade com CMOS é o sinal mais acionável para equipes de estratégia de fab e compras. O óxido de háfnio já está incorporado em dielétricos de porta CMOS modernos; o material base não requer novas linhas de fab ou precursores exóticos. A Cambridge Enterprise, o braço de comercialização da universidade, protocolou um pedido de patente, precursor padrão de discussões de licenciamento com a indústria. O financiamento veio da Royal Academy of Engineering, da Royal Society, do Swedish Research Council e da UKRI.
A restrição de bloqueio é térmica: o processo de fabricação atual requer aproximadamente 700 °C, acima das tolerâncias da fabricação de semicondutores de back-end-of-line padrão. Esse limite importa porque as camadas pós-silício, onde os memristores se integrariam para máximo efeito, não suportam processamento acima de aproximadamente 400 °C sem danificar estruturas subjacentes. Bakhit foi direto: "Este é atualmente o principal desafio em nosso processo de fabricação de dispositivos. Mas estamos trabalhando em formas de reduzir a temperatura para torná-lo mais compatível com processos industriais padrão."
O dado de retenção de estado de 24 horas também merece escrutínio. Cargas de trabalho de inferência com estado que exigem retenção subdiária precisariam de reescrita periódica em armazenamento não volátil convencional, corroendo parcialmente as economias de energia obtidas com a eliminação do tráfego do barramento de memória. O artigo não reporta experimentos de escalonamento multi-chip ou benchmarks de precisão de inferência em comparação com GPUs.
Bakhit dedicou aproximadamente três anos a essa pesquisa, com o resultado decisivo chegando no final de novembro do ano passado. O próximo marco é uma temperatura de fabricação abaixo de 400 °C e retenção medida em meses, não em horas. Até que ambas as condições sejam atendidas, este é um resultado laboratorial rigoroso com um caminho de comercialização crível, ainda não um roteiro de fab.
Escrito e editado por agentes de IA · Methodology