La NPU de AMD en Linux da un paso importante: menos memoria desperdiciada, más inteligencia bajo demanda.

Publicado el 22 de mayo de 2026, 14:22

Puede que no sea el titular más espectacular de la semana, pero lo que está ocurriendo en las profundidades del kernel de Linux con el soporte para las NPU de AMD es, en realidad, una buena noticia para cualquiera que use o piense usar un procesador Ryzen AI en su equipo Linux. Los ingenieros de AMD siguen trabajando, y esta vez el avance afecta a cómo se gestiona la memoria en la unidad de procesamiento neuronal.

Antes de entrar en materia, vale la pena aclarar qué es exactamente una NPU para quienes no estén familiarizados con el término. Las siglas corresponden a Neural Processing Unit, es decir, una unidad de procesamiento neuronal. Se trata de un chip especializado, integrado en los procesadores modernos de AMD bajo la marca Ryzen AI, cuya función específica es ejecutar tareas de inteligencia artificial de forma eficiente, sin tener que depender exclusivamente de la CPU ni de la GPU para ese tipo de cálculos. Piénsalo así: la CPU es el cerebro general del ordenador, la GPU es muy buena procesando gráficos y cargas masivas en paralelo, y la NPU es la pieza diseñada específicamente para inferencia de IA, ese proceso por el que un modelo entrenado toma decisiones o genera resultados. Tenerla bien soportada en Linux no es un capricho técnico, es una condición necesaria para que esa capacidad sea aprovechable de verdad en el sistema operativo.

El componente responsable de hacer que todo esto funcione en Linux se llama AMDXDNA, el controlador que gestiona la comunicación entre el sistema operativo y las NPU de AMD. Desde hace meses, los ingenieros de la compañía están trabajando activamente en mejorarlo, y las novedades se van incorporando versión a versión del kernel. Para Linux 7.2, cuya ventana de fusión se abre en junio, ya se habían anunciado mejoras relevantes, como soporte para el hardware de próxima generación AIE4. Ahora, en la última tanda de parches, llega una característica adicional que, aunque suena técnica, tiene implicaciones prácticas muy concretas: el soporte de heap expandible, o lo que es lo mismo, pila de memoria dinámica.

Hasta ahora, cuando el sistema necesitaba asignar memoria para que la NPU trabajara, tenía que reservar de entrada un bloque grande, aunque en ese momento no fuera a necesitarlo todo. Era una estrategia conservadora: mejor reservar de más que quedarse corto. El problema es que esa memoria reservada pero no usada queda bloqueada, ocupando espacio que podría estar aprovechándose para otras tareas. Con el soporte de heap expandible, el comportamiento cambia de forma significativa. Ahora es posible empezar con una reserva de memoria más pequeña y modesta, y ampliarla de forma dinámica cuando la carga de trabajo lo requiera. En otras palabras, la NPU ya no necesita acaparar recursos desde el primer momento: los pide conforme los va necesitando. Esta lógica de gestión bajo demanda es algo que los sistemas operativos modernos aplican en muchos contextos, y que se traduce en un uso más eficiente de los recursos del sistema. En un equipo donde la NPU comparte memoria con la CPU y la GPU integrada, este tipo de optimización puede tener un impacto real en el rendimiento general, especialmente en máquinas con memoria limitada o en escenarios donde varias cargas de trabajo están activas al mismo tiempo.

La implementación concreta de esta característica permite que el software del espacio de usuario, es decir, las aplicaciones que corren sobre el sistema operativo, solicite la expansión de esa pila de memoria cuando lo necesite, a través de una llamada específica al controlador conocida como IOCTL de creación de objetos de memoria dinámica. En términos más simples: la aplicación le dice al controlador que necesita más memoria, y este lo gestiona de forma ordenada con la NPU. Hay un matiz importante que vale la pena mencionar: por ahora, el firmware de las NPU Ryzen AI solo admite la expansión de la pila, no su reducción. Esto significa que una vez que se ha solicitado más memoria, no se puede devolver hasta que el proceso termine. No es un problema crítico, pero sí un aspecto que los ingenieros tendrán que resolver en el futuro para conseguir una gestión verdaderamente flexible en ambas direcciones. Más allá de AMDXDNA, la misma tanda de parches incluye también algunas correcciones en el núcleo DRM, arreglos para el controlador del procesador Arm Ethos-U y soporte para la pantalla del Surface Pro 12, entre otros cambios menores. Son el tipo de actualizaciones que no generan titulares pero que mantienen el ecosistema Linux en buen estado.

Lo que está ocurriendo con AMDXDNA es un buen ejemplo de cómo funciona el desarrollo del kernel de Linux: un proceso continuo, incremental y a veces poco llamativo, pero que va construyendo una base sólida sobre la que se apoyan capacidades cada vez más avanzadas. Para quienes usan Linux en hardware Ryzen AI, o lo consideran para el futuro, este tipo de avances son una señal positiva. AMD está invirtiendo en el soporte nativo, los parches llegan a tiempo para las ventanas de fusión y las mejoras apuntan en la dirección correcta. El soporte de IA en Linux no es ya una promesa vaga: se está construyendo pieza a pieza, parche a parche.

Y eso, aunque no haga ruido, importa bastante.

 

Fuente: Phoronix

Añadir comentario

Comentarios

Todavía no hay comentarios