Logran que las GPU utilicen memoria adjunta a PCIe para una capacidad ampliada gracias a una nueva tecnología

Han creado una tecnología que permite a las GPU acceder a la memoria del sistema a través de una interfaz Compute Express Link (CXL) que básicamente permite a estas GPU usar la memoria del sistema como una extensión de su propia memoria.
A día de hoy, los requisitos de memoria para aplicaciones de IA y HPC superan, bastantes veces, la memoria integrada en una GPU. Para solucionar esto, se tiene que instalar una costosa memoria de alta velocidad, algo que introduce cambios en la arquitectura o el software existente de la GPU.
Es un cuello de botella que parece que una compañía respaldada por el instituto de investigación KAIST de Corea del Sur que lleva por nombre Panmesia parece haber solucionado.
¿Cómo? A través de una tecnología que permite a las GPU acceder a la memoria del sistema a través de una interfaz Compute Express Link (CXL) que básicamente permite a estas GPU usar la memoria del sistema como una extensión de su propia memoria, según apuntan desde TechSpot.
Para que te hagas una idea, esta CXL GPU Image adjunta a PCIe tiene una latencia de nanosegundos de dos dígitos que es significativamente más rápida que los SSD tradicionales, según la empresa.
Ahora bien, para lograr esto, Panmnesia tuvo que enfrentarse a varios desafíos.
A grandes rasgos, CXL es un protocolo que funciona sobre un enlace PCIe, pero es una tecnología que debe ser reconocida por un ASIC y un subsistema. Es decir, no se puede añadir un controlador CXL a la pila tecnológica, puesto que no existe una lógica CXL y subsistemas que soporten endpoints de DRAM y/o SSD en las GPUs.
A esto se suma que los subsistemas de caché y memoria de la GU no reconocen ninguna expansión, excepto la memoria virtual unificada (UVM), que no es lo suficientemente rápida para la IA o HPC. En pruebas realizadas por Panmnesia, UVM tuvo el peor rendimiento entre todos los kernels de GPU probados.
Con CXL la cosa cambió por completo gracias a que consiguió acceso directo a almacenamiento expandido a través de instrucciones de carga/almacenamiento, algo que borró de un plumazo los problemas de UVM, como la sobrecarga de la intervención en tiempo de ejecución del host durante fallos de página y la transferencia de datos a nivel de página.
Al final, lo que la compañía ha desarrollado es una serie de capas de hardware que soportan todos los protocolos clave de CXL, consolidándolos en un controlador unificado.
El complejo raíz compatible con CXL 3.1 tiene múltiples puertos raíz que soportan memoria externa sobre PCIe y un puente host con un decodificador de memoria de dispositivo gestionado por el host que se conecta al bus del sistema de la GPU y gestiona la memoria del sistema.
Existen otros desafíos que Panmnesia enfrenta que están fuera de su control, como que AMD y Nvidia deben añadir soporte CXL a sus GPUs.