Un equipo del Laboratorio de Arquitectura de Computadoras y Sistemas de Memoria (CAMEL) en KAIST presentó una nueva solución de enlace exprés de cómputo (CXL) cuya desagregación de memoria de alto rendimiento y directamente accesible abre nuevas direcciones para el procesamiento de memoria de big data. El profesor Myoungsoo Jung dijo que la tecnología del equipo mejora significativamente el rendimiento en comparación con la desagregación de memoria basada en el acceso directo remoto a la memoria (RDMA).
CXL es un nuevo multiprotocolo dinámico basado en interconexión exprés de componentes periféricos (PCIe) creado para utilizar de manera eficiente dispositivos de memoria y aceleradores. Muchos centros de datos empresariales y proveedores de memoria le están prestando atención como el multiprotocolo de próxima generación para la era de los grandes datos.
Las aplicaciones de big data emergentes, como el aprendizaje automático, el análisis de gráficos y las bases de datos en memoria, requieren grandes capacidades de memoria. Sin embargo, la ampliación de la capacidad de la memoria a través de una interfaz de memoria anterior, como la velocidad de datos doble (DDR), está limitada por la cantidad de unidades centrales de procesamiento (CPU) y controladores de memoria. Por lo tanto, ha aparecido la desagregación de memoria, que permite conectar un host a la memoria oa los nodos de memoria de otro host.
RDMA es una forma en que un host puede acceder directamente a la memoria de otro host a través de InfiniBand, el protocolo de red comúnmente utilizado en los centros de datos. Hoy en día, la mayoría de las tecnologías de desagregación de memoria existentes emplean RDMA para obtener una gran capacidad de memoria. Como resultado, un host puede compartir la memoria de otro host transfiriendo los datos entre la memoria local y la remota.
Aunque la desagregación de memoria basada en RDMA proporciona una gran capacidad de memoria a un host, existen dos problemas críticos. En primer lugar, el escalado horizontal de la memoria aún necesita que se agregue una CPU adicional. Dado que la memoria pasiva, como la memoria dinámica de acceso aleatorio (DRAM), no puede funcionar por sí misma, debe ser controlada por la CPU. En segundo lugar, las copias de datos redundantes y las intervenciones de estructura de software para la desagregación de memoria basada en RDMA provocan una latencia de acceso más prolongada. Por ejemplo, la latencia del acceso a la memoria remota en la desagregación de memoria basada en RDMA es varios órdenes de magnitud más larga que el acceso a la memoria local.
Para abordar estos problemas, el equipo del profesor Jung desarrolló el marco de desagregación de memoria basado en CXL, que incluye CPU personalizadas habilitadas para CXL, dispositivos CXL, conmutadores CXL y módulos de sistema operativo compatibles con CXL. El dispositivo CXL del equipo es un nodo de memoria puramente pasivo y de acceso directo que contiene varios módulos de memoria dual en línea (DIMM) DRAM y un controlador de memoria CXL. Dado que el controlador de memoria CXL admite la memoria en el dispositivo CXL, un host puede utilizar el nodo de memoria sin la intervención del procesador o software. El conmutador CXL del equipo permite ampliar la capacidad de memoria de un host mediante la conexión jerárquica de varios dispositivos CXL al conmutador CXL, lo que permite más de cientos de dispositivos. Además de los conmutadores y dispositivos, el sistema operativo habilitado para CXL del equipo elimina la copia de datos redundantes y la conversión de protocolos que presenta la RDMA convencional, lo que puede reducir significativamente la latencia de acceso a los nodos de memoria.
En una prueba que comparó la carga de datos 64B (cacheline) desde dispositivos de agrupación de memoria, la desagregación de memoria basada en CXL mostró un rendimiento de carga de datos 8,2 veces mayor que la desagregación de memoria basada en RDMA e incluso un rendimiento similar al de la memoria DRAM local. En las evaluaciones del equipo para un punto de referencia de big data, como una prueba basada en aprendizaje automático, la tecnología de desagregación de memoria basada en CXL también mostró un rendimiento máximo de 3,7 veces mayor que las tecnologías anteriores de desagregación de memoria basadas en RDMA.
«Al escapar de la desagregación de memoria basada en RDMA convencional, nuestro marco de desagregación de memoria basado en CXL puede proporcionar una alta escalabilidad y rendimiento para diversos centros de datos e infraestructuras de servicios en la nube», dijo el profesor Jung. Continuó enfatizando: «Nuestra investigación de desagregación de memoria basada en CXL generará un nuevo paradigma para las soluciones de memoria que liderará la era de los grandes datos».
‘Desagregación de memoria’ para computación a gran escala hecha práctica
Proporcionado por KAIST
Citación: La tecnología de desagregación de memoria basada en CXL abre una nueva dirección para los marcos de soluciones de macrodatos (16 de marzo de 2022) consultado el 19 de marzo de 2022 en https://techxplore.com/news/2022-03-cxl-based-memory-disaggregation -tecnología-grande.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.