Cash Queue Systems Co., Ltd.el líder en herramientas de compilación para sistemas informáticos heterogéneos, anunció hoy la nueva compatibilidad del compilador para la aceleración de subprocesos múltiples en CPU con múltiples núcleos físicos.
Una característica de CacheQ Compiler Collection, este compilador elimina la reescritura manual de código y el uso de bibliotecas de subprocesos y API de ejecución paralela compleja como OpenMP y MPI. Utiliza código C de subproceso único para generar ejecutables que pueden ejecutarse en CPU, aprovechando muchos núcleos físicos x86, con o sin hiperprocesamiento, así como núcleos ARM y RISC-V.
Los usuarios usan el compilador flexible de CacheQ para generar código para procesadores multinúcleo de arquitecturas iguales o diferentes y usan variables de tiempo de ejecución para comparar el uso. Puede agregar a su hardware para obtener lo último en rendimiento y uso de energía, o reducir la cantidad de núcleos y asignar otros procesos para optimizar aún más el rendimiento por vatio de energía consumida.
El resultado es un 486 % más rápido que la ejecución de un solo subproceso en un procesador X86 con 12 núcleos lógicos, basado en un punto de referencia del algoritmo financiero Black Scholes que simula el comportamiento humano en el comercio de acciones. El procesador Apple M1 con ocho núcleos ARM es un 400 % más rápido que el GNU Compiler Collection (GCC) de subproceso único.
Clay Johnson, CEO de CacheQ Systems, dijo: “Puede usar nuestras herramientas para acelerar algoritmos de subproceso único y compilar y apuntar rápidamente a cualquier CPU con 2 o más núcleos”.
Colección del compilador CacheQ
CacheQ permite a los desarrolladores de software desarrollar e implementar fácilmente aceleradores de hardware personalizados para sistemas informáticos heterogéneos como FPGA, CPU y GPU. Su colección de compiladores CacheQ se basa en el conjunto de herramientas GCC y tiene una interfaz de usuario similar a los compiladores de código abierto populares. Menos cambios de código reducen el tiempo de desarrollo y mejoran la calidad del sistema.
Este conjunto de herramientas permite la compilación, el linting y la detección de errores, la estimación del rendimiento, la creación de perfiles, la depuración y la visualización de los motores virtuales generados. Admite sistemas informáticos heterogéneos con hardware de destino, incluidos procesadores de uno o varios núcleos y aceleradores FPGA conectados a procesadores x86 y ARM.
La colección de compiladores CacheQ admite código C y C++ a través del acceso “híbrido” de las llamadas a funciones exportadas.
puntos de referencia adicionales
Los puntos de referencia adicionales para CacheQ Compiler Collection destacan sus capacidades en servidores de gama alta y dispositivos electrónicos de consumo. El procesador M1 de 2 núcleos funcionó mejor que el chip x86 de 11 núcleos, lo que demuestra su ventaja de costo por vatio. El procesador Apple M1 de 4 núcleos fue un 210 % más rápido que el x86 de 12 núcleos. En general, se ejecutó un 1476 % más rápido que GCC de subproceso único que se ejecuta en x86 con CacheQ Compiler Collection.
Todas las simulaciones se ejecutaron con el mismo código compilado para diferentes objetivos. El punto de referencia se ejecuta en una CPU Intel i7-8700k x86 que funciona a 3,7 GHz con hyperthreading disponible en 6 núcleos físicos y 12 lógicos que ejecutan Ubuntu 18.04. El banco de pruebas Apple M1 se capturó en una máquina virtual Parallels que ejecutaba una imagen ARM Ubuntu 20.04 nativa.
disponibilidad y precio
Las herramientas del compilador CacheQ se envían actualmente a través de un programa de acceso restringido. Los precios están disponibles bajo petición.
visita Sitio web de CacheQ Para obtener información adicional o ver un video breve sobre la nueva tecnología de compilador multinúcleo, comuníquese con [email protected] para obtener más información.