Nuevas herramientas Intel oneAPI 2023 para maximizar el valor del próximo hardware Intel
3 de Enero de 2023Las nuevas funciones de las herramientas Intel aumentan la productividad multiplataforma.
Intel anunció la versión 2023 de las herramientas Intel® oneAPI, disponibles en Intel® Developer Cloud y que se lanzan a través de canales de distribución habituales.
Las nuevas herramientas oneAPI 2023 son compatibles con los próximos procesadores escalables Intel® Xeon® de 4ª Generación, Intel® Xeon® la serie CPU Max y las GPU de centros de datos Intel®, incluidas la serie Flex y la nueva serie Max. Las herramientas ofrecen mejoras en el desempeño y la productividad, y también agregan compatibilidad con nuevos complementos de Codeplay que facilitan que los desarrolladores escriban código SYCL para arquitecturas que no son de Intel GPU. Estas herramientas basadas en estándares ofrecen opciones de hardware y facilitan el desarrollo de aplicaciones de alto desempeño que se ejecutan en sistemas multiarquitectura.
"Estamos obteniendo resultados alentadores en cuanto al rendimiento de las aplicaciones en nuestros sistemas de desarrollo que utilizan aceleradores Intel Max Series GPU, aplicaciones creadas con los compiladores y las librerías oneAPI de Intel. Para la ciencia informática de liderazgo, valoramos los beneficios de la portabilidad de código, desde estándares de programación multivendor y multiarquitectura, como los marcos de inteligencia artificial Python y SYCL, como PyTorch, acelerados por las bibliotecas Intel. Esperamos los primeros descubrimientos científicos exascales a partir de estas tecnologías en el sistema Aurora". –Timothy Williams, subdirector, División de Ciencias Computacionales de Argonne
Qué ofrecen las herramientas oneAPI: Las herramientas para desarrolladores de Intel 2023 incluyen un conjunto integral de los compiladores y bibliotecas más recientes, herramientas de análisis y porción, y marcos optimizados de inteligencia artificial (IA) y aprendizaje automático para desarrollar aplicaciones de alto desempeño y multiarquitectura para CPU, GPU y FPGAs, con tecnología oneAPI. Las herramientas permiten a los desarrolladores cumplir rápidamente con los objetivos de desempeño y ahorrar tiempo mediante el uso de una base de código único, lo que ofrece más tiempo para la innovación.
Esta nueva versión de las herramientas oneAPI ayuda a los desarrolladores a aprovechar las capacidades avanzadas del hardware Intel®
* Procesadores escalables y xeon de 4ª generación de la serie CPU Max y Intel Xeon con Intel® Advanced Matrix Extensions (Intel® AMX), tecnología Intel® Quick Assist (Intel® QAT), Intel® AVX-512, bfloat16 y más.
* ® Intel® Data Center GPUs, incluidas las series Flex con codificador AV1 basado en hardware y GPUs de la serie Max con flexibilidad de tipo de datos, Intel® Xe Matrix Extensions (Intel® XMX), motor vectorial, Intel® Xe Link y otras características.
Ejemplos de análisis de desempeño:
* La inferencia y el desempeño del entrenamiento de aprendizaje profundo de MLPerf™ DeepCAM con La CPU Xeon Max mostraron una ganancia de desempeño de 3,6 veces superior a Nvidia en 2,4 y AMD como la línea base 1.0 utilizando Intel® AMX habilitadas por la biblioteca de redes neuronales profundas Intel® oneAPI (oneDNN).
* Las cargas de trabajo LAMMPS (simulador atómico/molecular enormemente paralelo a gran escala) que se ejecutan en la CPU Xeon Max con núcleos descargados en seis GPU de la serie Max y optimizadas por herramientas oneAPI dieron lugar a una ganancia de desempeño hasta 16 veces superior a la de Intel Xeon de tercera generación o solo AMD Radeon.
Desempeño avanzado del software:
* Intel® Fortran Compiler proporciona compatibilidad con estándares de lenguaje Fortran completos durante Fortran 2018 y amplía la compatibilidad con descarga de GPU OpenMP, acelerando el desarrollo de aplicaciones compatibles con estándares.
* La biblioteca math kernel de Intel® oneAPI (oneMKL) con capacidad extendida de descarga OpenMP mejora la portabilidad.
* La biblioteca de redes neuronales profundas (oneDNN) Intel® oneAPI permite las funciones avanzadas de aprendizaje profundo de cpu de los procesadores Intel Xeon y max de 4ª generación, que incluyen Intel® AMX, Intel AVX-512, VNNI y bfloat16.
A fin de aumentar la productividad de los desarrolladores, la compatibilidad enriquecida con SYCL y las sólidas herramientas de análisis y migración de códigos, resulta más fácil desarrollar código para sistemas de multiarquitectura.
* El compilador DPC++/C++ Intel® oneAPI agrega compatibilidad con nuevos complementos del software Codeplay para Nvidia y GPU AMD a fin de simplificar la escritura de código SYCL y ampliar la portabilidad de código en estas arquitecturas de procesadores. Esto proporciona un entorno de construcción unificado con herramientas integradas para la productividad entre plataformas. Como parte de esta solución, Intel y Codeplay ofrecerán soporte de prioridad comercial a partir del plug-in oneAPI para GPU NVIDIA.
* La migración de código CUDA a SYCL ahora es más fácil con más de 100 API de CUDA agregadas a la Intel® DPC++ Compatibility Tool, que se basa en SYCLomatic de código abierto.
* Los usuarios pueden identificar las amenazas de MPI a escala con Intel® VTune™ Profiler.
* Intel® Advisor agrega análisis automatizados en la cubierta de la GPU Intel® para centros de datos serie Max a fin de identificar y priorizar los cuellos de botella de memoria, caché o cómputo, con información procesable para optimizar los costos de reutilización de transferencia de datos de la descarga de CPU a GPU.
¿Por qué es importante? Dado que el 48 % de los desarrolladores se enfoca en sistemas heterogéneos que utilizan más de un tipo de procesador, se requiere una programación multiarquitectura más eficiente para abordar el creciente alcance y escala de las cargas de trabajo del mundo real. El uso del modelo de programación abierta y unificada de oneAPI con las herramientas multiarquitectura basadas en estándares de Intel ofrece libertad de elección en cuanto a hardware, desempeño, productividad y portabilidad de código para CPU y aceleradores. El código escrito para modelos de programación propietarios, como CUDA, no tiene portabilidad con otro hardware, lo que crea una práctica de desarrollo siloed que bloquea las organizaciones en un ecosistema cerrado.
Acerca de la adopción del ecosistema oneAPI: La adopción continua por el ecosistema de oneAPI está en curso con la creación de nuevos Centros de Excelencia. Uno, el Open Zscale Lab de la Universidad de Cambridge, se centra en portar códigos candidatos significativos de exascale a oneAPI, incluidos ENEP, FEniCS y AREPO. El centro ofrece cursos y talleres en los que expertos enseñan las herramientas y las herramientas de oneAPI para la compilación y porción de códigos, y para optimizar el desempeño. En total, se han establecido 30 Centros de Excelencia OneAPI.