Fujitsu ha anunciado el lanzamiento de una tecnología de middleware de computación de IA diseñada para mejorar la eficiencia computacional de la GPU en el procesamiento de IA y hacer frente a la escasez mundial de GPU. La nueva tecnología integra la tecnología de asignación adaptativa de GPU patentada por Fujitsu, que asigna las GPU de forma dinámica para lograr un procesamiento de alta eficiencia en tiempo real, con diversas técnicas de optimización del procesamiento de IA.
Tras el éxito de las pruebas piloto, TRADOM Inc. comenzará a utilizar soluciones basadas en la tecnología del agente informático de IA en octubre de 2024. Además, SAKURA internet Inc. ha iniciado un estudio de viabilidad sobre la tecnología de agente informático de IA para las operaciones de su centro de datos.
A partir de mayo de 2024, Fujitsu también ha estado realizando pruebas de esta tecnología de nuevo desarrollo con AWL, Inc, Xtreme-D Inc, y Morgenrot Inc, y ha demostrado mejoras significativas en las operaciones de estas empresas. Las pruebas confirmaron un aumento de hasta 2,25 veces en la eficiencia computacional de varios procesos de IA y un aumento sustancial en el número de procesos de IA gestionados simultáneamente en diversos entornos y servidores en la nube.
La tecnología recién desarrollada estará disponible para los clientes de Japón a partir del 22 de octubre de 2024 y para los usuarios de todo el mundo.
Fujitsu seguirá proporcionando su tecnología de intermediación de computación de IA a usuarios finales, incluidos proveedores de servicios de IA que buscan reducir los costes de GPU mejorando la eficiencia computacional, y a proveedores de servicios en la nube que pretenden maximizar la utilización de la GPU. Al abordar los retos de la escasez de GPU y el consumo de energía impulsados por la creciente demanda mundial de IA, Fujitsu pretende contribuir a mejorar la productividad empresarial y la creatividad de sus clientes.
Abordar el creciente consumo de energía de la IA con la asignación adaptativa de GPU
Impulsada por el rápido aumento de la demanda mundial de tecnología de IA (incluida la IA generativa), la necesidad de GPU, que son más adecuadas para el procesamiento de IA que las CPU, ha aumentado drásticamente. Se prevé que el mercado mundial de IA generativa se multiplique aproximadamente por 20 entre 2023 y 2030 (6) y que, en consecuencia, la demanda de GPU aumente a un ritmo similar. Sin embargo, el aumento del consumo de energía en los centros de datos para satisfacer esta demanda de GPU representa un reto importante. Se calcula que los centros de datos consumirán el 10% de la electricidad mundial en 2030 (7).
Para hacer frente a este reto social global, Fujitsu desarrolló en noviembre de 2023 una tecnología de asignación adaptativa de GPU. La tecnología optimiza el uso de CPU y GPU asignando recursos en tiempo real para dar prioridad a los procesos con alta eficiencia de ejecución, incluso si la GPU está ejecutando un programa. Fujitsu ha estado realizando pruebas de verificación de esta tecnología de asignación en varias plataformas.
Acerca del nuevo agente de computación de IA
El nuevo middleware AI computing broker integra la tecnología de asignación adaptativa de GPU con las tecnologías de optimización del procesamiento de IA, lo que permite identificar y optimizar automáticamente la asignación de recursos de GPU para el procesamiento de IA en múltiples programas.
A diferencia de la asignación convencional por tarea, el broker de computación de IA de Fujitsu asigna dinámicamente los recursos de la GPU por GPU, aprovechando la experiencia en optimización computacional de Fujitsu para mejorar las tasas de disponibilidad. Las funciones de gestión de la memoria de la GPU de la tecnología permiten a los usuarios ejecutar numerosos procesos de IA sin preocuparse por el uso de la memoria de la GPU o la capacidad física.
En las pruebas previas al lanzamiento, el broker de computación de IA de Fujitsu demostró una mejora de hasta 2,25 veces en el rendimiento de procesamiento de la GPU en términos de tiempo por unidad en comparación con las implantaciones que no utilizaban la tecnología. Además, la gestión de la memoria de la tecnología permite manejar simultáneamente hasta 150 GB de procesamiento de IA, aproximadamente cinco veces la capacidad de memoria física de la GPU.
Planes de futuro
En el futuro, Fujitsu ampliará el alcance de la aplicación de su tecnología AI computing broker, incluida la implementación en múltiples GPU instaladas en múltiples servidores, anticipando su uso en entornos informáticos aún mayores. Fujitsu seguirá desarrollando tecnologías informáticas avanzadas para hacer frente a retos como la escasez de GPU y de energía, contribuyendo a la realización de una IA que mejore la productividad y la creatividad como asistente de confianza.
Junichi Kayamoto, Director de Ciencia de Datos de TRADOM Inc. comenta: «Nuestra empresa ofrece soluciones punteras basadas en IA para la gestión del riesgo cambiario. La prueba de la tecnología AI computing broker de Fujitsu demostró su capacidad para racionalizar significativamente la asignación de recursos de GPU para la generación de modelos de IA, lo que permite el desarrollo de modelos sustancialmente más precisos en mucho menos tiempo a través de la multiplexación de procesos de aprendizaje de IA. Estamos comprometidos a aprovechar esta tecnología, en continua colaboración con Fujitsu, para ampliar proactivamente nuestra oferta de soluciones, impulsando tanto el crecimiento de TRADOM como el avance de la industria FinTech».
Ken Washikita, Director Senior de SAKURA internet Inc./ SAKURA Internet Research Center comenta: «Nuestra prueba del agente de computación de IA de Fujitsu ha demostrado la capacidad de la tecnología para mejorar significativamente la eficiencia de la asignación de recursos de GPU dentro de nuestro negocio en la nube, ampliando el acceso a la GPU a una base de clientes más amplia. Esperamos colaborar con Fujitsu para integrar plenamente esta tecnología y satisfacer la creciente demanda de GPU».
Hiroshi Fujimura, director general de I+D de AWL, Inc. comenta: «Estamos comprometidos con el desarrollo y suministro de soluciones de cámara de IA de última generación que resuelvan diversos problemas y maximicen el valor de todos los espacios del mundo real, especialmente los entornos comerciales. Para satisfacer las elevadas exigencias de nuestros clientes, es primordial optimizar los costes operativos de la GPU durante el entrenamiento paralelo de los modelos de IA. Nuestra prueba demostró la capacidad del agente de computación de IA de Fujitsu para mejorar significativamente la utilización de la GPU y la eficiencia del procesamiento de IA. Estamos impacientes por ver nuevos avances en esta importante tecnología».
Naoki Shibata, Founder, CEO Xtreme-D Inc, comenta: «Felicitamos a Fujitsu por el lanzamiento del agente informático de IA. Xtreme-D proporciona Raplase, un servicio basado en la nube para clientes de IA y HPC. Un reto crítico para nuestros clientes es la optimización de la relación precio/rendimiento a través de la utilización eficiente de las costosas GPU en las instalaciones y en la nube bare-metal. Confiamos en que el corredor de computación de IA de Fujitsu abordará significativamente este reto y estamos colaborando activamente con Fujitsu para integrar esta solución en nuestras ofertas para clientes».
Masamichi Nakamura, COO, e Hiroshi Ito, CTO, Morgenrot Inc, comentan: «Nuestra empresa está revolucionando el panorama de la computación en nube con su enfoque innovador y descentralizado que aprovecha los centros de datos de contenedores. Estamos construyendo un modelo vanguardista de economía colaborativa para la potencia de cálculo, perfectamente preparado para satisfacer la creciente demanda de recursos computacionales avanzados, incluidas las GPU. Nuestra reciente prueba, con vistas a colaborar entre nuestra solución de gestión de HPC (M:Arthur) y nuestro servicio en la nube (Cloud Bouquet) y la tecnología de intermediación de computación de IA de Fujitsu, arrojó unos resultados impresionantes. Al permitir el uso compartido de la GPU entre varios trabajos, conseguimos una notable reducción de casi el 10% en el tiempo total de ejecución en comparación con la ejecución de trabajos secuencialmente en dos GPU. Esta capacidad de procesamiento paralelo ofrece importantes ventajas, ya que permite la ejecución simultánea de largas sesiones de entrenamiento para la creación de modelos y tareas de inferencia/prueba más cortas, todo ello con recursos limitados. Estamos impacientes por seguir explorando el uso del broker de computación de IA de Fujitsu para integrar esta tecnología transformadora en nuestra suite de productos».