HPC et IA : une combinaison puissante

L'apprentissage automatique et l'apprentissage en profondeur augmentent le HPC pour obtenir de nouvelles informations plus rapidement.

Plus de données et des analyses plus approfondies avec l'IA HPC

  • Les implémentations d'IA ont une affinité avec l'architecture de calcul du HPC, et l'IA et le HPC bénéficient de configurations similaires basées sur du matériel haute performance Intel®.

  • Les chercheurs du CERN utilisent des réseaux neuronaux convolutifs reposant sur la technologie Intel® qui intègrent les lois de la physique dans des modèles d'IA afin d'obtenir des résultats plus précis pour des cas d'utilisation concrets.

  • Intel aide à réduire les compromis à faire entre les plateformes dédiées à l'IA et au HPC grâce à l'accélération matérielle de l'IA, à la programmation unifiée des plateformes avec oneAPI et aux solutions simplifiées Intel® Select qui permettent de réduire les problèmes de conception et de déploiement des systèmes.

author-image

Par

HPC enrichi par l'IA

L'architecture requise pour les implémentations HPC présente de nombreuses similitudes avec les implémentations IA. Tous deux utilisent de hauts niveaux de calcul et de stockage, une grande capacité de mémoire et de bande passante, et des infrastructures haut débit pour obtenir des résultats, généralement en traitant des ensemble de données massifs de plus en plus volumineux. L'apprentissage en profondeur convient parfaitement aux problèmes traités par HPC qui impliquent de très grands ensembles de données multidimensionnelles. Par exemple, Quantifi a utilisé l'IA reposant sur la technologie Intel® pour calculer 700 fois plus vite que les méthodes traditionnelles l'évaluation des produits dérivés sur les marchés financiers 1, fournissant des résultats en temps quasi-réel pour les charges de travail d'évaluation courantes.

La promesse de l'IA dans le domaine du calcul intensif est que les modèles d'IA peuvent renforcer l'analyse des ensembles de données par les experts afin de produire des résultats plus rapidement avec le même niveau de précision. Les principaux cas d'utilisation du HPC bénéficient des capacités avancées de l'IA, par exemple dans les cas suivants :

  • Analyses pour les services financiers (FSI) tels que la détection des risques et des fraudes, la logistique et la fabrication.
  • Conception de produits industriels, dynamique des fluides computationnelle (CFD), ingénierie assistée par ordinateur (IAO) et conception assistée par ordinateur (CAO).
  • Visualisation et simulation scientifiques, en particulier dans des domaines tels que la physique des hautes énergies.
  • Regroupement de modèles, sciences de la vie, séquençage génomique et recherche médicale.
  • Exploration du secteur des sciences de la terre et de l'énergie.
  • Le temps, la météorologie et la science du climat.
  • Astronomie et astrophysique.

Évolution des charges de travail

De nombreux cas d'utilisation actuels de l'IA se limitent aux déploiements en périphérie ou dans les centres de données, tels que les systèmes de trafic intelligents qui s'appuient fortement sur des caméras intelligentes pour la reconnaissance d'objets IA. Les algorithmes qui sous-tendent les modèles d'IA sont devenus beaucoup plus complexes, offrant un plus grand potentiel, mais aussi des exigences de calcul plus importantes pour la découverte scientifique, l'innovation et les applications industrielles et commerciales. Le défi consiste à faire passer l'inférence de l'IA à des niveaux de calcul intensif ou à passer de la reconnaissance de schémas de circulation à une intersection au séquençage d'un génome en quelques heures plutôt qu'en quelques semaines.

Heureusement, la communauté HPC dispose de dizaines d'années d'expérience sur la manière de relever les défis que pose l'IA à grande échelle, tels que le besoin de plus de parallélisme, d'E/S rapides pour des ensembles de données massifs et d'une navigation efficace dans les environnements informatiques distribués. De telles capacités HPC peuvent aider à accélérer l'IA pour obtenir des résultats utiles, tels que l'application d'heuristiques de niveau expert via l'inférence d'apprentissage en profondeur à des milliers de transactions, de charges de travail ou de simulations par seconde.

Réseaux de neurones informés par la physique (PINN)

L'intégration des lois de la physique dans les modèles d'inférence dans le but de générer des résultats plus réalistes est un exemple de cas d'utilisation du calcul intensif enrichi par IA. Dans ces applications, les réseaux de neurones doivent obéir à des lois connues telles que la conservation de la masse, de l'énergie et de la vitesse et sont appelés réseaux de neurones informés par la physique (PINN). Les PINN peuvent être utilisés pour augmenter, ou remplacer, la modélisation et la simulation HPC pour des cas d'utilisation tels que l'analyse de l'écoulement des fluides, la dynamique moléculaire, la conception d'ailes et de moteurs à réaction, et la physique des hautes énergies.

Par exemple, les chercheurs du CERN ont utilisé Intel® Deep Learning Boost (Intel® DL Boost) sur les processeurs Intel® Xeon® évolutif pour remplacer les simulations de Monte Carlo pour les collisions de particules. La quantification int8 de basse précision a permis d'obtenir un traitement jusqu'à 68 000 fois plus rapide que les simulations logicielles 2, avec une légère amélioration de la précision également.

L'IA dans le HPC est stimulée par la croissance des données

Les charges de travail du calcul intensif et de l'IA sont principalement motivées par la croissance constante des données et la nécessité de suivre le rythme de l'analyse à l'échelle du calcul intensif. Les algorithmes d'IA sont de plus en plus sophistiqués et peuvent gérer des ensembles de données beaucoup plus volumineux que les années précédentes, en particulier depuis l'introduction des méthodologies d'apprentissage en profondeur. Des disciplines comme le séquençage génomique génèrent une quantité phénoménale de données, et des institutions comme le Broad Institute du MIT et de Harvard créent environ 24 téraoctets de nouvelles données chaque jour3.

L'IA permet d'accélérer les charges de travail critiques, afin que la découverte ne prenne pas de retard. Par exemple, Intel s'est associé au Broad Institute pour développer une solution Intel® Select pour le Genomics Analytics Toolkit (GATK), qui intègre l'accélération matérielle de l'IA afin de gérer les charges de travail HPC pour les principaux outils de génomique. Grâce à la solution Select pour GATK, le Broad Institute a pu multiplier par 1,75 la vitesse de l'application Burrow-Wheeler Aligner (BWA) et par 2 celle de l'application HaplotypeCaller 3.

Le San Diego Supercomputer Center (SDSC) héberge l'un des plus grands centres de données universitaires au monde et sa réputation de leader international en matière d'utilisation, de gestion, de stockage et de préservation des données n'est plus à faire. Ce système axé sur l'IA permet aux scientifiques de développer de nouvelles approches pour la formation et l'inférence accélérées. Étude de cas : Le SDSC construit le supercalculateur « Voyager » axé sur l'IA.

Surmonter les obstacles liés à l'adoption de l'IA dans le calcul intensif

Lorsqu'il s'agit de configurations de calcul intensif pour l'IA, il existe traditionnellement un compromis entre les exigences de l'IA et du calcul intensif dans l'architecture de processeur. Les charges de travail gourmandes en IA échangeront généralement un nombre de cœurs plus élevé contre de la vitesse, tandis que les charges de travail HPC préfèrent souvent des performances de calcul supérieures avec un nombre de cœurs élevé et un plus grand débit de cœur à cœur. Grâce à des améliorations générationnelles continues, Intel propose des solutions incluant l'accélération intégrée dans les processeurs évolutif Intel® Xeon®.

Les innovations clés suivantes, tant au niveau du matériel que des logiciels, facilitent la conception et la réalisation de solutions d'IA :

  • Les processeurs évolutifs Intel® Xeon® offrent, grâce à l'accélération de l'IA intégrée, les niveaux élevés de performances requis en matière d'IA. Intel® Advanced Vector Extensions 512 avec Intel® DL Boost Vector Neural Network Instructions (VNNI), exclusif aux processeurs Intel®, offre des performances optimisées en matière d'intelligence artificielle pour des découvertes rapides en moins de temps.
  • Les bibliothèques d'optimisation de basse précision au sein de l'Intel® oneAPI AI analytics toolkit facilitent le codage pour les plateformes HPC et IA, tout en augmentant les performances et en maintenant les seuils de précision.
  • Les FPGA Intel® pour l'apprentissage automatique prennent en charge une parallélisation élevée et contribuent à accélérer l'obtention de résultats et d'informations pour les charges de travail HPC et IA.
  • La plateforme Gaudi de Habana Labs, l'équipe du centre de données d'Intel axée sur les technologies de processeur d'apprentissage profond, permet aux scientifiques des données et aux ingénieurs en apprentissage automatique d'accélérer la formation et de créer de nouveaux modèles ou de migrer des modèles existants avec seulement quelques lignes de code pour bénéficier d'une plus grande productivité, ainsi que des coûts opérationnels réduits. Les accélérateurs Habana sont spécialement conçus pour la formation et l'inférence de modèles d'IA à grande échelle.
  • Les solutions Intel® Select pour clusters IA HPC permettent de déployer des charges de travail d'IA sur des plateformes HPC convergées sans déployer de GPU.
  • Les développeurs spécialisés dans l'IA affinent leurs techniques et leur code pour qu'ils fonctionnent plus efficacement sur les clusters HPC. De nouvelles optimisations accélèrent les charges de travail de bout en bout, du chargement des données au prétraitement, à la formation et à l'inférence.

La complexité est également une source majeure de friction pour l'adoption du calcul intensif et de l'IA. Les compétences requises sont très spécifiques et les entreprises devront acquérir des talents formés au calcul intensif et à l'IA pour réussir. Le leadership d'Intel peut aider à ouvrir la voie, car Intel collabore étroitement avec des communautés du calcul intensif et de l'IA pour partager son expertise et ses idées.

Conclusion : l'IA au service du calcul intensif

L'IA est de plus en plus utilisée dans les applications de calcul intensif grâce à de nouvelles technologies et méthodologies qui augmentent le rythme et l'échelle de l'analyse de l'IA pour obtenir des découvertes et des informations plus rapidement. Grâce à ces innovations, les spécialistes des données et les chercheurs peuvent compter sur l'IA pour traiter davantage de données, créer des simulations plus réalistes et faire des prédictions plus précises, souvent en moins de temps.

Infos sur le produit et ses performances

2« Le CERN accélère les charges de travail des simulations grâce à l'IA », site Web d'Intel. Date d'accès : août 2021.
3« Solutions Intel® Select pour les analyses génomiques », site Web d'Intel. Date d'accès : août 2021.