Performances GROMACS sur les instances Intel sur AWS

Pourquoi Intel pour le calcul intensif (HPC) dans le Cloud

  • Partenariats technologiques avec les principaux fournisseurs d'ingrédients pour garantir l'optimisation des processeurs Intel®.

  • Des collaborations approfondies entre les ISV et la communauté HPC se sont concentrées sur l'optimisation des principaux codes HPC.

  • Évolutivité et flexibilité pour différentes charges de travail dans l'environnement cloud.

author-image

Par

Instances Intel pour les charges de travail HPC

Les tests ci-dessous ont été effectués sur des instances AWS basées sur différentes générations de processeurs Intel® Xeon® dans une configuration hyper-thread. Ce processeur personnalisé peut atteindre une fréquence d'horloge Turbo allant jusqu'à 3,5 GHz et intègre la technologie Intel® Turbo Boost 2.0, Intel® Advanced Vector Extensions 512 (Intel® AVX-512) et Intel® Deep Learning Boost. Ces nouvelles offres offrent une meilleure proposition de valeur pour les charges de travail à usage général et gourmandes en mémoire par rapport à la génération précédente (par exemple, une évolutivité accrue et une classe de CPU mise à niveau), y compris de meilleures performances.

Qu'est-ce que GROMACS ?

L'application GROMACS est une application liée au calcul (FLOPS). Les charges de travail de cette application sont sensibles à la latence pour toute communication (socket-socket, CPU-GPU et multi-nœuds). Cela permet de bénéficier des avantages d'AVX-512 (Y), des avantages liés au calcul (Y) (à l'exception de ionchannel - il est lié à MPI sur 8-16 nœuds), des avantages de Turbo (Y), des avantages de HT/SMT (Y).

Les charges de travail que nous avons prises en compte pour notre analyse comparative sont accessibles au public :

  • lignocellulose (atomes 3M, type RF) ; La lignocellulose est utile comme exemple de démonstration d'évolutivité.
  • water_rf (atomes 1,5M, type RF)

Voir ci-dessous pour les charges de travail et les configurations. Les résultats effectifs peuvent varier.

Configuration de C6i.32xlarge – Processeur Intel® Xeon® Scalable de 3e génération à 2,9 GHz, capacité de mémoire de 256 Go, bande passante réseau 50 Gbit/s, noyau de version CentOS Linux 7 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour système d'exploitation Linux, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel avant le 11/09/2021

Configuration de C5n.18xlarge - Processeur Intel® Xeon® Scalable à 2,9 GHz, capacité de mémoire de 192 Go, bande passante réseau 100 Gbit/s, noyau de version CentOS Linux 7 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour système d'exploitation Linux, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel avant le 11/09/2021

Configuration de M6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3e génération à 2,9 GHz, capacité mémoire de 512 Go, largeur de bande réseau 50 Gbps, noyau CentOS Linux 7 release 3.10.0-1160.45.1.el7. x86_64, GRO-MACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour le système d'exploitation Linux, Version 2021.4 Build 20210831 (id : 758087adf), Testé par Intel le 11/09/2021

Voir ci-dessous pour les charges de travail et les configurations. Les résultats effectifs peuvent varier.

Configuration de C6i.32xlarge – Processeur Intel® Xeon® Scalable de 3e génération à 2,9 GHz, capacité de mémoire de 256 Go, bande passante réseau 50 Gbit/s, noyau de version CentOS Linux 7 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour système d'exploitation Linux, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel avant le 11/09/2021

Configuration de C5n.18xlarge - Processeur Intel® Xeon® Scalable à 2,9 GHz, capacité de mémoire de 192 Go, bande passante réseau 100 Gbit/s, noyau de version CentOS Linux 7 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour système d'exploitation Linux, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel avant le 11/09/2021

Configuration de M6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3e génération à 2,9 GHz, capacité mémoire de 512 Go, largeur de bande réseau 50 Gbps, noyau CentOS Linux 7 release 3.10.0-1160.45.1.el7. x86_64, GRO-MACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour le système d'exploitation Linux, Version 2021.4 Build 20210831 (id : 758087adf), Testé par Intel le 11/09/2021

Comment obtenir les avantages d'Intel

Les processeurs évolutifs Intel Xeon de 3e génération offrent des gains de performances significatifs pour la charge de travail GROMACS qui sont accélérés par les technologies Intel AVX-512 et Intel Deep Learning Boost. Cette accélération offre des avantages significatifs à un nombre de nœuds inférieur (supérieur à 2x). Il devient plus limité à mesure que nous évoluons vers un plus grand nombre de nœuds en raison de la bande passante réseau inférieure de C6i.32xlarge et M6i.32xlarge. Les clients exécutant cette charge de travail GROMACS peuvent réaliser des gains de performances significatifs en déployant sur des types d'instance Intel Xeon Évolutif de 3e génération chez AWS (M6i, C6i) par rapport à l'exécution sur des processeurs évolutifs Intel Xeon de génération précédente de AWS.
Ressources : www.intel.com/HPC