Analysez davantage de données avec un débit jusqu’à 1,72 fois supérieur pour les charges de travail Apache Spark avec des instances Amazon EC2 M5n équipées de processeurs Intel Xeon scalables de 2e génération

Apache Spark

  • Analysez davantage de données avec un débit 1,57 fois supérieur sur les petites instances.

  • Débit 1,42 fois plus important sur des instances moyennes.

  • Débit 1,72 fois plus élevé sur les grandes instances.

author-image

Par

Les instances des services Web Amazon série M5n sont Intel® Xeon® processeurs évolutifs

Boostez le débit du machine learning avec les instances Amazon EC2 série M5n de 2e génération Intel Xeon évolutives

Alors que le Big Data continue de croître, les organisations doivent trouver des moyens de trier et d’exploiter les enseignements tirés de ces données pour rester agiles sur le marché. L’exécution de l’analyse de données dans le Cloud décharge les problèmes d’administration prém, mais il peut être difficile de déterminer l’impact que le choix de l’instance peut avoir sur les performances des charges de travail complexes d’analyse de données. Pour les charges de travail Apache Spark sur Amazon EC2, la sélection des instances M5n activées par les processeurs Intel Xeon Scalable de 2e génération peut fournir un débit supérieur pour trier davantage de données à la fois pour vous donner des informations plus rapidement.

Dans les tests de deux implémentations de machine learning comparant des instances Amazon EC2, des instances plus récentes de la série M5n activées par les Intel Xeon de 2e génération.

Les processeurs évolutifs ont surpassent les instances plus anciennes de la série M4 avec les processeurs Intel Xeon E5 v4, offrant un débit de données jusqu’à 1,72 fois supérieur pour les charges de travail Apache Spark.

Que vos charges de travail d’apprentissage automatique nécessitent des tailles d’instances petites, moyennes ou grandes, la sélection d’instances série M5n équipées de processeurs Intel Xeon scalables de 2e génération sur des instances M4 plus anciennes peut analyser davantage de données et fournir des informations exploitables plus rapidement.

Améliorer le délai d’analyse des petites instances

Toutes les données qu’une organisation collecte ne sont que très resserrables s’ils peuvent rapidement le comprendre. Par exemple, les prédictions de préférences des clients et les inférences similaires doivent fonctionner en temps réel pour avoir un impact sur l’entreprise, et cela nécessite une technologie mise à jour qui peut fournir des résultats plus rapidement.

Figure 1. Comparaison des débits relatifs sur de petites instances (8 vCPU/32 Go de RAM) pour la classification Bayesian Naïve et les charges de travail de clustering k-means de la suite de bancs d’essai HiBench.

Les tests comparant de petites instances avec huit vCPU montrent que le choix des instances Amazon EC2 M5n équipées de processeurs Intel® Xeon® Scalable de 2e génération offre un débit jusqu’à 1,57 fois celui des charges de travail d’apprentissage automatique Apache Spark des instances de la série M4 avec des processeurs Intel Xeon E5 v4.

Améliorer le délai d’analyse sur les instances moyennes

Comme pour les petites instances, les tests comparant des instances moyennes avec 16 vCPU ont montré que les instances Amazon EC2 M5n équipées de processeurs Intel® Xeon® Scalable de 2e génération ont amélioré les deux implémentations de machine learning sur Apache Spark, offrant dans ce cas un débit jusqu’à 1,42 fois celui des instances M4 plus anciennes.

Figure 2. Comparaison des débits relatifs sur des instances moyennes (16 vCPU/64 Go de RAM) pour la classification Bayesian Naïve et les charges de travail de clustering k-means de la suite de bancs d’essai HiBench.

Améliorer le délai d’analyse sur les grandes instances

Les tests montrent que les grandes tailles d’instances (avec 64 vCPU) ont connu l’augmentation la plus spectaculaire des performances de machine learning, offrant jusqu’à 1,72 fois le débit des instances de la série M4 pour une charge de travail de clustering k-means.

Figure 3. Comparaison du débit relatif sur de grandes instances (64 vCPU/256 Go de RAM) pour la classification Bayesian naïve et les charges de travail de clustering k-means de la suite de bancs d’essai HiBench.

Cela signifie que les entreprises qui cherchent à obtenir rapidement des informations exploitables à partir des données peuvent bénéficier de la sélection d’instances Amazon EC2 M5n améliorées activées par les processeurs Intel Xeon scalable de 2e génération, quelle que soit la taille des instances dont ils ont besoin.

Pour en savoir plus

Pour commencer vos déploiements Apache Spark sur des instances Amazon EC2 M5n avec des processeurs Intel Xeon scalable de 2e génération, rendez-vous sur http://intel.com/AWS.

Pour plus de détails sur le test, consultez http://facts.pt/3Kjn66x.

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.