Comparaison avec les instances M5a dotées de processeurs AMD EPYC sur plusieurs tailles d'instances
La plateforme Amazon EMR (anciennement Amazon Elastic MapReduce) permet aux entreprises de simplifier l'exécution des cadres de big data sur les instances AWS. Le choix d'un type d'instance doté de processeurs plus puissants peut accélérer l'analyse des données et améliorer vos résultats. À l'aide du benchmark TPC-DS 2.4, nous avons mesuré les performances EMR de plusieurs instances EC2 d'Amazon Web Services (AWS). Nous avons constaté que les instances M5 de taille moyenne et de grande taille équipées de processeurs Intel® Xeon® Scalable de 2e génération accélèrent l'analyse des données EMR par rapport aux instances M5a de même taille équipées de processeurs AMD EPYC.
D'après les résultats de ces tests, les entreprises qui cherchent à accélérer les charges de travail EMR (qui comprennent Apache Spark 3.1.1 et Hadoop 3.2.1) pour une analyse plus rapide des données pourraient obtenir des informations plus rapidement en choisissant des instances AWS M5 équipées de processeurs Intel® Xeon® Scalable de 2e génération.
Améliorer les performances d'Amazon EMR jusqu'à 31 % sur des instances de taille moyenne
Pour les instances avec 16 vCPU, l'instance m5.4xlarge activée par des processeurs Intel® Xeon® Scalable de 2e génération a permis d'améliorer les performances d'Amazon EMR jusqu'à 31 % par rapport à l'instance m5a.4xlarge avec des processeurs AMD EPYC (voir figure 1). De même, avec 8 vCPU, l'instance m5.2xlarge a amélioré l'analyse des données volumineuses jusqu'à 19 % par rapport à l'instance m5a.2xlarge.
Améliorer les performances d'Amazon EMR jusqu'à 40 % sur des instances plus grandes
Comme le montre la figure 2, en comparant les instances avec 48 vCPU, l'instance m5.12xlarge activée par des processeurs Intel® Xeon® Scalable de 2e génération a accéléré les performances d'Amazon EMR jusqu'à 28 % par rapport à l'instance m5a.12xlarge basée sur des processeurs AMD EPYC. Avec 32 vCPU, l'instance m5.8xlarge a accéléré l'analyse de 40 % par rapport à l'instance m5a.8xlarge.
Conclusion
Sur les quatre tailles d'instances que nous avons testées, les instances AWS M5 équipées de processeurs Intel® Xeon® Scalable de 2e génération ont amélioré les performances d'Amazon EMR par rapport aux instances AWS M5a équipées de processeurs AMD EPYC de même taille. Ces résultats montrent que les entreprises qui hébergent des plateformes de données volumineuses sur AWS peuvent accélérer l'analyse des données et obtenir des informations plus rapidement en choisissant des instances AWS M5 avec des processeurs Intel® Xeon® Scalable de 2e génération.
En savoir plus
Pour commencer à exécuter vos charges de travail analytiques Amazon EMR sur des instances M5 équipées de processeurs Intel® Xeon® Scalable de 2e génération, visitez le site suivant https://aws.amazon.com/ec2/instance-types/M5/.
Testé par Intel en janvier 2022. Testé sur AWS us-east-1 avec Linux 4.14.225-169.362.amzn2.x86_64 #1 SMP, EMR 6.3.0, Apache Spark 3.1.1, et Hadoop 3.2.1. Toutes les VMs AMD avec AMD EPYC 7571. Détails de l'instance : m5.12xlarge : 5x nœuds, Intel Xeon 8175M, 48 vCPU, 192GB RAM, EBS 512GB, 10Gbps NW BW, 9,500 Mbps Storage BW ; m5.8xlarge : 5x nœuds, Intel Xeon 8259 CL, 32 vCPU, 128GB RAM, EBS 512GB, 10 Gbps NW BW, 6,800 Mbps Storage BW ; m5.4xlarge : 5x nœuds, Intel Xeon 8259CL, 16 vCPU, 64GB RAM, EBS 256GB, 10 Gbps NW BW, 4,750 Mbps Storage BW ; m5.2xlarge : 10x nœuds, Intel Xeon 8259CL, 8 vCPU, 32GB RAM, EBS 128GB, jusqu'à 10Gbps NW BW, jusqu'à 4,750 Mbps Storage BW ; m5a.12xlarge : 5x nœuds, 48 vCPU, 192GB RAM, EBS 512GB, 10 Gbps NW BW, 6,780 Mbps Storage BW ; m5a.8xlarge : 5x nœuds, 32 vCPU, 128GB RAM, EBS 512GB, jusqu'à 10Gbps NW BW, 4,750 Mbps Storage BW ; m5a.4xlarge : 5x nœuds, 16 vCPU, 64GB RAM, EBS 256GB, jusqu'à 10Gbps NW BW, 2,880 Mbps Storage BW ; m5a.2xlarge : 10x noeuds, 8 vCPUs, 32GB RAM, EBS 128GB, jusqu'à 10Gbps NW BW, jusqu'à 2,880 Mbps Storage BW.