Recherche en génomique végétale à l'université de Delhi

Un système HPC Lenovo équipé de processeurs Intel® Xeon® Scalable de 2ᵉ génération réduit le temps nécessaire à l'obtention d'informations.

En bref :

  • L'université de Delhi est l'un des établissements d'enseignement supérieur les plus importants et les plus réputés d'Inde. Le département de génétique de l'université est devenu un pôle majeur d'enseignement et de recherche en génétique, génomique et biologie moléculaire.

  • Pour accélérer la recherche essentielle sur les plantes oléagineuses, le Centre for Genetic Manipulation of Crop Plants a décidé d'investir dans sa propre infrastructure de calcul intensif dédiée. En étroite collaboration avec Lenovo, le centre a installé deux serveurs Lenovo ThinkSystem, chacun équipé de huit processeurs Intel® Xeon® Platinum 8260, et un système de fichiers en réseau basé sur une baie de stockage hybride Lenovo ThinkSystem.

author-image

Par

Introduction

L'université de Delhi est l'un des établissements d'enseignement supérieur les plus importants et les plus réputés d'Inde, avec une communauté de plus de 62 000 étudiants. Depuis sa création en 1984, le département de génétique de l'université s'est imposé comme un pôle majeur d'enseignement et de recherche en génétique, génomique et biologie moléculaire.

Le département est reconnu internationalement pour les travaux de ses scientifiques sur la génétique végétale et humaine, la sélection végétale, ainsi que l'amélioration et la santé des cultures. Les généticiens de l'université de Delhi effectuent de l'analytique omique (par exemple, génomique, transcriptomique) pour comprendre la base génétique de plusieurs maladies humaines, notamment la schizophrénie, la maladie de Parkinson et la polyarthrite rhumatoïde. Le Centre for Genetic Manipulation of Crop Plants (CGMCP) a été créé en 1996 sur le campus sud de l'université de Delhi grâce à un financement du National Dairy Development Board (NDDB).

Depuis sa création, un des principaux mandats du CGMCP a été d'améliorer la productivité de la moutarde oléagineuse (Brassica juncea). Cette culture est largement répandue dans les zones arides du sous-continent indien comme source d'huile comestible pour la consommation humaine et de farine de graines pour l'alimentation du bétail.

Récemment, les scientifiques du CGMCP ont commencé à utiliser des approches omiques pour comprendre les interactions plantes-pathogènes et les facteurs sous-jacents au rendement élevé de la culture pour différentes variétés de l'espèce.

Défi

Chaque année, le département de génétique de l'université de Delhi lance des dizaines de nouveaux projets de recherche pionniers. La demande de ressources de calcul intensif (HPC) est donc extrêmement élevée. Le département exploite un cluster HPC central auquel tous les membres de la faculté peuvent accéder, mais l'attente était souvent longue pour obtenir des ressources de calcul essentielles.

Pour accélérer la recherche essentielle sur les plantes oléagineuses, le CGMCP a décidé d'investir dans sa propre infrastructure de calcul intensif dédiée. Le centre était à la recherche d'une solution abordable qui offrirait les performances et la capacité de traitement requises pour soutenir l'analytique génomique à grande échelle.

« Les dernières techniques de séquençage génomique produisent de très grandes quantités de données, ce qui nécessite une énorme capacité de calcul et de mémoire pour gérer le traitement et l'analyse à grande échelle. » - Dr. Kumar Paritosh, scientifique, Centre for Genetic Manipulation of Crop Plants, Université de Delhi, Campus Sud.

Calcul intensif de pointe

Le CGMPC a fait appel à Lenovo pour concevoir et déployer une solution de calcul intensif répondant à ses exigences en matière de performances et de mémoire.

Lenovo a proposé le Genomics Optimization and Scalability Tool (GOAST) Plus, une architecture HPC spécifiquement optimisée pour l'analytique génomique. L'ensemble matériel et logiciel préconfiguré, basé sur des serveurs Lenovo ThinkSystem SR950 équipés de processeurs Intel® Xeon® Scalable de 2ᵉ génération, est extrêmement rapide, abordable et facile à utiliser.

Le Dr Paritosh se souvient : « Nous avons été très impressionnés par les spécifications techniques de la solution proposée. Le ThinkSystem SR950 est un serveur à huit sockets, et la capacité de mémoire est un élément important pour les analyses génomiques. Nous sommes impressionnés par les performances du système pour l'assemblage de génomes de novo avec les données générées par les approches de séquençage de troisième génération. »

Pourquoi Lenovo ? Calcul intensif tout-en un pour la génomique

En étroite collaboration avec Lenovo, le CGMPC a installé deux serveurs Lenovo ThinkSystem SR950, chacun équipé de huit processeurs Intel® Xeon® Platinum 82601, et un système de fichiers en réseau (NFS) basé sur une baie de stockage hybride Lenovo ThinkSystem DE2000H.

Le système GOAST comprend le système d'exploitation CentOS, le Genome Analysis Toolkit (quatre types différents de flux de travail d'appel de variants dans le GATK) et la suite logicielle du Broad Institute, ainsi que toutes les autres dépendances logicielles nécessaires à l'exécution du GATK.

L'équipe de Lenovo a configuré et optimisé le système GOAST pour obtenir des performances optimales, en réglant le matériel afin qu'il puisse fonctionner à pleine capacité lors de l'analytique génomique. Lenovo a également créé des scripts faciles à exécuter qui contournent les flux de travail du GATK, complexes et souvent difficiles à configurer, pour simplifier la soumission, le suivi et la gestion des échantillons de génome, ce qui améliore considérablement la convivialité pour les chercheurs.

« L'équipe de Lenovo a fait le maximum pour livrer un système de calcul intensif qui répond aux besoins des chercheurs, tant en termes de performances que d'ergonomie. » - Dr. Kumar Paritosh, scientifique, Centre for Genetic Manipulation of Crop Plants, Université de Delhi, Campus Sud.

Résultats

Avec le système Lenovo GOAST en place, les scientifiques du CGMCP ont accès à de puissantes ressources de calcul intensif extrêmement rapides, abordables et faciles à utiliser. Il est essentiel que le débit élevé (plus d'échantillons analysés en même temps) et les temps d'exécution courts accélèrent le temps nécessaire à l'obtention d'informations.

L'un des principaux domaines de recherche du CGMCP est une variété de moutarde génétiquement modifiée dont les rendements ont augmenté par rapport aux variétés existantes. Pour réduire les besoins de l'Inde en matière d'importation d'huile comestible, les scientifiques du CGMCP s'efforcent d'améliorer cette variété de moutarde en s'appuyant sur la solution HPC de Lenovo. Par exemple, tout en identifiant et en manipulant les gènes liés à la résistance à la sécheresse et aux maladies afin de produire des cultures plus rustiques, le Dr. Kumar pourrait également cartographier, étiqueter et introduire des caractéristiques dans Brassica juncea pour la résistance à Albugo candida, un type de pucciniales qui peut causer de graves dommages aux plantes.

Le Dr Paritosh confirme : « Je peux maintenant traiter plus de génomes simultanément et obtenir des résultats plus rapidement. Auparavant, il fallait 48 heures pour traiter un génome de Brassica juncea ~110X. Maintenant, cela ne prend que six heures, grâce à la multiplication par 8 des performances de GOAST pour les génomes ultra-profonds. »1

 

  • Augmentation des performances de 36x et 8x pour l'analytique de la génomique humaine et végétale, respectivement2
  • 1,3 heure pour traiter un génome entier humain 30X ; 6 heures pour traiter un génome entier Brassica juncea 110X2
  • Obtention accélérée d'informations pour les chercheurs

« Avec le système Lenovo GOAST, je peux analyser davantage de données et découvrir de nouvelles informations plus rapidement. Notre nouvel environnement de calcul intensif alimente des recherches de pointe qui nous aideront à produire des plantes à haut rendement plus nutritives, plus tolérantes à la sécheresse et aux maladies, afin de nourrir le monde. » - Dr. Kumar Paritosh, scientifique, Centre for Genetic Manipulation of Crop Plants, Université de Delhi, Campus Sud.