Pourquoi avons-nous besoin de superordinateurs et qui les utilise ?

, Author

(Superordinateur Sierra au Lawrence Livermore National Laboratory en Californie.)

Alors que les États-Unis rivalisent avec la Chine pour construire les superordinateurs les plus rapides, vous vous demandez peut-être comment ces machines géantes sont utilisées.

Un superordinateur peut contenir des centaines de milliers de cœurs de processeurs et nécessiter un bâtiment entier pour les abriter et les refroidir – sans parler des millions de dollars pour les créer et les entretenir. Mais malgré ces défis, de plus en plus de superordinateurs vont être mis en ligne, car les États-Unis et la Chine développent de nouveaux superordinateurs « exascale », qui promettent une multiplication par cinq des performances par rapport aux principaux systèmes actuels.

Alors, qui a besoin de toute cette puissance de calcul et pourquoi ? Pour le savoir, PCMag a visité le Lawrence Livermore National Laboratory en Californie, qui abrite plusieurs superordinateurs, dont le deuxième plus rapide au monde, Sierra. C’est là que nous avons appris comment les ingénieurs système entretiennent les machines pour servir les chercheurs scientifiques, mais aussi pour tester quelque chose auquel on ne s’attend pas : les armes nucléaires.

Un système classifié

Un millier de personnes entretiennent les superordinateurs du laboratoire et créent des programmes pour eux.

Lorsque vous visitez Sierra, vous remarquerez les mots « classifié » et « données secrètes restreintes » affichés sur le superordinateur, qui est composé de 240 racks semblables à des serveurs. Les avertissements existent parce que Sierra traite des données impliquant le stock nucléaire des États-Unis, y compris la façon dont les armes devraient exploser dans le monde réel.

Les États-Unis ont effectué leur dernier essai réel d’armes nucléaires en 1992. Depuis lors, le pays a utilisé des superordinateurs pour aider à réaliser les expériences virtuellement, et Sierra fait partie de cette mission. La machine a été achevée l’année dernière principalement pour aider le gouvernement américain à surveiller et à tester l’efficacité de l’arsenal nucléaire vieillissant du pays, qui doit être régulièrement entretenu.

« La seule façon dont une force de dissuasion fonctionne est de savoir qu’elle peut fonctionner, et que votre adversaire sait et croit également qu’elle fonctionne », a déclaré Adam Bertsch, ingénieur en systèmes de calcul à haute performance au laboratoire.

Exemples de simulations effectuées au centre de supercalcul du laboratoire. A gauche, une expérience de recherche sur l’énergie de fusion impliquant le chauffage et la compression d’une cible de combustible avec 192 lasers. À droite, une simulation liée à l’hydrodynamique d’une « interaction de choc à triple point ».

Sans surprise, la simulation d’une explosion nucléaire nécessite beaucoup de mathématiques. Les principes fondamentaux de la science peuvent prédire comment les particules interagissent entre elles dans différentes conditions. Le gouvernement américain possède également des décennies de données collectées à partir de tests nucléaires réels. Les scientifiques ont combiné ces informations pour créer des équations à l’intérieur de modèles informatiques, qui peuvent calculer comment une explosion nucléaire va se déclencher et changer au fil du temps.

En gros, vous essayez de tracer une réaction en chaîne. Donc, pour que les modèles soient précis, ils ont été conçus pour prédire une détonation nucléaire au niveau moléculaire en utilisant la physique du monde réel. Le défi est que le calcul de ce que feront toutes ces particules nécessite beaucoup de chiffres.

PCMag Tech Deals

Looking For Deals On The Latest Tech?

Cette newsletter peut contenir de la publicité, des offres ou des liens affiliés. L’abonnement à une lettre d’information indique votre consentement à nos conditions d’utilisation et à notre politique de confidentialité. Vous pouvez vous désabonner à tout moment.

Entrez dans Sierra. Ce superordinateur possède 190 000 cœurs de processeurs CPU et 17 000 cœurs GPU. Toute cette puissance de calcul signifie qu’il peut prendre une tâche énorme, comme la simulation de la fission nucléaire, et la décomposer en plus petits morceaux. Chaque cœur peut alors traiter une petite partie de la simulation et communiquer les résultats au reste de la machine. Le processus se répétera encore et encore alors que le superordinateur tente de modéliser une explosion nucléaire d’une seconde à l’autre.

« Vous pouvez faire une simulation complète d’un dispositif nucléaire dans l’ordinateur », a ajouté Bertsch. « Vous pouvez découvrir que cela fonctionne, à quel point cela fonctionne exactement et quels types d’effets se produiraient. »

Une machine de recherche

Des grappes de câbles aident Sierra à échanger des données. D’autres câbles contiennent de l’eau pour maintenir le système au frais.

La capacité d’un superordinateur à calculer et à modéliser les interactions entre les particules explique pourquoi il est devenu un outil si important pour les chercheurs. En un sens, les réactions se produisent tout autour de nous. Il peut s’agir du temps qu’il fait, de la façon dont une étoile se forme ou du contact des cellules humaines avec un médicament.

Un superordinateur peut simuler toutes ces interactions. Les scientifiques peuvent ensuite exploiter les données pour en tirer des enseignements utiles, par exemple pour savoir s’il pleuvra demain, si une nouvelle théorie scientifique est valable ou si un traitement anticancéreux à venir est prometteur.

Ces mêmes technologies peuvent également permettre aux industries d’explorer d’innombrables nouveaux concepts et de déterminer ceux qui méritent d’être testés dans le monde réel. C’est pourquoi le laboratoire a connu une énorme demande pour ses deux douzaines de superordinateurs.

« Quelle que soit la puissance de calcul dont nous disposions, les gens l’utilisaient et en demandaient davantage », a déclaré Bertsch.

Cela explique également pourquoi le gouvernement américain veut un superordinateur exascale. La puissance de calcul supplémentaire permettra aux scientifiques de développer des simulations plus avancées, comme recréer des interactions de particules encore plus petites, ce qui pourrait ouvrir la voie à de nouvelles percées dans la recherche. Les systèmes exascale seront également en mesure de mener à bien les projets de recherche actuels en moins de temps. « Ce que vous deviez auparavant passer des mois à faire pourrait ne prendre que quelques heures », a ajouté Bertsch.

Un chercheur se connecte à un superordinateur du laboratoire en ligne via un PC Linux. Un  » travail  » peut être mis en file d’attente en utilisant simplement une application en ligne de commande.

Sierra fait partie d’un réseau classifié non connecté à l’internet public, qui est accessible à environ 1 000 chercheurs approuvés dans des programmes scientifiques affiliés. Environ 3 000 personnes effectuent des recherches sur des superordinateurs non classifiés, qui sont accessibles en ligne à condition d’avoir un compte utilisateur et les bons identifiants de connexion. (Désolé, mineurs de bitcoin.)

« Nous avons des gens qui achètent l’ordinateur au moment de l’acquisition », a déclaré Bertsch. « Le montant d’argent que vous mettez en corrélation avec le pourcentage de la machine que vous avez acheté. »

Un système de planification est utilisé pour assurer votre « juste part » avec la machine. « Il essaie d’orienter votre utilisation vers le pourcentage qui vous a été attribué », ajoute Bertsch. « Si vous avez utilisé moins que votre part équitable au fil du temps, votre priorité augmente et vous serez exécuté plus tôt. »

Les simulations sont toujours en cours. Un superordinateur peut exécuter des milliers de tâches à tout moment. Une machine peut également traiter ce qu’on appelle un « hero run », c’est-à-dire un travail unique si important que tout le superordinateur est nécessaire pour le terminer dans un temps raisonnable.

Keeping It Up And Running

Les entrailles d’un autre superordinateur, Sequoia. Un rack n’est pas très différent d’un serveur.

Sierra est un superordinateur, mais la machine a été largement fabriquée avec des pièces de base. Les processeurs, par exemple, sont des puces de qualité professionnelle d’IBM et de Nvidia, et le système lui-même fonctionne avec Red Hat Enterprise Linux, un système d’exploitation populaire parmi les vendeurs de serveurs.

« À l’époque, les superordinateurs étaient ces gros blocs monolithiques et ésotériques de matériel », a déclaré Robin Goldstone, architecte de solutions de calcul à haute performance du laboratoire. « De nos jours, même les plus grands systèmes du monde ne sont essentiellement qu’un ensemble de serveurs connectés entre eux. »

Pour maximiser son utilisation, un système comme Sierra doit être capable de mener différents types de recherche. Le laboratoire a donc entrepris de créer une machine polyvalente. Mais même un superordinateur n’est pas parfait. Le laboratoire estime que toutes les 12 heures, Sierra subira une erreur pouvant impliquer un dysfonctionnement matériel. Cela peut sembler surprenant, mais pensez que c’est comme posséder 100 000 ordinateurs ; les pannes et les réparations sont inévitables.

« Les choses les plus courantes qui tombent en panne sont probablement les DIMM de mémoire, les alimentations électriques, les ventilateurs », a déclaré Goldstone. Heureusement, Sierra est tellement énorme qu’il dispose d’une grande capacité. Le superordinateur crée aussi régulièrement des sauvegardes de mémoire au cas où une erreur perturberait un projet.

« Dans une certaine mesure, ce n’est pas exactement comme un PC que vous avez à la maison, mais une saveur de cela », a ajouté Goldstone. « Prenez les joueurs qui sont obsédés par l’obtention de la mémoire la plus rapide, et du GPU le plus rapide, et c’est la même chose qui nous obsède. Le défi avec nous, c’est que nous en avons tellement qui tournent en même temps. »

Sous les superordinateurs se trouve un système de tuyauterie qui envoie de l’eau à température ambiante pour maintenir les machines au frais. Sierra est refroidi à 80 % par l’eau et à 20 % par l’air.

Sierra lui-même se trouve dans une salle de 47 000 pieds carrés, qui est remplie du bruit des ventilateurs qui gardent le matériel au frais. Un niveau en dessous de la machine se trouve le système de pompage d’eau du bâtiment. Chaque minute, il peut envoyer des milliers de gallons dans des tuyaux, qui alimentent ensuite les racks du superordinateur et font circuler l’eau à nouveau.

Sur le front de l’énergie, le laboratoire a été équipé pour fournir 45 mégawatts – ou assez d’électricité pour une petite ville. Environ 11 de ces mégawatts ont été délégués à Sierra. Cependant, la consommation d’énergie d’un superordinateur peut parfois susciter des plaintes de la part des compagnies d’énergie locales. Lorsqu’une application plante, les demandes d’énergie d’une machine peuvent soudainement chuter de plusieurs mégawatts.

Le fournisseur d’énergie « n’aime pas ça du tout. Parce qu’ils doivent se délester de la charge. Ils paient pour l’électricité », a déclaré Goldstone. « Ils nous ont appelés au téléphone et ont dit : « Pouvez-vous ne plus faire ça ? » »

Le futur Exascale

L’année dernière, Sequoia s’est classé comme le 10e superordinateur le plus rapide du monde. Mais il sera bientôt remplacé par une machine plus puissante.

Le Lawrence Livermore National Lab abrite également un autre supercalculateur appelé Sequoia, qui a brièvement régné comme le meilleur système au monde en 2012. Mais le laboratoire prévoit de le mettre hors service dans le courant de l’année pour faire place à un superordinateur plus grand et plus performant, appelé El Capitan, qui fait partie des superordinateurs exascale prévus par le gouvernement américain.

S’attendre à ce qu’il soit mis en ligne en 2023. Mais il ne sera pas seul. El Capitan rejoindra deux autres systèmes exascale, pour la construction desquels les États-Unis dépensent plus d’un milliard de dollars. Tous deux seront achevés en 2021 dans des laboratoires distincts de l’Illinois et du Tennessee.

« À un moment donné, je continue à penser : « N’est-ce pas assez rapide ? Combien plus rapide avons-nous vraiment besoin que ces ordinateurs soient ?' ». a déclaré Goldstone. « Mais il s’agit plutôt de pouvoir résoudre des problèmes plus rapidement ou d’étudier des problèmes à plus haute résolution, afin que nous puissions vraiment voir quelque chose aux niveaux moléculaires. »

Mais l’industrie des superordinateurs devra finalement innover. Il n’est tout simplement pas viable de continuer à construire des machines plus grandes qui consomment plus de puissance et prennent plus d’espace physique. « Nous repoussons les limites de ce que la technologie actuelle peut faire », a-t-elle déclaré. « Il va falloir faire des progrès dans d’autres domaines que les puces informatiques traditionnelles à base de silicium pour nous amener à ce prochain niveau. »

En attendant, le laboratoire a travaillé avec des fournisseurs tels qu’IBM et Nvidia pour résoudre les goulots d’étranglement immédiats, notamment en améliorant l’architecture réseau d’un superordinateur afin qu’il puisse communiquer rapidement entre les différents clusters, ainsi que la fiabilité des composants. « La vitesse des processeurs n’a tout simplement plus d’importance », a-t-elle ajouté. « Aussi rapides que soient les processeurs, nous sommes limités par la bande passante de la mémoire. »

Le laboratoire annoncera plus de détails sur El Capitan dans le futur. Quant à l’ordinateur qu’il remplace, Sequoia, le système se dirige vers l’oubli.

Pour des raisons de sécurité, le laboratoire prévoit de broyer chaque pièce de la machine et de recycler ses restes. Les superordinateurs peuvent finir par exécuter des données gouvernementales classifiées, il est donc vital que toute trace de ces informations soit complètement purgée – même si cela signifie transformer la machine en ferraille. Cela peut sembler extrême, mais des erreurs peuvent être commises en essayant de supprimer virtuellement les données, le laboratoire doit donc être absolument sûr que les données ont définitivement disparu.

À propos de Michael Kan

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.