LE DÉFI FOU DU SUPERCALCUL
Par PAR THIERRY LUCAS - Publié le | L'Usine Nouvelle n° 3222
© PHOTOS D.R.
En 2018, les supercalculateurs atteindront l'exaflops et seront 1 000 fois plus puissants que les machines actuelles. Il leur faudra alors multiplier par 300 leur efficacité énergétique et s'accommoder d'un flux continu de pannes désormais inévitables.
Quatre centrales nucléaires EPR pour alimenter un ordinateur, est-ce bien raisonnable ? Assurément non. C'est pourtant l'énergie que demanderait la future génération de supercalculateurs, attendue pour 2018, si on les construisait avec les technologies d'aujourd'hui. Ces ordinateurs 1 000 fois plus puissants que les plus grosses machines actuelles atteindront l'exaflops, soit 1 milliard de milliards d'opérations par seconde. Un chiffre astronomique qui laisse rêveur. Mais les utilisateurs du calcul, dans l'industrie comme dans la recherche, savent déjà ce qu'ils vont faire de ce surcroît de puissance : améliorer la modélisation des réservoirs pétroliers, accélérer le criblage de médicaments, simuler un avion en vol... Pour satisfaire cette demande, les constructeurs informatiques et les grands centres de recherche sont déjà sur la brèche. Car le passage à l'exaflops, loin d'être une simple évolution du matériel informatique, est un véritable changement d'échelle. Si Blue Waters, le prochain supercalculateur qu'IBM doit livrer cette année, contiendra 300 000 coeurs de processeurs pour une puissance de 10 petaflops, les machines exaflopiques, elles, pourront en aligner 1 milliard !
1. Coordonner des millions de coeurs
L'évolution des processeurs ne suffira pas à atteindre l'exaflops. « La loi de Moore, qui permet de compter sur le doublement de la puissance des processeurs tous les deux ans, nous donne un facteur 30. Il faut trouver les moyens de gagner un autre facteur 30 », résume Pascal Barbolosi, le vice-président de l'Extreme computing chez Bull. Ce Tera 100, un supercalculateur de 1,05 petaflops, a été inauguré à la fin 2010 au CEA pour des calculs de simulation nucléaire.
Pour changer d'échelle, la recette est connue. Il faut mettre en parallèle un nombre aussi grand que possible de coeurs de processeurs. Mais plus le nombre d'unités de traitement augmente, plus un logiciel a du mal à exploiter la puissance disponible. Tous les calculs ne sont en effet pas « parallélisables », c'est-à-dire divisibles en multiples sous-calculs répartis entre les processeurs fonctionnant en parallèle. Avec des dizaines de milliers de processeurs, certaines applications sont loin de tourner à la vitesse record que l'on prête à la machine. Avec des millions de processeurs, tout est à revoir. « Fini le temps où l'on pouvait miser sur l'évolution du matériel pour augmenter les performances ! », s'exclame William Jalby, le responsable scientifique du centre Exascale Computing Research, le laboratoire européen créé récemment par Intel avec le CEA, le Genci, et installé à l'université de Versailles Saint-Quentin-en-Yvelines. Pour atteindre l'exaflops, le lien entre le matériel et le logiciel est la clé de la performance. Ce qui suppose de développer de nouveaux systèmes d'exploitation et des méthodes de programmation. De là à penser qu'il va falloir réécrire les énormes codes de calculs déjà mis au point dans l'énergie nucléaire, l'automobile ou l'aéronautique... « On fera tout pour éviter ça », affirme-t-on chez IBM. Mais pour certains grands utilisateurs, pas d'illusions à se faire : l'exaflops est à ce prix.
2. Mettre les calculateurs au régime
L'autre conséquence de la prolifération des processeurs - et de leur mémoire associée - est l'explosion de la consommation d'énergie de l'ordinateur. Au point que le paramètre de référence, dans le classement des supercalculateurs, devient le nombre d'opérations à la seconde rapporté à la puissance électrique : la performance se mesure désormais en Gflops par watt (Gflops/W). L'objectif est fixé : la machine exaflopique devra fonctionner à raison de 50 Gflops par watt. On en est loin ! Le Tera 100 du CEA, qui a fait de gros efforts pour limiter sa consommation, affiche 140 Mflops/W. D'ici à 2018, il va donc falloir multiplier par 300 l'efficacité énergétique des machines.
Réduire la consommation des composants ne suffira pas. « Dans les futurs calculateurs, la communication entre les composants et les mouvements de données représenteront une part majeure de la consommation », indique Luigi Brochard, expert en calcul haute performance chez IBM Europe. Les nouvelles méthodes de programmation auront pour impératif de minimiser les mouvements de données. Côté matériel, les liaisons optiques vont se généraliser. Jusqu'à s'intégrer dans les puces, comme l'ont montré tout récemment des chercheurs d'IBM qui présentaient un prototype de circuit sur silicium comprenant ses propres modules de communication optique.
Autre levier pour gagner en efficacité : construire des ordinateurs « mixtes », qui associent des processeurs généralistes et des processeurs graphiques (GPU). On a découvert qu'ils pouvaient accélérer certains calculs à moindre coût énergétique. Le supercalculateur chinois Tianhe-1A, premier du classement mondial (atteignant 2,5 Pflops pour 4 MW) depuis octobre 2010, fait un usage intensif de puces graphiques fournies par le spécialiste nVidia. Ce dernier a d'ailleurs été retenu par la Darpa, l'agence de la défense américaine, pour travailler sur un projet exaflops. Cray, le vétéran des fabricants de supercalculateurs, pense lui aussi atteindre l'exaflops en 2018 en associant étroitement processeurs généralistes et processeurs graphiques. « Il faudra intégrer sur une puce les deux types de processeurs. Cela commence à se faire », souligne Jean-Pierre Panziera, le directeur technique chez Bull pour l'Extreme computing.
Réduire la consommation des supercalculateurs, c'est aussi un vulgaire problème de tuyauteries : le système de refroidissement des machines, indispensable pour que l'électronique puisse continuer à fonctionner, représente une part croissante de la consommation électrique. Là encore, des ruptures sont nécessaires. Refroidir avec de l'air ne suffit plus. Bull a introduit des circulations d'eau glacée dans les portes des armoires du Tera 100. IBM a installé à l'Institut technologique de Zurich (ETH) un prototype de calculateur, Aquasar, de puissance modeste (6 Tflops). Mais il est parcouru par un réseau de canaux placé directement sur les cartes électroniques. Originalité : Aquasar est refroidi par de l'eau à 60 °C, ce qui limite encore la consommation. Prochaine étape : des puces constituées d'empilement 3 D et refroidies par un réseau de microcanaux (voir le schéma). « La technologie d'empilement 3 D, plus compacte, réduit la consommation. Associée au refroidissement direct des puces par liquide, elle offre une solution pour l'exaflops », affirme Bruno Michel, chercheur au centre IBM de Zurich.
3. Résister à un flot continu de pannes
La statistique est impitoyable : augmenter le nombre de processeurs multiplie le nombre de pannes. Le problème n'est pas nouveau. Avec des dizaines de millions de coeurs actifs simultanément, il devient rédhibitoire : le calcul ne peut plus être exécuté. « À l'échelle de l'exaflops, les erreurs et les défaillances devront être considérées comme des événements normaux. Un flux continu auquel le système devra pouvoir résister », explique Franck Cappello, codirecteur du laboratoire commun à l'Inria et à l'université de l'Illinois, qui travaille sur les défis fondamentaux posés par l'exaflops. Le centre de calcul NCSA de l'université accueillera en 2011 le Blue Waters d'IBM, qui devrait atteindre 10 Pflops. Les spécialistes de la « résilience » (la capacité de la machine à fonctionner malgré les pannes) s'intéressent à deux types de problèmes. Les erreurs transitoires, dues au matériel ou au logiciel, qui perturbent le calcul. Et les pannes, qui arrêtent le déroulement de l'application. Jusqu'ici, les informaticiens savent s'en débrouiller. Les processeurs intègrent des codes de correction d'erreurs toujours plus sophistiqués et des opérations de sauvegarde régulières de l'état de l'application sont effectuées. Cela afin de redémarrer facilement en cas de blocage. Les codes d'erreurs occupant déjà 12 à 15 % de la mémoire et les sauvegardes engendrant d'énormes flux d'information vers des mémoires de stockage gigantesques, on conçoit que ces solutions soient bientôt inapplicables.
Les constructeurs et les laboratoires explorent plusieurs pistes : des sauvegardes partielles sur des disques locaux, la migration instantanée des tâches lorsqu'une partie de la machine s'arrête, la prévision des défaillances, des logiciels de calcul qui s'accommoderont des pannes... La question est d'autant plus cruciale que, lorsqu'il faut redémarrer 100 millions de coeurs, la facture énergétique s'en ressent. Les plus grosses machines actuelles consacrent 20 % de l'énergie qu'elles consomment à éviter de tomber en panne. Un signe de plus qu'il est temps de revoir leur conception de fond en comble.
Modéliser complètement un réservoir pétrolier Calculer le comportement d'un avion en vol Simuler des systèmes biologiques complexes Analyser des données sur internet (réseaux sociaux...)
Les progrès réalisés dans la gestion des calculs parallèles et surtout dans la maîtrise de la consommation d'énergie auront des retombées dans toute l'informatique. Particulièrement dans les équipements portables. Dans dix ans, la puissance de calcul embarquée dans un smartphone sera considérable. Les travaux visant à garantir la fiabilité des super-ordinateurs, malgré l'augmentation statistique des erreurs et des pannes, permettront d'améliorer le fonctionnement des systèmes informatiques de toutes tailles (système d'exploitation des postes de travail...).
Des canaux de 50 microns de diamètre, parcourus par un fluide réfrigérant, assurent le refroidissement d'un empilement de coeurs de processeurs interconnectés. Ce type d'architecture électronique très compacte est étudié par le projet CMosaic. Ce dernier associe IBM à l'École polytechnique fédérale de Lausanne (EPFL) et à l'Institut technologique fédéral de Zurich (ETH).
BULL Son record de puissance : 1,05 petaflops (2010) Sa machine : Le Tera 100, inauguré récemment au centre de calcul du CEA-DAM. Sa voie vers l'exaflops Le français fabrique des machines à base de processeurs Intel et des supercalculateurs à architecture mixte. Pour monter en puissance, il mise sur de futures puces qui intégreront processeurs généralistes et graphiques. CRAY Son record de puissance : 1,75 petaflops (2009) Sa machine : Le XT5 Jaguar, installé à l'Oak Ridge National Laboratory. Sa voie vers l'exaflops Le créateur du mythique Cray 1 vise l'exaflops en 2018, en associant étroitement processeurs généralistes et processeurs graphiques. En Europe il a créé un centre de technologie exascale avec l'université d'Édimbourg. IBM Son record de puissance : 20 petaflops (fin 2011) Sa machine : Le Blue Gene /Q, qui doit être livré au Lawrence Livermore National Laboratory. Sa voie vers l'exaflops Pour optimiser la consommation électrique de la machine en augmentant la puissance, IBM développe deux options : un grand nombre de coeurs à faible fréquence (Blue Gene) ou un nombre restreint de coeurs à haute fréquence. INTEL Son record de puissance : 2,57 petaflops (2010) Sa machine : Des processeurs Intel équipent le dernier numéro un en date, l'ordinateur chinois Tianhe-1A. Sa voie vers l'exaflops Intel est l'un des quatre industriels sélectionnés par l'agence de la défense américaine, pour développer des prototypes de machines Exaflops. En Europe, Intel a créé trois centres de recherche. NVIDIA Son record de puissance : 2,57 petaflops (2010) Sa machine : Le fabricant de processeurs graphiques est partie prenante du Tianhe-1A, qui utilise des milliers de ses puces. Sa voie vers l'exaflops Le recours à des processeurs graphiques, dont le rapport performance-consommation d'énergie est très avantageux.

dans la même rubrique
26/05/2012 La sémantique de l'industrie26/05/2012 L'impression 3D détournée par l'artiste Neri Oxman
26/05/2012 "Je suis fasciné par les technologies sans fil"












