(Sierra szuperszámítógép a kaliforniai Lawrence Livermore Nemzeti Laboratóriumban.)
Amíg az USA Kínával versenyez a leggyorsabb szuperszámítógépek megépítéséért, talán kíváncsiak vagyunk, hogyan használják ezeket az óriásgépeket.
Egy szuperszámítógép több százezer processzormagot tartalmazhat, és egy egész épületet igényel az elhelyezése és hűtése – nem is beszélve a létrehozásukra és karbantartásukra fordított dollármilliókról. De e kihívások ellenére egyre több és több fog üzembe állni, ahogy az USA és Kína új “exascale” szuperszámítógépeket fejleszt, amelyek ötszörös teljesítménynövekedést ígérnek a jelenlegi vezető rendszerekhez képest.
Hát kinek van szüksége ennyi számítási teljesítményre és miért? Hogy ezt kiderítsük, a PCMag ellátogatott a kaliforniai Lawrence Livermore Nemzeti Laboratóriumba, amely több szuperszámítógépnek ad otthont, köztük a világ második leggyorsabbjának, a Sierrának. Ott megtudtuk, hogy a rendszermérnökök hogyan tartják karban a gépeket, amelyek a tudományos kutatókat szolgálják, de olyasmit is tesztelnek, amire talán nem is számítanánk: nukleáris fegyvereket.
Egy titkos rendszer
Nagyjából 1000 ember tartja karban a laboratórium szuperszámítógépeit, és készít programokat számukra.
Aki meglátogatja a Sierrát, észreveheti a “titkos” és “titkos, korlátozottan hozzáférhető adatok” feliratokat a szuperszámítógépen, amely 240 szerverszerű állványból áll. A figyelmeztetések azért vannak, mert a Sierra az USA nukleáris készletét érintő adatokat dolgoz fel, beleértve azt is, hogy a fegyvereknek hogyan kellene felrobbanniuk a való világban.
Az USA 1992-ben hajtotta végre az utolsó éles atomfegyver-kísérletét. Azóta az ország szuperszámítógépekkel segíti a kísérletek virtuális végrehajtását, és a Sierra része ennek a küldetésnek. A gép tavaly készült el, elsősorban azért, hogy segítse az amerikai kormányt az ország elöregedő nukleáris arzenálja hatékonyságának ellenőrzésében és tesztelésében, amelyet rendszeresen karbantartani kell.
“Egy elrettentő eszköz csak akkor működik, ha tudod, hogy működőképes, és az ellenfeled is tudja és hiszi, hogy működik” – mondta Adam Bertsch, a laboratórium nagy teljesítményű számítási rendszerek mérnöke.
Példák a laboratórium szuperszámítógépes központjában végzett szimulációkból. Balra egy fúziósenergia-kutatási kísérlet, amely egy üzemanyagcélpont 192 lézerrel történő felmelegítését és összenyomását foglalja magában. Jobbra egy hidrodinamikával kapcsolatos szimuláció egy “hárompontos lökés kölcsönhatásról.”
Nem meglepő, hogy egy nukleáris robbanás szimulációja sok matematikát igényel. A tudomány alapelvei megjósolhatják, hogy a részecskék különböző körülmények között hogyan fognak egymással kölcsönhatásba lépni. Az amerikai kormány is rendelkezik évtizedes adatokkal, amelyeket valódi nukleáris tesztekből gyűjtöttek össze. A tudósok ezeket az információkat kombinálták, hogy a számítógépes modellekben olyan egyenleteket hozzanak létre, amelyek képesek kiszámítani, hogy egy nukleáris robbanás hogyan fog lezajlani és idővel változni.
Lényegében egy láncreakciót próbálsz feltérképezni. Ezért, hogy a modellek pontosak legyenek, úgy tervezték őket, hogy a valós fizika segítségével molekuláris szinten előre jelezzenek egy nukleáris detonációt. A kihívás az, hogy annak kiszámítása, hogy mit fognak csinálni ezek a részecskék, rengeteg számfejtést igényel.
Looking for Deals On The Latest Tech?
This newsletter may contain advertising, deals, or affiliate links. A hírlevélre való feliratkozással hozzájárul a Felhasználási feltételekhez és az Adatvédelmi irányelvekhez. Bármikor leiratkozhat.
Enter Sierra. A szuperszámítógép 190 000 CPU processzormaggal és 17 000 GPU maggal rendelkezik. Ennyi számítási teljesítmény azt jelenti, hogy képes egy hatalmas feladatot, például a maghasadás szimulációját kisebb darabokra bontani. Minden egyes mag képes feldolgozni a szimuláció egy apró darabkáját, és az eredményeket közölni a gép többi részével. A folyamat újra és újra megismétlődik, ahogy a szuperszámítógép egyik másodpercről a másikra megpróbál modellezni egy nukleáris robbanást.
“Egy nukleáris eszköz teljes szimulációját el lehet végezni a számítógépben” – tette hozzá Bertsch. “Megtudhatjuk, hogy működik-e, pontosan mennyire jól működik, és milyen hatások következnének be.”
Egy kutatógép
Kábelfürtök segítik a Sierra adatcseréjét. Más kábelek vizet tartalmaznak, hogy a rendszert hűvösen tartsák.
A szuperszámítógépek képesek kiszámítani és modellezni a részecskék kölcsönhatásait, ezért váltak olyan fontos eszközzé a kutatók számára. Bizonyos értelemben a reakciók körülöttünk zajlanak. Ilyen lehet az időjárás, az, hogy hogyan alakul ki egy csillag, vagy amikor az emberi sejtek kapcsolatba kerülnek egy gyógyszerrel.
A szuperszámítógép képes szimulálni mindezeket a kölcsönhatásokat. A tudósok aztán az adatokból hasznos felismerésekre juthatnak, például arra, hogy holnap esni fog-e az eső, hogy érvényes-e egy új tudományos elmélet, vagy hogy egy közelgő rákkezelés ígéretes-e.
Ugyanezekkel a technológiákkal az iparágak is számtalan új tervet vizsgálhatnak, és kitalálhatják, melyeket érdemes a való világban kipróbálni. Ez az oka annak, hogy a laboratóriumban hatalmas kereslet mutatkozott a két tucat szuperszámítógép iránt.
“Nem számított, hogy mennyi számítási teljesítményünk volt, az emberek elhasználták és többet kértek” – mondta Bertsch.
Ez magyarázza azt is, hogy az amerikai kormány miért akar exascale szuperszámítógépet. Az extra számítási teljesítmény lehetővé teszi a tudósok számára, hogy fejlettebb szimulációkat fejlesszenek ki, például még kisebb részecskék kölcsönhatásának újrateremtését, ami új kutatási áttörésekhez vezethet. Az exascale rendszerek a jelenlegi kutatási projekteket is rövidebb idő alatt tudják majd befejezni. “Amivel korábban hónapokat kellett eltölteni, lehet, hogy csak órákba telik” – tette hozzá Bertsch.”
A kutató online csatlakozik a laboratórium szuperszámítógépéhez egy Linux PC-n keresztül. Egy “munkát” egyszerűen egy parancssori alkalmazás segítségével lehet beállítani a sorba.
A Sierra egy nyilvános internethez nem kapcsolódó, titkosított hálózat része, amely a kapcsolódó tudományos programok mintegy 1000 jóváhagyott kutatója számára áll rendelkezésre. Körülbelül 3000 ember végez kutatásokat nem minősített szuperszámítógépeken, amelyek online hozzáférhetők, feltéve, hogy rendelkezik felhasználói fiókkal és a megfelelő bejelentkezési adatokkal. (Bocsánat, Bitcoin-bányászok.)
“Az emberek már a beszerzéskor megvásárolják a számítógépet” – mondta Bertsch. “A befektetett pénz összege korrelál a megvásárolt gép százalékos arányával.”
Egy ütemezési rendszert használunk, hogy biztosítsuk a “méltányos részesedést” a gépből. “Megpróbálja a használatodat a neked kiosztott százalék felé terelni” – tette hozzá Bertsch. “Ha idővel kevesebbet használtál, mint a méltányos részed, a prioritásod feljebb kerül, és hamarabb futsz le.”
A szimulációk folyamatosan futnak. Egy szuperszámítógép egy adott időpontban több ezer feladatot képes futtatni. Egy gép feldolgozhat úgynevezett “hero run”-ot is, vagyis egyetlen olyan nagy feladatot, amelynek ésszerű időn belüli elvégzéséhez az egész szuperszámítógépre szükség van.
Keeping It Up And Running
A másik szuperszámítógép, a Sequoia belseje. Egy rack nem sokban különbözik egy szervertől.
A Sierra egy szuperszámítógép, de a gép nagyrészt commodity alkatrészekből készült. A processzorok például az IBM és az Nvidia vállalati szintű chipjei, maga a rendszer pedig a Red Hat Enterprise Linuxot futtatja, amely a szervergyártók körében népszerű operációs rendszer.
“Régen a szuperszámítógépek ilyen monolitikus, nagy, ezoterikus hardverdarabok voltak” – mondta Robin Goldstone, a laboratórium nagy teljesítményű számítási megoldásokért felelős architektje. “Manapság még a világ legnagyobb rendszerei is lényegében csak egy csomó, egymással összekapcsolt szerver.”
A használat maximalizálásához egy olyan rendszernek, mint a Sierra, különböző típusú kutatások elvégzésére kell alkalmasnak lennie. Ezért a laboratórium egy univerzális gép létrehozását tűzte ki célul. De még egy szuperszámítógép sem tökéletes. A laboratórium becslése szerint a Sierra 12 óránként szenved hibát, ami hardverhibával járhat. Ez meglepően hangozhat, de gondoljunk csak arra, hogy 100 000 számítógép tulajdonosa; a meghibásodások és javítások elkerülhetetlenek.
“A leggyakoribb dolgok, amelyek meghibásodnak, valószínűleg a memória DIMM-ek, a tápegységek és a ventilátorok” – mondta Goldstone. Szerencsére a Sierra olyan hatalmas, hogy rengeteg kapacitással rendelkezik. A szuperszámítógép rutinszerűen memória biztonsági mentéseket is készít arra az esetre, ha egy hiba megszakítana egy projektet.
“Bizonyos mértékig ez nem egészen olyan, mint egy otthoni PC, de annak egy íze” – tette hozzá Goldstone. “Vegyük a játékosokat, akik a leggyorsabb memória és a leggyorsabb GPU megszállottjai, és ez ugyanaz a dolog, aminek mi is a megszállottjai vagyunk. A kihívás nálunk az, hogy nagyon sokan futnak egyszerre.”
A szuperszámítógépek alatt egy csőrendszer található, amely szobahőmérsékletű vizet küld felfelé, hogy hűvösen tartsa a gépeket. A Sierra 80 százalékban vízhűtéses, 20 százalékban léghűtéses.
A Sierra maga egy 47 000 négyzetméteres teremben áll, amelyet a hardvert hűvösen tartó ventilátorok zaja tölt be. Egy szinttel a gép alatt található az épület vízszivattyú rendszere. Percenként több ezer gallon vizet képes a csövekbe küldeni, amelyek aztán a szuperszámítógép állványaiba táplálják, és a vizet visszaforgatják kifelé.
A villamosenergia-fronton a laboratórium 45 megawatt – vagyis egy kisebb város számára elegendő áram – ellátására lett felszerelve. Ebből körülbelül 11 megawattot delegáltak a Sierra számára. A szuperszámítógép energiafogyasztása azonban időnként panaszokat válthat ki a helyi energiacégek részéről. Amikor egy alkalmazás összeomlik, a gép energiaigénye hirtelen több megawattot is elérhet.
Az energiaszolgáltató “ezt egyáltalán nem szereti. Mert le kell adniuk a terhelést. Fizetnek az energiáért” – mondta Goldstone. “Felhívtak minket telefonon, és azt kérdezték: “Nem tudnátok ezt már nem csinálni?””
Az Exascale jövő
A Sequoia tavaly a világ 10. leggyorsabb szuperszámítógépeként szerepelt. Hamarosan azonban egy nagyobb teljesítményű gép váltja fel.
A Lawrence Livermore Nemzeti Laboratóriumban működik egy másik szuperszámítógép is, a Sequoia, amely 2012-ben rövid ideig a világ legjobb rendszere volt. A laboratórium azonban azt tervezi, hogy még ebben az évben nyugdíjazza, hogy helyet adjon egy nagyobb és jobb szuperszámítógépnek, az El Capitan nevűnek, amely az amerikai kormány által tervezett exascale szuperszámítógépek közé tartozik.
Várhatóan 2023-ban fog üzembe állni. De nem lesz egyedül. Az El Capitan csatlakozik két másik exascale rendszerhez, amelyek megépítésére az USA több mint 1 milliárd dollárt költ. Mindkettő 2021-ben készül el Illinois és Tennessee különálló laboratóriumaiban.
“Egy bizonyos ponton folyton arra gondolok, hogy ‘Nem elég gyors? Mennyivel kell gyorsabbnak lennie ezeknek a számítógépeknek valójában?”” mondta Goldstone. “De inkább arról van szó, hogy gyorsabban tudunk problémákat megoldani, vagy nagyobb felbontásban tudunk problémákat tanulmányozni, hogy valóban láthassunk valamit a molekuláris szinteken.”
A szuperszámítógépes iparnak azonban előbb-utóbb újítani kell. Egyszerűen nem fenntartható, hogy továbbra is nagyobb gépeket építsünk, amelyek több energiát fogyasztanak és több fizikai helyet foglalnak el. “A mai technológia határait feszegetjük” – mondta. “A hagyományos szilíciumalapú számítóchipeken túl más területeken is fejlődnünk kell, hogy eljussunk a következő szintre.”
A laboratórium addig is olyan gyártókkal dolgozik együtt, mint az IBM és az Nvidia, hogy megoldja a közvetlen szűk keresztmetszeteket, beleértve a szuperszámítógépek hálózati felépítésének javítását, hogy gyorsan tudjanak kommunikálni a különböző klaszterek között, valamint az alkatrészek megbízhatóságát. “A processzor sebessége már nem számít” – tette hozzá. “Bármilyen gyorsak is a processzorok, minket a memória sávszélessége korlátoz.”
A laboratórium a jövőben további részleteket fog közölni az El Capitanról. Ami az általa leváltott számítógépet, a Sequoia-t illeti, a rendszer a feledés homályába vész.
A labor biztonsági okokból azt tervezi, hogy a gép minden darabját ledarálja, és a maradványait újrahasznosítja. A szuperszámítógépeken végül titkos kormányzati adatok futhatnak, ezért létfontosságú, hogy ezen információk minden nyomát teljesen eltüntessék – még akkor is, ha ez azt jelenti, hogy a gépet törmelékké kell alakítani. Ez talán szélsőségesen hangzik, de az adatok virtuális törlésére tett kísérletek során hibákat lehet elkövetni, ezért a laboratóriumnak teljesen biztosnak kell lennie abban, hogy az adatok végleg eltűntek.