(Superpočítač Sierra v Lawrencově livermorské národní laboratoři v Kalifornii)
Jelikož USA soupeří s Čínou o nejrychlejší superpočítače, možná vás zajímá, jak se tyto obří stroje využívají.
Superpočítač může obsahovat stovky tisíc procesorových jader a vyžaduje celou budovu na umístění a chlazení – nemluvě o milionech dolarů na jejich vytvoření a údržbu. Navzdory těmto výzvám jich však bude v provozu stále více, protože USA a Čína vyvíjejí nové „exascale“ superpočítače, které slibují pětinásobné zvýšení výkonu ve srovnání se současnými špičkovými systémy.
Kdo tedy potřebuje všechen tento výpočetní výkon a proč? Aby to zjistil, navštívil PCMag Národní laboratoř Lawrence Livermora v Kalifornii, která je domovem několika superpočítačů, včetně druhého nejrychlejšího na světě, Sierry. Právě tam jsme se dozvěděli, jak systémoví inženýři udržují stroje, které slouží vědeckým výzkumníkům, ale také testují něco, co byste možná nečekali: jaderné zbraně.
Utajovaný systém
Přibližně 1 000 lidí udržuje superpočítače laboratoře a vytváří pro ně programy.
Při návštěvě Sierry si všimnete nápisů „tajné“ a „tajná data s omezeným přístupem“ vyvěšených na superpočítači, který se skládá z 240 stojanů podobných serverům. Tato upozornění existují proto, že Sierra zpracovává údaje týkající se amerických jaderných zásob, včetně toho, jak by měly zbraně vybuchnout v reálném světě.
Spojené státy provedly poslední ostrý test jaderných zbraní v roce 1992. Od té doby země využívá superpočítače, které pomáhají provádět experimenty virtuálně, a Sierra je součástí této mise. Stroj byl dokončen v loňském roce především proto, aby pomohl americké vládě při monitorování a testování účinnosti stárnoucího jaderného arzenálu země, který je třeba běžně udržovat.
„Jediný způsob, jak odstrašující prostředek funguje, je, když víte, že může fungovat, a že váš protivník také ví a věří, že funguje,“ řekl Adam Bertsch, systémový inženýr pro vysoce výkonné počítače v laboratoři.
Příklad simulací prováděných v superpočítačovém centru laboratoře. Vlevo je výzkumný experiment v oblasti fúzní energie zahrnující zahřívání a stlačování palivového terče pomocí 192 laserů. Vpravo je simulace „trojbodové rázové interakce“ související s hydrodynamikou.“
Není překvapivé, že simulace jaderného výbuchu vyžaduje spoustu matematiky. Základní vědecké principy dokáží předpovědět, jak na sebe budou částice za různých podmínek vzájemně působit. Americká vláda také disponuje desítkami let shromážděných dat ze skutečných jaderných testů. Vědci tyto informace zkombinovali a vytvořili rovnice uvnitř počítačových modelů, které dokáží vypočítat, jak bude jaderný výbuch probíhat a jak se bude měnit v čase.
V podstatě se snažíte zmapovat řetězovou reakci. Aby tedy modely byly přesné, byly navrženy tak, aby předpovídaly jadernou detonaci na molekulární úrovni s využitím fyziky reálného světa. Problém spočívá v tom, že výpočet toho, co všechny tyto částice udělají, vyžaduje spoustu čísel.
Hledáte nabídky na nejnovější techniku?
Tento zpravodaj může obsahovat reklamu, nabídky nebo partnerské odkazy. Přihlášením k odběru newsletteru vyjadřujete svůj souhlas s našimi podmínkami používání a zásadami ochrany osobních údajů. Z odběru se můžete kdykoli odhlásit.
Vstupte do Sierry. Superpočítač má 190 000 procesorových jader CPU a 17 000 jader GPU. Všechen tento výpočetní výkon znamená, že může vzít obrovskou úlohu, jako je simulace jaderného štěpení, a rozdělit ji na menší části. Každé jádro pak může zpracovat malou část simulace a sdělit výsledky zbytku stroje. Tento proces se bude opakovat stále dokola, protože superpočítač se bude snažit modelovat jaderný výbuch od jedné sekundy k druhé.
„V počítači můžete provést kompletní simulaci jaderného zařízení,“ dodal Bertsch. „Můžete zjistit, že to funguje, jak přesně to funguje a k jakým efektům by došlo.“
Výzkumný stroj
Klastry kabelů pomáhají Sierře vyměňovat si data. Další kabely obsahují vodu, která udržuje systém v chladu.
Schopnost superpočítače počítat a modelovat interakce částic je důvodem, proč se stal tak důležitým nástrojem pro výzkumníky. V jistém smyslu probíhají reakce všude kolem nás. Může jít o počasí, vznik hvězdy nebo kontakt lidských buněk s lékem.
Superpočítač dokáže všechny tyto interakce simulovat. Vědci pak mohou na základě těchto dat získat užitečné poznatky, například zda bude zítra pršet, zda je nová vědecká teorie platná nebo zda je připravovaná léčba rakoviny perspektivní.
Stejné technologie mohou také umožnit průmyslovým podnikům prozkoumat nespočet nových návrhů a zjistit, které z nich stojí za to otestovat v reálném světě. To je důvod, proč laboratoř zaznamenala obrovskou poptávku po svých dvou tuctech superpočítačů.
„Bez ohledu na to, kolik výpočetního výkonu jsme měli, lidé by ho spotřebovali a žádali by další,“ řekl Bertsch.
Vysvětluje to také, proč americká vláda chce exascale superpočítač. Dodatečný výpočetní výkon umožní vědcům vyvíjet pokročilejší simulace, jako je například znovuvytváření ještě menších interakcí částic, což by mohlo otevřít cestu k novým průlomovým objevům ve výzkumu. Systémy exascale budou také schopny dokončit současné výzkumné projekty v kratším čase. „To, na čem jste dříve museli strávit měsíce, může trvat jen hodiny,“ dodal Bertsch.
Vědec se připojuje k superpočítači v laboratoři online prostřednictvím počítače s operačním systémem Linux. „Úlohu“ lze zařadit do fronty jednoduše pomocí aplikace příkazového řádku.
Sierra je součástí utajované sítě nepřipojené k veřejnému internetu, která je k dispozici asi 1 000 schválených výzkumných pracovníků v přidružených vědeckých programech. Asi 3 000 lidí provádí výzkum na neutajovaných superpočítačích, které jsou přístupné online za předpokladu, že máte uživatelský účet a správné přihlašovací údaje. (Omlouváme se těžařům bitcoinů.)
„V době akvizice si u nás lidé počítač kupují,“ řekl Bertsch. „Množství vložených peněz koreluje s procentem stroje, které jste si koupili.“
K zajištění vašeho „spravedlivého podílu“ na stroji se používá systém plánování. „Snaží se řídit vaše využití směrem k procentuálnímu podílu, který vám byl přidělen,“ dodal Bertsch. „Pokud jste v průběhu času využili méně, než je váš spravedlivý podíl, vaše priorita se zvýší a vy poběžíte dříve.“
Simulace běží neustále. Na jednom superpočítači mohou v daném okamžiku běžet tisíce úloh. Stroj může také zpracovat takzvaný „hero run“ neboli jedinou úlohu, která je tak velká, že k jejímu dokončení v rozumném čase je zapotřebí celý superpočítač.
Udržování v chodu
Útroby dalšího superpočítače Sequoia. Jeden rack se příliš neliší od serveru.
Sierra je superpočítač, ale stroj byl z velké části vyroben z komoditních dílů. Například procesory jsou čipy podnikové třídy od společností IBM a Nvidia a na samotném systému běží Red Hat Enterprise Linux, oblíbený operační systém mezi dodavateli serverů.
„Kdysi byly superpočítače monolitické velké ezoterické kusy hardwaru,“ řekl Robin Goldstone, architekt vysoce výkonných výpočetních řešení v laboratoři. „Dnes jsou i ty největší systémy na světě v podstatě jen hromada serverů propojených dohromady.“
Pro maximální využití musí být systém jako Sierra schopen provádět různé druhy výzkumu. Proto se laboratoř rozhodla vytvořit univerzální stroj. Ale ani superpočítač není dokonalý. Laboratoř odhaduje, že každých 12 hodin dojde u Sierry k chybě, která může zahrnovat selhání hardwaru. To může znít překvapivě, ale představte si, že vlastníte 100 000 počítačů; poruchy a opravy jsou nevyhnutelné.
„Nejčastější věci, které selhávají, jsou pravděpodobně paměťové moduly DIMM, napájecí zdroje, ventilátory,“ řekl Goldstone. Naštěstí je Sierra tak obrovská, že má dostatek kapacity. Superpočítač také běžně vytváří zálohy paměti pro případ, že by chyba narušila nějaký projekt.
„Do jisté míry to není úplně jako počítač, který máte doma, ale taková příchuť,“ dodal Goldstone. „Vezměte si hráče, kteří jsou posedlí tím, aby měli co nejrychlejší paměť a co nejrychlejší GPU, a to je to samé, čím jsme posedlí my. U nás je problém v tom, že jich máme tolik spuštěných najednou.“
Pod superpočítači se nachází potrubní systém, který posílá nahoru vodu o pokojové teplotě, aby se stroje chladily. Sierra je z 80 procent chlazena vodou a z 20 procent vzduchem.
Sama Sierra se nachází v místnosti o rozloze 47 000 čtverečních stop, která je naplněna hlukem ventilátorů udržujících hardware v chladu. O patro níže pod strojem se nachází systém čerpání vody z budovy. Každou minutu dokáže poslat tisíce galonů do potrubí, které pak přivádí vodu do stojanů superpočítače a cirkuluje ji zpět ven.
Co se týče napájení, laboratoř byla vybavena tak, aby mohla dodávat 45 megawattů – tedy dost elektřiny pro malé město. Přibližně 11 z těchto megawattů bylo delegováno na Sierru. Spotřeba energie superpočítače však může občas vyvolat stížnosti místních energetických společností. Při pádu aplikace může energetická náročnost stroje náhle klesnout o několik megawattů.
Dodavatelům energie se to „vůbec nelíbí. Protože se musí zbavit zátěže. Platí za energii,“ řekl Goldstone. „Zavolali nám telefonem a řekli: ‚Nemůžete to už dělat?“
Budoucnost exascale
Loni se Sequoia umístila na 10. místě mezi nejrychlejšími superpočítači na světě. Brzy však bude nahrazen výkonnějším strojem.
Národní laboratoř Lawrence Livermora je také domovem dalšího superpočítače Sequoia, který v roce 2012 krátce kraloval jako nejlepší systém na světě. Laboratoř jej však plánuje vyřadit ještě letos, aby uvolnila místo většímu a lepšímu superpočítači s názvem El Capitan, který patří mezi exascale superpočítače, jež plánuje americká vláda.
Očekává se, že bude uveden do provozu v roce 2023. Nebude však sám. El Capitan se připojí ke dvěma dalším exascale systémům, na jejichž výstavbu USA vynakládají více než 1 miliardu dolarů. Oba budou dokončeny v roce 2021 v samostatných laboratořích v Illinois a Tennessee.
„V určitém okamžiku si stále říkám: ‚Není to dost rychlé? O kolik rychlejší tyhle počítače opravdu potřebujeme?“‚ Goldstone řekl. „Ale jde spíše o to, abychom mohli rychleji řešit problémy nebo studovat problémy s vyšším rozlišením, abychom skutečně viděli něco na molekulární úrovni.“
Superpočítačový průmysl však nakonec bude muset inovovat. Je prostě neudržitelné pokračovat ve stavbě větších strojů, které spotřebovávají více energie a zabírají více fyzického prostoru. „Posouváme hranice možností dnešní technologie,“ řekla. „Bude muset dojít k pokroku v dalších oblastech mimo tradiční výpočetní čipy na bázi křemíku, abychom se dostali na další úroveň.“
Laboratoř mezitím spolupracuje s dodavateli, jako jsou IBM a Nvidia, na řešení okamžitých překážek, včetně zlepšení síťové architektury superpočítače, aby mohl rychle komunikovat mezi různými clustery, a také spolehlivosti komponent. „Na rychlosti procesoru už prostě nezáleží,“ dodala. „Jakkoli jsou procesory rychlé, omezuje nás šířka paměťového pásma.“
Laboratoř oznámí další podrobnosti o El Capitanu v budoucnu. Pokud jde o počítač, který nahrazuje, Sequoia, systém míří do zapomnění.
Z bezpečnostních důvodů laboratoř plánuje rozemlít každý kus stroje a jeho zbytky recyklovat. Na superpočítačích mohou skončit utajovaná vládní data, takže je životně důležité, aby byla jakákoli stopa po těchto informacích zcela odstraněna – i kdyby to mělo znamenat, že se stroj promění ve šrot. Může to znít extrémně, ale při pokusu o virtuální odstranění dat může dojít k chybám, takže laboratoř si musí být naprosto jistá, že data jsou trvale pryč.
O Michaelu Kanovi
.