De ce avem nevoie de supercalculatoare și cine le folosește?

, Author

(Supercalculatorul Sierra de la Laboratorul Național Lawrence Livermore din California.)

În timp ce SUA concurează cu China pentru a construi cele mai rapide supercalculatoare, poate vă întrebați cum sunt folosite aceste mașini gigantice.

Un supercalculator poate conține sute de mii de nuclee de procesare și necesită o întreagă clădire pentru a fi adăpostite și răcite – ca să nu mai vorbim de milioane de dolari pentru a le crea și întreține. Dar, în ciuda acestor provocări, din ce în ce mai multe sunt pe cale să intre în funcțiune pe măsură ce SUA și China dezvoltă noi supercalculatoare „exascale”, care promit o creștere de cinci ori a performanțelor în comparație cu sistemele actuale de vârf.

Dar cine are nevoie de toată această putere de calcul și de ce? Pentru a afla, PCMag a vizitat Laboratorul Național Lawrence Livermore din California, care găzduiește mai multe supercalculatoare, inclusiv al doilea cel mai rapid din lume, Sierra. Acolo am aflat cum inginerii de sistem întrețin mașinile pentru a servi cercetătorilor științifici, dar și pentru a testa ceva la care nu v-ați aștepta: arme nucleare.

Un sistem clasificat

Peste 1.000 de persoane întrețin supercomputerele laboratorului și creează programe pentru ele.

Când vizitați Sierra, veți observa cuvintele „clasificat” și „date secrete restricționate” afișate pe supercalculator, care este alcătuit din 240 de rafturi asemănătoare unui server. Avertismentele există deoarece Sierra procesează date care implică stocul nuclear al SUA, inclusiv modul în care ar trebui să detoneze armele în lumea reală.

SUA a efectuat ultimul său test real cu arme nucleare în 1992. De atunci, țara a folosit supercalculatoare pentru a ajuta la efectuarea experimentelor în mod virtual, iar Sierra face parte din această misiune. Mașina a fost finalizată anul trecut în primul rând pentru a ajuta guvernul SUA în monitorizarea și testarea eficienței arsenalului nuclear îmbătrânit al țării, care trebuie întreținut în mod curent.

„Singurul mod în care un mijloc de descurajare funcționează este dacă știi că poate funcționa, iar adversarul tău știe și crede, de asemenea, că funcționează”, a declarat Adam Bertsch, inginer de sisteme de calcul de înaltă performanță la laborator.

Exemple de simulări efectuate la centrul de supercalculatoare al laboratorului. În stânga este un experiment de cercetare a energiei de fuziune care implică încălzirea și comprimarea unei ținte de combustibil cu 192 de lasere. În dreapta este o simulare legată de hidrodinamică a unei „interacțiuni de șoc cu punct triplu.”

Nu este surprinzător faptul că simularea unei explozii nucleare necesită multă matematică. Principiile fundamentale ale științei pot prezice modul în care particulele vor interacționa unele cu altele în diferite condiții. Guvernul SUA deține, de asemenea, zeci de ani de date colectate în urma unor teste nucleare reale. Oamenii de știință au combinat aceste informații pentru a crea ecuații în interiorul modelelor computerizate, care pot calcula modul în care o explozie nucleară se va declanșa și se va schimba în timp.

În esență, încercați să cartografiați o reacție în lanț. Așadar, pentru ca modelele să fie precise, acestea au fost concepute pentru a prezice o detonare nucleară la nivel molecular folosind fizica lumii reale. Provocarea este că pentru a calcula ce vor face toate aceste particule este nevoie de o mulțime de calcule numerice.

PCMag Tech Deals

Căutați oferte pentru cele mai noi tehnologii?

Acest buletin informativ poate conține publicitate, oferte sau linkuri afiliate. Abonarea la un buletin informativ indică acordul dvs. cu privire la Termenii de utilizare și Politica de confidențialitate. Vă puteți dezabona în orice moment.

Introduceți Sierra. Supercomputerul are 190.000 de nuclee de procesare CPU și 17.000 de nuclee GPU. Toată această putere de calcul înseamnă că poate lua o sarcină uriașă, cum ar fi simularea fisiunii nucleare, și o poate împărți în bucăți mai mici. Fiecare nucleu poate apoi să proceseze o mică parte din simulare și să comunice rezultatele către restul mașinii. Procesul se va repeta la nesfârșit pe măsură ce supercomputerul încearcă să modeleze o explozie nucleară de la o secundă la alta.

„Puteți face o simulare completă a unui dispozitiv nuclear în calculator”, a adăugat Bertsch. „Puteți afla că funcționează, exact cât de bine funcționează și ce fel de efecte s-ar întâmpla.”

O mașină de cercetare

Grupurile de cabluri ajută Sierra să facă schimb de date. Alte cabluri conțin apă pentru a menține sistemul rece.

Capacitatea unui supercomputer de a calcula și modela interacțiunile particulelor este motivul pentru care a devenit un instrument atât de important pentru cercetători. Într-un fel, reacțiile au loc peste tot în jurul nostru. Acestea pot include vremea, modul în care se formează o stea sau când celulele umane intră în contact cu un medicament.

Un supercomputer poate simula toate aceste interacțiuni. Oamenii de știință pot folosi apoi datele pentru a afla informații utile, cum ar fi dacă va ploua mâine, dacă o nouă teorie științifică este valabilă sau dacă un viitor tratament împotriva cancerului este promițător.

Aceleași tehnologii pot permite, de asemenea, industriilor să exploreze nenumărate modele noi și să își dea seama care dintre ele merită să fie testate în lumea reală. Acesta este motivul pentru care laboratorul s-a confruntat cu o cerere uriașă pentru cele două duzini de supercomputere ale sale.

„Indiferent de câtă putere de calcul am avut, oamenii o foloseau până la capăt și cereau mai mult”, a spus Bertsch.

Acesta explică, de asemenea, de ce guvernul SUA dorește un supercomputer exascale. Puterea de calcul suplimentară le va permite oamenilor de știință să dezvolte simulări mai avansate, cum ar fi recrearea interacțiunilor cu particule și mai mici, ceea ce ar putea deschide calea pentru noi descoperiri în cercetare. Sistemele exascale vor putea, de asemenea, să finalizeze proiectele de cercetare actuale în mai puțin timp. „Ceea ce înainte trebuia să petreci luni de zile pentru a face ar putea dura doar câteva ore”, a adăugat Bertsch.

Un cercetător se conectează online cu un supercomputer din laborator prin intermediul unui PC cu Linux. Un „job” poate fi pus în coadă de așteptare prin simpla utilizare a unei aplicații de linie de comandă.

Sierra face parte dintr-o rețea clasificată care nu este conectată la internetul public, care este disponibilă pentru aproximativ 1.000 de cercetători autorizați în cadrul programelor științifice afiliate. Aproximativ 3.000 de persoane efectuează cercetări pe supercalculatoare neclasificate, care sunt accesibile online, cu condiția să aveți un cont de utilizator și acreditările de acces corecte. (Ne pare rău, mineri Bitcoin.)

„Avem oameni care cumpără computerul la momentul achiziției”, a spus Bertsch. „Suma de bani pe care o puneți este corelată cu procentul din mașină pe care l-ați cumpărat.”

Un sistem de programare este folosit pentru a vă asigura „partea corectă” cu mașina. „Încearcă să vă orienteze utilizarea către procentul care v-a fost alocat”, a adăugat Bertsch. „Dacă ați folosit mai puțin decât cota dvs. echitabilă de-a lungul timpului, prioritatea dvs. crește și veți rula mai repede.”

Simulările sunt mereu în funcțiune. Un supercomputer poate rula mii de lucrări la un moment dat. O mașină poate procesa, de asemenea, ceea ce se numește „hero run”, sau o singură lucrare care este atât de mare încât întregul supercomputer este necesar pentru a o finaliza într-un timp rezonabil.

Keeping It Up And Running

Substanțele unui alt supercomputer, Sequoia. Un rack nu este prea diferit de un server.

Sierra este un supercomputer, dar mașina a fost realizată în mare parte cu piese de bază. Procesoarele, de exemplu, sunt cipuri de nivel enterprise de la IBM și Nvidia, iar sistemul în sine rulează Red Hat Enterprise Linux, un sistem de operare popular printre vânzătorii de servere.

„Pe vremuri, supercomputerele erau aceste blocuri monolitice mari și ezoterice de hardware”, a declarat Robin Goldstone, arhitectul de soluții de calcul de înaltă performanță al laboratorului. „În zilele noastre, chiar și cele mai mari sisteme din lume sunt, în esență, doar o grămadă de servere conectate între ele.”

Pentru a-și maximiza utilizarea, un sistem precum Sierra trebuie să fie capabil să efectueze diferite tipuri de cercetare. Așa că laboratorul și-a propus să creeze o mașină polivalentă. Dar nici măcar un supercomputer nu este perfect. Laboratorul estimează că la fiecare 12 ore Sierra va suferi o eroare care poate implica o defecțiune hardware. Acest lucru poate părea surprinzător, dar gândiți-vă că este ca și cum ați deține 100.000 de calculatoare; defecțiunile și reparațiile sunt inevitabile.

„Cele mai frecvente lucruri care se defectează sunt probabil DIMM-urile de memorie, sursele de alimentare, ventilatoarele”, a spus Goldstone. Din fericire, Sierra este atât de mare, încât are o capacitate suficientă. De asemenea, supercomputerul creează în mod obișnuit copii de rezervă ale memoriei în cazul în care o eroare întrerupe un proiect.

„Într-o anumită măsură, acesta nu este exact ca un PC pe care îl aveți acasă, dar este o aromă de așa ceva”, a adăugat Goldstone. „Luați-i pe jucătorii care sunt obsedați să obțină cea mai rapidă memorie și cel mai rapid GPU, iar acesta este același lucru de care suntem obsedați și noi. Provocarea cu noi este că avem atât de multe care rulează în același timp.”

Sub supercomputere se află un sistem de conducte care trimite apă la temperatura camerei pentru a menține mașinile la rece. Sierra este răcit în proporție de 80 la sută cu apă și 20 la sută cu aer.

Sierra în sine se află într-o încăpere de 47.000 de metri pătrați, care este plină de zgomotul ventilatoarelor care mențin răcoarea hardware-ului. La un nivel mai jos de mașină se află sistemul de pompare a apei din clădire. În fiecare minut, acesta poate trimite mii de galoane în țevi, care apoi alimentează rafturile supercomputerului și face să circule apa înapoi.

În ceea ce privește energia, laboratorul a fost echipat pentru a furniza 45 de megawați – sau suficientă electricitate pentru un oraș mic. Aproximativ 11 din acești megawați au fost delegați către Sierra. Cu toate acestea, consumul de energie al unui supercomputer poate ocazional să stârnească plângeri din partea companiilor locale de energie. Atunci când o aplicație se blochează, cererea de energie a mașinii poate scădea brusc cu câțiva megawați.

Furnizorului de energie „nu-i place deloc acest lucru. Pentru că ei trebuie să renunțe la sarcină. Ei plătesc pentru energie”, a declarat Goldstone. „Ne-au sunat la telefon și ne-au spus: „Puteți să nu mai faceți asta?””

Viitorul Exascale

Anul trecut, Sequoia s-a clasat pe locul 10 în topul celor mai rapide supercomputere din lume. Dar va fi înlocuit în curând cu o mașină mai puternică.

Laboratorul Național Lawrence Livermore găzduiește, de asemenea, un alt supercomputer numit Sequoia, care a domnit pentru scurt timp ca cel mai bun sistem din lume în 2012. Dar laboratorul plănuiește să îl retragă mai târziu în acest an pentru a face loc unui supercalculator mai mare și mai bun, numit El Capitan, care se numără printre supercalculatoarele exascale pe care guvernul SUA le-a planificat.

Așteptați-vă ca acesta să intre online în 2023. Dar nu va fi singur. El Capitan se va alătura altor două sisteme exascale, pentru a căror construcție SUA cheltuiește peste 1 miliard de dolari. Ambele vor fi finalizate în 2021 în laboratoare separate din Illinois și Tennessee.

„La un moment dat, mă tot gândesc: ‘Nu este suficient de rapid? Cât de rapide trebuie să fie cu adevărat aceste computere?””. a spus Goldstone. „Dar este vorba mai mult despre posibilitatea de a rezolva probleme mai rapid sau de a studia probleme la o rezoluție mai mare, astfel încât să putem vedea cu adevărat ceva la niveluri moleculare.”

Dar industria supercalculatoarelor va trebui în cele din urmă să inoveze. Este pur și simplu nesustenabil să continuăm să construim mașini mai mari, care consumă mai multă energie și ocupă mai mult spațiu fizic. „Depășim limitele a ceea ce poate face tehnologia actuală”, a spus ea. „Va trebui să existe progrese în alte domenii, dincolo de cipurile de calcul tradiționale pe bază de siliciu, pentru a ne duce la nivelul următor.”

Între timp, laboratorul a lucrat cu furnizori precum IBM și Nvidia pentru a rezolva blocajele imediate, inclusiv îmbunătățirea arhitecturii de rețea a unui supercomputer, astfel încât să poată comunica rapid între diferitele clustere, precum și fiabilitatea componentelor. „Viteza procesorului pur și simplu nu mai contează”, a adăugat ea. „Oricât de rapide ar fi procesoarele, suntem constrânși de lățimea de bandă a memoriei.”

Laboratorul va anunța mai multe detalii despre El Capitan în viitor. În ceea ce privește computerul pe care îl înlocuiește, Sequoia, sistemul se îndreaptă spre uitare.

Din motive de securitate, laboratorul plănuiește să macine fiecare piesă a mașinii și să îi recicleze resturile. Supercomputerele pot ajunge să ruleze date guvernamentale clasificate, așa că este vital ca orice urmă a acestor informații să fie complet epurată – chiar dacă asta înseamnă transformarea mașinii în fier vechi. Acest lucru poate părea extrem, dar se pot face erori atunci când se încearcă ștergerea virtuală a datelor, așa că laboratorul trebuie să fie absolut sigur că datele au dispărut definitiv.

Despre Michael Kan

Lasă un răspuns

Adresa ta de email nu va fi publicată.