Superpočítač

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Superpočítač „Columbia“

Superpočítač je v informatice označení pro velmi výkonný počítač, v poslední době nejčastěji ve formě počítačového clusteru, tedy spojení mnoha počítačů dohromady, a to obvykle speciální vysokorychlostní sítí. Nejrychlejším superpočítačem světa byl v červnu 2016 čínský superpočítač Sunway TaihuLight čínského původu, který dosahuje rychlosti přibližně 93 petaflops.[1][2]

Charakteristika[editovat | editovat zdroj]

Podíl operačních systémů na 500 nejvýkonnějších superpočítačích.

Hranice pro označení superpočítač není přesně daná. V některých pramenech se hovoří o minimálně desetinásobně vyšším výkonu oproti běžně dostupným počítačům, avšak za superpočítače jsou s jistou mírou nadsázky označovány i méně výkonná, avšak zajímavá řešení (například superpočítač z Raspberry Pi).[3] Výkon superpočítačů je měřen v jednotkách FLOPS (FLoating Point Operations Per Second), přičemž se využívají její SI násobky, např. „TFLOPS“ (1012 FLOPS, napíšeme jeden teraflops). Měření je založené na benchmarku, který počítá operace s velkými maticemi.

Jak je možné vidět na obrázku, největší podíl v oblasti operačních systémů mají unixové systémy, speciálně pak Linux, což je způsobeno otevřeností těchto systémů.

Architektura moderních superpočítačů[editovat | editovat zdroj]

Architektura superpočítačů je v současné době založena na propojení velkého množství běžných počítačů prostřednictvím vysokorychlostní počítačové sítě (viz počítačový cluster). Tento způsob používá např. firma Google pro katalogizaci stránek z celého internetu. Cluster z běžných počítačů je nesrovnatelně levnější, než jeden specializovaný superpočítač obdobného výkonu. Prvních deset nejvýkonnějších superpočítačů v žebříčku TOP500 má stejnou základní architekturu. Každý z nich je clusterem MIMD (Multiple Instruction stream, Multiple Data stream) multiprocesorových sestav, přičemž každý z procesorů je architektury SIMD (Single Instruction/Multiple Data). Superpočítače se radikálně liší počtem multiprocesorových jednotek na cluster, počtem procesorů na jednu jednotku a počtem současně vykonavatelných instrukcí na jeden SIMD procesor.

  • Počítačový cluster je soubor počítačů propojených vysokorychlostní sítí, přičemž na každém z nich běží samostatné úlohy operačního systému.
  • Multiprocesorový počítač je počítač, na kterém běží jeden samostatný operační systém a používá víc, jako jeden CPU, přičemž počet uživatelských aplikací je jiný jako počet procesorů. Procesory sdílejí úlohy pomocí technologií SMP (Symmetric multiprocessing) a NUMA (Non-Uniform Memory Access).
  • SIMD procesor spouští stejné instrukce na více jako jednom souboru dat v tomtéž čase. Jsou to tzv. vektorové procesory. Jejich výhodou je větší efektivita s tím spojená nižší spotřeba při stejném výkonu.

Některé superpočítače používají i výkonné grafické karty, přesněji jejich GPU (GPGPU).

Historie[editovat | editovat zdroj]

První superpočítače byly vytvořené v šedesátých letech Seymourem Crayem. Veřejnosti byly zpřístupněné prostřednictvím jeho firmy Cray Research. V osmdesátých a začátkem devadesátých let vstupovaly na trh se superpočítači mnohé malé firmy. Ty však byly začátkem devadesátých let vytlačeny velkými „tradičními společnostmi“ jako IBM a HP.

Nazývat nějaký výpočetní stroj superpočítačem můžeme jen při současné specifikaci doby, ve které byl navržen a sestrojen. Důvodem relativnosti tohoto přívlastku je rychlý vývoj v této oblasti, protože stačí několik let a běžné počítače se výkonem plně vyrovnají několik let starému superpočítači. V prvním Crayově stroji byly jednoduché a rychlé skalární procesory, přibližně 10krát rychlejší jako běžně používané v komerční sféře. V sedmdesátých letech se na trh dostávají levné stroje postavené na vektorových procesorech od malých výrobců s novou vlastní architekturou. Začíná se prosazovat paralelizace, čtyř až šestnácti výpočetních jader. Začátkem devadesátých let začala vlna enormní paralelizace. Toto vedlo k superpočítačům postavených na serverových procesorech architektur PowerPC, Itanium a x86-64. Zpočátku byly množstvím rovnocenných procesorů uspořádaných do navzájem propojených struktur. Dnes nastává éra hybridních řešení, ve kterých se využívají různé druhy procesorů na různé části výpočetního procesu. Jejím „zakladatelem“ se stává IBM se systémem založeným na procesorech Cell a Opteron pro Los Alamos National Laboratory.

Využití[editovat | editovat zdroj]

Superpočítače jsou používány pro výpočetně náročné úlohy a „velké“ úlohy, např. výzkum genomu, fyzikální modelování (např. modelování jaderných výbuchů, předpovídání počasí), kryptoanalýzu apod. Pro některé úlohy se vytvářejí specializované superpočítače (viz níže).

Mezi superpočítače lze zařadit i spojení velkého množství běžných osobních počítačů pomocí internetu. Striktně vzato to není superpočítač, ale distribuovaný výpočet, a může počítat (některé) podobné druhy a velikosti úloh jako superpočítače a přitom má smysl srovnávat jeho výkon se superpočítači. To je výhodné u výpočtů, které lze snadno paralelizovat a nevyžadují rychlou komunikaci mezi jednotlivými uzly. Jedním z nejznámějších projektů tohoto druhu je SETI@home, který se zabývá analýzou signálů z radioteleskopu a dosahuje výkonu přibližně 250 teraflops (biliónů operací za sekundu).[4] Tento způsob využívání volného procesorového času počítačů po celém světě pomocí internetu se nazývá grinding. Obecná platforma pro distribuované výpočty, která počítá různé, i rozumné věci, je BOINC.

Superpočítače se dnes využívají téměř ve všech vědních oblastech. Používají se na tvorbu a testování modelů sledovaných nebo zkoumaných jevů.

  • modely kvantové fyziky, předpovídání počasí, modely organické chemie
  • kryptoanalýza, modely dopravní situace

Superpočítače se speciálním určením[editovat | editovat zdroj]

Mnoho superpočítačů nebylo postavených, aby uspokojovaly potřeby vědecké komunity, ale pro řešení konkrétní úlohy. Například:

Hardware a software[editovat | editovat zdroj]

Výpočetní síla superpočítačů s sebou přináší extrémní složitost po hardwarové i softwarové stránce.

Napájení a chlazení
Napájení a chlazení je nejviditelnějším problémem. Superpočítače jsou sestavované z velkého množství paralelně zapojených procesorů se spotřebou podobnou jako mají běžně dostupné počítače na trhu. Vzhledem na velikost celého systému je jejich spotřeba enormní, což klade velké nároky na interní elektrické rozvody, které musí být chlazené. V některých případech jsou využívány supravodivé materiály v kombinaci s chlazením na teplotu blízkou absolutní nule. Chlazení samotných procesorů je také náročná úloha. Dnes nejrozšířenější metodou je využití kapalinového okruhu. Někdy se využívá dusíkové nebo héliové chlazení.
Velký objem přenášených dat
Velký objem přenášených dat je dalším problémem. Sítě musí mít obrovskou datovou propustnost a zároveň musí být dostatečně rychlé. Jejich rychlost je však limitovaná rychlostí šíření elektromagnetického impulzu. Zdali už se jedná o optickou nebo metalickou síť, rychlost přenosu dat je limitovaná rychlostí světla. I operační paměť musí být přiměřeně velká, rychlá a blízká.
Vysoké frekvence
Vysoké frekvence v řádech GHz jsou dalším problémem. Při vysokých elektrických frekvencích impuls ztrácí schopnost šířit se i po velmi krátkých vodičích. Je to způsobeno tím, že každý vodič se stává téměř dokonalou anténou, pokud je jeho délka rovna alespoň polovině vlnové délky el. signálu v tomto vodiči. Proto je nutné všechny spoje realizovat pomocí vedení nebo vlnovodů, což však klade velké nároky na konstrukci a použití materiálů.

Technologie ze světa superpočítačů[editovat | editovat zdroj]

Software[editovat | editovat zdroj]

Softwarové nástroje nutné na paralelní a distribuované procesy vyžadují speciální technologie. Například standardní API jako MPI, PVM nebo open source řešení klastru jako Beowulf, WareWulf, openMosix. Tyto nástroje umožní vytvoření superpočítače, resp. klastru, z několika propojených pracovních stanic. Technologie ZeroConf (Rendezvous/Bonjour) se využívají na vytvoření jednoúčelových clusterů pro specializovaný software jako například Apple's Shake (úprava a tvorba obrazu). V této oblasti[kdo?] je open source software na stejné úrovni jako komerční.

Programování[editovat | editovat zdroj]

Paralelní architektura si přímo vynucuje použití speciálních metod a nástrojů, aby bylo možné maximálně využít dostupný výkon. Často se používají speciální překladače pro jazyk Fortran, které generují rychlejší kódy než kompilátory jazyků C a C++. Programovací jazyk Fortran je přímo určený na vědeckotechnické výpočty. Pro rozvinutí paralelismu se používají prostředí jako PVM, MPI nebo OpenMP.

Žebříček TOP500[editovat | editovat zdroj]

Od roku 1993 jsou superpočítače řazené do žebříčku TOP500 OS, podle výsledku v benchmarku LINPACK. Současný (od června 2015) nejvýkonnější superpočítač je čínský „Tianhe-2“ o výkonu 33,862 590 TFLOPS od společnosti NUDT. Druhou příčku zabírá „Titan“ od Cray Inc. o výkonu 17,590 324 TFLOPS. Český nejvýkonnější počítač „Salomon“ obsadil v tomto testu 40. místo. Žebříček TOP500 se obnovuje dvakrát do roka[5].

České superpočítače[editovat | editovat zdroj]

Národní superpočítačové centrum IT4Innovations[editovat | editovat zdroj]

IT4Innovations národní superpočítačové centrum provozuje nejmodernější technologie a služby v oblasti superpočítání a zpřístupňuje je českým i zahraničním výzkumným týmům z akademické sféry i průmyslu. IT4Innovations je výzkumným centrem se silnými mezinárodními vazbami.

Centrum má své sídlo v Ostravě jako součást Vysoké školy báňské – Technické univerzity Ostrava.

IT4Innovations provozuje dva superpočítače – Anselm (94TFLOPS Rpeak, instalován v létě 2013) a Salomon (2PFLOPS Rpeak, instalován v létě 2015). V létě 2015 při svém uvedení do provozu byl superpočítač Salomon 40. nejvýkonnějším superpočítačem na světě a nejvýkonnějším superpočítačem s procesory Intel Xeon Phi v Evropě. Kromě poskytování infrastruktury a s ní spojených služeb má IT4Innovations vlastní vědu a výzkum v oblasti HPC, zajišťuje pravidelná školení a nabízí možnost magisterského a doktorského studia v oblasti HPC.

IT4Innovations je součástí Cestovní mapy velkých infrastruktur pro výzkum, experimentální vývoj a inovace jako jedna ze tří velkých e-infrastruktur v České republice. Od svého založení v roce 2011 je IT4Innovations členem prestižní celoevropské síťě superpočítačových center PRACE (Partnership for Advanced Computing in Europe), kde reprezentuje Českou republiku. Od roku 2016 je rovněž zapojeno v Evropské technologické platformě pro oblast HPC (ETP4HPC, European Technology Platform in the area of High-Performance Computing), která se zaměřuje na definování výzkumných priorit v oblasti superpočítání v Evropě.

Centrum v současné době spolupracuje s předními akademickými a průmyslovými partnery na desítce mezinárodních projektů v rámci osmého rámcového programu  Evropské komise Horizon 2020. IT4Innovations je také prvním Intel Parallel Computing Center (Intel PCC) v nových členských státech Evropské unie. Výzkumníci IT4Innovations v rámci Intel PCC vyvíjejí vysoce paralelní algoritmy a knihovny optimalizované pro nejnovější paralelní technologie Intelu.

V přepočtu na plný úvazek má IT4Innovations 131 zaměstnanců, z toho 92 jsou výzkumní pracovníci, 13 se podílí na provozu superpočítače a 26 patří do managementu a administrativy ( údaje k 30.11.2016).

Superpočítač Anselm

Superpočítač Anselm byl uveden do provozu v létě roku 2013. Jeho jméno připomíná historický název jednoho z prvních hlubinných černouhelných dolů na Ostravsku.

Technické parametry:

-      94TFLOPS teoretický výpočetní výkon

-      209 výpočetních uzlů s 3344 výpočetními jádry Intel Xeon (Sandy Bridge EP) s celkem 15,1 TB paměti RAM

-      27 akcelerátorů, 23x NVIDIA K20, 4x Intel Xeon Phi 5110P

-      sdílená disková uložiště s kapacitou 350 TB (320 TiB) HOME, 160 TB  (146 TiB) SCRATCH

-      výpočetní síť Infiniband QDR s rychlostí 40 GB/s a topologií Full Fat Tree

-      2 dedikované uzly pro akcelerované vzdálené vizualizace

-      lokální disky s uživatelsky dostupnou kapacitou 354 GB (320 GiB) na každém uzlu

-      redundantní připojení 10 GB/s do Internetu

-      distribuce bullx Linux

-      plánovač/manažer zdrojů PBS Professional

Superpočítač Salomon

Superpočítač Salomon byl uveden do provozu v létě roku 2015. V době spuštění byl 40. nejvýkonnějším superpočítačem na světě. Jeho jméno odkazuje na další ostravskou šachtu a také známého bankéře, jež je pevně spjat s regionem i hornictvím – Salomona Mayera Rothschilda.

Technické parametry:

-      2PFLOPS teoretický výpočetní výkon

-      1008 výpočetních uzlů s 24 192 výpočetními jádry Intel Xeon (Haswell EP) s celkem 129 TB paměti RAM

-      864 Intel Xeon Phi™ 7120 akcelerátorů s 52 704 jádry a 13,8 TB paměti RAM v 432 akcelerovaných výpočetních uzlech

-      sdílená disková uložiště s kapacitou 500 TB HOME, 1 692 TB SCRATCH

-      výpočetní síť Infiniband FDR s rychlostí 56 GB/s a topologií 7D SGI Enhanced hypercube

-      3 000 TB páskové kapacity pro zálohování

-      2 dedikované uzly pro akcelerované vzdálené vizualizace

-      SMP/NUMA výpočetní uzel SGI UV2000 s 3,57 TB  (3,25 TiB) paměti RAM, 112 výpočetními jádry a teoretickým výkonem 3 TFLOPS

-      redundantní připojení 40 GB/s do Internetu

-      distribuce CentOS a RHEL

-      plánovač/manažer zdrojů PBS Professional

Přidělování výpočetní kapacity

-      Výpočetní kapacita centra je určena pro řešení úloh ve výzkumu a vývoji především pro akademická pracoviště a další výzkumné instituce, část kapacity je pak dedikována pro rozvoj spolupráce mezi akademickou sférou a průmyslovými partnery, či pro samostatné využití průmyslovými podniky.

-      Veřejná grantová soutěž IT4Innovations je vypisována 3x ročně (únor, červen, říjen) pro zaměstnance výzkumných, vědeckých a vzdělávacích organizací z ČR a pro projekty financované z veřejných zdrojů ČR

-      Přidělení výpočetního času rozhodnutím ředitelství. Žádost lze podat kdykoliv. Jedná se o nepravidelné přidělování výpočetního času na základě posouzení ředitelstvím IT4Innovations. Ucházet se může jak komerční, tak nekomerční sféra a to v takových případech, kdy nelze využít veřejné grantové soutěže.

Realizované výpočty

Superpočítače Anselm a Salomon podporují různorodé vědecké projekty z mnoha oblastí, včetně kosmologie, astronomie, strukturálního inženýrství a mechaniky tekutých látek, geofyziky, klimatologie, molekulárního modelování, plazmové a částicové fyziky, informatiky a aplikované matematiky.

Výzkumné projekty řešené na superpočítačích jsou velmi různorodé, například ladění katalyzátorů pro syntézu léčiv, šíření ultrazvukových vln lidským tělem při léčení nádorů, šíření tepla uvnitř planet a jejich měsíců, počítačový návrh léčiv, simulace sond pro řízení fúzních reaktorů, srážkovo-odtokové modely pro simulace povodní, simulace defektů ve výrobě ocelových plechů, výpočty pro léčení zlatého stafylokoka, predikce kontaktního únavového opotřebení a mnohé další.

Projekty

IT4Innovations národní superpočítačové centrum řeší, či se podílí na desítce domácích i zahraničních projektů. K nejvýznamnějším patří:

·      PRACE-4IP - Partnership For Advanced Computing in Europe 4th Implementation Phase

PRACE je výzkumná infrastruktura, která umožňuje vědcům požádat si skrze grantové soutěže o přístup na superpočítače provozované v různých členských zemích z celé Evropy.

www.prace-ri.eu

·      ANTAREX - AutoTuning and Adaptivity appRoach for Energy efficient eXascale HPC systems

Hlavním cílem projektu ANTAREX je navrhnout pomocí doménově specifického jazyka samo-adaptivní přístup pro aplikace spouštěné na superpočítačích. Řízení jejich běhu a zavedení samo-regulace umožní dosáhnout energeticky úsporných heterogenních HPC systémů na exascale úrovni.

http://www.antarex-project.eu

·      SESAME Net - Supercomputing Expertise for Small and Medium Enterprises

Tento projekt má za cíl vybudovat síť center, jež budou společnými silami podporovat malá a střední podniky v používání HPC pro svůj rozvoj. V rámci projektu tak budou připraveny výukové materiály, manuály a portfolio vzdělávacích akcí, které budou volně dostupné ve všech zemích Evropy.

http://sesamenetwork.eu

·      READEX - Runtime Exploitation of Application Dynamism for Energy-efficient eXascale computing

Spotřeba elektrické energie u superpočítačů přibližujících se výkonu 1EFLOPS (1018 operací s plovoucí desetinnou čárkou za sekundu) razantně poroste. Hlavním cílem institucí participujících na tomto projektu je vyvinout automatizovaný ladící nástroj, který náročné výpočty a simulace zefektivní skrze nové techniky a scénáře měnící softwarové a hardwarové parametry jakými je např. frekvence výpočetních jader. Úloha IT4I spočívá v evaluaci dynamismu v HPC aplikacích, ručním ladění zejména FETI řešiců založených na metodě rozložení oblasti, která kombinuje přímé a iterační metody, a následná evaluace a validace vyvinutého nástroje, který bude brát výsledky tohoto ručního ladění za referenční.

www.readex.eu

·      ExCAPE - Exascale Compound Activity Prediction Engine

V projektu se vyvíjí moderní škálovatelné algoritmy a jejich vhodné implementace, jenž budou použitelné pro výpočty na exascale superpočítačích budoucnosti (superpočítače s výkonem v řádech EXAFLOPS). Příslušné algoritmy jsou vyvíjeny pro řešení komplexních úloh z oblasti farmakologie s ohledem na nutnost zpracování velkého množství dat potřebného pro průmyslový vývoj léčiv.

http://excape-h2020.eu/

·      RODOS - Centrum pro ROzvoj DOpravních Systémů

Komplexní řešení problematiky modelování, řízení a optimalizace dopravy.

www.centrum-rodos.cz

·      FLOREON+

Vyhodnocování informací pro podporu rozhodování v rámci procesů krizového řízení, zejména povodní. Tvorba systému pro monitorování, modelování, predikci a podporu řešení krizových situací, a to především se zaměřením na oblast Moravskoslezského kraje.

floreon.vsb.cz/base/

Amálka[editovat | editovat zdroj]

Amálka je český paralelní superpočítač umístěný v Ústavu fyziky atmosféry Akademie věd ČR (ÚFA AV ČR).[6] Jeho úkolem je provádění náročných výpočtů, numerických experimentů a vizualizací v rámci kosmického výzkumu. Využití tohoto superpočítače se přitom neomezuje pouze na české projekty, ale spolupracuje se i na výzkumné činnosti pro Evropskou kosmickou agenturu a NASA. Používaným operačním systémem je Linux Slackware.

Současný výpočetní výkon Amálky je 6,38 TFLOPS (6. generace), což znamená, že superpočítač zvládne zpracovat 6,38 bilionu operací v plovoucí řádové čárce za sekundu. „Co Amálka zvládne vypočítat za jednu sekundu, by na běžném stolním počítači v roce 2007 trvalo odhadem devět hodin. Průměrná úloha, kterou Amálka řeší, jí odhadem trvá šest dní“.[6]

Na Amálce byly například analyzovány výsledky pozorování sond Cassini nebo MESSENGER.[7]

Vývoj Amálky[editovat | editovat zdroj]

Generace Rok Výkon Počet počítačů Počet procesorů Počet jader Další parametry
1 1998 jednotky MFLOPS 8 8 8
2 2000 desítky GFLOPS 16 16 16
3 2003 téměř 1 TFLOPS 96 188 188
4 2006 2,6 TFLOPS 138 272 360 180 GB RAM, 20 TB HDD, 40 kW
5 2007 4,07 TFLOPS 326 572
6[8] 2009 6,38 TFLOPS 356 800

Současné složení[editovat | editovat zdroj]

Typ procesoru Počet procesorů Počet jader Od generace
Intel Pentium III Xeon 700 16 16 2
Intel Xeon 2,80 GHz 172 172 3
Intel Xeon 5140 84 168 4
Intel Xeon E5345 54 216 5
Intel Xeon L5520 64 256 6

Dorje[editovat | editovat zdroj]

Dorje[9] ([:dordže:] – z tibetštiny, rituální žezlo, v překladu Diamantový klín, doslovně Pán kamene) je v současné době třetí nejvýkonnější český superpočítač, který je umístěn ve Fyzikálním ústavu Akademie věd. Jeho výpočetní výkon dosahuje 4,2 TeraFlops.

MetaCentrum[editovat | editovat zdroj]

MetaCentrum sdružuje superpočítače a výpočetní clustery tří superpočítačových center a několika dalších organizací. Ke konci března 2009 sdružovalo počítače:

MetaCentrum není homogenním clusterem jako Amálka, je tvořeno propojením více clusterů páteřní 100 Gb/s e-infrastrukturou CESNET. Nicméně dohromady MetaCentrum sdružuje k 30.3.2009 stroje s celkem 1365 jádry procesorů.

Reference[editovat | editovat zdroj]

  1. OLŠAN, Jan. Nový nejrychlejší superpočítač. Sunway TaihuLight pohání „čínské Celly“ ShenWei. www.cnews.cz [online]. 2016-06-21 [cit. 2016-06-25]. Dostupné online.  (česky) 
  2. June 2016 [online]. www.top500.org, [cit. 2016-06-25]. Dostupné online. (anglický) 
  3. http://www.zive.cz/bleskovky/britove-postavili-superpocitac-z-raspberry-pi-a-lega/sc-4-a-165422/default.aspx Živě.cz: Britové postavili superpočítač z Raspberry Pi a Lega
  4. http://www.boincstats.com/stats/project_graph.php?pr=sah
  5. http://top500.org/list/2015/06/
  6. a b http://hpc.sprinx.cz/files/Tiskova_Zprava_Amalka_2007.pdf – neplatný odkaz !
  7. PACNER, Karel. Češi v kosmu. Praha : Academia, 2011. 191 s. ISBN 978-80-200-2033-8. Kapitola 10. Nové astronomické projekty, s. 113–114.  
  8. http://www.mediakom.cz/intel/2009_11_11-Amalka/ – 6. generace – nefungující odkaz !
  9. http://www-hep2.fzu.cz/twiki/bin/view/VS/VsDorje – Dorje

Externí odkazy[editovat | editovat zdroj]