Delavnica: Nadgradnja aplikacij CUDA C++ na več vozlišč

Name: Delavnica: Nadgradnja aplikacij CUDA C++ na več vozlišč
Start: 2024-05-21T10:00:00+02:00
End: 2024-05-21T18:00:00+02:00
Location: MS Teams

21 May 2024

MS Teams

Europe/Ljubljana timezone

Contact

Opis: Na tej delavnici se boste spoznali in preizkusili orodja in tehnike potrebne za razvoj aplikacij CUDA C/C++, ki se lahko učinkovito prilagajajo superračunalniškim gručam opremljenimi z grafičnimi procesorji NVIDIA. Na praktičnih primerih boste dopolnili programsko kodo in preizkusili njeno izvajanje v interaktivnem oblačnem okolju, ki vsebuje več grafičnih procesorjev NVIDIA. Spoznali boste nekaj osnovnih programskih metod, ki omogočajo učinkovito izvajanje takšnih aplikacij v računalnikih gručah. Pričeli bomo z uporabo klasičnega MPI programskega vmesnika (Vmesnika za posredovanje sporočil/ Message Passing Interface - MPI), ki je nadgrajen z arhitekturno rešitvijo CUDA, in potem nadaljevali z glavno tematiko tega tečaja, programskim vmesnikom NVSHMEM.

Podrobnejši opis: Sodobno visokozmogljivo računalništvo (HPC), aplikacije za globoko učenje in podobne zahtevajo za učinkovito delovanje računsko moč grafičnih procesnih enot (GPE) na ravni računalniških gruč in omrežij. Razvoj aplikacij s arhitekturno rešitvijo CUDA, ki omogoča učinkovito izrabo grafičnih procesnih enot v računalniških gručah, zahteva poseben nabor veščin. Na tej delavnici boste spoznali in praktično preizkusili nekaj orodij in tehnik, potrebnih za pisanje aplikacij s programskim ogrodjem CUDA C/C++, ki se lahko učinkovito prilagajajo izvajanju aplikacij v gručah opremljenimi z GPE NVIDIA.

Tekom delavnice boste dopolnili praktične primere kode napisane s programskim ogrodjem CUDA C/C++ in jo preizkusili v interaktivnem oblačnem okolju, ki podpira več GPE. Spoznali boste nekaj osnovnih programskih metod za delo z več GPE, vključno s programskim vmesnikom za posredovanje sporočil (MPI), ki ima vključeno podporo arhitekture CUDA, in z NVSHMEM, ki bo osrednja točka delavnice.

NVSHMEM je programski vmesnik za vzporedno izvajanje programov na distribuiranih okoljih, ki temelji na odprtokodni rešitvi OpenSHMEM in ki zagotavlja učinkovito in razširljivo komunikacijo na gručah opremljeni z grafičnimi procesorji NVIDIA. NVSHMEM ustvari skupni pomnilniški prostor za podatke, ki obsegajo pomnilnike več grafičnih procesorjev. Do tega pomnilniškega prostora lahko transparentno dostopajo grafične procesne enote, centralne procesne enote in operacije povezane s tokovi CUDA. Asinhroni prenos podatkov, ki ga NVSHMEM omogoča, zmanjša stroške sinhronizacije med CPE in GPE. NVSMEM omogoča tudi zaganjanje jeder, ki se izvajajo daljši čas in vključujejo tako komunikacijo med enotami in tudi računanje. S sem se zmanjšajo režijski stroški velikih aplikacij, ki se izvajajo na večjem številu vozlišč. NVSHMEM je je učinkovito uporabljen v najzmogljivejših superračunalniških sistemi, kot je superračunalnik Summit (Oak Ridge, Leadership Computing Facility), superračunalnik Sierra (Nacionalni laboratorija Lawrence Livermore) in superračunalniška rešitev podjetja NVIDIA, DGX A100.

Potek izobraževanja: Delavnica bo potekala na daljavo preko brskalnika na oblačni infrastrukturi AWS.

Zahtevnost: Napredna

Jezik: Slovenski

Priporočeno predznanje: Srednje izkušnje s programiranjem aplikacij CUDA C/C++

Predlagani materiali za izpolnjevanje predpogojev:

- Osnove pospešenega računalništva s CUDA C/C++

- Pospeševanje aplikacij CUDA C++ z več grafičnimi procesorji

- Pospeševanje aplikacij CUDA C++ s sočasnimi tokovi

- Osnovno znanje uporabe in izvajanja aplikacij na računalniških gručah

Ciljna publika: Razvijalci HPC, ki uporabljajo CUDA v omrežju ali oblaku.

Na izobraževanju pridobljena znanja:

Uporaba več metod za pisanje aplikacij s pomočjo programskega ogrodja CUDA C/C++ in z uporabo več grafičnih procesnih enot (GPE).
Uporaba različne komunikacijskih vzorcev ob uporabi več GPE in razumevanje posledic njihove uporabe in kompromisov.
Pisanje prenosljive in razširljive kode CUDA z eno-programske/več-podatkovne paradigme (SPMD) z uporabo protokola MPI, ki vključuje podporo za arhitekturo CUDA in protokola NVSHMEM.
Optimizacija kode z več GPE in paradigmo SPDM s simetričnim pomnilniškim modelom NVSHMEM in upoštevanjem zmožnosti in omejitev prenosa podatkov med več GPE.
Praktične izkušnje pri delu s pogostimi programskimi paradigmami aplikacij z več GPE, kot sta dekompozicija domenske množice podatkov in izmenjava podatkov, ki se med vozlišči prekrivajo.
Poznavanje različnih vidikov konfiguriranja in razširjanja aplikacij na gručah z vozlišči opremljenimi z GPE.

Omejitev števila udeležencev: 20

Virtualna lokacija: MS Teams

Organizator:

Predavatelji:

Ime:	Domen Verber
Opis:	Domen Verber je docent na Fakulteti za elektrotehniko in računalništvo Univerze v Mariboru (UM FERI) ter ambasador NVIDIA Deep Learning Institute za Univerzo v Mariboru in njihov specialist za umetno inteligenco in HPC. S problematiko HPC in umetne inteligence se ukvarja že več kot 25 let.
	domen.verber@um.si, deep.learning@um.si

Ime:	Jani Dugonik
Opis:	Jani Dugonik je raziskovalec na Fakulteti za elektrotehniko, računalništvo in informatiko Univerze v Mariboru (UM FERI). Že več kot 10 let deluje na področju obdelave naravnega jezika (predvsem strojnega prevajanja) in evolucijskih algoritmov. Zadnja leta se ukvarja z umetno inteligenco in visokozmogljivim računalništvom.
	jani.dugonik@um.si