Detail předmětu

Paralelní výpočty na GPU

FIT-PCGAk. rok: 2020/2021

Předmět pokrývá architekturu a programování grafických karet Nvidia a částečně i AMD. Nejprve je detailně rozebrána architektura grafických karet. Následně je popsán model vykonávání programu pomocí techniky SIMT a víceúrovňové rozdělení výpočtu do vláken a bloků. Následuje popis hierarchie paměti CUDA, techniky synchronizace a redukce. Následuje popis pokročilých technik dynamického paralelismu a data-flow zpracování na GPU zakončené možnostmi využití více GPU v distribuovaných systémech s technologií NVlink a MPI společně s technikami překrývání výpočtu a komunikace. Předmět dále popisuje vysokoúrovňové knihovny pro akceleraci algoritmů na GPU. Zbytek předmětu se věnuje technologii OpenACC, která významně zjednodušuje programování grafických karet pomocí pragma nápověd pro kompilátor.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Znalost využití grafických karet pro akceleraci obecných výpočtů, orientace v oblasti akcelerovaných výpočetních systémů a knihoven.
Pochopení důsledků hardwarových omezení na efektivitu softwarových řešení.

Prerekvizity

Látka vyučovaná v předmětech AVS, PRL a částečně PPP.

Způsob a kritéria hodnocení

Vyhodnocení dvou projektů v celkovém rozsahu 14 hodin, půlsemestrální písemka.
Podmínky zápočtu:
Získání 20 ze 40 bodů za projekty a půlsemestrální písemku.

Učební cíle

Detailně se seznámit s architekturou a programováním grafických karet v oblasti obecných výpočtů pomocí knihoven Nvidia CUDA a standardu OpenACC. Naučit se navrhovat akcelerované programy využívající potenciál grafických karet. Seznámit se dostupnými knihovnami pro akceleraci výpočtu na grafických kartách. 

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

  • Zameškaná cvičení je možné nahradit v alternativní termín.
  • V poslední týdnu semestru budou probíhat náhradní cvičení.

Doporučená literatura

Current PPT slides for lectures (EN)
Nvidia CUDA documentation: https://docs.nvidia.com/cuda/ (EN)
OpenACC documentation: https://www.openacc.org/ (EN)
Kirk, D., and Hwu, W.: Programming Massively Parallel Processors: A Hands-on Approach, Elsevier, 2010, s. 256, ISBN: 978-0-12-381472-2. download.
Storti,D., and Yurtoglu, M.: CUDA for Engineers: An Introduction to High-Performance Parallel Computing, Addison-Wesley Professional; 1 edition, 2015. ISBN 978-0134177410. link.

Zařazení předmětu ve studijních plánech

  • Program MITAI magisterský navazující

    specializace NBIO , libovolný ročník, zimní semestr, volitelný
    specializace NISD , libovolný ročník, zimní semestr, volitelný
    specializace NISY , libovolný ročník, zimní semestr, volitelný
    specializace NIDE , libovolný ročník, zimní semestr, volitelný
    specializace NCPS , libovolný ročník, zimní semestr, volitelný
    specializace NSEC , libovolný ročník, zimní semestr, volitelný
    specializace NMAT , libovolný ročník, zimní semestr, volitelný
    specializace NGRI , libovolný ročník, zimní semestr, volitelný
    specializace NNET , libovolný ročník, zimní semestr, volitelný
    specializace NVIZ , libovolný ročník, zimní semestr, volitelný
    specializace NSEN , libovolný ročník, zimní semestr, volitelný
    specializace NMAL , libovolný ročník, zimní semestr, volitelný
    specializace NHPC , libovolný ročník, zimní semestr, povinný
    specializace NVER , libovolný ročník, zimní semestr, volitelný
    specializace NEMB , libovolný ročník, zimní semestr, volitelný
    specializace NADE , libovolný ročník, zimní semestr, volitelný
    specializace NSPE , libovolný ročník, zimní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Architektura grafických jednotek GPU. 
  2. CUDA model vykonávání programu. 
  3. CUDA hierarchie pamětí. 
  4. Synchronizace a redukce. 
  5. Dynamický paralelismus a unifikovaná paměť. 
  6. Návrh a optimalizace algoritmů pro GPU. 
  7. Víceproudové zpracování, překrytí komunikace a výpočtu. 
  8. Multi-GPU systémy. 
  9. Knihovna Nvidia Thrust. 
  10. Základy knihovny OpenACC. 
  11. Správa paměti v OpenACC. 
  12. Optimalizace s OpenACC. 
  13. Knihovny pro akceleraci výpočtů pomocí GPU.

Cvičení na počítači

12 hod., povinná

Vyučující / Lektor

Osnova

  1. CUDA: Paměťové přenosy, jednoduché kernely (4, týden)
  2. CUDA: Práce se sdílenou pamětí (5. týden).
  3. CUDA: Práce s texturní a konstantní pamětí (6. týden).
  4. CUDA: Dynamický paralelismus, streamy (8. týden).
  5. OpenACC: základní techniky (10. týden).
  6. OpenACC: pokročilé techniky (11. týden).

Projekt

14 hod., povinná

Vyučující / Lektor

Osnova

  • Vývoj aplikace v prostředí Nvidia CUDA
  • Vývoj aplikace v prostředí OpenACC