Detail předmětu

Konvoluční neuronové sítě

FIT-KNNAk. rok: 2019/2020

Řešení založená na metodách strojového učení postupně nahrazují ručně navržená řešení v mnoha oblastech vývoje software, speciálně pak v percepčních úlohách zaměřených na získávání informací o reálném světě z informačně bohatých senzorů jako jsou kamery, mikrofony a podobně. Dominantní metodou strojového učení jsou v současné době neuronové sítě, a speciálně pak jejich varianty zaměřené na strukturovaná data - konvoluční neuronové sítě. Tyto přístupy jsou jádrem mnoha úspěšných komerčních aplikací a posunují možnosti umělé inteligence.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Studenti se seznámí se základy konvolučních neuronových sítí, jejich učení (optimalizace), jejich stavebními bloky a programovými prostředími (frameworky) pro jejich implementaci. Získají základní povědomí o faktorech, které určují jejich úspěšnost v reálných aplikacích včetně vlastností datové sady, vhodnosti chybové funkce, vhodné struktury sítě, regularizace, optimalizace, přetrénování sítí a multi-task učení. Studenti se také seznámí s konkrétními příklady neuronových sítí pro široké spektrum úloh počítačového vidění (klasifikace, detekce, segmentace, identifikace), zpracování řeči, jazykového modelování, posilovaného učení a generování dat.
Studenti si vyzkouší spolupráci na týmovém projektu a seznámí se s knihovnami jazyka Python zaměřenými na matematické operace, lineární algebru a strojové učení.

Prerekvizity

Základní znalosti lineární algebry (násobení vektorů a matic), diferenciálního počtu (parciální derivace a její význam, řetězcové pravidlo), jazyka Python a intuitivní pochopení teorie pravděpodobnosti (např. podmíněná pravděpodobnost). Jakékoliv znalosti strojového učení a zpracování obrazu jsou výhodou.

Způsob a kritéria hodnocení

  • Hodnocený projekt s obhajobou - 65 bodů.
  • Tři testy během semestru - 35 bodů.

Podmínky zápočtu:
Získání alespoň 50 bodů z hodnocených částí předmětu.

Učební cíle

Seznámit se s konovlučními neuronovými sítěmi, jejich možnostmi, limity a s jejich praktickým využitím převážně v úlohách zpracování obrazu a počítačového vidění s částečným přesahem do zpracování řeči a jazyka. Umožnit absolventům samostatně používat konvoluční sítě v praktických aplikacích a celkově navrhovat řešení založená na konvolučních sítích včetně struktury sítí, jejich učení, tvorby datových sad a vyhodnocení kvality výsledku.

Doporučená literatura

Li, Fei-Fei, et al.: CS231n: Convolutional Neural Networks for Visual Recognition. Stanford, 2018.
Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
Goodfellow, I., Bengio, Y., Courville, A.: Deep Learning. MIT Press, 2016.

Zařazení předmětu ve studijních plánech

  • Program MITAI magisterský navazující

    specializace NBIO , 0 ročník, letní semestr, povinný
    specializace NSEN , 0 ročník, letní semestr, volitelný
    specializace NVIZ , 0 ročník, letní semestr, povinný
    specializace NGRI , 0 ročník, letní semestr, volitelný
    specializace NISD , 0 ročník, letní semestr, volitelný
    specializace NSEC , 0 ročník, letní semestr, volitelný
    specializace NCPS , 0 ročník, letní semestr, volitelný
    specializace NHPC , 0 ročník, letní semestr, volitelný
    specializace NNET , 0 ročník, letní semestr, volitelný
    specializace NMAL , 0 ročník, letní semestr, povinný
    specializace NVER , 0 ročník, letní semestr, volitelný
    specializace NIDE , 0 ročník, letní semestr, volitelný
    specializace NEMB , 0 ročník, letní semestr, volitelný
    specializace NSPE , 0 ročník, letní semestr, povinný
    specializace NADE , 0 ročník, letní semestr, volitelný
    specializace NMAT , 0 ročník, letní semestr, volitelný
    specializace NISY , 0 ročník, letní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Uvod, lineární modely, chybová funkce, alg. učení (optimalizace), vyhodnocení. (Organizace a projektyzáklady neuronových sítínumpy tutoriál)
  2. Plně propojené sítě, chybové funkce pro klasifikaci a regresi. (Regrese v PyTorch, Klasifikace obrazu)
  3. Generalizace, batch normalizace, regularizace, rozšiřování datových sad, multi-task sítě a předtrénování. (Přednáška)
  4. Problémy při učení, trénovací algoritmy. (Optimalizátory)
  5. Konvoluční sítě, lokalita a invariance výpočtů. Existující architektury klasifikačních sítí pro obraz. (Architektury klasifikačních sítí)
  6. Detekce objektů: MTCNN face detektor, R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD.
  7. Sémantická segmentace a segmentace instancí. Odhad vzdáleností, normál povrchu, osvětlení a pohybu.
  8. Sítě pro učení podobností a embedding. Rozpoznávání osob podle obličeje a hlasu. 
  9. Rekurentní neuronové sítě a zpracování sekvencí (textu a řeči). Connectionist Temporal Classification (CTC). Sítě s pozorností.
  10. Jazykové modely. Základní modely pro generování popisů obrázků, odpovědi na otázky, překlad jazyka a podobně.
  11. Generativní modely. Autoregresivní faktorizace. Generative Adversarial Networks.
  12. Posilované učení s neuronovými sítěmi. Deep Q-network (DQN) a policy gradients.
  13. Přehled nových a neortodoxních aplikací konvolučních sítí a jejich základní myšlenky.

Projekt

26 hod., povinná

Vyučující / Lektor

Osnova

Týmový projekt (2-3 studenti).
Libovolná témata navržená studenty a odsouhlasená vyučujícím.
Postup řešení projektu:
  • Formulace úlohy a utvoření týmu.
  • Průzkum existujících řešení a použitelných nástrojů.
  • Základní řešení a návrh vyhodnocování.
  • Sběr dat.
  • Experimenty, testování a postupné vylepšení řešení.
  • Závěrečná zpráva a prezentace projektu.