diplomová práce

Algoritmy hlubokého učení na embedded platformě

Text práce 7.94 MB Příloha 9.81 MB

Autor práce: Ing. Jaroslav Hadzima

Ak. rok: 2018/2019

Vedoucí: Ing. Karel Horák, Ph.D.

Oponent: Ing. Ondřej Boštík

Abstrakt:

Táto práca popisuje v súčastnosti široko používané architektúry a modely pre Hlboké Učenie, riešiace úlohu detekcie a klasifikácie objektov vo videu. Dôraz tu bude kladený na ich použiteľnosť na vstavaných zariadeniach. Postupne preberieme kroky a odvôvodňovanie pri výbere najlepšieho vstavaného systému pre našu aplikáciu. Ukážková aplikáci pozostáva hlavne z detekcie vozidiel a detekcie voľných parkovacích miest s využitím algoritmov Hlbokého Učenia. Táto aplikácia umožňuje monitorovať počet vozidiel, nachádzajúcich sa na parkovisku a zároveň rozhodnúť, či sa nachádzajú na prakovacom mieste alebo nie. Následne tu budú prebrané kroky nutné ku konfigurácii zariadenia s dôrazom na optimalizáciu hardvéru pre dosiahnutie čo najväčšej rýchlosti. V ďaľšej časti bude poskytnuté porovnanie vybraných modelov, ktoré budú porovnávané hlavne v kategóriách ako rýchlosť alebo F1 skóre. Najlepší kandidát bude použitý na riešenie našej aplikácie a následné testovanie jej vlastností s názvom Inteligentné parkovisko.

Klíčová slova:

Strojové učenie, Hlboké učenie, Vstavané systémy, Raspberry Pi 3 Model B, Detekcia objektov, Detekcia vozidiel, Inteligentné parkovisko

Termín obhajoby

05.06.2019

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

A

Průběh obhajoby

Student obhájil diplomovou práci. Reagoval na všechny dotazy komise i na připomínky oponenta.

Jazyk práce

angličtina

Fakulta

Ústav

Studijní program

Elektrotechnika, elektronika, komunikační a řídicí technika (EEKR-M1)

Studijní obor

Kybernetika, automatizace a měření (M1-KAM)

Složení komise

doc. Ing. Eduard Janeček, CSc. (předseda)
prof. Ing. Petr Pivoňka, CSc. (místopředseda)
doc. Ing. Petr Fiedler, Ph.D. (člen)
Ing. Radek Štohl, Ph.D. (člen)
Ing. Stanislav Klusáček, Ph.D. (člen)

Posudek vedoucího
Ing. Karel Horák, Ph.D.

Pan Bc. Hadzima se ve své diplomové práci věnoval použití metod strojového učení pro rozpoznávání objektů za pomocí vybraného embedded zařízení. Diplomant pracoval spíš samostatně, bylo by vhodné využít více konzultací i např. jen v korespondenční formě, nicméně výsledky práce jsou dobré. Na zařízení Raspberry Pi 3 s využitím boardové kamery implementoval student vybraný algoritmus pro úlohu rozpoznávání automobilů na parkovací ploše. Velkou pozornost student věnoval implementačním záležitostem jako výběr vhodného nástroje (knihovny TensorFlow, OpenCV a jiné) a také možnostem výpočetního hardware, zejména taktování CPU pro zvýšení rychlosti čtení a zápisu dat s vlivem na teplotu procesoru apod. Kladně hodnotím relativně rozsáhlou experimentální část zahrnující trénování a následné vyhodnocení několika variant architektur SSDLite a R-CNN s využitím veřejně dostupného datasetu COCO. Jak po věcné tak formální stránce je podle mého názoru předložená diplomová práce velmi dobrá a doporučuji ji k obhajobě. Výsledný počet bodů navržený vedoucím: 82

Známka navržená vedoucím: B

Posudek oponenta
Ing. Ondřej Boštík

Předložená diplomová práce s názvem "Algoritmy hlubokého učení na embedded platformě" si kladla za cíl provést rešerši metod strojového učení využívajících prvků hlubokého učení na embeded platformách a dále vybrat a vyřešit vhodnou úlohu využívající tyto prostředky.

Práce je uspořádána převážně v logickém sledu a obsahuje malé množství gramatických, typografických a faktických chyb a překlepů. Z několika najitých chyb lze například zmínit obrázek 5 na straně 20, který má údajně zobrazovat jednu vrstvu neuronové sítě, ale reálně zobrazuje 4. Dále změna písma na konci strany 19, nejasný graf 27 na straně 35, na straně 59 odkaz na nesprávný graf, v seznamu literatury 2 položky s pořadovým číslem 51.

Na druhou stranu oceňuji vypracování práce v anglickém jazyce v rozsahu 70 stran čistého textu.

Všechny body zadání byly splněny, byť teoretická část věnující se problematice neuronových sítí je možná až příliš stručná. Kladně hodnotím práci s cizojazyčnou literaturou, průzkum zahraničních článků a zjištění aktuálních trendů v oblasti hlubokého učení.

Ve druhém bodu zadání se student věnuje převážně výběru použitelného hardware pro řešení dané úlohy. Zde jsem objevil menší nelogičnost, když na straně 38 student najednou skočí od popisu jednotky TPU k porovnání mezi CPU, GPU, FPGA a ASIC. Doporučil bych tuto část zařadit do samostatné podkapitoly. Srovnání hardware končí výběrem desky Raspberry Pi.

Třetí bod zadání, tj. sestavení vhodného datasetu je věnována jedna strana. Dataset se skládá ze 720 vlastních snímků a dalších 200 z volně dostupného datasetu. Dataset by však měl být dostatečný pro danou úlohu.

V posledním bodu zadání měl student na vyhraném zařízení implementovat a zhodnotit vybranou úlohu. Vybral si úlohu počítání aut na parkovišti a výpočet obsazenosti jednotlivých parkovacích míst. Celý postup řešení je popsán logicky, postupuje krok za krokem a provádí čtenáře celým návrhem od začátku do konce. Nejprve je zde popsána jak konfigurace a úpravy na zařízení Raspberry Pi. Dále pak práce obsahuje popis programu pro zjištění pozic parkovacích míst a pro výpočet obsazenosti těchto parkovacích míst. Kladně hodnotím automatické zjištění polohy parkovacích míst a minimální potřebný zásah operátora při instalaci zařízení. Zvolenou koncepci programu považuji za správnou a daná práce se dá použít k replikaci zařízení pro potřeby dalších osob.

Práce byla časově středně náročná, vyvinutý systém je funkční a zadání bylo splněno v celém rozsahu. Práci i přes výše uvedené drobné výtky hodnotím jako velmi dobrou a doporučuji k obhajobě. Otázky k obhajobě:
  1. Jakým způsobem přidává vrstva "Batch normalization" šum?
  2. V souvislosti s tvrzením na straně 21, proč řešení okrajů ve výstupním obrazu u operace konvoluce závisí jen na rozměrech obrazu a masky?
Výsledný počet bodů navržený oponentem: 80

Známka navržená oponentem: B

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová