Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Ing. Jan Lorenc
Ak. rok: 2022/2023
Vedoucí: Ing. Jan Pluskal, Ph.D.
Oponent: Ing. Ondrej Lichtner
Cílem práce je vytvoření řešení pro rozpoznání kláves na klávesnici za účelem automatizace robotického psaní na klávesnici. V rámci práce jsou vytvořeny datasety pro detekci klávesnice v obraze, rozpoznání znaků v obraze a dodatečnou korekci detekovaných znaků na základě různých rozložení klávesnic. Práce předkládá různé přístupy k řešení problému rozpoznání znaků na klávesnici a vybírá ten nejvhodnější. Navržený postup je rozdělen do 3 fází, kterým odpovídají připravené datasety. Pomocí neuronových sítí a Cannyho metody detekce hran se nejprve rozpozná klávesnice v obraze a následně se v nalezené klávesnici detekují jednotlivé znaky. V poslední fázi dochází k dodatečnému zpracování výsledků (oprava znaků, doplnění nerozpoznaných znaků, nalezení speciálních kláves apod.). Pro každou část jsou vyhodnoceny výsledky. Přínos práce spočívá ve vytvoření datasetů pro detekci klávesnice a jejích kláves a především modulárního a rozšiřitelného řešení pro detekční proces se slibnými výsledky.
strojové učení, počítačové vidění, detekce objektů, rozpoznávání, neuronové sítě, Cannyho detektor hran, augmentace dat, detekce klávesnice, rozpoznání znaků
Termín obhajoby
21.06.2023
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Otázky k obhajobě
Jazyk práce
angličtina
Fakulta
Fakulta informačních technologií
Ústav
Ústav informačních systémů
Studijní program
Informační technologie a umělá inteligence (MITAI)
Specializace
Informační systémy a databáze (NISD)
Složení komise
doc. Ing. Radek Burget, Ph.D. (předseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Šárka Květoňová, Ph.D. (člen)
Posudek vedoucíhoIng. Jan Pluskal, Ph.D.
Práce řeší problém detekce klávesnice a jednotlivých kláves z obrazu kamery robotické ruky. Práce byla oceněna na konferenci EXCEL@FIT. Dle studia SotA se jedná o unikátní a inovativní řešení. Implementace byla důkladně otestována a vyhodnocena. Výsledek bude nasazen v praxi ve firmě Y Soft.
Navrhuji hodnotit práci stupněm A jako výbornou.
Jedná se o zadání firmy Y Soft. Práce si klade za cíl rozpoznání klávesnice a kláves na různých typech zařízení a klávesnic. Dle provedeného SotA nebylo nalezeno dostupné řešení pro srovnání, proto hodnotím práci jako velmi obtížnou a inovativní.
Autor samostatně nalezl 37 referenčních zdrojů převážně kvalitní literatury a relevantních online materiálů. Byla nalezena pouze jedna práce řešící obdobný problém, proti které se autor relevantně vymezuje.
Student začal na tématu pracovat se značným předstihem a udržel si konstantní tempo během obou semestrů. Konzultace byly iniciovány na popud studenta, který byl vždy velmi dobře připraven.
Práce byla dokončena se značným předstihem a řádně konzultována.
Autor se zúčastnil konference EXCEL@FIT, kde byl oceněn.
Známka navržená vedoucím: A
Posudek oponentaIng. Ondrej Lichtner
Celkovo prácu hodnotím na A. Jedná sa o kvalitné spracovanie aj technickej správy aj samotnej implementácie pre náročnú tému.
Súčasťou riešenia je aj vytvorenie datasetu, ktorý bol publikovaný na platforme Kaggle, ktorý je podľa slov študenta jediný voľne dostupný v kategórii klávesníc.
Študent svoju prácu prezentoval aj na konferencii Excel@FIT 2023 kde bola ohodnotená odbornou verejnosťou cenou Jiřího Kunovského.
Stupeň hodnocení: obtížnější zadání
Zadanie vyžaduje rozsiahlejší priezkum do tématiky rozpoznávania objektov z obrazových dát. Zároveň v špecifickej problematike klávesníc, neexistujú jednoducho dostupné otvorené dátové sady a študent teda musel pripraviť vlastné.
Zadanie preto považujem za obtiažnejšie.
Stupeň hodnocení: zadání splněno
Všetky body zadanie boli splnené bez výhrad.
Stupeň hodnocení: je v obvyklém rozmezí
Text práce je v obvyklom rozsahu, je informačne bohatý a je vhodne doplnený obrázkami, ktoré pomáhajú pochopeniu textu.
Technická správa je členená do logicky naväzujúcich kapitol štandardne usporiadaných do Teoretický rozbor "state of the art", Návrh a Implementácia, Vyhodnotenie. Všetok obsah je na správnom mieste, v poskytnutých informáciach sa dobre orientuje a je jednoducho pochopitelný.
Práca je písaná v angličtine na skutočne kvalitnej úrovni. Neobsahuje skoro žiadne preklepy, logické alebo štylistické chyby.
Študent v práci cituje z množstva relevantných zdrojov. Zoznam literatúry obsahuje 37 položiek. Odkazovaná literatúra obsahuje dobrý mix online zdrojov aj rôznych konferenčných alebo žurnálových článkov a kníh. V texte sú riadne odkazované.
Implementované riešenie je funkčné a bolo prezentované na osobnej konzultácii. Vytvorený kód je na vysokej úrovni, logicky zorganizovaný do modulov a tried s dedičnosťou tak aby bol modulárny a rozšíriteľný.
Riešenie je tiež plne zdokumentované dokumentačnými komentármi.
Práca bola vypracovaná ako firemné zadanie pre spoločnost Y Soft, podľa ich požiadavkov a má teda priame praktické využtie v kombinácii s platformou AIVA.
Známka navržená oponentem: A
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová