Bachelor's Thesis

Automatic Graphics Tool Selection Using Freehand Sketches

Final Thesis 5.32 MB

Author of thesis: Bc. Richard Harman

Acad. year: 2022/2023

Supervisor: doc. Ing. Martin Čadík, Ph.D.

Reviewer: Ing. Petr Bobák, Ph.D.

Abstract:

This thesis works on classifications of sketch representations of telestration tool. This classification is being developed for telestration application as part of the free-hand drawing section. After choosing the sketch representations, collecting data with specifically created application I created two datasets. First dataset was used to train a convolutional neural network to classify the sketches. Second dataset was used to train segmentation neural network to classify lines and ellipses in sketches. Both networks was then implemented into application to showcase their usage in real-time and experiment on their accuracy. This application also contains post-processing process to recreate the telestration tool representations from the sketches.

Keywords:

sketch classification, automatic tool selection, image segmentation, convolutional neural network, computer vision, image processing, human -- computer interaction

Date of defence

14.06.2023

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Topics for thesis defence

  1. Uveďte parametry grafického tabletu použitého k řešení práce a objasněte potřebu segmentace tahů.
  2. Při vytváření datasetu jste pro rozlišení pixelů korespondujících s čarami a elipsami použil algoritmu pro nalezení kontur. Proč je tento přístup nedostačující a je třeba trénovat segmentační síť?

Language of thesis

English

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

prof. Ing. Adam Herout, Ph.D. (předseda)
doc. Dr. Ing. Otto Fučík (člen)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
Ing. Jiří Hynek, Ph.D. (člen)
doc. Mgr. Lukáš Holík, Ph.D. (člen)

Supervisor’s report
doc. Ing. Martin Čadík, Ph.D.

In general, I consider the quality of this work slightly above the average. The student proposed and implemented a functional system for sketch classification and segmentation. The student further collected a dataset of almost 1.5K sketches. I appreciate that the text part of the thesis is written in English.

Evaluation criteria Verbal classification
Informace k zadání

The difficulty of the assignment of this thesis is slightly above average. The student had to study current research work on sketch recognition, familiarize himself with machine learning algorithms and collect the data necessary to train the methods. I am satisfied with the results.

Práce s literaturou

I find the student's activity in obtaining and using study materials slightly above average. The student showed the ability to study, understand and use research articles and other sources.

Aktivita během řešení, konzultace, komunikace

From my viewpoint, the student's activity was fluctuating during the solution. The student often missed to report the progress in the agreed regular weekly intervals. 

Aktivita při dokončování

The work was completed just before the deadline, the final content was partially consulted with the supervisor.

Publikační činnost, ocenění
Points proposed by supervisor: 85

Grade proposed by supervisor: B

Reviewer’s report
Ing. Petr Bobák, Ph.D.

Autor v rámci bakalářské práce prostudoval problematiku klasifikace a segmentace ručně kreslených skic a vytvořil přesvědčivé a komplexní dílo spojující množství metod a technologií do jednoho celku splňující zadání práce. Vzhledem k výše zmíněným prezentačním a formálním nedostatkům navrhuji hodnocení stupněm B.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: obtížnější zadání

Zadání práce je obtížnějšího charakteru. Autor musel nastudovat problematiku rozpoznávání skic a dále také klasifikační a segmentační metody strojového učení. Součástí zadání byl mimo jiné i sběr dat pro trénování zmíněných úloh strojového učení.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno s drobnými výhradami

Poslední bod zadání (diskutujte silné a slabé stránky navrženého řešení) není v technické zprávě adresován.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Rozsahem se práce nachází v obvyklém rozmezí – závěr je uveden na straně 41 (cca 62 normostran).

Prezentační úroveň technické zprávy

Logická struktura technické zprávy je na průměrné úrovni. V kapitole 2 pojmenovaná jako „Related work“ se prolínají informace o existujících metodách společně s návrhem a realizací nástroje pro rozpoznání skic. V textu se nezřídka objevují také reference na budoucí části, což výrazně znepříjemňuje pochopitelnost a komplikuje návaznost sekcí. Ve zprávě zcela chybí přehled typů či vlastností grafických tabletů pro záznam ručních kreseb, který by pomohl objasnit potřebu segmentace tahů, jejiž motivace je v technické zprávě zcela opomenuta. Text zprávy neposkytuje ani specifikaci typu či parametry grafického tabletu použitého pro sběr dat a evaluaci realizovaného řešení. V kapitole 5 (Experiments) chybí demografické informace o participantech evaluační studie.

70
Formální úprava technické zprávy

Práce je psána ve anglickém jazyce. Po gramatické stránce se v textu četně vyskytují chyby v určitých a neurčitých členech a menší množství překlepů. Po typografické stránce je formátování textu na průměrné úrovni. Rovnice nejsou číslovány a názvy kapitol/sekcí jsou často bezprostředně následovány sekcí/subsekcí bez průvodního textu (např. sekvence Chapter 4, Method, 4.1 Annotation tool, 4.1.1 Framework). Obrázky 4.10 až 4.14 jsou zbytečně veliké a jejich rozložení zabírá příliš mnoho prostoru (vhodnější by bylo uspořádání do dvojic či trojic).

75
Práce s literaturou

Autor cituje 20 převážně vědeckých zdrojů relevantních pro řešený problém.

95
Realizační výstup

Výstupem práce je nástroj pro rozpoznání sedmi tříd ručně kreslených skic, které reprezentují grafické symboly/nástroje využívané v nástrojích pro analýzu sportovních záznamů, a rozmístění těchto grafických symbolů. Součástí výstupů je také dataset čítající více než 1400 skic získaných od 97 participantů. Klasifikace skic je realizována neuronovou sítí ResNet s přesností klasifikace 99.64 %, bohužel bez bližšího zdůvodnění a analýzy výběru. Dle mého názoru, by bylo vhodné porovnat více architektur, např. stanovit baseline síť a následně porovnat s mocnějšími typy jako VGG, EfficientNet, ResNet pro vybudování hlubší představy o velikosti sítě potřebné pro klasifikaci skic. Následně je raster skici segmentován pomocí architektury U-net dle (1) směru tahu nebo (2) prvku (tj. čára, elipsa, pozadí). Přesnost segmentace je však nejasná, neboť v technické zprávě není uvedena kvalitativní metrika (např. pixel accuracy/error). Na základě klasifikace a segmentace jsou grafické symboly vytvořeny a umístěny na odpovídající pozice.

90
Využitelnost výsledků

Realizované dílo je funkční a vzniklo ve spolupráci se společností ChyronHego Corporation, která se mimo jiné zaměřuje na poskytování řešení pro analýzu a sledování sportovních výkonů.

Topics for thesis defence:
  1. Při vytváření datasetu jste pro rozlišení pixelů korespondujících s čarami a elipsami použil algoritmu pro nalezení kontur. Proč je tento přístup nedostačující a je třeba trénovat segmentační síť?
  2. Uveďte parametry grafického tabletu použitého k řešení práce a objasněte potřebu segmentace tahů.
Points proposed by reviewer: 88

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová