Bachelor's Thesis

Object recognition using 3D convolutional neural network

Final Thesis 3.1 MB Appendix 244.85 kB

Author of thesis: Jan Procházka

Acad. year: 2025/2026

Supervisor: Mgr. Jana Procházková, Ph.D.

Reviewer: Ing. Roman Byrtus

Abstract:

This bachelor's thesis discusses convolutional neural networks with a focus on their extension to three-dimensional space. The theoretical part describes the methods of obtaining 3D data, their representation and the basic principles of functioning of neural networks, including convolutional layers, pooling layers, activation functions, learning and regularization. Subsequently, the architecture and principle of functioning of 3D convolutional neural networks are described in detail. In the practical part, the own model was implemented and trained on a selected dataset of 3D objects. The influence of various parameters, such as learning rate or number of epochs, on the classification accuracy and training time was monitored.

Keywords:

Neural network, convolution, 3D data, backpropagation, optimization algorithms, regularization, activation function

Date of defence

09.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaEznamka

Grading

E

Process of defence

Student přednesl prezentaci svojí bakalářské práce na téma: 3D konvoluční neuronové sítě pro rozpoznávání objektů. Dále zodpověděl otázky dané oponentem a v diskuzi byla provedena analýza zavedení výpočtu chyby pomocí entropie. Doc. Vašík se poté zeptal na výpočet přesnosti vzhledem k learning rate. Student měl problém s vysvětlením pojmů.

Language of thesis

Czech

Faculty

Department

Study programme

Mathematical Engineering (B-MAI-P)

Composition of Committee

doc. Mgr. Petr Vašík, Ph.D. (předseda)
doc. Mgr. Zuzana Hübnerová, Ph.D. (místopředseda)
doc. Mgr. Zdeněk Opluštil, Ph.D. (člen)
Mgr. Jitka Zatočilová, Ph.D. (člen)
Ing. Pavel Loučka, Ph.D. (člen)

Supervisor’s report
Mgr. Jana Procházková, Ph.D.

Práce se zabývá využitím 3D konvolučních neuronových sítí pro klasifikaci 3D objektů. Student zpracoval základní teoretický přehled problematiky neuronových sítí a navrhl vlastní model, který následně experimentálně ověřoval na vybraných datasetech. Součástí práce je také porovnání vlivu několika parametrů na výslednou úspěšnost klasifikace.

Student prokázal základní orientaci v problematice a schopnost implementovat a experimentálně otestovat navržené řešení. Oceňuji zejména snahu o praktické ověření různých konfigurací modelu a zpracování experimentálních výsledků formou tabulek a grafů. V textu ale například chybí vysvětlení confusion matrix.

Práce však obsahuje větší množství formálních i odborných nedostatků. Teoretická část je místy příliš popisná a opírá se i o méně vhodné zdroje literatury. Některé odborné formulace jsou nepřesné nebo zjednodušené. Výraznější výhradu mám také k části popisující ztrátové funkce. Rovnice (5.7), (5.8) vyjadřují kvadratickou ztrátu, ale v implementaci používá bakalant cross-entropy.  V textu se dále objevují jazykové a stylistické nedostatky i drobné chyby v terminologii. Grafická úprava práce je také slabší. Obrázky 3.1, 4.1, 4.2 by bylo vhodné překreslit do kvalitnější verze, obrázky ve výsledcích exportovat ve vyšší kvalitě. Text práce bylo nutné opakovaně korigovat po formální i odborné stránce a řadu částí přepracovávat. 

Student splnil cíle práce, navrhuji hodnocení D. 

Grade proposed by supervisor: D

Reviewer’s report
Ing. Roman Byrtus

Bakalářská práce se zabývá problematikou neuronových sítí se zaměřením na konvoluční neuronové sítě.

Po úvodu práce začíná krátkým popisem diskrétních 3D dat a vhodnými možnostmi jejich reprezentace. Dále práce pokračuje úvodem do neuronových sítí. Jsou zde drobné nepřesnosti, například perceptron je uveden jako čistě binární, u běžné definice perceptronu jsou definovány vstupy jako reálný vektor a výstup jako jedna binární hodnota. U ReLU by v návaznosti na zmínku o diferencovatelnosti aktivačních funkcí bylo vhodné zmínit, že funkce ReLU není diferencovatelná v 0. Práci provázejí ne úplně jasné formulace, např. počáteční odstavec o konvolucích v sekci o konvolučních neuronových vrstvách působí značně zmateně, obzvláště když už byl pojem konvoluce definován výše.

Někdy jsou pojmy zavedeny až po jejich užití, jako příklad uveďme pojem padding. Obecně je teorie psána více slovně, než by v matematické práci bylovhodné.

Autor pracuje se zahraniční literaturou, přičemž občas využívá nestandardních překladů, nebo nechává pojmy v angličtině, např. "tréninková" místo "trénovací", "momentum" místo "hybnost". U některých referencí není jasné, co přesně je citováno. Na některé obrázky chybí reference v textu, např. Obrázek 5.5. V textu se objevuje větší množství překlepů.

Nicméně, autor všechny cíle zadání splnil. Jsou sestaveny konvoluční sítě pro klasifikaci na dvou různých 3D datasetech. Autor diskutuje vlivy změn parametrů a hyperparametrů implementovaných sítí. V uvedených implementacích se objevují drobné nepodstatné chyby, např. využití funkce np.vdot místo klasického součinu np.dot nebo operátoru @; pro komplexní data by výsledek operace byl jiný.

Předložená práce i přes uvedené výhrady splňuje požadavky kladené na bakalářskou práci. Doporučuji ji k obhajobě a navrhuji celkové hodnocení D.
Evaluation criteria Grade
Splnění požadavků a cílů zadání C
Postup a rozsah řešení, adekvátnost použitých metod C
Vlastní přínos a originalita E
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry C
Využitelnost výsledků v praxi nebo teorii D
Logické uspořádání práce a formální náležitosti D
Grafická, stylistická úprava a pravopis D
Práce s literaturou včetně citací D
Topics for thesis defence:
  1. Prosím o objasnění ztrátových funkcí daných vztahem 5.7 a 5.8; jakou roli mají jednotlivé proměnné?
  2. Jaký je rozdíl mezi parametry a hyperparametry?

Grade proposed by reviewer: D

Responsibility: Mgr. et Mgr. Hana Odstrčilová