Přístupnostní navigace
E-application
Search Search Close
Bachelor's Thesis
Author of thesis: Tomáš Pěnkava
Acad. year: 2025/2026
Supervisor: prof. Ing. Martin Čadík, Ph.D.
Reviewer: Ing. Petr Bobák, Ph.D.
This bachelor thesis focuses on the design and implementation of a mobile application for indoor navigation within the Faculty of Information Technology campus. The thesis analyzes current approaches to visual localization and focuses on development using the Unity game engine. The core of the solution lies in the integration of precise point-cloud-based localization (Immersal SDK) and coarse localization based on the image retrieval method using a neural network. The work describes the process of mapping the extensive faculty campus, addressing challenges related to visually uniform spaces and evaluating the success of the proposed system in real-world operation. The output is a functional augmented reality prototype that facilitates user orientation in the complex faculty environment.
Augmented reality, visual localisation, indoor navigation, point cloud, Image Retrieval
Date of defence
16.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
D
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.
Topics for thesis defence
Language of thesis
Czech
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology (BIT)
Composition of Committee
prof. Ing. Adam Herout, Ph.D. (předseda) doc. Ing. Michal Bidlo, Ph.D. (místopředseda) Ing. Jaroslav Dytrych, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) Dr. Ing. Petr Peringer (člen)
Supervisor’s reportprof. Ing. Martin Čadík, Ph.D.
Předložená bakalářská práce se zabývá tématem navigace v rozšířené realitě (AR) s využitím metod počítačového vidění. Student implementoval aplikaci v prostředí Unity, která kombinuje technologii image retrieval pro iniciální lokalizaci a lokalizační systém Immersal pro následné zpřesnění pózy kamery. Práce má z mého pohledu následující hlavní nedostatky:
Celkově považuji práci Tomáše Pěnkavy za mírně podprůměrnou.
Zadání této bakalářské práce považuji za náročnější, neboť vyžaduje pochopení a implementaci principů rozšířené reality (AR), vizuální lokalizace kamery, sběr obrazových dat v rozsáhlých objektech a implementaci mobilní aplikace. Student vytvořil prototyp AR aplikace pro navigaci v rozsáhlém prostředí FIT VUT, který ale není v současném stavu dostatečně robustní a stabilní.
Student pracoval s materiály doporučenými vedoucím práce a sám si také dohledával další zdroje.
Student byl v průběhu obou semestrů průměrně aktivní, dohodnuté termíny dodržoval a své řešení průběžně konzultoval s vedoucím práce.
Práce byla dokončována na poslední chvíli, její obsah byl konzultován.
Grade proposed by supervisor: D
Reviewer’s reportIng. Petr Bobák, Ph.D.
Autor v rámci bakalářské práce nastudoval problematiku indoor lokalizace a vytvořil prototyp AR navigační aplikace integrující komerční SDK pro lokalizaci v mračnech bodů (Immersal) s vlastní implementací hrubé lokalizace pomocí předtrénované konvoluční neuronové sítě (Unity Sentis, MobileNetV2). Praktický pokus o zmapování značné části areálu FIT VUT je nezanedbatelný. Vzhledem k závažným nedostatkům:
navrhuji hodnocení stupněm D.
Evaluation level: obtížnější zadání
Zadání práce je obtížnějšího charakteru. Autor musel nastudovat poměrně širokou problematiku indoor lokalizace, seznámit se s technologiemi pro tvorbu AR aplikací a prakticky zmapovat rozsáhlý prostor areálu FIT VUT.
Logická struktura technické zprávy vykazuje řadu závažných nedostatků, které negativně ovlivňují pochopitelnost práce:
Práce je psána v českém jazyce. Po typografické a jazykové stránce se v textu vyskytuje znatelné množství nedostatků:
Výstupem práce je mobilní AR aplikace v enginu Unity, která kombinuje hrubou lokalizaci pomocí image retrieval (MobileNetV2 v rámci Unity Sentis) a precizní lokalizaci pomocí ImmersalSDK založeného na mračnech bodů. Autor pomocí existující aplikace zmapoval značnou část areálu FIT VUT (budovy A, B, C, D, E, L, M, N, O), vytvořil 39 použitelných map z přibližně 140 skenů a databázi cca 1000 referenčních fotografií pro image retrieval. Oba přístupy k lokalizaci jsou však nepřesné a v kombinaci s množstvím autorem přiznaných nedodělků činí aplikaci v praxi téměř nepoužitelnou. Realizovaná aplikace trpí množstvím autorem otevřeně přiznaných nedostatků (sekce 4.4.3):
NavMesh
Úspěšnost hrubé lokalizace (image retrieval) prezentovaná v sekci 4.3 vykazuje velmi nízké hodnoty: v polovině testovaných lokalit je úspěšnost detekce pod 50 % (Budova A — Učebny 47 %, Budova A — Horní patro 32 %, Budova C — Spodní patro 29 %, Budova D — podzemí 33 %, Budovy M, N, O 33 %, Budova L 40 %). Tabulky 4.4–4.14 navíc neposkytují popis validační sady ani metodiky vyhodnocení. Úspěšnost precizní lokalizace (ImmersalSDK) — metrika přesnosti je nedostatečně popsaná a objasněná, nicméně ve většině sledovaných prostor relativně dobrá (60–80 %), v některých lokalitách však problematická (Budova D — podzemí 8/103 ≈ 8 %). Plakát (Příloha B) obsahuje chybu — sekce „Image Retrieval“ a „Point Cloud lokalizace“ na plakátu obsahují identický popis „Z galerie lokálně uložených fotografií, S využitím neuronové sítě MobileNetV2, Trénované na více než 1000 fotografiích“. Pro Point Cloud lokalizaci (ImmersalSDK) je tento popis zcela chybný, jelikož metoda nepoužívá MobileNetV2 ani fotografie z galerie, ale mračna bodů. Jedná se zřejmě o chybu vzniklou kopírováním.
Vytvořené dílo je prototypem demonstrujícím proveditelnost kombinace klasické vizuální lokalizace s metodou image retrieval. Vzhledem k nízké přesnosti obou lokalizačních přístupů a množství přiznaných nedostatků je však aplikace v současné podobě prakticky nepoužitelná pro nasazení v areálu fakulty.
Evaluation level: zadání splněno s drobnými výhradami
Všechny body zadání jsou formálně adresovány, avšak s výhradami:
Evaluation level: je v obvyklém rozmezí
Rozsahem se práce nachází mírně pod hranicí obvyklého rozmezí — závěr je uveden na straně 47. Značnou část technické zprávy však tvoří kódové výpisy, obrázky a parafrázovaná dokumentace SDK, čistý autorský text je tak rozsahem blíže minimálním požadavkům.
Autor cituje 43 zdrojů, z nichž je významná část kvalitních vědeckých publikací a survey článků relevantních pro problematiku indoor lokalizace. Mám však následující výhrady:
Grade proposed by reviewer: D
Responsibility: Mgr. et Mgr. Hana Odstrčilová