Přístupnostní navigace
E-application
Search Search Close
Bachelor's Thesis
Author of thesis: Rudolf Baumgartner
Acad. year: 2025/2026
Supervisor: Ing. Pavol Dubovec
Reviewer: Ing. Marek Vaško
Parking issues have a fundamental impact on urban mobility and the overall quality of life of residents. The aim of this bachelor’s thesis is the design and implementation of a system for the automatic detection of parking lot occupancy from aerial images of parking lots using semantic maps. The core of the proposed solution is the use of a modern Vision Transformer model (DINOv2) for generating these maps. The thesis describes which datasets were used, the reason for their selection and the chosen architecture. A significant part of the work covers the implementation process, from loading the data to training, testing, and evaluating the model. The practical part focuses on optimizing weights using semantic loss and comparing two vehicle-detection modes afterwards. The first mode is the analysis of parking-lot crops from aerial images of parking lots, while the second mode enriches this analysis with information in the form of crops from semantic maps. The thesis contains eight experiments that analyze these modes in detail, with training parameters presented in the form of a table followed by the results of the given experiment. The best model for the PKLot and CNRPark-EXT datasets achieved a detection accuracy of 99.78 % using the ResNeXt50 architecture in the mode with semantic maps. The conclusion summarizes the findings and limitations of the proposed solution. It also outlines directions for possible further research for a diploma thesis.
deep learning, neural networks, convolutional neural networks, parking lot occupancy, crops, vehicle counting, semantic segmentation
Date of defence
16.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
C
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C
Topics for thesis defence
Language of thesis
Slovak
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology (BIT)
Composition of Committee
doc. Ing. Lukáš Burget, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) Ing. Libor Polčák, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Martin Žádník, Ph.D. (člen)
Supervisor’s reportIng. Pavol Dubovec
Študent navrhol a implementoval funkčné riešenie analýzy obsadenosti parkoviska z obrazových dát. Oceňujem najmä experimentálny prístup a snahu overiť využitie sémantických máp a modelu DINOv2 pri analýze obsadenosti parkovacích miest.
Práca má dobrý technický základ a študent preukázal primeranú samostatnosť pri implementácii aj návrhu experimentov. Niektoré experimenty však nepriniesli oproti jednoduchším prístupom jednoznačné zlepšenie. Ich vyhodnotenie mohlo byť detailnejšie. Rezervy vidím aj vo finálnom spracovaní technickej správy, najmä v systematickejšom zhodnotení výsledkov.
Napriek uvedeným rezervám považujem prácu za solídne spracovanú bakalársku prácu.
Téma práce bola pomerne náročná, keďže okrem samotnej implementácie zahŕňala aj návrh experimentov, prácu s datasetmi a vyhodnotenie viacerých prístupov k určovaniu obsadenosti parkovacích miest z obrazových dát.
Študent sa pri riešení oboznámil s problematikou počítačového videnia a hlbokého učenia. V práci experimentoval s využitím predtrénovaného modelu DINOv2 a sémantických máp pri určovaní obsadenosti parkovacích miest. Súčasťou riešenia bol aj návrh vlastnej stratovej funkcie a porovnanie viacerých variantov tréningu.
Riešenie je funkčné a zadanie považujem za splnené, hoci nie všetky formálne výstupy zadania boli odovzdané v plnom rozsahu.
Študent si potrebnú literatúru vyhľadával samostatne. Vychádzal najmä zo základných zdrojov k strojovému učeniu, hlbokému učeniu a počítačovému videniu, ktoré doplnil o práce súvisiace s detekciou obsadenosti parkovísk. Literatúru využil pri návrhu vlastného riešenia. Priestor na zlepšenie vidím najmä v dôslednejšom porovnaní navrhnutého riešenia so súčasnými state-of-the-art prístupmi v danej oblasti.
Študent na práci priebežne pracoval počas oboch semestrov, výraznejšie najmä v druhom semestri. Konzultácie využíval pravidelne a prichádzal na ne s konkrétnymi otázkami alebo návrhmi ďalšieho postupu. Komunikácia bola bezproblémová.
Väčšina implementačnej časti bola dokončená v dostatočnom predstihu. Finálne testovanie, vyhodnotenie experimentov a formulácia záverov však mohli byť spracované systematickejšie a s väčšou časovou rezervou. Napriek tomu bol výsledný obsah práce konzultovaný a finálna verzia práce pôsobí ucelene.
Nie je mi známa žiadna publikačná činnosť, ocenenie ani verejné zverejnenie softvéru súvisiace s touto bakalárskou prácou.
Grade proposed by supervisor: B
Reviewer’s reportIng. Marek Vaško
Práca sa venuje aktuálnej téme a preukazuje, že študent zvládol implementáciu netriviálneho systému s modernými nástrojmi hlbokého učenia.
Teoretická časť je korektná, avšak je neúmerne rozsiahla. Praktická časť je funkčná a systematicky členená do troch návrhov s jasnou motiváciou.
Hlavnou slabinou je experimentálna sekcia; experimenty nie sú metodologicky konzistentné; výhoda sémantických máp nie je presvedčivo preukázaná.
Celkovo navrhujem známku C.
Evaluation level: průměrně obtížné zadání
Zadanie vyžaduje znalosti zo strojového učenia a počítačového videnia, ktoré mierne presahujú rozsah bakalárskeho štúdijného programu. Avšak základné riešenie úlohy by vyžadovalo správne pripravené dáta a jeden príkaz s príslušným Python balíčkom. Celkovo teda hodnotím zadanie ako priemerne zložité.
Technická práca dobre chronologicky nadväzuje na seba. Kapitola 2 mi príde prebytočná. Neexistencia sekcie 4.1 by taktiež nemala žiadny vplyv na zvyšok práce.
Je celkovo prezenovaných 8 experimentov, žiadna prehľadná tabuľka. Výsledky sú rozhadzané v odrážkach v každej sekcii zvlášť; čitateľ musí listovať naprieč celou kapitolou.
Popisy pipeline pri jednotlivých návrhoch sú v dvoch prípadoch takmer identické a v nich sa údaje značne opakujú.
Zároveň niektoré grafy pri výsedkoch experimentov značne nafukujú rozsah a neprinášajú validný vstup, viď priebeh tréningu pre každý model.
Celkovo však veľmi pozitívne hodnotím množstvo vizuálnych príkladov a schém.
Úprava textu je dobrá.
Po typografickej stránke je nekonzistentná anotácia skratiek: niekedy skratky sedia s iniciálmi, niekedy nie a niekedy podobná anotácia definuje anglický výraz.
V práci je menšie množstvo jazykových chýb.
Implementovaný systém je funkčný a dosahuje vysokú klasifikačnú presnosť (až 99,78 %) na štandardných dátových sadách PKLot a CNRPark-EXT.
Avšak experimentálna časť trpí zásadným metodologickým nedostatkom: v jednotlivých experimentoch sa súčasne mení viacero hyperparametrov (počet epôch, model, augmentácie, dataset). Nie je teda možné jednoznačne určiť, ktorá zmena spôsobila pozorovaný rozdiel vo výsledkoch.
To, že sémantické mapy z modelu DINOv2 prinášajú merateľné zlepšenie oproti čistému RGB vstupu, nie je experimentmi presvedčivo podložené: Experiment I dual-input model (99,75 %) vs. Experiment II single-input (99,77 %). Nie je zároveň jasná štatistická významnosť týchto meraní.
Práca netestuje odolnosť voči deklarovaným problémovým scenárom (noc, dážď, oklúzia), napriek tomu, že ich identifikuje v teoretickej časti ako kľúčové výzvy, a tým zostáva priepasť medzi teoretickou motiváciou a experimentálnym overením nenaplnená.
Práca preukazuje funkčnú implementáciu a schopnosť pracovať so súčasnými nástrojmi hlbokého učenia, no experimentálna metodológia nestačí na podporu jej hlavného prínosu. Primárne sú nejasné procesy testovania a to, či sú výsledky modelov skutočne porovnateľné. Zároveň sa tiež zdá, že niektoré riešenia pridávajú zložitosť bez konkrétnej potreby spraviť systém zložitejším.
Evaluation level: zadání splněno
Evaluation level: přesahuje obvyklé rozmezí
Práca je významne dlhšia ako priemerná bakalárska práca. Z môjho pohľadu je však druhá kapitola značne prebytočná. Podobný štýl bakalárky implicitne predpokladá základné znalosti zo strojového učenia a nie je ich potrebné explicitne definovať. Bez nich by sa dalo ušetriť približne 10 strán.
Práca s literatúrou je celkovo dobrá. Autor cituje recentné metódy. Mierne zvážne sú citácie v sekcii 3.1.1, kde sa zdá, že celé je to parafráza referencie [20].
Grade proposed by reviewer: C
Responsibility: Mgr. et Mgr. Hana Odstrčilová