Bachelor's Thesis

Analysis of parking lot occupancy from the image and processing of the acquired data

Author of thesis: Bc. Rudolf Baumgartner

Acad. year: 2025/2026

Abstract:

Parking issues have a fundamental impact on urban mobility and the overall quality of life of residents. The aim of this bachelor’s thesis is the design and implementation of a system for the automatic detection of parking lot occupancy from aerial images of parking lots using semantic maps. The core of the proposed solution is the use of a modern Vision Transformer model (DINOv2) for generating these maps. The thesis describes which datasets were used, the reason for their selection and the chosen architecture. A significant part of the work covers the implementation process, from loading the data to training, testing, and evaluating the model. The practical part focuses on optimizing weights using semantic loss and comparing two vehicle-detection modes afterwards. The first mode is the analysis of parking-lot crops from aerial images of parking lots, while the second mode enriches this analysis with information in the form of crops from semantic maps. The thesis contains eight experiments that analyze these modes in detail, with training parameters presented in the form of a table followed by the results of the given experiment. The best model for the PKLot and CNRPark-EXT datasets achieved a detection accuracy of 99.78 % using
the ResNeXt50 architecture in the mode with semantic maps. The conclusion summarizes the findings and limitations of the proposed solution. It also outlines directions for possible further research for a diploma thesis.

Keywords:

deep learning, neural networks, convolutional neural networks, parking lot occupancy, crops, vehicle counting, semantic segmentation

Date of defence

16.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C

Topics for thesis defence

Aký je presný počet snímok a cropov v trénovacej, validačnej a testovacej množine pre každý experiment? Kto definoval tento split?
Byla práce součástí nějakého projektu?
Bude výsledek práce nasazen v praxi?
K čemu používáte segmentační mapy?
Fungoval by navržený systém v noci?

Language of thesis

Slovak

Faculty

Fakulta informačních technologií

Department

Department of Computer Graphics and Multimedia

Study programme

Information Technology (BIT)

Composition of Committee

doc. Ing. Lukáš Burget, Ph.D. (předseda)
doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda)
Ing. Libor Polčák, Ph.D. (člen)
Ing. Michal Hradiš, Ph.D. (člen)
Ing. Martin Žádník, Ph.D. (člen)

Supervisor’s report
Ing. Pavol Dubovec

Študent navrhol a implementoval funkčné riešenie analýzy obsadenosti parkoviska z obrazových dát. Oceňujem najmä experimentálny prístup a snahu overiť využitie sémantických máp a modelu DINOv2 pri analýze obsadenosti parkovacích miest.

Práca má dobrý technický základ a študent preukázal primeranú samostatnosť pri implementácii aj návrhu experimentov. Niektoré experimenty však nepriniesli oproti jednoduchším prístupom jednoznačné zlepšenie. Ich vyhodnotenie mohlo byť detailnejšie. Rezervy vidím aj vo finálnom spracovaní technickej správy, najmä v systematickejšom zhodnotení výsledkov.

Napriek uvedeným rezervám považujem prácu za solídne spracovanú bakalársku prácu.

Evaluation criteria	Verbal classification
Information about assignment	Téma práce bola pomerne náročná, keďže okrem samotnej implementácie zahŕňala aj návrh experimentov, prácu s datasetmi a vyhodnotenie viacerých prístupov k určovaniu obsadenosti parkovacích miest z obrazových dát. Študent sa pri riešení oboznámil s problematikou počítačového videnia a hlbokého učenia. V práci experimentoval s využitím predtrénovaného modelu DINOv2 a sémantických máp pri určovaní obsadenosti parkovacích miest. Súčasťou riešenia bol aj návrh vlastnej stratovej funkcie a porovnanie viacerých variantov tréningu. Riešenie je funkčné a zadanie považujem za splnené, hoci nie všetky formálne výstupy zadania boli odovzdané v plnom rozsahu.
Work with literature	Študent si potrebnú literatúru vyhľadával samostatne. Vychádzal najmä zo základných zdrojov k strojovému učeniu, hlbokému učeniu a počítačovému videniu, ktoré doplnil o práce súvisiace s detekciou obsadenosti parkovísk. Literatúru využil pri návrhu vlastného riešenia. Priestor na zlepšenie vidím najmä v dôslednejšom porovnaní navrhnutého riešenia so súčasnými state-of-the-art prístupmi v danej oblasti.
Activity during solution, consultations, communication	Študent na práci priebežne pracoval počas oboch semestrov, výraznejšie najmä v druhom semestri. Konzultácie využíval pravidelne a prichádzal na ne s konkrétnymi otázkami alebo návrhmi ďalšieho postupu. Komunikácia bola bezproblémová.
Activity during completion	Väčšina implementačnej časti bola dokončená v dostatočnom predstihu. Finálne testovanie, vyhodnotenie experimentov a formulácia záverov však mohli byť spracované systematickejšie a s väčšou časovou rezervou. Napriek tomu bol výsledný obsah práce konzultovaný a finálna verzia práce pôsobí ucelene.
Publication activity, awards	Nie je mi známa žiadna publikačná činnosť, ocenenie ani verejné zverejnenie softvéru súvisiace s touto bakalárskou prácou.

Points proposed by supervisor: 80

Grade proposed by supervisor: B

Reviewer’s report
Ing. Marek Vaško

Práca sa venuje aktuálnej téme a preukazuje, že študent zvládol implementáciu netriviálneho systému s modernými nástrojmi hlbokého učenia.

Teoretická časť je korektná, avšak je neúmerne rozsiahla. Praktická časť je funkčná a systematicky členená do troch návrhov s jasnou motiváciou.

Hlavnou slabinou je experimentálna sekcia; experimenty nie sú metodologicky konzistentné; výhoda sémantických máp nie je presvedčivo preukázaná.

Celkovo navrhujem známku C.

Evaluation criteria	Verbal classification	Points
The difficulty of the assignment	Evaluation level: moderately difficult assignment Zadanie vyžaduje znalosti zo strojového učenia a počítačového videnia, ktoré mierne presahujú rozsah bakalárskeho štúdijného programu. Avšak základné riešenie úlohy by vyžadovalo správne pripravené dáta a jeden príkaz s príslušným Python balíčkom. Celkovo teda hodnotím zadanie ako priemerne zložité.
Presentation level of the technical report	Technická práca dobre chronologicky nadväzuje na seba. Kapitola 2 mi príde prebytočná. Neexistencia sekcie 4.1 by taktiež nemala žiadny vplyv na zvyšok práce. Je celkovo prezenovaných 8 experimentov, žiadna prehľadná tabuľka. Výsledky sú rozhadzané v odrážkach v každej sekcii zvlášť; čitateľ musí listovať naprieč celou kapitolou. Popisy pipeline pri jednotlivých návrhoch sú v dvoch prípadoch takmer identické a v nich sa údaje značne opakujú. Zároveň niektoré grafy pri výsedkoch experimentov značne nafukujú rozsah a neprinášajú validný vstup, viď priebeh tréningu pre každý model. Celkovo však veľmi pozitívne hodnotím množstvo vizuálnych príkladov a schém.	75
Formal preparation of a technical report	Úprava textu je dobrá. Po typografickej stránke je nekonzistentná anotácia skratiek: niekedy skratky sedia s iniciálmi, niekedy nie a niekedy podobná anotácia definuje anglický výraz. V práci je menšie množstvo jazykových chýb.	80
Realisation output	Implementovaný systém je funkčný a dosahuje vysokú klasifikačnú presnosť (až 99,78 %) na štandardných dátových sadách PKLot a CNRPark-EXT. Avšak experimentálna časť trpí zásadným metodologickým nedostatkom: v jednotlivých experimentoch sa súčasne mení viacero hyperparametrov (počet epôch, model, augmentácie, dataset). Nie je teda možné jednoznačne určiť, ktorá zmena spôsobila pozorovaný rozdiel vo výsledkoch. To, že sémantické mapy z modelu DINOv2 prinášajú merateľné zlepšenie oproti čistému RGB vstupu, nie je experimentmi presvedčivo podložené: Experiment I dual-input model (99,75 %) vs. Experiment II single-input (99,77 %). Nie je zároveň jasná štatistická významnosť týchto meraní. Práca netestuje odolnosť voči deklarovaným problémovým scenárom (noc, dážď, oklúzia), napriek tomu, že ich identifikuje v teoretickej časti ako kľúčové výzvy, a tým zostáva priepasť medzi teoretickou motiváciou a experimentálnym overením nenaplnená.	75
Usability of results	Práca preukazuje funkčnú implementáciu a schopnosť pracovať so súčasnými nástrojmi hlbokého učenia, no experimentálna metodológia nestačí na podporu jej hlavného prínosu. Primárne sú nejasné procesy testovania a to, či sú výsledky modelov skutočne porovnateľné. Zároveň sa tiež zdá, že niektoré riešenia pridávajú zložitosť bez konkrétnej potreby spraviť systém zložitejším.
The extent to which the requirements of the assignment have been met	Evaluation level: assignment fulfilled
Extent of the technical report	Evaluation level: exceeds the usual extent Práca je významne dlhšia ako priemerná bakalárska práca. Z môjho pohľadu je však druhá kapitola značne prebytočná. Podobný štýl bakalárky implicitne predpokladá základné znalosti zo strojového učenia a nie je ich potrebné explicitne definovať. Bez nich by sa dalo ušetriť približne 10 strán.
Work with literature	Práca s literatúrou je celkovo dobrá. Autor cituje recentné metódy. Mierne zvážne sú citácie v sekcii 3.1.1, kde sa zdá, že celé je to parafráza referencie [20].	80

Topics for thesis defence:

Aký je presný počet snímok a cropov v trénovacej, validačnej a testovacej množine pre každý experiment? Kto definoval tento split?

Points proposed by reviewer: 75

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová

VUT

Faculties and university institutes

Parts

Analysis of parking lot occupancy from the image and processing of the acquired data