Master's Thesis

System for Visualization and Analysis of Worker Movements in the Workplace Using Computer Vision

Final Thesis 2.67 MB Appendix 53.16 kB

Author of thesis: Bc. Adam Babovák

Acad. year: 2025/2026

Supervisor: doc. Ing. Pavel Škrabánek, Ph.D.

Reviewer: Zdeněk Matějů

Abstract:

This thesis deals with the problem of automatic generation of human movement trajectories from image data. The thesis focuses on the field of computer vision, specifically on multiple object detection and tracking in video sequences. It summarizes the principles of visual object tracking, trajectory generation, and selected object tracking methods. Subsequently, the acquired knowledge is applied to the design and implementation of a system that generates trajectories based on image data. The proposed system is then evaluated and tested.

Keywords:

Trajectory maps, visual tracking of an object, multiple object tracking, trajectory generation, ByteTrack, BoT-SORT, MOT

Date of defence

10.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student obeznámil komisi s výsledky své DP. Po přečtení posudků následovaly dotazy komise: Vyhodnocení nejlepší metriky z tabulky uvedené v prezentaci. Dotaz na kriteriální fci, ze které vzešlo vyhodnocení. Předávání dat (použití více kamer). Diagram algoritmu (zdůvodnění výběru metody). Zvážení referenční metody Deepsort. Testování YOLO (rychlost). Student na všechny dotazy oponenta i komise reagoval uspokojivě (na většinu dotazů).

Language of thesis

Czech

Faculty

Department

Study programme

Applied Computer Science and Control (N-AIŘ-P)

Composition of Committee

doc. Ing. Oldřich Trenz, Ph.D. (předseda)
doc. Ing. Jakub Kůdela, Ph.D. (místopředseda)
prof. Ing. Zdeněk Hadaš, Ph.D. (člen)
doc. Ing. Pavel Škrabánek, Ph.D. (člen)
Ing. Jiří Kurfürst, Ph.D. (člen)
Ing. Zdeněk Švihálek (člen)
prof. Ing. Petr Doležel, Ph.D. (člen)
prof. Ing. Jiří Jaroš, Ph.D. (člen)

Diplomová práce se zabývá návrhem a implementací systému pro automatické generování trajektorií z obrazových dat s využitím metod počítačového vidění. Student splnil všechny cíle stanovené v zadání práce. V teoretické části zpracoval rozsáhlou rešerši zaměřenou na problematiku detekce a sledování objektů, tvorby trajektorií a současných metod využívaných v oblasti počítačového vidění. Rešeršní část poskytuje dostatečný přehled o řešené problematice a vytváří vhodný základ pro následnou realizaci navrženého systému.

V praktické části student navrhl a implementoval softwarový systém umožňující automatické generování trajektorií z videozáznamů. V průběhu řešení bylo nutné přizpůsobit původní záměr práce reálným podmínkám a dostupnosti dat, přičemž student zvolil vhodný náhradní přístup založený na využití veřejně dostupných datových sad a moderních metod víceobjektového sledování. Oceňuji zejména schopnost reagovat na vzniklé komplikace a dovést řešení do funkční podoby navzdory okolnostem, které nebyly plně v jeho kompetenci ovlivnit. Výsledkem je funkční aplikace umožňující generování, ukládání a vizualizaci trajektorií pohybujících se objektů.

Při řešení byly využity vhodné a aktuální nástroje a metody odpovídající současnému stavu poznání v oblasti počítačového vidění. Student prokázal schopnost samostatné implementace, integrace jednotlivých komponent systému a experimentálního ověření navrženého řešení. Pozitivně hodnotím rovněž provedené testování a porovnání použitých metod, na jejichž základě student formuloval odpovídající závěry. Interpretace dosažených výsledků je věcná a přiměřeně kritická. Přestože práce nepřináší nový algoritmický přístup, její přínos spočívá v návrhu a realizaci uceleného softwarového řešení a v ověření možností využití současných metod sledování objektů pro tvorbu trajektorií.

Práce je logicky členěna a jednotlivé kapitoly na sebe navazují. Formální úroveň práce je dobrá, text je přehledný a doplněný odpovídajícím množstvím obrázků a schémat. Použitá literatura je aktuální a vhodně zvolená vzhledem k řešené problematice. Student při zpracování tématu prokázal vysokou míru samostatnosti, schopnost řešit technické problémy a orientaci v moderních metodách počítačového vidění.

Vzhledem k výše uvedenému doporučuji práci k obhajobě a hodnotím ji známkou B.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita C
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: B

Reviewer’s report
Zdeněk Matějů

Slovní hodnocení práce

Diplomová práce Bc. Adama Babováka představuje ucelené softwarové řešení pro aktuální problematiku analýzy pohybu v průmyslu. Použité textové GUI není pro průmyslové implementace žádnou překážkou. Autor prokázal vysokou úroveň technických dovedností při práci s moderními frameworky počítačového vidění, jako jsou Ultralytics YOLO a OpenCV. Oceňuji hloubku teoretické rešerše i evaluaci na standardizovaných datasetech. Hardware systém pro PC platformu je plně funkční, dobře zdokumentovaný a správně zhodnocený, ve finále je určitě lepším řešením než původně navrhovaný systém založený na platformě Raspberry Pi (ta byla uvažována hlavně z důvodu mobility a flexibilitě možného umístění). Práce splňuje veškeré požadavky kladené na závěrečnou práci a je dobrým podkladem pro další rozvoj v oblasti automatizované analýzy pracovišť.

Hodnocení dle stanovených kritérií

 

a) Splnění požadavků a cílů zadání: B

Práce úspěšně naplnila čtyři hlavní cíle definované v oficiálním zadání, kterými byly rešerše metod, návrh systému, implementace v jazyce Python a následná evaluace. Při srovnání s původním projektovým záměrem se výsledný text více soustředí na obecnou problematiku trajektorických (spaghetti) map přičemž odsouvá do pozadí vyhodnocení pomocí „heat map“. Z praktického pohledu to ovšem nemá žádný dopad na finální vyhodnocení pracoviště, kdy je spaghetti diagram nakonec možná i lepším řešením než samotné heat mapy. Přesto lze konstatovat, že jádro úkolu bylo splněno a systém je schopen generovat trajektorie pro analýzu pohybů pracovníků.

b) Postup a rozsah řešení, adekvátnost použitých metod: A

Zvolený postup kombinující techniky „tracking-by-detection“ s moderními detektory řady YOLO (v8, v11 a v26) je adekvátní současnému stavu techniky. Rozsah řešení pokrývá celý proces od získávání videozáznamů přes detekci a asociaci objektů až po ukládání výsledků do strukturovaných CSV a JSON souborů. Použití metod ByteTrack a BoT-SORT pro simulaci online provozu je metodicky správné.

c) Vlastní přínos a originalita: B

Hlavní přínos autora spočívá v integraci pokročilých algoritmů počítačového vidění do uceleného a ovladatelného softwarového systému s vlastním textovým uživatelským rozhraním (TUI). Ačkoliv autor nevytvořil zcela novou metodu sledování, jeho přínos tkví v praktické realizaci celého řetězce zpracování dat a v porovnání různých verzí detekčních modelů v rámci jednoho frameworku.

d) Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry: A

Autor prokázal vynikající schopnost interpretace dosažených výsledků pomocí standardních metrik jako MOTA, MOTP, IDF1 a moderní metriky HOTA. Správně a kriticky vyhodnocuje, že průměrné hodnoty přesnosti jsou dány především kvalitou detekce a absencí specifického trénování modelů pro konkrétní skladové prostředí. Závěry o vhodnosti metody ByteTrack pro aplikace kladoucí důraz na rychlost jsou podloženy provedenými měřeními.

e) Využitelnost výsledků v praxi nebo teorii: B

Vytvořený software je ve své podstatě přímo využitelný pro analýzu pohybu osob a techniky v průmyslových prostorech, což odpovídá potřebám zadavatele z praxe. Práce tvoří funkční základ, který lze po nutných optimalizacích detekčního modelu (a ve spolupráci s optimalizací umístění kamer ve sledovaném prostoru) nasadit pro reálné analýzy layoutů pracovišť.

f) Logické uspořádání práce a formální náležitosti: A

Práce má jasnou a logickou strukturu, která postupuje od teoretických základů sledování a detekce až po praktickou implementaci a testování. Obsahuje všechny formální náležitosti, včetně abstraktů a klíčových slov. Velmi oceňuji i jasné prohlášení o využití nástrojů generativní AI!

g) Grafická, stylistická úprava a pravopis: A

Text je psán kultivovaným technickým stylem a je prost výrazných pravopisných chyb. Grafická úroveň práce je odpovídající technickému zaměření textu, grafy jsou přehledné a diagramy uživatelského rozhraní i schémata algoritmů vhodně doplňují odborný text.

h) Práce s literaturou včetně citací: A

Autor pracuje s dostatečně obsáhlým seznamem 33 relevantních a aktuálních literárních zdrojů, které zahrnují jak základní vědecké články k algoritmům, tak dokumentaci k použitým knihovnám. Citace v textu jsou důsledné a v souladu s normami.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová