Master's Thesis

Visual surveillance system

Final Thesis 3.42 MB Appendix 11.6 MB

Author of thesis: Bc. Josef Janásek

Acad. year: 2025/2026

Supervisor: Ing. Miloslav Richter, Ph.D.

Abstract:

This diploma thesis deals with the design and implementation of a camera-based system
for visual monitoring and evaluation of Overall Equipment Effectiveness (OEE) in an
industrial environment. The theoretical part provides an overview of current commercial
solutions and image processing methods with a focus on anomaly detection. The practical
part describes in detail the development of a distributed software application that
combines classical computer vision algorithms for unplanned downtime detection with
modern deep learning architectures for precise identification of machine working cycles.
The system enables seamless real-time execution through asynchronous processing and
ensures robust communication with a supervisory enterprise dashboard. Experimental
testing results demonstrated the high reliability and stability of the proposed solution,
making the system a fully-fledged and interesting alternative to physical sensors.

Keywords:

visual monitoring, computer vision, machine learning, deep learning, temporal
convolutional networks (TCN), Overall Equipment Effectiveness (OEE), downtime
detection, Industry 4.0

Date of defence

10.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

Process of defence

Student obhájil diplomovou práci. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy student odpověděl na dotazy týkající se vývojového diagramu a technických možnostech při realizace práce.

Language of thesis

Czech

Faculty

Fakulta elektrotechniky a komunikačních technologií

Department

Department of Control and Instrumentation

Study programme

Cybernetics, Control and Measurements (MPC-KAM)

Composition of Committee

doc. Ing. Radovan Hájovský, Ph.D. (předseda)
doc. Ing. Zdeněk Bradáč, Ph.D. (místopředseda)
Ing. Peter Honec, Ph.D. (člen)
Ing. Ilona Janáková, Ph.D. (člen)
Ing. Stanislav Klusáček, Ph.D. (člen)
Ing. Miloslav Richter, Ph.D. (člen)

Supervisor’s report
Ing. Miloslav Richter, Ph.D.

Praktické téma diplomové práce s realizací v průmyslu si student přinesl sám. I přesto postup práce pravidelně konzultoval a seznamoval mě s postupem prací a dosaženými výsledky. Zprostředkoval mi i návštěvu na výrobní hale, kde byla jeho aplikace testována. Jako u většiny průmyslových aplikací došlo k použití doporučených komponent, stejně jako k úpravám v zamýšleném postupu řešení na základě získaných poznatků a vývoje ve firmě. Z hlediska výsledné kvality řešené diplomové práce však neměly tyto zásadnější vliv.
Práce je dobře koncipovaná, jednotlivé kapitoly jsou přehledné a svým rozsahem odpovídají popisované problematice. Připomínku bych měl k některým prezentacím obrazovek programu, které jsou díky malému fontu špatně čitelné. Rozsah práce je 42 stran. První část věnovaná rešerši je čerpaná z literatury, která je vhodně vybrána. Druhá část, ve které je popisované řešení, je samostatnou prací studenta. Práce sloužila jako pilotní projekt pro testování vlastností tohoto typu přístupu pro kontrolu ve výrobě. Z důvodu nutnosti testy ve výrobě plánovat nebylo možné pořídit více testovacích běhů, ale po důkladném otestování na současném stanovišti se počítá s využitím i na dalších pracovištích.
Předložená práce svědčí o magisterských schopnostech studenta. Points proposed by supervisor: 95

Grade proposed by supervisor: A

Reviewer’s report
Ing. Karel Horák, Ph.D.

Předložená diplomová práce má název „Systém pro vizuální dohled prostorů“ a zjednodušeně jejím cílem je pomocí půdorysného pohledu kamery detekovat stav pracoviště na výrobním zařízení a případnou nečinnost lidského operátora. Vzhledem ke skutečnosti, že analogické téma a pro tutéž společnost ALPS Electric Czech zpracovával můj diplomant loňského roku, pouze za použití radarového snímače, je mi problematika důvěrně známa.
Přestože předložená práce v souhrnu splňuje body zadání a technické řešení je v podstatě také správné, mám výrazné výhrady nejméně k typografické části dokumentu. Samotný text práce zabírá od úvodu po závěr včetně 43 stran, přičemž nezanedbatelný počet stran je zaplněn ani ne z poloviny, aniž by následovala hlavní kapitola. Příkladem str. 21, str. 25, str. 29, str. 34, str. 43 nebo vývojové diagramy na stranách 34 a 35, které by bez problému mohly být přehledně na jedné straně a mohly tak být i lépe porovnatelné. Podobně po str. 40 uvnitř kapitoly o realizaci systému následuje str. 13 se seznamem obrázků a poté student pokračuje stranou 41. Naskýtá se pak otázka, zda student vůbec provedl nějakou korekci dokumentu před tiskem. Od strany 43 do str. 52, tedy celých 10 stran práce, jsou pak vkládány velké obrázky printscreenů uživatelské aplikace, které jednak měly být umístěny v přílohách, jednak nejsou často čitelné a ani doprovodný text je více nepopisuje. Příkladem může být Obr. 20 na str. 46 odkazovaný jako „detailní výsledky analýzy nahraného videa“, který je o dvě strany dříve na str. 44 pouze zmíněn a dále není v textu nikde blíže popsán, přičemž (pod lupou luštěný) samotný obsah obrázku uvádí pro čtenáře nicneříkající změť čísel. Podobně práce obsahuje i chyby v kapitolování, kdy zjevně kapitoly 1.3 a 1.4 měly být podkapitolou 1.2. Uvedené kapitoly nadto vyjmenovávají různé tradiční i ML metody zpracování obrazu pro detekci abnormalit, ale nepopisují je dostatečně na to, aby diplomant prokázal, že ve výsledku vybral vhodnou metodu kvalifikovaně a znale, nikoli náhodně ve smyslu s dělem na komára.
Nicméně ze stručného popisu samotné implementace od str. 36, u níž je třeba diplomantovi přiznat nemalé množství manuální práce při sběru provozních dat (videí provozu), lze dovodit, že zadání práce bylo v podstatě splněno, byť vzhledem k absenci rozsáhlejší testovací fáze nelze dobře usuzovat na stabilitu navrženého řešení zejména při změnách provozních podmínek. Ty by totiž TEORETICKY měly být použitými robustními metodami pokryty – konkrétně detekce pohybu, resp. abnormalit ve videu pomocí architektury CNN s modelem MobileNetV3-Small v kombinaci s Temporal Convolutional Network zakládá robustnost vůči artefaktům, popř. šumu a jiným vlivům, není však v práci PRAKTICKY dostatečně otestována (s výjimkou umělé augmentace vstupních dat simulujících zmíněné chyby, což je ale pro ryze průmyslovou úlohu zcela nedostatečné). Rovněž hodnocení výkonnosti tří implementovaných modelů na str. 53 není bezchybné, kdy v kapitole absentuje především definice „Stability“ v tabulce 3 a není tak zřejmé, jakým způsobem hodnota vzniká, ani jakým způsobem jsou míry Accuracy, F1-score a právě Stability kombinovány v závěrečný verdikt o vhodnosti CNN+TCN jako nejlepším řešení (v textu je pouze uvedeno „jako nejlepší poměr mezi přesností a stabilitou vyšel model CNN+TCN“, kdy ve skutečnosti však nejde o poměr parametrů, ale nějakou jejich v práci neuvedenou kombinaci).
Diplomantovi pak lze přičíst k dobru, že úlohu samotnou řešil komplexně a např. dílčí úkol komunikace s nadřazeným systémem (webový server) vyřešil elegantně pomocí FastAPI a sdílení JSON objektů obsahujících aktuální stav výroby. Podobně je třeba zvážit, že výrobní firma měla požadavky na specifický HW, tedy student neměl ve svém řešení pravděpodobně volnou ruku.
Z použitých metod i jejich implementace lze závěrem shrnout, že student zadání práce splnil, byť nejméně po formální stránce na minimální úrovni na hranici přijatelnosti a po technické stránce s jistými výhradami ohledně ověřování výsledků, stále však předložil principiálně funkční řešení. Z toho důvodu doporučuji práci k obhajobě před komisí. Topics for thesis defence:

Popište blok "čekej" na obrázku na str. 26 a vysvětlele, jak za dodržení pravidel vývojových diagramů lze z tohoto stavu uniknout do další iterace (příp. opravte popis bloku)?
Jak je definována stabilita v tabulce 3 a jak je definováno kritérium užívající parametry z této tabulky udávající výkonnosti modelu?
Popište metriku F1-skóre, kdy matematicky ukažte proč se jedná o harmonický průměr preciznosti a citlivosti a na základě toho vysvětlete, proč jste pro určenou úlohu použil mezi dalšími právě tuto metriku, tedy jaká okolnost procesu výrobního stroje tuto metriku přímo vybízí?
V jakém rozsahu jste prováděl zátěžové testy obecně zmíněné v závěru na str. 57 poslední odstavec, konkrétně na kolika zařízeních (stanovištích) se SW testoval, na kolika různých procesech (výrobních sekvencích) a v jakém rozsahu (stačí řádově provozní hodiny)?

Points proposed by reviewer: 70

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová

VUT

Faculties and university institutes

Parts

Visual surveillance system