Master's Thesis

Development of a Predictive Model for Temperature Systems Using Machine Learning Methods

Final Thesis 8.27 MB Appendix 33.49 kB

Author of thesis: Bc. Jan Kamínek

Acad. year: 2025/2026

Abstract:

This master's thesis focuses on the design and implementation of predictive models for forecasting the temperatures of the BUD100 Multi-purpose cylindrical grinding machine. The research aim is to employ machine learning methods for early prediction of temperature fluctuations. The study provides a detailed analysis and comparison of three distinct approaches. The statistical SARIMAX model, the Random Forest and LightGBM algorithms, and the Long Short-Term Memory (LSTM) recurrent neural network. Real operational data from the machine's sensor network were utilized for model training and validation.

Keywords:

Machine learning, time-series forecasting, grinding machine, neural networks, LSTM, Random Forest, SARIMAX, Walk-forward validation

Date of defence

18.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

Process of defence

Diplomant seznámil komisi se svojí prací na téma Vývoj predikčního modelu pro teplotní systémy pomocí metod strojového učení. Na úvod seznámil komisi s popisem problematiky, rešeršním rozborem, systémovým rozborem řešené problematiky a analýzou dat. Pokračoval volbou modelu a softwarovou architekturou. Na závěr provedl validaci, hodnocení modelů, technicko-ekonomické zhodnocení a doporučení pro další rozvoj. Po prezentaci své práce diplomant zodpovídal doplňující otázky od oponenta. Všechny doplňující otázky byly zodpovězeny. Následně zodpovídal položené doplňující otázky členů komise. - Jak probíhá komunikace mezi strojem a PC? - Jak jste verifikoval učící proces a jakým způsobem validoval výsledky? - Jakou roli má nejistota měření? - Co je cílem predikování teploty u stroje? - Jak dloho předem je potřeba získávat data, abychom mohli předpovědět teplotu s požadovanou přesností za 30 minut? - Folie 6 - Warum diese Positionen? - Folie 15 + 16 - Welcher Zeitbereich? - Wie ist Echtzeit definiert? - Wie hoch ist die Genauigkeit der Temperatursensoren? - Zustand der Maschine bein Messen?

Language of thesis

Czech

Faculty

Fakulta strojního inženýrství

Department

Institute of Production Machines, Systems and Robotics

Study programme

Production Systems (N-VSY-P)

Composition of Committee

doc. Ing., Dipl.-Ing Michal Holub, Ph.D., FEng. (předseda)
doc. Ing. Petr Blecha, Ph.D., FEng. (místopředseda)
Ing. Radim Blecha, Ph.D. (člen)
Ing. Zdeněk Tůma, Ph.D. (člen)
Dr.-Ing. Holger Schlegel (člen)
M.Sc. Manuel Norberger (člen)

Supervisor’s report
Ing. Adam Jelínek

Cílem práce bylo navrhnout a implementovat programový modul pro predikci časových řad, demonstrovaný na úloze předpovědi teplot multifunkčního hrotového brousicího stroje BUD100 Multi. Práce tento cíl splňuje. Autor postupuje od rešerše a systémového rozboru přes komparativní analýzu metod až k implementaci a vyhodnocení funkčního řešení.

Teoretická část (kap. 3 a 4, s. 23–79) pokrývá knihovny pro datovou vědu a strojové učení, předzpracování dat, klasické autoregresní modely i regresní, stromové a hluboké přístupy včetně RNN a LSTM. Rešerše je obsáhlá a věcně správná, místy však přesahuje rámec nezbytný pro řešený problém, takže těžiště vlastní práce nastupuje relativně pozdě. Systémový rozbor (kap. 5, s. 80–95) ústí do přehledného workflow diagramu a myšlenkové mapy reprezentativních parametrů (obr. 57 a 58), které dobře propojují teorii s následným řešením.

Za nejhodnotnější považuji statistickou analýzu dat v kap. 6.1–6.3 (s. 96–103). Student na základě korelační heatmapy (obr. 59), STL dekompozice (obr. 61–63) a analýz ACF, PACF a CCF (obr. 64–66) odůvodněně volí reprezentativní senzory, vzorkovací periodu i parametry vstupující do modelů. Tato část je zpracována nadstandardně a je metodicky správným základem pro výběr modelu. Na ni navazuje komparativní vyhodnocení čtyř metod – SARIMAX, LightGBM, Random Forest a LSTM (kap. 6.4, s. 103–119) – s konzistentní metodikou dopředné walk-forward validace, autokorelace reziduí, degradačních charakteristik a grafů parciální závislosti. Výsledky shrnuté v kap. 7 (tab. 5, s. 127) jsou interpretovány korektně: stromové metody snížily chybu MAE u dynamických senzorů AX1/AZ1 z hodnot kolem 2,3 °C u referenčního SARIMAXu na cca 0,4–0,6 °C, přičemž LSTM u týchž senzorů vykazuje fyzikálně věrohodnější hladký průběh parciální závislosti. Implementace programu podle navržené softwarové architektury (kap. 6.5, s. 119–126) je doložena přiloženými zdrojovými kódy a popisem postupu spuštění.

Z hlediska splnění zadání má slabinu bod technicko-ekonomického zhodnocení, který je v kap. 7 zpracován spíše okrajově a omezuje se na kvalitativní konstatování bez vyčíslení přínosu. Úvaha o redukci počtu fyzických senzorů zaznívá až v diskusi jako autorův návrh dalšího směru, nikoli jako realizovaný výstup. Po formální stránce práce obsahuje chyby: text obsahuje překlepy, gramatické nedostatky i nepřesnosti v odborných termínech, grafické výstupy a některé obrázky jsou vkládány rastrově s drobným písmem. Seznam literatury čítá 13 položek s převahou online zdrojů nad recenzovanými publikacemi a s neúplnými údaji u zdroje [1].

V průběhu řešení student pracoval samostatně, aktivně konzultoval a reagoval na připomínky; osvojil si přitom práci s ekosystémem jazyka Python pro datovou analýzu, prostředím terminálu, kontejnerizací a sloupcovým formátem Parquet. Přes uvedené výhrady je odborné jádro práce solidní a prokazuje reálnou kompetenci autora v oblasti strojového učení a analýzy časových řad. Práce splňuje požadavky kladené na diplomovou práci.

Celkově hodnotím práci studenta velmi kladně a předloženou diplomovou práci doporučuji k obhajobě.

Evaluation criteria	Grade
Splnění požadavků a cílů zadání	B
Postup a rozsah řešení, adekvátnost použitých metod	C
Vlastní přínos a originalita	B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry	B
Využitelnost výsledků v praxi nebo teorii	C
Logické uspořádání práce a formální náležitosti	B
Grafická, stylistická úprava a pravopis	D
Práce s literaturou včetně citací	C
Samostatnost studenta při zpracování tématu	A

Grade proposed by supervisor: B

Reviewer’s report
Ing. Daniel Zuth, Ph.D.

Práce se věnuje vývoji predikčního modelu pro analýzu teplotních charakteristik stroje. Teoretická část je zaměřená na rešerši v oblasti prediktivních modelů a také předzpracování dat a s ohledem na počet stran obsahuje velké množství nadbytečné teorie. Praktická část začíná na straně 81, ale i přesto obsahuje teorii a za skutečné řešení konkrétního problému, lze označit kapitolu 6 na straně 95. Co se týká samotného řešení tak nadstandardně je zpracována statistická analýza dat pro výběr vhodných parametrů pro vstup do predikčního modelu a jejich vzorkovací periody. Poté následuje porovnání výsledků jednotlivých modelů. Součástí práce jsou i zdrojové kódy, které byly v práci použity. Co se týká splnění cílů zadání, tak lze vytknout slabé zpracování bodu „Technicko–ekonomické zhodnocení navrženého řešení“, kde autor uvádí v kapitole 7 pouze konstatování, že „Z technicko-ekonomického hlediska přináší navržené řešení potenciál predikovat hodnoty do budoucnosti s nízkou chybovostí“.

Text práce obsahuje velké množství překlepů („přtože“, „psoledních“, „zavilost“ a další), gramatických chyb („jednotlivé data“, “data byly sjednoceny“ a další), chyby v odborných výrazech (několikrát chybně „Skicit-learn“, „Mean squer error“ a další). Všechny obrázky v práci jsou v rastrové grafice, a to včetně tabulek, které obsahují pouze text (např. obr. 16) anebo ukázky kódu (např. obr. 91 a dále) a taktéž všechny vlastní grafické výstupy jsou vkládány rastrově s velmi malými fonty. Práce nedodržuje jednotné zarovnání textu (str. 66, 105,107, 108) a stejně tak obrázky jsou většinově zarovnány na střed, ale například obr. 76 až 82 jsou zarovnány doprava.

Seznam použité literatury obsahuje pouze 13 zdrojů a doporučená literatura je ignorována. Zdroj 1 nemá uveden rok vydání a vydavatele. V použité literatuře jsou spíše online blogy než recenzované publikace.

Evaluation criteria	Grade
Splnění požadavků a cílů zadání	B
Postup a rozsah řešení, adekvátnost použitých metod	B
Vlastní přínos a originalita	B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry	B
Využitelnost výsledků v praxi nebo teorii	C
Logické uspořádání práce a formální náležitosti	B
Grafická, stylistická úprava a pravopis	D
Práce s literaturou včetně citací	D

Topics for thesis defence:

Při používání LSTM zmiňujete nutnost normalizace dat. Správná volba normalizace dat u této technologie je poměrně zásadní, ale vy se jí věnujete i v teorii spíše okrajově. Jaké typy normalizace dat umožňuje knihovna scikit-learn a jak zvolit ten správný typ normalizace?
V kapitole 3.1 popisujete vhodné knihovny, ale vůbec se nezmiňujete o licencích, kdy každá knihovna může být pod jinou licencí. Pokud by váš projekt měl být používán komerčně v průmyslu, jaké by byly pro vás vhodné licence?
V práci zmiňujete doporučení nasadit „hybridní strategii“ a to s odůvodněním velké výpočetní náročnosti. Popište trochu blíže vaši představu nasazení v průmyslu, na jakém stroji by probíhal proces učení a na jakém stroji proces predikce. Jaká je výpočetní náročnost predikce (nikoliv učení) vašeho LSTM modelu na vašem HW pro jeden dopředný krok, tzn stav za 30minut.

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová

VUT

Faculties and university institutes

Parts

Development of a Predictive Model for Temperature Systems Using Machine Learning Methods