Master's Thesis

Development of a Predictive Model for Temperature Systems Using Machine Learning Methods

Final Thesis 8.27 MB Appendix 33.49 kB

Author of thesis: Bc. Jan Kamínek

Acad. year: 2025/2026

Supervisor: Ing. Adam Jelínek

Reviewer: Ing. Daniel Zuth, Ph.D.

Abstract:

This master's thesis focuses on the design and implementation of predictive models for forecasting the temperatures of the BUD100 Multi-purpose cylindrical grinding machine. The research aim is to employ machine learning methods for early prediction of temperature fluctuations. The study provides a detailed analysis and comparison of three distinct approaches. The statistical SARIMAX model, the Random Forest and LightGBM algorithms, and the Long Short-Term Memory (LSTM) recurrent neural network. Real operational data from the machine's sensor network were utilized for model training and validation.

Keywords:

Machine learning, time-series forecasting, grinding machine, neural networks, LSTM, Random Forest, SARIMAX, Walk-forward validation

Date of defence

18.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Diplomant seznámil komisi se svojí prací na téma Vývoj predikčního modelu pro teplotní systémy pomocí metod strojového učení. Na úvod seznámil komisi s popisem problematiky, rešeršním rozborem, systémovým rozborem řešené problematiky a analýzou dat. Pokračoval volbou modelu a softwarovou architekturou. Na závěr provedl validaci, hodnocení modelů, technicko-ekonomické zhodnocení a doporučení pro další rozvoj. Po prezentaci své práce diplomant zodpovídal doplňující otázky od oponenta. Všechny doplňující otázky byly zodpovězeny. Následně zodpovídal položené doplňující otázky členů komise. - Jak probíhá komunikace mezi strojem a PC? - Jak jste verifikoval učící proces a jakým způsobem validoval výsledky? - Jakou roli má nejistota měření? - Co je cílem predikování teploty u stroje? - Jak dloho předem je potřeba získávat data, abychom mohli předpovědět teplotu s požadovanou přesností za 30 minut? - Folie 6 - Warum diese Positionen? - Folie 15 + 16 - Welcher Zeitbereich? - Wie ist Echtzeit definiert? - Wie hoch ist die Genauigkeit der Temperatursensoren? - Zustand der Maschine bein Messen?

Language of thesis

Czech

Faculty

Department

Study programme

Production Systems (N-VSY-P)

Composition of Committee

doc. Ing., Dipl.-Ing Michal Holub, Ph.D., FEng. (předseda)
doc. Ing. Petr Blecha, Ph.D., FEng. (místopředseda)
Ing. Radim Blecha, Ph.D. (člen)
Ing. Zdeněk Tůma, Ph.D. (člen)
Dr.-Ing. Holger Schlegel (člen)
M.Sc. Manuel Norberger (člen)

Supervisor’s report
Ing. Adam Jelínek

Cílem práce bylo navrhnout a implementovat programový modul pro predikci časových řad, demonstrovaný na úloze předpovědi teplot multifunkčního hrotového brousicího stroje BUD100 Multi. Práce tento cíl splňuje. Autor postupuje od rešerše a systémového rozboru přes komparativní analýzu metod až k implementaci a vyhodnocení funkčního řešení.

Teoretická část (kap. 3 a 4, s. 23–79) pokrývá knihovny pro datovou vědu a strojové učení, předzpracování dat, klasické autoregresní modely i regresní, stromové a hluboké přístupy včetně RNN a LSTM. Rešerše je obsáhlá a věcně správná, místy však přesahuje rámec nezbytný pro řešený problém, takže těžiště vlastní práce nastupuje relativně pozdě. Systémový rozbor (kap. 5, s. 80–95) ústí do přehledného workflow diagramu a myšlenkové mapy reprezentativních parametrů (obr. 57 a 58), které dobře propojují teorii s následným řešením.

Za nejhodnotnější považuji statistickou analýzu dat v kap. 6.1–6.3 (s. 96–103). Student na základě korelační heatmapy (obr. 59), STL dekompozice (obr. 61–63) a analýz ACF, PACF a CCF (obr. 64–66) odůvodněně volí reprezentativní senzory, vzorkovací periodu i parametry vstupující do modelů. Tato část je zpracována nadstandardně a je metodicky správným základem pro výběr modelu. Na ni navazuje komparativní vyhodnocení čtyř metod – SARIMAX, LightGBM, Random Forest a LSTM (kap. 6.4, s. 103–119) – s konzistentní metodikou dopředné walk-forward validace, autokorelace reziduí, degradačních charakteristik a grafů parciální závislosti. Výsledky shrnuté v kap. 7 (tab. 5, s. 127) jsou interpretovány korektně: stromové metody snížily chybu MAE u dynamických senzorů AX1/AZ1 z hodnot kolem 2,3 °C u referenčního SARIMAXu na cca 0,4–0,6 °C, přičemž LSTM u týchž senzorů vykazuje fyzikálně věrohodnější hladký průběh parciální závislosti. Implementace programu podle navržené softwarové architektury (kap. 6.5, s. 119–126) je doložena přiloženými zdrojovými kódy a popisem postupu spuštění.

Z hlediska splnění zadání má slabinu bod technicko-ekonomického zhodnocení, který je v kap. 7 zpracován spíše okrajově a omezuje se na kvalitativní konstatování bez vyčíslení přínosu. Úvaha o redukci počtu fyzických senzorů zaznívá až v diskusi jako autorův návrh dalšího směru, nikoli jako realizovaný výstup. Po formální stránce práce obsahuje chyby: text obsahuje překlepy, gramatické nedostatky i nepřesnosti v odborných termínech, grafické výstupy a některé obrázky jsou vkládány rastrově s drobným písmem. Seznam literatury čítá 13 položek s převahou online zdrojů nad recenzovanými publikacemi a s neúplnými údaji u zdroje [1].

V průběhu řešení student pracoval samostatně, aktivně konzultoval a reagoval na připomínky; osvojil si přitom práci s ekosystémem jazyka Python pro datovou analýzu, prostředím terminálu, kontejnerizací a sloupcovým formátem Parquet. Přes uvedené výhrady je odborné jádro práce solidní a prokazuje reálnou kompetenci autora v oblasti strojového učení a analýzy časových řad. Práce splňuje požadavky kladené na diplomovou práci.

Celkově hodnotím práci studenta velmi kladně a předloženou diplomovou práci doporučuji k obhajobě.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod C
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii C
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis D
Práce s literaturou včetně citací C
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: B

Reviewer’s report
Ing. Daniel Zuth, Ph.D.

Práce se věnuje vývoji predikčního modelu pro analýzu teplotních charakteristik stroje. Teoretická část je zaměřená na rešerši v oblasti prediktivních modelů a také předzpracování dat a s ohledem na počet stran obsahuje velké množství nadbytečné teorie. Praktická část začíná na straně 81, ale i přesto obsahuje teorii a za skutečné řešení konkrétního problému, lze označit kapitolu 6 na straně 95. Co se týká samotného řešení tak nadstandardně je zpracována statistická analýza dat pro výběr vhodných parametrů pro vstup do predikčního modelu a jejich vzorkovací periody. Poté následuje porovnání výsledků jednotlivých modelů. Součástí práce jsou i zdrojové kódy, které byly v práci použity. Co se týká splnění cílů zadání, tak lze vytknout slabé zpracování bodu „Technicko–ekonomické zhodnocení navrženého řešení“, kde autor uvádí v kapitole 7 pouze konstatování, že „Z technicko-ekonomického hlediska přináší navržené řešení potenciál predikovat hodnoty do budoucnosti s nízkou chybovostí“.

Text práce obsahuje velké množství překlepů („přtože“, „psoledních“, „zavilost“ a další), gramatických chyb („jednotlivé data“, “data byly sjednoceny“ a další), chyby v odborných výrazech (několikrát chybně „Skicit-learn“, „Mean squer error“ a další). Všechny obrázky v práci jsou v rastrové grafice, a to včetně tabulek, které obsahují pouze text (např. obr. 16) anebo ukázky kódu (např. obr. 91 a dále) a taktéž všechny vlastní grafické výstupy jsou vkládány rastrově s velmi malými fonty. Práce nedodržuje jednotné zarovnání textu (str. 66, 105,107, 108) a stejně tak obrázky jsou většinově zarovnány na střed, ale například obr. 76 až 82 jsou zarovnány doprava.

Seznam použité literatury obsahuje pouze 13 zdrojů a doporučená literatura je ignorována. Zdroj 1 nemá uveden rok vydání a vydavatele. V použité literatuře jsou spíše online blogy než recenzované publikace.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii C
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis D
Práce s literaturou včetně citací D
Topics for thesis defence:
  1. Při používání LSTM zmiňujete nutnost normalizace dat. Správná volba normalizace dat u této technologie je poměrně zásadní, ale vy se jí věnujete i v teorii spíše okrajově. Jaké typy normalizace dat umožňuje knihovna scikit-learn a jak zvolit ten správný typ normalizace?
  2. V kapitole 3.1 popisujete vhodné knihovny, ale vůbec se nezmiňujete o licencích, kdy každá knihovna může být pod jinou licencí. Pokud by váš projekt měl být používán komerčně v průmyslu, jaké by byly pro vás vhodné licence?
  3. V práci zmiňujete doporučení nasadit „hybridní strategii“ a to s odůvodněním velké výpočetní náročnosti. Popište trochu blíže vaši představu nasazení v průmyslu, na jakém stroji by probíhal proces učení a na jakém stroji proces predikce. Jaká je výpočetní náročnost predikce (nikoliv učení) vašeho LSTM modelu na vašem HW pro jeden dopředný krok, tzn stav za 30minut.

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová