Master's Thesis

Application of Machine Learning for Heat Pump Fault Prediction

Final Thesis 3.5 MB Appendix 1.21 MB

Author of thesis: Bc. Daniel Sněhota

Acad. year: 2025/2026

Abstract:

This master's thesis explores the application of machine learning methods for anomaly detection in brine-to-water heat pumps. The primary objective was to assess the feasibility of utilizing machine learning and deep learning in this context. In the experimental section, various machine learning architectures and neural networks were compared. The results confirm the models' sensitivity to fault conditions, which was demonstrated through a real-world case of an undetected expansion valve failure. The GRU recurrent neural network emerged as the most advantageous architecture for these purposes, exhibiting high accuracy and robustness to hyperparameter tuning. Furthermore, the thesis identified limitations regarding model transferability between different installations and highlighted the importance of flow measurements for improving the generality of predictions.

Keywords:

Heat Pump, Refrigeration Cycle, Regression Models, Machine Learning, Deep Learning, Data-driven Digital Twin

Date of defence

10.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

Process of defence

Student seznámil zkušební komisi s průběhem řešení, výsledky a závěry své závěrečné práce. V návaznosti na posudky student zodpověděl dotazy oponenta. V rozpravě k DP byly položeny studentovi dále tyto otázky: Doc. Katolický položil dotaz týkající se univerzálnosti použitelnosti navrženého modelu. Student dotaz zodpověděl. Profesor Jedelský položil dotaz týkající se trénování modelu a jeho reakce v přechodových obdobích. Student na dotaz odpověděl. Doc. Fišer položil dotaz týkající se typů poruch, které by bylo možné detekovat. Student dotaz zodpověděl. Profesor Jedelský položil dotaz týkající se délky trénování jednotlivých modelů. Student dotaz zodpověděl.

Language of thesis

Czech

Faculty

Fakulta strojního inženýrství

Department

Energy Institute

Study programme

Power and Thermo-fluid Engineering (N-ETI-P)

Specialization

Environmental Engineering (TEP)

Composition of Committee

doc. Ing. Jaroslav Katolický, Ph.D. (předseda)
doc. Ing. Bc. Jan Fišer, Ph.D. (člen)
Ing. Stanislav Patočka, Ph.D. (člen)
prof. Ing. Jan Jedelský, Ph.D. (místopředseda)
doc. Ing. František Lízal, Ph.D. (člen)
doc. Ing. Pavel Charvát, Ph.D. (člen)

Supervisor’s report
Ing. Jiří Hejčík, Ph.D.

Diplomová práce se zabývá problematikou včasné diagnostiky poruchy tepelného čerpadla na základě informací, získaných z jeho řídícího systému, a jejím cílem bylo posoudit, zda se k tomuto účelu dají použít metody a postupy strojového učení. Pro zpracování práce byla použita reálná data z provozu tepelných čerpadel země-voda, která poskytl průmyslový partner.
Student v rámci řešení musel nastudovat pro něj zcela novou oblast strojového učení a to nejen z pohledu vlastních metod strojového učení, ale také s ohledem na zpracování a přípravu vstupních dat. Výsledkem práce je tedy nalezení vhodného přístupu ke zpracování reálných dat, porovnání vhodnosti různých přístupů (metod) strojového učení k nalezení poruchového stavu a stanovení vhodného parametru, indikujícího poruchový stav.
Vytvořený postup prokázal svoji funkčnost již v průběhu řešení diplomové práce, kdy se v poskytnutých datech objevila anomálie, kterou byl diplomant schopen identifikovat a která se následně fyzicky potvrdila jako porucha expanzního ventilu.
Student v rámci řešení zadaného tématu prokázal schopnost samostatné inženýrské práce, předložená práce splňuje všechny požadavky na diplomovou práci a cíle zadání byly splněny. Práci tedy doporučuji práci k obhajobě.

Evaluation criteria	Grade
Splnění požadavků a cílů zadání	A
Postup a rozsah řešení, adekvátnost použitých metod	A
Vlastní přínos a originalita	A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry	A
Využitelnost výsledků v praxi nebo teorii	A
Logické uspořádání práce a formální náležitosti	A
Grafická, stylistická úprava a pravopis	A
Práce s literaturou včetně citací	A
Samostatnost studenta při zpracování tématu	A

Grade proposed by supervisor: A

Reviewer’s report
doc. Ing. Tomáš Mauder, Ph.D.

1) Hlavní cíle a motivace

Hlavním cílem práce je vytvořit datově orientované digitální dvojče (Data-driven Digital Twin) tepelného čerpadla typu země-voda.

Motivace: Běžné řídicí systémy často neodhalí postupné nebo menší závady (např. špatné nastavení expanzního ventilu), které sice systém okamžitě nezastaví, ale dlouhodobě vedou ke zničení jednotlivých komponent (kompresoru) a snižují účinnost (COP).

Předpoklad: Natrénovat model strojového/hlubokého učení na datech z normálního (bezporuchového) provozu a použít tento model jako virtuální senzor. Pokud se následně reálná data ze senzorů začnou výrazně lišit od predikce modelu (vznikne velké reziduum/odchylka), může tato odchylka indikovat poruchový/nestandardní stav zařízení.

2) Metodika a zpracování

Autor postupoval velmi systematicky a na úrovni, která přesahuje běžný standard diplomových prací. Postup autora lze srovnat s postupy, které se v praxi běžně používají.

- Teoretický background: Kapitoly 1 a 2 obsahují hlavní teoretický základ práce, popisují jednotlivé metody.

- Data: Reálná provozní data ze systému MERVIS SCADA v minutovém rozlišení. Práce nezkoumá laboratorní modely, ale skutečné instalace (kaskády tepelných čerpadel v budovách).

- Vstupy modelu (5 veličin): Výkon kompresoru, vstupní teploty primárního a sekundárního okruhu, otáčky čerpadel.

- Výstupy modelu (9 veličin): Teploty a tlaky v chladicím okruhu (sání, výtlak, kondenzace, vypařování), pozice expanzního ventilu.

- Porovnávané modely: Autor srovnává tradiční algoritmy (SVR, XGBoost) s hlubokými neuronovými sítěmi (Feedforward NN, Recurrent NN - LSTM a GRU, a architekturu Transformer).

- Nástroje: Python, PyTorch, Scikit-learn, XGBoost. Velkým plusem je použití frameworku MLflow pro logování experimentů a SHAP pro vysvětlitelnost modelů (Explainable AI).

3) Klíčová zjištění a výsledky

- Vysoká přesnost predikce: Modely (zejména sítě s pamětí jako GRU, LSTM a Transformer) dokázaly s obrovskou přesností ( ) predikovat chování tepelného čerpadla v normálním stavu.

- Detekce reálné poruchy (Úspěch): Autor analyzoval reálnou událost, kdy došlo k poruše expanzního ventilu. Řídicí systém poruchu nezaznamenal, ale natrénovaný ML model ukázal drastickou odchylku. Tím autor prokázal, že koncept v praxi funguje.

- Problém s přenositelností (Limity): Model natrénovaný na čerpadle 1 fungoval velmi dobře na identickém čerpadle 2 ve stejné kaskádě A. Když ale model autor aplikoval na fyzicky stejné čerpadlo v jiné lokalitě kaskáda B, model dosáhl v predikcích značných residuí a pro využití v detekci poruch je nepoužitelný. Možným důvodem je chybějící měření reálného průtoku vody. Model spoléhal jen na otáčky oběhového čerpadla, ale různé budovy mají různé tlakové ztráty v potrubí. Stejné otáčky neznamenají stejný průtok.

4) Celkové zhodnocení

Silné stránky práce:

- Vysoká praktická využitelnost: Práce řeší reálný problém průmyslu tepelných čerpadel. Ukázka nedetekované poruchy expanzního ventilu, kterou by model odhalil, je pádným argumentem pro další rozvoj práce směrem ke komercializaci.

- Technologická vyspělost: Zahrnutí architektury Transformer (typicky používané pro LLM) na analýzu časových řad je velmi pokročilé. Použití MLflow a paralelizace výpočtů na GPU (CUDA) ukazuje, že autor má hluboké znalosti softwarového inženýrství a datové vědy.

- Limity přístupu: Autor nezastírá selhání modelu při přenosu na jinou lokalitu. Zároveň přináší smysluplnou hypotézu, proč takto výsledky dopadly.

- SHAP analýza: Nejde jen o slepé použití modelů ale, autor se pomocí SHAP hodnot snaží pochopit, jak hyperparametry ovlivňují výsledek, což dodává práci transparentnost.

Slabiny a rozporuplné body:

- Rozpor mezi teoretickou a praktickou částí v pojetí detekce anomálií: V teoretické části autor popisuje algoritmy pro Unsupervised learning (učení bez učitele - K-Means, One-Class SVM, Isolation Forest), které jsou primárně určeny pro detekci anomálií. V praktické části ale žádný z těchto algoritmů nepoužije. Místo toho postaví Supervised (regresní) modely, kterými predikuje běžný stav a anomálii detekuje "ručně" tím, že se podívá na nárůst chyby (rezidua). To je legitimní přístup (tzv. reconstruction-based anomaly detection), ale teoretická část tak působí trochu odtrženě od té praktické.

- Klasifikace poruch chybí: Model řekne "něco je špatně" (reziduum je vysoké). Dokáže sice ukázat, na kterém senzoru je největší odchylka (v tomto případě expanzní ventil), ale chybí automatická klasifikace typu poruchy. Autor to sám v závěru přiznává jako krok pro budoucí vývoj.

- Přenositelnost (Scalability): Zjištění, že model nelze přenést na jinou instalaci bez fyzických průtokoměrů, je pro produktové používání velká komplikace. Znamená to, že se pro každé nainstalované tepelné čerpadlo musí trénovat unikátní model (což může být výpočetně drahé). Instalace senzorů průtoku může tuto slabinu odstranit, nicméně toto není v práci dokázáno.

5) Shrnutí

Jedná se o nadprůměrnou a mimořádně kvalitní diplomovou práci. Autor prokázal vynikající orientaci v moderních metodách strojového/hlubokého učení, schopnost zpracovat surová data z průmyslového SCADA systému a co je nejdůležitější – dokázal své výsledky kriticky interpretovat. Práce má dobrý grafický standard a dobře pracuje s citacemi. Práce má přímý potenciál pro komerční uplatnění u výrobců nebo velkých provozovatelů tepelných čerpadel.

Evaluation criteria	Grade
Splnění požadavků a cílů zadání	A
Postup a rozsah řešení, adekvátnost použitých metod	A
Vlastní přínos a originalita	A
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry	A
Využitelnost výsledků v praxi nebo teorii	B
Logické uspořádání práce a formální náležitosti	A
Grafická, stylistická úprava a pravopis	A
Práce s literaturou včetně citací	A

Topics for thesis defence:

Jaké features byly v modelu XGB použity predikci teplot? Byly použity lagy jednotlivých veličin, rolling features, kalendářní data?
Autor v případě chybějících dat (NaN) používá metodu Forward Fill. To je v pořádku, pokud je chybějících dat velmi malé množství. V případě většího počtu chybějících dat bude model predikovat špatné výsledky. Napadnou autora nějaké další možnosti (techniky), jak doplňovat chybějící data?
Autor z důvodu použití neuronových sítí škáluje vstupní parametry modelu (u ML modelů toto není nutné). Je použit MinMaxScaler, který je však velmi náchylný na outlinery v datech. Byla provedena před aplikací scaleru kontrola dat s odlehlými hodnotami? Existují jiné druhy scalerů, které by byly robustnější?
Použil autor při učení modelu techniku Time Series Cross-Validation? Jak má délka učících dat vliv na výsledky jednotlivých přístupů?
V případě, že nemáme label provozních dat (bezporuchový stav/poruchový stav), jak docílit, aby v rámci tréninkové části se neučil model již z provozu, který je zatížen poruchou?

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová

VUT

Faculties and university institutes

Parts

Application of Machine Learning for Heat Pump Fault Prediction