Bachelor's Thesis

Prediction of the Time of Partial Service Interventions from Aggregated Data

Final Thesis 1.61 MB

Author of thesis: Rostislav Ludvík

Acad. year: 2025/2026

Supervisor: Ing. Aleš Smrčka, Ph.D.

Reviewer: Ing. Michal Rozsíval

Abstract:

This bachelor's thesis focuses on methods for estimating latent variables applicable to a dataset of service interventions from Thermo Fisher Scientific. The addressed problem consists in estimating the partial replacement times of spare parts from the aggregated total time of a service intervention. Neural networks are used for the final predictive model, mainly due to their ability to capture nonlinear dependencies in the data. Based on the attributes of a service intervention and the identification of a spare part, the proposed model estimates the expected time required for its replacement. The thesis also includes the implementation of the model as a command-line interface application. The application enables loading a dataset, training the model, and subsequently predicting the replacement time for a selected part or a combination of parts. The functionality of the solution is then verified on anonymized data. The evaluation results indicate the ability of the implemented model to provide practically useful estimates.

Keywords:

prediction model, aggregated data, latent variables, linear regression, least squares method, neural networks, machine learning, CLI application

Date of defence

19.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Topics for thesis defence

  1. V evaluaci uvádíte, že Váš model dosahuje vyšší chybovosti než jednoduchý průměr nad datovou sadou. Jaký je tedy přínos Vašeho modelu?
  2. V analyzované datové sadě je i u identických servisních zásahů vysoká variabilita doby jejich trvání. Napadá Vás, jaké další parametry by bylo možné využít pro jejich lepší rozlišení, a tedy i pro následné zlepšení predikce Vašeho modelu?
  3. Navržený model využívá symetrickou hodnotící funkci, tedy nadhodnocení i podhodnocení doby zásahu má stejnou penalizaci. Nebylo by však v praxi vhodnější podhodnocení doby zásahu penalizovat více než nadhodnocení?
  4. Proč jste všechny obrázky v práci převzal?

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

prof. RNDr. Alexandr Meduna, CSc. (předseda)
prof. Ing. Martin Čadík, Ph.D. (místopředseda)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
Ing. Lukáš Kekely, Ph.D. (člen)

Supervisor’s report
Ing. Aleš Smrčka, Ph.D.

Aktivita studenta i jeho přístup k práci byly nadprůměrné. Rostislav Ludvík musel při řešení zohlednit požadavky zadavatele i vedoucího projektu a průběžně konfrontovat navržený postup s dostupnou datovou sadou.

Evaluation criteria Verbal classification
Informace k zadání

Práce vznikla ve spolupráci s firmou Termofisher Scientific. Zadání má jasný aplikovatelný charakter, který má pomoci při odhadu doby servisních záznamů na základě historických dat. Student musel navrhnout několik přístupů, konzultovat je se mnou i s technickým vedoucím a experimentálně je ověřit na pro datové analýzy nepříznivých datech dodaných externí firmou. Výsledek je hodnocený jako použitelný.

Práce s literaturou

Studentovi byly doporučeny konkrétní oblasti literatury. Samotné studijní prameny si student vybíral sám.

Aktivita během řešení, konzultace, komunikace

Student byl po celou dobu aktivní. Konzultace probíhaly pravidelně s jasným pokrokem v práci.

Aktivita při dokončování

Technické řešení i zpráva byly dokončeny v dostatečném předstihu.

Publikační činnost, ocenění
Points proposed by supervisor: 90

Grade proposed by supervisor: A

Reviewer’s report
Ing. Michal Rozsíval

Student analyzoval poskytnutou datovou sadu a na jejím základě navrhl a pro účely evaluace natrénoval predikční model pro odhad doby dílčích servisních zásahů. Celkově vytvořil funkční programové řešení, které umožňuje trénování modelu a jeho následné využití pro orientační odhad délky servisního zásahu.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Cílem práce byl návrh modelu pro predikci doby výměny zadaného dílu či jejich kombinace z agregovaných dat a vytvoření aplikace umožňující trénování a použití navrženého modelu. Student se mimo jiné musel seznámit s datovou sadou obsahující parametry skutečně provedených servisních zásahů, kterou poskytla společnost Thermo Fisher, a na jejím základě navrhnout a natrénovat vhodný predikční model.

Prezentační úroveň technické zprávy

Text práce se celkově drží logické struktury. Chybí mi však samostatná kapitola s popisem poskytnuté datové sady a obecně by některé části, především v kombinované kapitole návrhu a implementace, mohly být více rozepsány.

70
Formální úprava technické zprávy

Práce je psaná v českém jazyce. Celkově se v práci vyskytuje malé množství jazykových a typografických chyb, například jednopísmenné členy na konci řádků, chybějící reference obrázky (např. obrázky 3.1 a 3.2) nebo míchání matematického a programátorského zápisu v rovnicích (např. rovnice 3.10 a 4.6).

72
Realizační výstup

Implementovaná aplikace umožňuje trénování a použití navrženého modelu. Zdrojové kódy jsou vhodně formátované, ale mohly být více dokumentované. Vytvořené řešení bylo studentem demonstrováno a je funkční, avšak slabší stránkou řešení je dosažená přesnost predikčního modelu.

75
Využitelnost výsledků

Vytvořenou aplikaci je možné použít pro natrénování navrženého modelu nad poskytnutou datovou sadou a pro následnou predikci doby trvání servisních zásahů.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: splňuje pouze minimální požadavky

Technická zpráva má rozsah kolem 40 normostran. Celkově však obsahuje potřebné části, i když některé mohly být více rozepsané. Především mi v práci chybí samostatná kapitola s popisem použité datové sady.

Práce s literaturou

K literatuře nemám větší výhrady.

80
Topics for thesis defence:
  1. V evaluaci uvádíte, že Váš model dosahuje vyšší chybovosti než jednoduchý průměr nad datovou sadou. Jaký je tedy přínos Vašeho modelu?
  2. V analyzované datové sadě je i u identických servisních zásahů vysoká variabilita doby jejich trvání. Napadá Vás, jaké další parametry by bylo možné využít pro jejich lepší rozlišení, a tedy i pro následné zlepšení predikce Vašeho modelu?
  3. Navržený model využívá symetrickou hodnotící funkci, tedy nadhodnocení i podhodnocení doby zásahu má stejnou penalizaci. Nebylo by však v praxi vhodnější podhodnocení doby zásahu penalizovat více než nadhodnocení?
Points proposed by reviewer: 75

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová