Bachelor's Thesis

Prediction of contamination level in a water treatment plant using neural networks

Final Thesis 23.99 MB Appendix 915.97 kB

Author of thesis: Vojtěch Kropáč

Acad. year: 2025/2026

Supervisor: Ing. Dominik Řičánek

Reviewer: Ing. Ilona Janáková, Ph.D.

Abstract:

This semester thesis focuses on the development of neural network models of the MLP and RNN types for the prediction of a selected measured variable in small wastewater treatment plants. Based on real operational data, models for predicting the monitored parameter were developed, trained, and tested. Individual model configurations were evaluated by comparing their prediction accuracy using the MSE, MAE, and the coefficient of determination $\text{R}^2$. The results demonstrate that the proposed models are capable of reliably predicting the selected variable without the direct use of the corresponding sensor, which may lead to reduced costs associated with measurement and maintenance of sensor equipment that must be operated, calibrated, and regularly maintained in wastewater treatment plant operation.

Keywords:

Artificial Neural Network, Parameter prediction, Wastewater treatment process, MLP, RNN, Regression

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student obhájil bakalářskou práci. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy student odpověděl na dotazy oponenta. Navazující otázka komise směřovala k aktuálně používaným snímačům - jaké snímače by mohly být nahrazeny vaší predikcí koncentrací látek pomocí neuronových sítí? Jaká je orientační cena těchto snímačů, kolik peněz by se tím ušetřilo? Student odpověděl na položené otázky komise bez výhrad.

Language of thesis

Czech

Faculty

Department

Study programme

Automation and Measurement (BPC-AMT)

Composition of Committee

doc. Ing. Jan Mikulka, Ph.D. (předseda)
doc. Ing. Petr Blaha, Ph.D. (místopředseda)
Ing. Ilona Janáková, Ph.D. (člen)
Ing. Lukáš Kopečný, Ph.D. (člen)
Ing. Tomáš Macho, Ph.D. (člen)
Ing. Soňa Šedivá, Ph.D. (člen)

Supervisor’s report
Ing. Dominik Řičánek

Student Vojtěch Kropáč zpracovával téma využit neuronových sítí k predikci koncentrací látek v čističkách odpadních vod. Student otestoval využití klasických MLP sítí i regresních sítí jako jsou LSTM a GRU.
Podařilo se mu vytvořit softsenzor pomocí výše zmíněných modelů, přičemž jednotlivé modely porovnal a vyhodnotil MLP jako dostačující pro většinu zkoumaných veličin. Pan Kropáč pravidelně chodil na konzultace, byl vždy připravený s věcnými otázkami a jinak postupoval schopně a samostatně. Obsahově má práce 62 stran, což je nad poměry bakalářských prací. Student dobře pracuje s literaturou, která je značně obsáhlá a zároveň relevantní.
Pan Vojtěch Kropáč tímto prokázal nadstandartní bakalářské schopnosti a práci doporučuji k obhajobě se stupněm A (99b). Points proposed by supervisor: 99

Grade proposed by supervisor: A

Reviewer’s report
Ing. Ilona Janáková, Ph.D.

Student Vojtěch Kropáč vypracoval bakalářskou práci na téma predikce koncentrace látek čističky odpadních vod pomocí neuronových sítí. Zadání se skládá ze tří bodů, které autor splnil v plném rozsahu a v některých ohledech je i překročil.
Bod 1 (rešerše neuronových sítí a veličin měřených v ČOV) je zpracován v kapitolách 1 až 3 (33 stran), aktuální stav poznání je navíc shrnut v úvodu práce. Rešerše je nadstandardně obsáhlá, tematicky vyvážená, precizně zpracovaná. Autor podává přehled strojového učení a metod učení (kap. 1), podrobně a s odpovídajícím matematickým aparátem popisuje architektury MLP, RNN, LSTM a GRU včetně algoritmů zpětného šíření chyby (kap. 2) a samostatnou kapitolu věnuje technologii ČOV, sekvenčnímu biologickému reaktoru a měřeným veličinám a principům příslušných senzorů (kap. 3).
Bod 2 (implementace prediktorů a výběr nejefektivnějšího) je naplněn v kapitole 4. Autor implementoval prediktory pro tři veličiny. Nad rámec zadání, které požaduje pouze sítě typu MLP, navrhl a porovnal i rekurentní architekturu GRU. Pro výběr architektury a ladění hyperparametrů byl využit framework Optuna, čemuž předcházela promyšlená tvorba a selekce příznaků (vzájemná informace, RFE s náhodným lesem, permutační důležitost).
Bod 3 (test přesnosti na reálných datech) je splněn v kapitole 5. Modely jsou vyhodnoceny na nezávislé testovací sadě reálných provozních dat z ČOV Modřice pomocí metrik RMSE, MAE a R² a doplněny o analýzu časového průběhu predikcí proti skutečným hodnotám.
Odborná úroveň práce je nadprůměrná a student prokázal velmi dobrou znalost dané problematiky jak v oblasti strojového učení, tak v oblasti technologie čištění odpadních vod. Zvolená koncepce je správná a metodicky čistá. Vyzdvihnout je třeba zejména: důsledné zamezení úniku informací z budoucnosti, metodika analýzy veličin a jejich předzpracování, efektivní několikastupňová selekce příznaků, vhodné použití regularizačních technik, pokročilá automatizovaná optimalizace hyperparametrů a kritické porovnání modelů. Vytkla bych jen, že při uvedení výsledných metrik modelů mohl být uveden i přibližný rozsah veličin, ten je však patrný z následných grafů.
Práce má logickou a přehlednou strukturu, která plynule postupuje od teoretických základů přes popis technologie a dat až k návrhu, trénování a vyhodnocení modelů. Rozsah vlastního textu (úvod až závěr) je 62 stran, tedy mírně překračuje doporučený limit. Obrázky, schémata a tabulky jsou kvalitní, vhodně zvolené a provázané s textem. Práce s literaturou je na výborné úrovni. Seznam použité literatury obsahuje 51 relevantních zdrojů, mezi nimiž převažují recenzované odborné články; řada z nich je z let 2023–2025. Citace jsou v textu zavedeny korektně a v souladu s platnými normami.
Jazykový projev studenta je kultivovaný, striktně odborný a prostý závažných gramatických či stylistických chyb. Vytknout lze jen: chyba v příjmení vedoucího práce v bibliografické citaci a poděkování („Říčánek“); nejednotné používání termínů „softsenzor“ a „softsensor“; výčet dní na str. 52 udávající jako poslední dostupný den 22., přitom v grafech a csv je i část 23.6; chyba v zápisu exponentu hodnoty váhového útlumu v tab. 4.6 (GRU, QIC71: „1,0 · 1,0⁻³“) a nesoulad uváděných metrik u modelu GRU pro QIC70 – tabulka 5.1 uvádí RMSE = 1,857, MAE = 1,331, R² = 0,866, zatímco text na str. 69 uvádí RMSE = 1,896, MAE = 1,348, R² = 0,860.
Na přiloženém médiu jsou kompletní data k projektu (data, kódy, modely, návody). Zdrojové kódy jsou strukturované, komentované a snadno replikovatelné.
Předložená práce Vojtěcha Kropáče plně prokazuje schopnosti autora samostatně řešit komplexní inženýrské úlohy od analýzy dat přes návrh pokročilých algoritmů až po jejich rigorózní vyhodnocení. Výstupy práce mají jasný aplikační potenciál. Práce splňuje všechny požadavky na udělení akademického titulu bakalář, proto práci doporučuji k obhajobě a navrhuji celkové hodnocení A (97 b). Topics for thesis defence:
  1. - Co představuje úsek cca 06-22 08 – 06-22 16 v grafech 5.1-5.5? Modely se v této části chovají odlišně. Představuje to problém?
  2. - Trénovací a testovací data pokrývají pouze 18 dní provozu. Jak by se podle Vás změnila přesnost navržených softsenzorů při nasazení v jiném ročním období, kdy se mění dynamika nitrifikace a denitrifikace? Jakým způsobem byste navrhl model v provozu průběžně aktualizovat?
  3. - U dusičnanového dusíku (QIC71) dosáhla jednodušší architektura MLP lepších výsledků než rekurentní GRU, zatímco u amoniakálního dusíku (QIC70) tomu bylo naopak. Čím si tento výsledek vysvětlujete, vzhledem k tomu, že jste architekturu GRU zvolil právě s ohledem na pomalou dynamiku a paměťovou setrvačnost dusíkatých procesů?
  4. - Jaké konkrétní příznaky byly pro modely MLP vytvořeny nad rámec surových senzorických hodnot a one-hot kódování fáze SBR? Obsahují tyto příznaky explicitně informaci z minulosti (např. zpožděné hodnoty, klouzavé průměry, čas od začátku fáze), bez níž by architektura MLP bez vnitřní paměti nemohla zachytit časovou dynamiku procesu?
Points proposed by reviewer: 97

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová