Master's Thesis

Soft Sensor for Wastewater Quality Assessment Using Standard Online Parameters

Final Thesis 1.86 MB

Author of thesis: Bc. Jan Píža

Acad. year: 2025/2026

Supervisor: Ing. Václav Miklas, Ph.D.

Reviewer: Mgr. Jaromír Sobotka, Ph.D.

Abstract:

This master’s thesis deals with the design of a virtual sensor for the estimation of Chemical Oxygen Demand (COD) in wastewater applications. Virtual sensors represent an economically and time-efficient alternative to the direct measurement of difficult-to-measure variables, enabling the estimation of monitored parameters and more efficient process control. The aim of the thesis was to evaluate current approaches to virtual sensors, collect data for the design of a virtual sensor, analyze relationships between measured variables, and subsequently develop a predictive model. The theoretical part summarizes approaches to virtual sensors, statistical methods, and machine learning techniques. The experimental part focused on the preparation of synthetic wastewater corresponding to a real dairy industry operation and on COD measurements together with selected input variables identified through a literature review, specifically turbidity, pH, ORP, and conductivity. Data analysis demonstrated a very strong correlation between COD and turbidity, while the remaining variables showed weak and practically less applicable relationships. Various models were tested for the development of the virtual sensor using the Python programming language and the PyCaret library. The best results on synthetic data were achieved by the Extra Trees Regressor model with coefficient of determination of R2 = 0,98 a mean absolute error of 163.7 mg/l. However, this model did not demonstrate sufficient extrapolation capability when validated on real wastewater data. From a practical point of view, linear (R2 = 0,97, MAE = 256,1 mg/l) and power-law (R2 = 0,97) models based solely on turbidity proved to be the most suitable. The thesis also includes a conceptual design of a virtual sensor based on continuous turbidity measurement and mathematical COD estimation in real time. The main benefit of the proposed sensor lies in continuous wastewater quality monitoring and early identification of abnormal operating conditions. A key factor affecting long-term reliable operation is regular maintenance and prevention of sensor fouling.

Keywords:

virtual sensor, chemical oxygen demand, wastewater, turbidity, dairy industry, Python, regression model

Date of defence

09.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Byla předvedena prezentace závěrečné práce a zodpovězeny otázky oponenta práce. Doplňující dotaz na provedená ověření v kontextu závěrečné práce, bylo zodpovězeno. Otázka na způsob měření turbidity, bylo zodpovězeno. Dotaz na rozsah měření v předvedené práci a související přenositelnost výstupů závěrečné práce na odlišný typ odpadních vod, bylo zodpovězeno. Dotaz na význam zanášení v kontextu práce a možnosti prevence zanášení, bylo zodpovězeno.

Language of thesis

Czech

Faculty

Department

Study programme

Process Engineering (N-PRI-P)

Composition of Committee

prof. Dr. Ing. Marcus Reppich (předseda)
doc. Ing. Martin Pavlas, Ph.D. (místopředseda)
prof. Ing. Petr Stehlík, CSc., dr. h. c. (člen)
prof. Ing. Zdeněk Jegla, Ph.D. (člen)
Ing. Pavel Skryja, Ph.D. (člen)
Ing. Pavel Lošák, Ph.D. (člen)
Mgr. Ing. Marek Vondra, Ph.D. (člen)

Supervisor’s report
Ing. Václav Miklas, Ph.D.

Diplomová práce Bc. Jana Píži se zaměřuje na téma virtuálních senzorů, tedy možnosti v reálném čase nepřímo predikovat obtížně či nákladně stanovitelné veličiny na základě veličin, které se v procesních systémech běžně měří. Tato problematika je vysoce relevantní v oblasti čištění odpadních vod, kde virtuální senzory slibují významné ekonomické benefity, efektivnější ochranu životního prostředí a lepší kontrolu nad technologickými celky. Tato diplomová práce specificky přispívá aktuálnímu výzkumně-vývojovému projektu, který VUT řeší se společností ASIO TECH.

Práce je dobře logicky vystavěná, od teoretické části s vymezením pojmů, přes klasifikací přístupů, až po hodnotnou rešerši čtyř případových studií z různých zemí (Hongkong, Řecko, Finsko, JAR), která ukazuje reálně dosahované přesnosti rozličných přístupů a klíčové faktory ovlivňující vhodnost modelů.

Experimentální část je metodicky velmi dobře zpracovaná. Některá omezení metodiky autor přiznává a vhodně komentuje (např. interpolace laboratorních stanovení z kalibrační křivky). Transparentnost lze ocenit i na jiných místech – autor např. otevřeně uvádí výpadky CHSK sondy, kolísání teplot v laboratoři i způsob jejich ošetření. Navržená matice experimentu a syntetické složení je dobrým kompromisem mezi šíří poznatků a časovou náročností.

Klíčovým přínosem práce je přístup k validaci modelů. Autor v prostředí PyCaret testoval řadu modelů a model Extra Trees Regressor dosáhl na syntetických datech velmi přesných predikcí. Nezastavil se nicméně u tohoto výsledku, ale provedl validaci na vzorcích reálné mlékárenské odpadní vody. Zde se ukázalo, že komplexní model nedokáže extrapolovat mimo trénovací rozsah, a autor správně přechází k jednodušším modelům založeným pouze na turbiditě. Toto rozhodnutí svědčí o zralé inženýrské úvaze – preferenci robustnosti a interpretovatelnosti před formální přesností.

Koncepční návrh senzoru včetně ekonomického posouzení a diskuze provozních aspektů (zanášení, údržba, kalibrace) propojuje práci s reálnou průmyslovou praxí ve spolupráci se společností ASIO TECH. Praktická využitelnost výsledků je tedy nadprůměrná.

Za nedostatky této jinak velmi přínosné práce bych označil: a) místy horší schopnost interpretace komplexnějších souvislostí, b) frekventované jazykové neobratnosti a překlepy, c) menší míru kreativity diplomanta. Naopak oceňuji značnou píli a čas strávený v laboratoři průmyslového partnera, stejně jako mimořádný time management a včasnou přípravu textových částí.

Celkově se jedná o zdařilou práci, která splňuje všechny body zadání. Hodnotím ji stupněm B – velmi dobře a doporučuji ji k obhajobě.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis C
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu B

Grade proposed by supervisor: B

Reviewer’s report
Mgr. Jaromír Sobotka, Ph.D.

Předložená práce se zabývá aktuálním tématem v rámci optimalizace čistíren odpadních vod (ČOV) v reálném čase s využitím soft senzorů, konkrétně pro parametry chemické spotřeby kyslíku

Diplomant provedl kvalitní, detailní rešerši současných přístupů k virtuálním senzorům a matematickým modelům. Teoretický základ je vhodně doplněn o čtyři mezinárodní případové studie, které přidávají na relevantnosti řešení problematiky. Oceňuji precizní přístup při přípravě experimentální části, systematické zpracování dat, vyhodnocení výsledků a aplikaci vhodného matematického modelu.

V části 6 mi chybí detailnější porovnání, kde je navrhována pouze jedna varianta měření zákalu, stejně tak širší porovnání systémů měření CHSK. V práci zcela chybí zmínka o investici do výpočetního hardwaru a softwaru nutného k provozování soft senzoru.

Diplomová práce obsahuje větší množství typografických chyb či strukturních nedostatků, které snižují její kvalitu. U typografických chyb se jedná např. o předložky na koncích řádků, nesprávně použité spojovníky a pomlčky, oddělená čísla od jednotek na konci řádku apod. Nejasné byly také popisky tabulek a grafů, jelikož obsahovaly nedostatek informací, bylo použito nelogické zaokrouhlování čísel na počet platných míst v Tab. 10 a 11. Horší orientaci v textu přispěl také velmi nahuštěný text okolo tabulek či grafů, z důvodu nedostatečného vizuálního rozdělení. A také nejednotvárnost použité terminologie (fyzikální modely -> mechanistické modely; datově založené modely -> Data-driven senzory)

Celkově je diplomová práce čtivá, kvalitně zpracovaná, vykazuje systematický přístup k problematice a poskytuje velký potenciál pro praktickou aplikaci. Byly splněny všechny body zadání a práci proto doporučuji k obhajobě.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis C
Práce s literaturou včetně citací B
Topics for thesis defence:
  1. Jakým způsobem by měl být v reálném provozu zajištěn systém průběžného dotrénování modelu při výskytu datového driftu či sezónalitě a jak často doporučujete provádět kontrolní laboratorní analýzy pro re-kalibraci?
  2. Na obrázcích 5 a 6 je u hodnot s vyšší turbiditou a chemickou spotřebou kyslíku větší rozptyl hodnot. Čím je podle Vás tento větší rozptyl způsoben?
  3. V sekci 3.3 se u zpětnovazebného učení zmiňujete o agentovi. Co si pod tímto agentem můžeme představit?

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová