Bachelor's Thesis

Analysis of Measured Electricity Consumption Data in the Faculty Campus

Final Thesis 32.32 MB

Author of thesis: Ondřej Paluska

Acad. year: 2025/2026

Supervisor: Ing. Matěj Vrtal, Ph.D.

Reviewer: Ing. Branislav Bátora, Ph.D.

Abstract:

This thesis analyzes measured electricity consumption data at the FEKT VUT campus. It describes the data collection process using P-Q analyzers, the principles of data cleaning, and the preparation of data for further processing. The main objective of the thesis is to conduct a statistical and comparative analysis of consumption on the sixth floor and to develop algorithms for identifying anomalies and deviations.

Keywords:

data analysis, electricity consumption, typical waveforms, P-Q analyzer, load factor, anomaly detection, data processing, energy management, Isolation Forest, SARIMA, time series, influence of teaching.

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student představil výsledky svojí bakalářské práce. Předseda komise prof. Drápela vyzval oponenta práce doktora Bátoru, aby komisi seznámil s posudky vedoucího a oponenta práce. Po seznámení s posudky, oponent studenta seznámil se svými otázkami. Student na ně samostatně odpověděl s využitím vlastní přípravy v prezentaci. Doktor Bátora pokládal doplňující dotazy, na které student reagoval a prokázal schopnost reagovat v rámci spontánní diskuse. Prof. Drápela následně otevřel diskusi ohledně volby názvosloví v samotné prezentaci práce. Student v rámci diskuse reagoval, byl schopen volbu názvosloví objasnit.

Language of thesis

Czech

Faculty

Department

Study programme

Power Electrical and Electronic Engineering (BPC-SEE)

Composition of Committee

prof. Ing. Jiří Drápela, Ph.D. (předseda)
doc. Ing. David Topolánek, Ph.D. (místopředseda)
Ing. Lukáš Radil, Ph.D. (člen)
Ing. Martin Vojtek, Ph.D. (člen)
Ing. Václav Vyčítal, Ph.D. (člen)
doc. Ing. Vladimír Král, Ph.D. (člen)

Supervisor’s report
Ing. Matěj Vrtal, Ph.D.

Student Ondřej Paluska se ve své bakalářské práci zabýval analýzou naměřených dat spotřeby elektrické energie v areálu fakulty. Práce má analytický charakter a vede od sběru a přípravy dat z měření až po návrh algoritmů pro detekci anomálií. Teoretická část přehledně shrnuje problematiku nejistoty měření, přípravy velkoobjemových dat a popisuje použité algoritmy. Výklad je účelný a dobře představuje čtenáři problematiku využitou v praktické části.

Vzhledem k zaměření práce mohla teoretická část hlouběji rozebrat vlastnosti a omezení sezónního modelování a způsoby vyhodnocení kvality detekce anomálií, naopak některé obecné pasáže o členění zdrojů dat souvisejí s vlastním objektem jen okrajově. Méně přesný je výklad nejistot měření podle GUM typů A a B, které jsou prezentovány jako typy měření, ačkoli se jedná o metody vyhodnocení nejistoty.

Po formální a jazykové stránce je práce na dobré úrovni. Vytknout lze zaměněné pořadí obrázků v šesté kapitole, budoucí datum citace u jednoho zdroje, nejednotné označení měřicího přístroje (BCPM 233 oproti BCPM 233.012). V práci se objevují i drobné číselné nesrovnalosti, například průměrná měsíční spotřeba vztažená ke dvanácti namísto třinácti měsíců měřeného období. Abstrakt nepokrývá celý rozsah práce, neboť opomíjí typové průběhy i hlavní zjištění. Počet a kvalitu citovaných zdrojů považuji vzhledem k praktickému zaměření práce za dostatečné.

Přínosem práce je její praktická část, v níž student zpracoval ucelený software obsahující metody zpracování a vyhodnocení surových dat z analyzátorů až po návrh detekce anomálií. Velmi kladně hodnotím šíři zpracování, tedy statistickou analýzu, komparativní analýzu různých datasetů, tvorbu týdenních a denních typových průběhů, analýzu vlivu výuky na spotřebu i nasazení dvou odlišných metod detekce anomálií a jejich vzájemné porovnání.

Hlavní věcnou výhradu mám právě k závěrečnému porovnání metod Isolation Forest a SARIMA, kdy výsledná míra shody je výrazně ovlivněna rozdílným časovým rozlišením (minutová oproti hodinovým datům) a zpětným převodem hodinových anomálií na minutové, takže závěr o nevhodnosti použití obou metod pro souběžnou detekci je třeba brát s jistou rezervou. Nicméně podotýkám, že ověření detekcí proti zdokumentovaným událostem by již přesahovalo rozsah zadání bakalářské práce a kvalita práce nebyla zásadně snížena.

Bakalářskou práci považuji za přínosnou, doporučuji ji k obhajobě a hodnotím známkou A (90 b.). Points proposed by supervisor: 90

Grade proposed by supervisor: A

Reviewer’s report
Ing. Branislav Bátora, Ph.D.

Předložená bakalářská práce se zabývá analýzou naměřených dat spotřeby elektrické energie v areálu FEKT VUT. Práce svým obsahem i rozsahem odpovídá zadání a všechny jeho body byly splněny. Student provedl rešerši problematiky měření a zpracování dat, statistickou a komparativní analýzu naměřených dat, vytvořil typové průběhy spotřeby, navrhl postup identifikace anomálií a provedl porovnání vybraných metod jejich detekce.

Práce má logickou strukturu a jednotlivé kapitoly na sebe navazují. Za přínosné považuji zejména zpracování reálných provozních dat, statistickou analýzu spotřeby šestého podlaží a její porovnání s daty pátého podlaží, dále vytvoření typových denních a týdenních průběhů a vyhodnocení vlivu výuky na průběh spotřeby. Praktická část je zpracována v odpovídající šíři a prokazuje schopnost autora samostatně pracovat s rozsáhlými datovými soubory a vhodně interpretovat získané výsledky.

K práci mám několik dílčích připomínek. Teoretická část je místy příliš obecná a některé pasáže nejsou dostatečně provázány s řešenou problematikou. Nepřesně je například interpretována problematika nejistot typu A a B podle metodiky GUM. Určitou rezervu vidím také v interpretaci některých výsledků, zejména při posuzování vlivu venkovní teploty na spotřebu elektrické energie, který není podložen samostatnou analýzou. Diskutabilní je rovněž závěr o nízké kompatibilitě metod Isolation Forest a SARIMA, protože porovnání vychází z dat s rozdílným časovým rozlišením, což mohlo výslednou míru shody významně ovlivnit.

Po formální stránce je práce zpracována na dobré úrovni. Grafy a tabulky jsou přehledné a vhodně doplňují text. V práci se objevují pouze drobné formální a věcné nepřesnosti, které však zásadním způsobem nesnižují její odbornou úroveň. Použité informační zdroje odpovídají zaměření bakalářské práce a jsou využity v přiměřeném rozsahu.

Celkově hodnotím práci jako zdařilé řešení zadané problematiky s praktickým přínosem pro oblast analýzy energetických dat a detekce anomálií. Předloženou bakalářskou práci doporučuji k obhajobě a hodnotím 88 body (B). Topics for thesis defence:
  1. V práci používáte pro algoritmus Isolation Forest hodnotu kontaminace 1 %. Jakým způsobem byla tato hodnota stanovena a jak by se změnily výsledky detekce při nastavení 0,5 % nebo 5 %?
  2. Porovnání metod Isolation Forest a SARIMA je provedeno nad daty s odlišným časovým rozlišením (minutová vs. hodinová data). Jaký vliv může mít tato skutečnost na vypočtený Jaccardův index a na závěr o kompatibilitě obou metod?
  3. Popište metodiku detekce anomálií použitou v práci. Byla detekce založena výhradně na statistických metodách a modelech strojového učení, nebo byly zvažovány také technické limity nebo provzní meze sledovaných elektrických veličin?
Points proposed by reviewer: 88

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová