Bachelor's Thesis

OLAP Analysis of Data from Smart Devices

Final Thesis 1.74 MB

Author of thesis: Mário Perecz

Acad. year: 2025/2026

Supervisor: Ing. Petr John

Reviewer: doc. RNDr. Pavel Smrž, Ph.D.

Abstract:

The Internet of Things generates a constant stream of time-series measurements from various types of sensors. However, simply storing the data is not sufficient to gain actionable insights and requires more advanced analysis. The aim of this thesis is to investigate the suitability of OLAP approaches for analyzing IoT data and to demonstrate in practice that they are effective in this environment. The output is an extension of the RIoT platform with an analytical module that represents an alternative approach to traditional solutions based on a standalone OLAP server. The module utilizes the ETL process in Apache Spark and the Apache Druid analytical database. The functionality of the solution is demonstrated using publicly available air quality data from the Czech Hydrometeorological Institute. The usability of the resulting user interface, which provides access to typical OLAP operations
through interconnected analytical views, was verified through user testing.

Keywords:

Internet of Things, IoT, OLAP, analytical processing, multidimensional analysis, analytical database, RIoT, Apache Druid, Apache Spark, air quality

Date of defence

15.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Topics for thesis defence

  1. Prováděl jste nějakou analýzu existujících řešení?
  2. Řešíte korelaci mezi hodnotami? Ovlivňování čidel mezi sebou?

Language of thesis

Slovak

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Dr. Ing. Dušan Kolář (předseda)
doc. Dr. Ing. Otto Fučík (místopředseda)
RNDr. Marek Rychlý, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Tomáš Goldmann, Ph.D. (člen)

Supervisor’s report
Ing. Petr John

Student pracoval samostatně, důkladně a pečlivě. Výsledkem je kvalitní řešení, které poskytuje nejen zřetězené zpracování otevřených dat z portálu ČHMÚ, ale také umožňuje koncovým uživatelům tato data procházet a analyzovat podle vlastních potřeb. Navrhuji hodnocení stupněm A.

Evaluation criteria Verbal classification
Informace k zadání

Cílem této bakalářské práce bylo navrhnout a implementovat nástroj pro OLAP analýzu z chytrých zařízení v rámci internetu věcí, IoT. Za tímto účelem student nejprve prozkoumal oblast IoT a související koncepty, jako jsou chytrá města (Smart Cities) a komunikační technologie. Dále se student seznámil s problematikou zpracování OLAP, rozdíly proti OLTP a v neposlední řadě s aktuálně využívanými přístupy k OLAP v rámci IoT. Jelikož studentova práce spočívala v rozšíření již existující IoT platformy RIoT, musel student v další části tuto platformu vhodně analyzovat a zaměřit se jak na její současnou architekturu, tak na aktuálně využívané typy databází, aby mohl vyhodnotit požadavky na úložiště dat pro OLAP zpracování. Poté student navrhl rozšíření v podobě hromadného a zřetězeného zpracování dat pomocí mikroslužeb. Každá z těchto mikroslužeb zajišťuje samostatnou činnost a stará se o načítání a transformaci dat, jejich převod do vhodného formátu pro další práci a uložení do specializovaného úložiště Apache Druid. V rámci implementace student zrealizoval nejen zmíněné mikroslužby, ale také implementoval aplikační rozhraní pro práci s úložištěm Apache Druid poskytující potřebné funkce pro OLAP, a dále vhodně rozšířil uživatelské rozhraní. Pro implementaci musel student nastudovat velké množství technologií. Primárně se jednalo o zmíněné úložiště Apache Druid a další technologie na datové vrstvě v podobě InfluxDB (ve verzích 2 a 3), PostgreSQL a RabbitMQ, programovací jazyky Go, Java a Python, nástroje pro práci s kontejnery Docker a Docker compose a nástroje pro tvorbu komponent, React. Práce byla otestována z pohledu nasazení na konkrétním fakultním serveru, zpracováním otevřených dat od Českého hydrometeorologického ústavu (ČHMÚ) a zachycením a zhodnocením relevantních metrik. Kromě toho bylo provedeno uživatelské testování zaměřené na uživatelskou interakci se zpracovanými daty. Zadání hodnotím jako obtížné a to jak z důvodu rozsahu, tak kvůli nutnosti nastudovat aktuální přístupy k této analýze v IoT. Student úspěšně zadání splnil v celém rozsahu, a to kvalitním způsobem. Práce navazuje na a rozvíjí výstupy vznikající v rámci mé disertační práce [1].

[1] John, Petr. Optimising processes in IoT. Brno, 2024. Pojednání k tématu disertační práce. Vysoké učení technické v Brně, Fakulta informačních technologií.

Práce s literaturou

Student prostudoval doporučenou literaturu a sám aktivně vyhledával další relevantní zdroje.

Aktivita během řešení, konzultace, komunikace

Student komunikoval po celý akademický rok. Konzultace s vedoucím práce probíhaly online přibližně jednou za dva týdny. V letním semestru pak probíhaly konzultace přibližně jednou za týden. Student také často komunikoval prostřednictvím zpráv a informoval o pokroku. Student řádně plnil zadané úkoly a práce postupovala dobrým tempem.

Aktivita při dokončování

Student dokončil praktickou část bakalářské práce včas, což umožnilo otestovat integraci do existujícího projektu a nasadit jím upravené řešení. Technická zpráva byla dokončena na poslední chvíli, ale i přes to byla řádně konzultována. Vzhledem k rozsahu práce je tento fakt pochopitelný.

Publikační činnost, ocenění

-

Points proposed by supervisor: 98

Grade proposed by supervisor: A

Reviewer’s report
doc. RNDr. Pavel Smrž, Ph.D.

Vytvořený systém je plně funkční a bez výhrad splňuje zadání. Technická zpráva má výbornou úroveň, čerpá z mnoha relevantních zdrojů a provádí čtenáře vhodným způsobem od obecných poznatků až po specifika návrhu a implementace, stejně jako vyhodnocení systému. Celkově hodnotím práci jako velmi dobrou, případně až výbornou, podle kvality samotné prezentace v rámci státní zkoušky. 

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: obtížnější zadání

Zadání bylo mírně obtížnější, vyžadovalo prostudování problematiky OLAP a, zejména, současného systému RIoT, a vytvoření a otestování systému, který snese srovnání s profesionálními řešeními, používanými v praxi.

Prezentační úroveň technické zprávy

Technická zpráva má velmi dobrou prezentační úroveň, členění na kapitoly je logické, rozsahy jednotlivých částí jsou vhodně zvoleny a navazují na sebe tak, aby i čtenář neseznámený s problematikou OLAP, případně s detaily systému RIoT, snadno pochopil motivaci, realizaci i vyhodnocení vytvořeného řešení. 

89
Formální úprava technické zprávy

Po typografické i jazykové stránce má práce výbornou úroveň, splňuje všechny formální náležitosti, kladené na bakalářkou práci, a text zjevně prošel důkladnou kontrolou.

90
Realizační výstup

Realizační výstup je velmi zdařilý, i při předvedení výsledků práce mně student jasně demonstroval funkčnost vytvořeného programového řešení. Dokumentace odpovídá běžným standardům a výsledky byly ověřeny ve vhodně zvolených a vyhodnocených experimentech a testech. Využité externí moduly byly použity v souladu s licenčními podmínkami a autorským právem a v kódu je jasně rozlišeno, které části vytvořil student sám a které jsou převzaty. Ocenil bych pouze větší důraz na časovou náročnost vyhodnocení složitějších analytických dotazů, nicméně podle vyjádření studenta jsou odezvy natolik rychlé, že dobu čekání uživatelé nevnímají nijak negativně.

90
Využitelnost výsledků

Výsledky jsou bezprostředně využitelné v rámci vytvářeného systému a zdá se, že by o jejich nasazení mohla mít zájem i spolupracující firma.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Zadání bylo bez výhrad splněno, výborně je provedeno začlenění pokročilých analytických funkcí OLAP, propojení se současným systémem RIoT a vyhodnocení prvotního načítání rozsáhlých dat, která mají být dále analyzována. 

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Technická zpráva má očekávaný rozsah, všechny části jsou informačně bohaté a jsou vhodně zvoleny proporce mezi rozborem řešené problematiky ve formě přehledu současného stavu poznání, popisu návrhu a implementace studentova řešení a testování a vyhodnocení. 

Práce s literaturou

Práce cituje značné množství relevantních zdrojů, výběr studijních pramenů je výborný, všechny mají jasný vztah k tématu a dobře dokreslují části systému, kterých se daná část textu týká. Převzaté prvky jsou řádně odlišeny od vlastních výsledků a úvah a blibliografické citace jsou úplné a v souladu s citačními zvyklostmi a normami.

90
Points proposed by reviewer: 89

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová