Bachelor's Thesis

Optimization of Analyses and Work with External Data for the Voting System of Representative Bodies

Final Thesis 2.44 MB

Author of thesis: Matúš Fignár

Acad. year: 2025/2026

Supervisor: Ing. Kristýna Zaklová

Reviewer: doc. Ing. Radek Burget, Ph.D.

Abstract:

This thesis addresses the design and implementation of an extension to the Zastupko application, providing analytical views on external statistical data. The first component of the solution is a standalone ETL tool that ensures automatic retrieval, transformation, and storage of data from statistical institutions into a shared data repository. The second component extends both the server and client sides of the Zastupko application with interactive visualization features, enabling filtering, territorial comparison, and descriptive-analytical observations. The result is a functional extension of an existing web application that makes statistical indicators accessible to end users without requiring knowledge of the underlying data structure.

Keywords:

statistical data, datasets, Eurostat, Czech Statistical Office, ETL, API, JSON-stat, visualization, MongoDB, processing

Date of defence

15.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položenou otázku rozhodla práci hodnotit stupněm C.

Topics for thesis defence

  1. Mohl byste konkretizovat mechanismus mapování, který používáte? Jak vypadají zdrojová data, jaké vlastnosti mapujete a jak vypadá cílové schéma?

Language of thesis

Slovak

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Dr. Ing. Dušan Kolář (předseda)
doc. Dr. Ing. Otto Fučík (místopředseda)
RNDr. Marek Rychlý, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Tomáš Goldmann, Ph.D. (člen)

Supervisor’s report
Ing. Kristýna Zaklová

Student splnil všechny body zadání a vytvořil kvalitní výstupy zaměřené na zpracování externích datasetů a vizualizaci nových analýz na regionální a národní úrovni. U nástroje pro práci s externími daty oceňuji jeho snadnou rozšiřitelnost, u analýz pak snahu vyvarovat se identifikovaným problémům u předchozích řešení. Část výstupů je již využívána v produkčním provozu a zbylé části budou integrovány v nejbližší době. K práci student přistupoval svědomitě a vytvořené řešení bylo průběžně konzultováno a testováno. Navrhuji proto hodnocení stupněm A.

Evaluation criteria Verbal classification
Informace k zadání

Zadání vzniklo jako rozšíření aplikace pro zpracování, analýzu a vizualizaci dat ze zasedání zastupitelských orgánů, která demonstruje výstupy vznikající v rámci mé disertační práce [1]. Student se seznámil s problematikou hlasování zastupitelských orgánů a analyzoval externí datové zdroje vhodné pro rozšíření existujících analýz. Dále se zabýval problematikou informačních systémů a aplikačních rozhraní. V praktické části analyzoval způsob využívání externích dat v systému a identifikoval nedostatky existujících analýz. Na základě získaných poznatků navrhl a implementoval nástroj pro automatizované zpracování externích datasetů, jejich ukládání do dokumentové databáze, verzování a nástroje poskytující možnost vyhodnocovat rozdíly jednotlivých verzí a následné využití v klientské části aplikace – součástí práce byly také vizualizace využívající nově získaná externí data. Backendová i frontendová část řešení je schopná zpracovávat data ze zvolených datových zdrojů dynamicky, pomocí jednotné konfigurace. Vytvořené řešení je snadno rozšiřitelné pro další datové sady i nové datové zdroje. Zadání hodnotím jako obtížnější a považuji jej za zcela splněné.


[1] Zaklová, K. (2025). Formal Models of Open Data. Pojednání k tématu disertační práce. Vysoké učení technické v Brně, Fakulta informačních technologií.

Práce s literaturou

Student nastudoval doporučenou literaturu a aktivně vyhledával další relevantní zdroje.

Aktivita během řešení, konzultace, komunikace

Student měl během akademického roku aktivnější a méně aktivní období, která se střídala. V aktivnějších obdobích pracoval intenzivně a vždy výrazně posunul řešení práce. V letním semestru pracoval student intezivněji. Konzultace probíhaly průběžně a na mé zprávy reagoval vždy obratem.

Aktivita při dokončování

Technická zpráva byla dokončována těsně před termínem odevzdání. Nicméně obsah byl řádně konzultován a student zapracoval většinu mých připomínek. 

Publikační činnost, ocenění

Points proposed by supervisor: 94

Grade proposed by supervisor: A

Reviewer’s report
doc. Ing. Radek Burget, Ph.D.

Pan Fignár vytvořil poměrně propracované a funkční řešení navržené s ohledem na další rozšiřitelnost a průběžné aktualizace dat. Vše implementoval pomocí vhodných technologií a provedl i základní uživatelskou studii použitelnosti. Výsledný dojem bohužel výrazně kazí technická zpráva, která je nekonkrétní, dokumentuje pouze základní rysy řešení a postrádá mnoho technických detailů. Celkově proto navrhuji hodnocení stupněm C.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Předmětem zadání je integrace strukturovaných dat dostupných prostřednictvím externích API do společné databáze a jejich základní  procházení. Z hlediska náročnosti práce takové zadání považuji za průměrně obtížné.

Prezentační úroveň technické zprávy

Text práce popisuje dostatečně základní rysy vytvořeného řešení, je však téměř ve všech pasážích formulován velmi obecně, takže ve výsledku není úplně zřejmý konkrétní cíl, ke kterému autor směřuje, ani všechny detaily řešení. Postrádám podrobnější analýzu datových zdrojů na vstupu, jejich vlastností (formát a struktura dat), požadovaného výstupu (jak se data budou ukládat, co přesně má uživatel vidět a k čemu to použije) a zejména přehled existujících přístupů datové integraci, což je problém, který autor řeší, namísto obecného popisu informačních systémů. Text často sklouzává do obecných a málo technických popisů (např. specifikace požadavků v kap. 4.3). Testování je také stručně popsáno. Lze ocenit, že byla provedena studie použitelnosti na reálných uživatelích, na druhou stranu ale není jasné, nakolik autor ověřil, že při mapování nedochází k chybám nebo ztrátě dat.

62
Formální úprava technické zprávy

Po formální stránce je práce přijatelná, v textu se však poměrně často vyskytují překlepy a ojediněle gramatické chyby. Obrázky často rozměrově nezapadají do ostatního obsahu a mohly být více informativní (např. návrh architektury na Obr. 5.1 je velmi nekonkrétní). Většina podnadpisů není z nějakého důvodu číslována, což komplikuje odkazování.

65
Realizační výstup

Vytvořené softwarové řešení je silnou stránkou práce. Výsledná aplikace zpracovává vstupní data z několika zdrojů a mapuje je na cílové schéma, přičemž autor věnoval velkou pozornost procesu aktualizace dat, verzování apod., stejně jako snadné rozšiřitelnosti o další datové zdroje. Velmi zdařilé je i uživatelské rozhraní pro procházení dat, které nezobrazuje pouze zdrojová data, ale i užitečné statistické souhrny.

90
Využitelnost výsledků

Výsledek rozšiřuje možnosti cílové aplikace o zobrazení popsaných statistických dat.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Zadání považuji za splněné ve všech bodech.

Rozsah technické zprávy

Evaluation level: splňuje pouze minimální požadavky

Technická zpráva je svým rozsahem v obvyklém rozmezí, nicméně některé poměrně dlouhé části nepovažuji za relevantní k tématu práce. Kapitola 2 obšírně vysvětluje strukturu zastupitelských orgánů v ČR, přičemž ale s daty o činnosti těchto orgánů student vůbec nepracuje. Relevantní jsou proto snad sekce 2.2 a 2.3, které jsou však poměrně obecné. Podobně kapitola 3 je obecným a nepříliš přesným slohovým cvičením na téma informační systémy přičemž ale autor nenavrhuje informační systém a ani aplikace Zastupko není v pravém slova smyslu informačním systémem. Naopak zejména části věnované návrhu řešení a testování jsou stručné na hranici přijatelnosti a mnoho detailů není zdokumentováno.

Práce s literaturou

Seznam literatury je velmi rozsáhlý, jeho značnou část však tvoří legislativní zdroje. Nicméně technické zdroje jsou také hojně zastoupeny, pokrývají řešenou problematiku a jsou v textu řádně citovány. V seznamu literatury jsou jen ojediněle drobné formální nedostatky.

88
Topics for thesis defence:
  1. Mohl byste konkretizovat mechanismus mapování, který používáte? Jak vypadají zdrojová data, jaké vlastnosti mapujete a jak vypadá cílové schéma?
Points proposed by reviewer: 72

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová