Bachelor's Thesis

Design of a Database Solution for the Analysis of Pharmaceutical Consumption Trends Using Open Healthcare Data

Final Thesis 1.38 MB

Author of thesis: Michaela Küfhaberová

Acad. year: 2025/2026

Supervisor: Ing. Jiří Kříž, Ph.D.

Reviewer: RNDr. Jana Kopanicová

Abstract:

This bachelor's thesis focuses on the design and implementation of an analytical solution for unifying fragmented datasets on drug consumption in Slovakia between 2015 and 2025. It transforms the static and methodologically inconsistent NCZI reporting into a fully automated Business Intelligence model. As part of the practical section, a robust ETL process was developed in Power Query, consolidating dozens of heterogeneous files into an optimized star schema. The proposed solution achieves radical time savings during data updates and, through interactive visualizations, reveals hidden market trends, such as the impact of the COVID-19 pandemic on antibiotic prescription or the steady growth in the psychoanaleptic segment. The resulting semantic model complements retrospective analysis with a statistically supported prediction for the year 2026.

Keywords:

Business Intelligence, Power BI, data integration, ETL process, drug consumption, data visualization, open data, National health information centre, data modeling

Date of defence

18.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Studentka ve své prezentaci seznámila komisi s cíli, řešením a výsledky, ke kterým v závěrečné práci dospěla. Komise se poté seznámila s posudky a hodnocením vedoucího práce a oponenta. Otázky z posudku oponenta zodpověděla v plném rozsahu. Otázky členů komise: 1. Kříž, Ph.D. - Uvažovala jste o jiných formách vizualizace? odpovězeno 2. doc. Šremr - Vysvětlete pojem prognostická funkce? odpovězeno 3. prof. Rais - Kolik jste měla dat? odpovězeno Na základě přednesené prezentace a odpovědí na otázky položené v diskusi komise rozhodla, že studentka práci obhájila.

Language of thesis

Czech

Faculty

Department

Study programme

Managerial Informatics (BAK-MIn)

Composition of Committee

prof. Ing. Karel Rais, CSc., MBA, dr. h. c. (předseda)
doc. Ing. Jiří Šremr, Ph.D. (místopředseda)
Ing. Jiří Kříž, Ph.D. (člen)
Ing. Karel Doubravský, Ph.D. (člen)
Ing. Jan Budík, Ph.D., MBA (člen)

Supervisor’s report
Ing. Jiří Kříž, Ph.D.

Bakalářská práce se zabývá návrhem databázového řešení pro analýzu trendů spotřeby léčiv s využitím otevřených zdravotnických dat. Autorka provedla analýzu veřejně dostupných datasetů Národného centra zdravotníckych informácií a navrhla řešení založené na platformě Microsoft Power BI umožňující sjednocení datových struktur a tvorbu analytických výstupů. Součástí práce je implementace ETL procesu, návrh relačního datového modelu a vizualizace trendů spotřeby léčiv.

Práce je zpracována systematicky a logicky. Pozitivně lze hodnotit zejména kvalitní analýzu datových zdrojů, návrh ETL procesu a návaznost teoretických východisek na praktickou část práce. Silnou stránkou práce je především práce s reálnými otevřenými zdravotnickými daty a vytvoření funkčního analytického modelu v prostředí Business Intelligence.

Dílčí rezervy lze spatřovat zejména v omezeném rozsahu hlubší statistické evaluace analytických výstupů, absenci širšího provozního ověření navrženého řešení v praxi a místy více popisném charakteru teoretické části.
Evaluation criteria Verbal classification Grade
Splnění stanovených cílů Cíl bakalářské práce byl splněn v souladu se zadáním práce. Autorka navrhla databázové řešení pro sjednocení heterogenních datových sad o spotřebě léčiv a ověřila jeho využitelnost prostřednictvím analytických výstupů v prostředí Business Intelligence. Součástí práce je návrh ETL procesu, datového modelu a vizualizace vybraných trendů spotřeby léčiv. Výsledné řešení odpovídá požadavkům definovaným v zadání práce. A
Zvolený postup řešení, adekvátnost použitých metod Autorka zvolila vhodný a systematický postup řešení odpovídající charakteru bakalářské práce. Práce obsahuje analýzu datových zdrojů, návrh ETL procesu v prostředí Power Query, návrh hvězdicového schématu a implementaci analytické vrstvy pomocí jazyka DAX. Pozitivně lze hodnotit logickou návaznost jednotlivých částí práce a propojení datového modelování s analytickými požadavky uživatelů. Dílčí rezervy lze spatřovat zejména v omezeném rozsahu hlubší metodické reflexe a detailnější evaluace některých návrhových rozhodnutí. B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry Autorka prokázala schopnost analyzovat strukturu otevřených zdravotnických dat a identifikovat problémy související s jejich nekonzistencí a fragmentací. Návrhová část obsahuje popis analytických výstupů, vizualizací a interpretaci vybraných trendů spotřeby léčiv. Pozitivně lze hodnotit také využití predikčních funkcí a práci s časovými řadami. Dílčí rezervy lze spatřovat zejména v omezeném rozsahu hlubší statistické evaluace a detailnější interpretace některých analytických výstupů. B
Praktická využitelnost výsledků Práce má praktický přínos v oblasti zpracování a analytického využití otevřených zdravotnických dat. Navržené řešení umožňuje automatizovanou integraci datových sad, efektivnější aktualizaci dat a tvorbu analytických výstupů nad rozsáhlými datovými soubory. Přínosem práce je zejména sjednocení datových struktur a vytvoření podkladu pro další analytické využití dat. Praktická část však zůstává převážně na úrovni analytického modelu bez širšího provozního ověření nebo implementace v reálném organizačním prostředí. B
Uspořádání práce, formální náležitosti, použitá terminologie a odborná jazyková úroveň Práce je zpracována přehledně a její struktura odpovídá doporučením směrnice Fakulty podnikatelské pro vypracování závěrečných prací. Jednotlivé kapitoly na sebe logicky navazují, hlavní kapitoly začínají na samostatných stranách a práce obsahuje všechny požadované části včetně metodiky zpracování. Odborná terminologie z oblasti Business Intelligence, datového modelování a ETL procesů je používána správně a jazyková úroveň práce odpovídá požadavkům kladeným na bakalářskou práci. A
Práce s informačními zdroji, včetně citací Autorka pracuje s relevantní odbornou literaturou zaměřenou na oblast Business Intelligence, datového modelování, ETL procesů a vizualizace dat. Použité zdroje odpovídají tématu práce a jsou v textu průběžně citovány. Pozitivně lze hodnotit propojení teoretických východisek s praktickou částí práce i využití odborné literatury a technické dokumentace používaných nástrojů. Výstup systému Theses vykazuje velmi vysokou podobnost ve výši 99 %. Analýzou výsledků však bylo zjištěno, že dominantní část podobnosti vznikla porovnáním s jinou verzí téže závěrečné práce autorky uloženou v systému Theses. Ostatní nalezené podobnosti jsou pouze marginální a odpovídají běžně používané odborné terminologii, citačním a formálním částem práce. Nebyly zjištěny skutečnosti nasvědčující porušení citační etiky. B

Grade proposed by supervisor: B

Reviewer’s report
RNDr. Jana Kopanicová

Študentka mala za úlohu analyzovať vstupné údaje v štruktúre datasetov a vytvoriť z nich vhodný model pre ďalšie spracovanie a interpretáciu. Cieľom práce bolo pochopiť štruktúru rozsiahlych dát, spracovať ich do prehľadnej formy a pripraviť výstupy, ktoré umožnia ich ďalšiu analytickú a rozhodovaciu podporu.
Študentka sa veľmi dobre popasovala s rozsiahlym objemom dát aj ich štruktúrou. Preukázala schopnosť orientovať sa v komplexných datasetoch a identifikovať ich kľúčové vlastnosti.
Vytvorená multidimenzionálna dátová kocka predstavuje vhodný a flexibilný nástroj na generovanie rôznych typov výstupov. Ide o správne zvolený prístup, ktorý zvyšuje využiteľnosť dát.
Analýza dát je spracovaná veľmi dobre. Študentka vytvorila štatistické výstupy, ktoré presne a zrozumiteľne popisujú správanie dát a ich vnútorné vzťahy.
Grafy a tabuľky vhodne odrážajú informácie ukryté v dátach. Vizualizácie sú prehľadné, informatívne a podporujú interpretáciu výsledkov.
Bakalársku prácu odporúčam k obhajobe.
Evaluation criteria Grade
Splnění stanovených cílů A
Zvolený postup řešení, adekvátnost použitých metod B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Praktická využitelnost výsledků A
Struktura práce, použitá terminologie a odborná jazyková úroveň B
Práce s informačními zdroji B
Topics for thesis defence:
  1. Ktoré z vašich výsledkov považujete za najdôležitejšie a čo konkrétne o dátach odhaľujú?
  2. Prečo ste zvolili práve tieto typy grafov a tabuliek? Uvažovali ste aj o iných formách vizualizácie?
  3. Ako by sa dali vaše výsledky využiť v praxi alebo v ďalšej analytickej práci?

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová