Přístupnostní navigace
E-application
Search Search Close
Bachelor's Thesis
Author of thesis: Bc. Jakub Šicner
Acad. year: 2024/2025
Supervisor: Ing. Jiří Hynek, Ph.D.
Reviewer: Ing. Magdaléna Ondrušková
This bachelor's thesis deals with the design, implementation and testing of a software tool for AMBICA. This tool focuses on the management and configuration of the massively parallel Apache Cloudberry database in the field of Business Intelligence. The main objective of the tool is to streamline the deployment and operation of this database. Key features include real-time monitoring of the current status and utilization of the database. The theoretical part of the thesis introduces the issues of big data, parallel architectures and Business Intelligence. This is followed by a detailed description of the Apache Cloudberry database architecture. The thesis further analyzes the requirements of the company, presents the architecture design of the developed tool and describes its implementation. Finally, an evaluation is performed using tests to verify the effectiveness of the proposed solution for database configuration and monitoring.
massively parallel processing, big data, indexing, Business Intelligence, horizontal scaling, monitoring, Apache Cloudberry, deployment automation
Date of defence
19.06.2025
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
Czech
Faculty
Fakulta informačních technologií
Department
Department of Information Systems
Study programme
Information Technology (BIT)
Composition of Committee
doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Radek Hranický, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen)
Supervisor’s reportIng. Jiří Hynek, Ph.D.
Student spolupracoval s průmyslem a vytvořil bakalářskou práci, jejíž výstupy jsou prakticky využitelné. Navrhuji hodnocení stupněm A.
Práce vznikla ve spolupráci s firmou AMBICA. Úkolem bylo vytvořit systém pro správu, konfiguraci a škálování paralelní databáze Apache Cloudberry pro oblast Business Intelligence. Student se musel podrobně seznámit s daným databázovým systémem, nástroji pro monitorování databáze (Prometheus), ukládáním metrik (PostgreSQL) a vizualizace dat (Grafana). Řídící logika byla implementována v jazyce Bash. Zadání hodnotím jako obtížnější a považuji ho za splněné.
Student si aktivně dohledával literaturu týkající se zejména databázového systému Apache Cloudberry a problematiky business intelligence.
Student pracoval samostatně a konzultace vyžadoval spíše méně. Řešení bylo primárně konzultováno ve firmě AMBICA.
Práce byla dokončena v včas a mohla být konzultována.
Výsledky jsou využitelné ve firmě AMBICA.
Grade proposed by supervisor: A
Reviewer’s reportIng. Magdaléna Ondrušková
Študent vytvoril použiteľné riešenie pre správu a monitorovanie databázy Cloudberry. Navrhujem hodnotiť stupňom A.
Evaluation level: obtížnější zadání
Cieľom práce bolo navrhnúť, implementovať a otestovať nástroj na jednoduché nasadenie, konfiguráciu, monitorovanie a škálovanie databázy Apache Cloudberry v Business Intelligence (BI). Riešenie malo nahradiť existujúci obmedzený systém, zvýšiť efektívnosť správy databázy a umožniť spoločnosti Ambica ľahšie prispôsobiť infraštruktúru potrebám konkrétneho zákazníka. Študent previedol analýzu aktuálneho riešenia, pričom detailne rozobral jeho nedostatky a zameral sa na jasné formulovanie požiadaviek na nové riešenie. Nové riešenie navrhol, detailne popísal a implementoval. Samotnú implementáciu dôkladne otestoval, pričom sa sústredil na definíciu viacerých testovacích scenárov, ktoré môžu reálne nastať v praxi. Zadanie hodnotím ako obtížnejšie.
Práca je rozumne členená na teoretickú a praktickú časť. Teoretická časť obsahuje popísaný problém spracovania veľkého množstva dát z pohľadu potrieb BI. Takisto obsahuje detailne analyzovanú databázu CloudBerry. Chýbalo mi tu ale väčšie porovnanie s inými databázovými riešeniami.
Praktická časť je dobre popísaná, analýza aktuálneho riešenia je dôkladná a samotný návrh a implementácia nového riešenia je dobre popísaná.
Formálna úprava technickej práci je na dobrej úrovni.
Študent vytvoril nástroj na správu databázy Apache Cloudberry, ktorý je funkčný a obsahuje niekoľko vzájomne prepojených častí – skripty na automatizáciu nasadenia, systém na monitorovanie a vizualizáciu údajov pomocou aplikácií Prometheus a Grafana a komponent na upozorňovanie pomocou aplikácie Alertmanager. Testovanie funkčnosti sa uskutočnilo na realistických scenároch (napr. nasadenie a rozšírenie klastra, simulácia výpadku).
Študent vytvoril použiteľné riešenie, ktoré bolo prezentované a je použiteľné pre potreby danej firmy Ambica. Študent pripravil množstvo skriptov pre správu databázy, spolu s nastavením jej monitorovania a alertovania.
Evaluation level: zadání splněno
Evaluation level: je v obvyklém rozmezí
Študent preštudoval dostatočné množstvo zdrojov.
Grade proposed by reviewer: A
Responsibility: Mgr. et Mgr. Hana Odstrčilová