Bachelor's Thesis

Cloudberry Database Configuration and Management Tool in Business Intelligence

Final Thesis 3 MB

Author of thesis: Bc. Jakub Šicner

Acad. year: 2024/2025

Supervisor: Ing. Jiří Hynek, Ph.D.

Reviewer: Ing. Magdaléna Ondrušková

Abstract:

This bachelor's thesis deals with the design, implementation and testing of a software tool for AMBICA. This tool focuses on the management and configuration of the massively parallel Apache Cloudberry database in the field of Business Intelligence. The main objective of the tool is to streamline the deployment and operation of this database. Key features include real-time monitoring of the current status and utilization of the database. The theoretical part of the thesis introduces the issues of big data, parallel architectures and Business Intelligence. This is followed by a detailed description of the Apache Cloudberry database architecture. The thesis further analyzes the requirements of the company, presents the architecture design of the developed tool and describes its implementation. Finally, an evaluation is performed using tests to verify the effectiveness of the proposed solution for database configuration and monitoring.

Keywords:

massively parallel processing, big data, indexing, Business Intelligence, horizontal scaling, monitoring, Apache Cloudberry, deployment automation

Date of defence

19.06.2025

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Ako prebiehalo vyhodnotenie Vášho implementovaného riešenia oproti pôvodnému riešeniu? Podarilo sa Vám týmto novým riešením eliminovať problémy, ktoré malo pôvodné riešenie v PostgreSQL?
  2. Proč jste si vybral Cloudberry? Provedl jste rešerši ostatních state-of-the-art řešení?

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Dr. Ing. Dušan Kolář (předseda)
doc. Ing. Vladimír Janoušek, Ph.D. (člen)
Ing. Radek Hranický, Ph.D. (člen)
doc. Ing. Jan Kořenek, Ph.D. (člen)
Ing. Zdeněk Materna, Ph.D. (člen)

Supervisor’s report
Ing. Jiří Hynek, Ph.D.

Student spolupracoval s průmyslem a vytvořil bakalářskou práci, jejíž výstupy jsou prakticky využitelné. Navrhuji hodnocení stupněm A.

Evaluation criteria Verbal classification
Informace k zadání

Práce vznikla ve spolupráci s firmou AMBICA. Úkolem bylo vytvořit systém pro správu, konfiguraci a škálování paralelní databáze Apache Cloudberry pro oblast Business Intelligence. Student se musel podrobně seznámit s daným databázovým systémem, nástroji pro monitorování databáze (Prometheus), ukládáním metrik (PostgreSQL) a vizualizace dat (Grafana). Řídící logika byla implementována v jazyce Bash. Zadání hodnotím jako obtížnější a považuji ho za splněné.

Práce s literaturou

Student si aktivně dohledával literaturu týkající se zejména databázového systému Apache Cloudberry a problematiky business intelligence.

Aktivita během řešení, konzultace, komunikace

Student pracoval samostatně a konzultace vyžadoval spíše méně. Řešení bylo primárně konzultováno ve firmě AMBICA.

Aktivita při dokončování

Práce byla dokončena v včas a mohla být konzultována.

Publikační činnost, ocenění

Výsledky jsou využitelné ve firmě AMBICA.

Points proposed by supervisor: 90

Grade proposed by supervisor: A

Reviewer’s report
Ing. Magdaléna Ondrušková

Študent vytvoril použiteľné riešenie pre správu a monitorovanie databázy Cloudberry. Navrhujem hodnotiť stupňom A. 

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: obtížnější zadání

Cieľom práce bolo navrhnúť, implementovať a otestovať nástroj na jednoduché nasadenie, konfiguráciu, monitorovanie a škálovanie databázy Apache Cloudberry v Business Intelligence (BI). Riešenie malo nahradiť existujúci obmedzený systém, zvýšiť efektívnosť správy databázy a umožniť spoločnosti Ambica ľahšie prispôsobiť infraštruktúru potrebám konkrétneho zákazníka. Študent previedol analýzu aktuálneho riešenia, pričom detailne rozobral jeho nedostatky a zameral sa na jasné formulovanie požiadaviek na nové riešenie. Nové riešenie navrhol, detailne popísal a implementoval. Samotnú implementáciu dôkladne otestoval, pričom sa sústredil na definíciu viacerých testovacích scenárov, ktoré môžu reálne nastať v praxi. Zadanie hodnotím ako obtížnejšie.  

Prezentační úroveň technické zprávy

Práca je rozumne členená na teoretickú a praktickú časť. Teoretická časť obsahuje popísaný problém spracovania veľkého množstva dát z pohľadu potrieb BI. Takisto obsahuje detailne analyzovanú databázu CloudBerry. Chýbalo mi tu ale väčšie porovnanie s inými databázovými riešeniami. 

Praktická časť je dobre popísaná, analýza aktuálneho riešenia je dôkladná a samotný návrh a implementácia nového riešenia je dobre popísaná.

85
Formální úprava technické zprávy

Formálna úprava technickej práci je na dobrej úrovni.

90
Realizační výstup

Študent vytvoril nástroj na správu databázy Apache Cloudberry, ktorý je funkčný a obsahuje niekoľko vzájomne prepojených častí – skripty na automatizáciu nasadenia, systém na monitorovanie a vizualizáciu údajov pomocou aplikácií Prometheus a Grafana a komponent na upozorňovanie pomocou aplikácie Alertmanager. Testovanie funkčnosti sa uskutočnilo na realistických scenároch (napr. nasadenie a rozšírenie klastra, simulácia výpadku).

95
Využitelnost výsledků

Študent vytvoril použiteľné riešenie, ktoré bolo prezentované a je použiteľné pre potreby danej firmy Ambica. Študent pripravil množstvo skriptov pre správu databázy, spolu s nastavením jej monitorovania a alertovania. 

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce s literaturou

Študent preštudoval dostatočné množstvo zdrojov. 

90
Topics for thesis defence:
  1. Ako prebiehalo vyhodnotenie Vášho implementovaného riešenia oproti pôvodnému riešeniu? Podarilo sa Vám týmto novým riešením eliminovať problémy, ktoré malo pôvodné riešenie v PostgreSQL?
Points proposed by reviewer: 95

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová