Bachelor's Thesis

Automated processing of logistic data and work with the database server

Final Thesis 1.68 MB Appendix 57.94 kB

Author of thesis: Štěpán Ryš

Acad. year: 2025/2026

Supervisor: doc. Ing. Jakub Kůdela, Ph.D.

Reviewer: Ing. Jan Turčínek, Ph.D.

Abstract:

This bachelor thesis focuses on the design and implementation of a validation library in the form of a Python package, developed for processing data in bulk material logistics. The primary objective was to ensure the standardization and consistency of raw operational data exported from a dispatching system, which exhibits a high error rate, and to prepare these data for subsequent optimization and planning algorithms. The developed library sequentially processes datasets containing geographical locations and orders specifying individual transportation requests. It implements functions that validate required properties and parameters, such as verifying a uniform data format, checking the logical consistency of time-related information, and assessing the feasibility of orders. Detected correctable inconsistencies are automatically resolved by the program logic, using a reference mariadb database to verify specific data. The output of the entire process consists of a modified dataset containing cleansed data and structured diagnostic reports that comprehensively document all identified errors and performed modifications.

Keywords:

Automated data processing, logistics, SQL database, data consistency check, transport routes, Python programming language, data validation, process optimisation

Date of defence

15.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaDznamka

Grading

D

Process of defence

Student seznámil komisi s výsledky své bakalářské práce a odpověděl na otázky oponenta. Následovala diskuze k závěrečné práci a otázky komise: Relační databáze a získání hodnot. Koeficient přepravní vzdálenosti. Použití identifikace lokací dle jmen měst a dle PSČ. Fuzzy párování a možnosti jeho nahrazení Word2vec. Definice minimální externí závislosti. Tvorba automatického reportu. Student uspokojivě odpověděl na položené dotazy.

Language of thesis

Czech

Faculty

Department

Study programme

Engineering (B-STR-P)

Specialization

Applied Computer Science and Control (AIŘ)

Composition of Committee

doc. Ing. Lukáš Novotný, Ph.D. (předseda)
doc. Ing. Miloš Hammer, CSc. (místopředseda)
Ing. Radek Poliščuk, Ph.D. (člen)
Ing. Jan Turčínek, Ph.D. (člen)
Ing. Petr Hadraba, Ph.D. (člen)
Ing. Filip Kšica, Ph.D. (člen)
doc. Ing. Ivan Švarc, CSc. (člen)
doc. Ing. Stanislav Věchet, Ph.D. (člen)
Ing. Zdeněk Ančík, Ph.D. (člen)

Supervisor’s report
doc. Ing. Jakub Kůdela, Ph.D.

Bakalářská práce se zabývá návrhem a implementací validační knihovny pro automatizované zpracování logistických dat. Zadání práce bylo motivováno konkrétní potřebou partnerské logistické společnosti ve spolupráci s Ústavem procesního inženýrství.

V teoretické části práce autor přehledně shrnuje problematiku kvality dat v logistických systémech, principy validace a normalizace dat, využití formátu JSON a základy práce s relační databází MariaDB a jazykem SQL. Přestože některé pasáže mají spíše charakter technologického přehledu, vytvářejí vhodný základ pro pochopení navazující implementace. Velká část textu vysvětluje Python, JSON, SQL, datové typy a relační databáze na úrovni, která působí spíše učebnicově než jako nutné odůvodnění konkrétního řešení.

Za hlavní přínos práce považuji praktickou implementaci validační knihovny distribuované ve formě Python balíčku. Student navrhl modulární architekturu, která umožňuje snadnou integraci do stávajícího softwarového ekosystému firmy. Knihovna provádí kontrolu konzistence lokací a objednávek, detekci chyb, automatické opravy bezpečně identifikovatelných problémů a generování diagnostických reportů.

Práce byla ověřena na reálných provozních datech. Student prezentuje výsledky validace, statistiky provedených oprav a základní měření výkonnosti. Tím prokazuje, že navržené řešení je prakticky použitelné a dokáže významně omezit manuální zásahy při přípravě dat pro plánovací algoritmy.

Student splnil stanovené cíle. Práci doporučuji k obhajobě a navrhuji hodnocení B/velmi dobře.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita C
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací B
Samostatnost studenta při zpracování tématu B

Grade proposed by supervisor: B

Reviewer’s report
Ing. Jan Turčínek, Ph.D.

Práce se zabývá tématem automatizovaného zpracování logistických dat a jejich integrace s databázovým serverem. Autor v úvodních částech práce úspěšně definuje funkční a nefunkční požadavky, což poskytuje dobrý základ pro následný návrh. Oceňuji také kapitolu věnovanou validační metodice pro navrženou knihovnu, která se jeví jako vhodně zvolená, metodicky správná a pro potřeby logistických dat plně aplikovatelná.

Určité nedostatky se však objevují v analytické a koncepční části, konkrétně v diagramech. V rámci schématu datových toků a integrace validační knihovny autor uvádí krok „Načtení dat do Pythonu“. Tato formulace je nepřesná, neboť Python je programovací jazyk, nikoliv konkrétní softwarový nástroj, a z textu není zcela zřejmé, jaký software či proces bude toto načítání reálně zajišťovat. Dále v Review schématu referenční databáze spatřuji chybu v definici kardinality vazeb, konkrétně mezi entitami lokace a objednávka, kde jsou chybně nastaveny vztahy 1:1.

V praktické části autor v 6. kapitole uvádí, že validační knihovna byla úspěšně otestována na reálných provozních datech logistické firmy. V textu práce však chybí konkrétní ukázka nebo podrobnější popis toho, jakým způsobem je vytvořená knihovna zapojena do kódu širší aplikace. K samotnému softwarovému výstupu mám také drobné výhrady – přiložený zdrojový kód postrádá dostatečné komentáře a soubor README.md nesourodě kombinuje český a anglický jazyk, což snižuje jeho profesionalitu.

Z hlediska naplnění zadání bylo cílem práce vytvoření nástroje pro zpracování dat. Ačkoliv by práci prospělo kompletní softwarové řešení nebo alespoň detailní popis integračního procesu, samotnou funkční knihovnu lze považovat za validní nástroj, který definované cíle splňuje. Práci doporučuji k obhajobě.

Navržené otázky k obhajobě

V kapitole 6 uvádíte, že knihovna byla nasazena na reálná provozní data. Můžete popsat nebo na schématu ukázat, jak přesně vypadá integrace Vaší knihovny do stávajícího softwarového prostředí dané logistické firmy?

V datovém modelu uvádíte mezi lokacemi a objednávkami vztah 1:1. Můžete vysvětlit logiku tohoto rozhodnutí, když v logistické praxi bývá běžné, že na jedné lokaci může figurovat více objednávek?
Evaluation criteria Grade
Splnění požadavků a cílů zadání D
Postup a rozsah řešení, adekvátnost použitých metod C
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii D
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací C

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová