Bachelor's Thesis

Development of AI Agents for Business Process Automation

Final Thesis 2.48 MB

Author of thesis: Ondřej Jalůvka

Acad. year: 2025/2026

Supervisor: Ing. Vojtěch Staněk

Reviewer: Ing. Anton Firc, Ph.D.

Abstract:

This thesis compares two approaches to implementing AI agents for business process automation: the low-code platform n8n and the Python/LangGraph programmatic framework. The theoretical background connects classical agent architectures to modern large language model implementations. A business process audit of SANTIM, a Czech e-commerce company specializing in pool chemicals, identified four automation opportunities; the AI email assistant was selected for implementation and comparison due to its technical complexity, including natural language classification, agent communication, external API integration, and prompt-injection defense. Both systems were implemented in parallel and evaluated on a shared dataset of 33 synthetic customer emails (165 runs per system) across three research questions: routing accuracy, development adaptability, and runtime efficiency. Both systems achieved 100\% routing accuracy on standard cases; on edge cases, n8n outperformed Python (100\% vs 88.9\%). Adding a new email category took approximately 7 minutes in n8n versus 25 minutes in Python. n8n used 19\% fewer tokens on average and was 10\% faster. The Python system provides a more extensive security layer, XML structural isolation, PII redaction, and sender identity verification, that are not replicable in n8n's pre-built nodes. For a small team prioritizing rapid deployment, n8n is the more practical starting point; for environments with security or maintainability requirements, Python/LangGraph provides the necessary control.

Keywords:

AI agents, business process automation, LangChain, LangGraph, n8n, low-code platforms, comparative analysis, LLM, LLM-based agents, workflow automation

Date of defence

19.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Topics for thesis defence

  1. Jaké požadavky z hlediska AI Actu a GDPR musí navržený systém splňovat, zejména při zpracování osobních údajů v rámci automatického zasílání platebních reminderů a jejich předávání přes API externě hostovanému modelu?
  2. Z jakých existujících útoků nebo metodik vycházejí testy obrany proti prompt injection? Jedná se pouze o vlastní testovací vstupy nebo jsou použity existující benchmarky?
  3. Byl systém reálně nasazen ve společnosti? Pokud ano, jaké byly zkušenosti z provozu a jak se výsledky lišily oproti experimentálnímu testování?
  4. Jaké jsou infrastrukturní a provozní náklady systému, například z pohledu hardware, API tokenů a celkového cost-benefit poměru automatizace?
  5. Jaké další AI systémy jste zkusil?

Language of thesis

English

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

prof. RNDr. Alexandr Meduna, CSc. (předseda)
prof. Ing. Martin Čadík, Ph.D. (místopředseda)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
Ing. Lukáš Kekely, Ph.D. (člen)

Supervisor’s report
Ing. Vojtěch Staněk

Jedná se o kvalitně zpracovanou bakalářskou práci s prakticky použitelným výstupem. Student prokázal schopnost nastudovat aktuální oblast AI agentů, navrhnout řešení pro konkrétní podnikový proces a realizovat jej dvěma odlišnými technologickými přístupy. Významným kladem práce je přímé porovnání low-code a programátorské implementace na shodném scénáři a důkladnější zohlednění bezpečnostních aspektů. Největším omezením práce je ověření pouze na simulovaných datech a absence produkčního nasazení. Z výše uvedených důvodů hodnotím práci jako nadprůměrnou a navrhuji hodnocení stupněm B - velmi dobře.

Evaluation criteria Verbal classification
Informace k zadání

Zadání hodnotím jako průměrně obtížné, s důrazem na praktickou implementaci a porovnání dvou odlišných přístupů k tvorbě AI agentů. Zadání bylo splněno ve všech hlavních bodech. Oceňuji zejména dvě funkční implementace, praktické porovnání low-code a programátorského přístupu a zahrnutí bezpečnostních aspektů. Za slabší stránku považuji ověření řešení jen na syntetizovaných zákaznických e-mailech. Řešení zatím nebylo nasazeno do reálného provozu, i když v nejbližší době nejspíš nasazené bude.

Práce s literaturou

Student nastudoval relevantní literaturu k problematice AI agentů, agentních architektur, LLM systémů, automatizace podnikových procesů a použitých implementačních nástrojů. V práci vhodně kombinuje akademické zdroje s dokumentací prakticky použitých technologií, zejména n8n, LangChain a LangGraph. Zejména v oblasti AI agentů by mohlo být více různých zdrojů. Použitá literatura je však přiměřená tématu a poskytuje dostatečný teoretický základ pro následný návrh a implementaci.

Aktivita během řešení, konzultace, komunikace

Student pracoval samostatně a systematicky. Z výsledné práce je patrné, že byl schopen převést obecné zadání do konkrétního podnikového případu, analyzovat potřeby vybrané společnosti a navrhnout realistické řešení. Oceňuji zejména samostatnost při návrhu experimentální metodiky a schopnost porovnat oba implementační přístupy nejen popisně, ale i na základě měřitelných kritérií. Za vhodné bych považoval ještě širší ověření na reálných zákaznických datech nebo formálnější uživatelské testování, což však nepovažuji za zásadní nedostatek vzhledem k rozsahu bakalářské práce.

Aktivita při dokončování

V rámci práce vznikl použitelný AI agent, kterého lze bez většího prodlení nasadit do produkčního prostředí; nasazení samotné však před odevzdáním práce neproběhlo. Text práce byl konzultován sporadicky, ale dostatečně. Připomínky k definitivní podobě práce byly včas zapracovány.

Publikační činnost, ocenění

Publikační činnost ani ocenění související s touto prací mi nejsou známy. Student plánuje využít získané znalosti a výstupy práce jako základ pro svou podnikatelskou činnost, v čemž vidím velký potenciál a studenta v tomto záměru podporuji.

Points proposed by supervisor: 87

Grade proposed by supervisor: B

Reviewer’s report
Ing. Anton Firc, Ph.D.

Práce je celkově nadprůměrná a obsahuje několik velmi dobře zpracovaných částí, zejména formulaci research questions, metodologii experimentů a návrh automatizačních workflow. Student prokazuje schopnost pracovat s moderními AI technologiemi a přemýšlet o jejich využití v praktickém prostředí.


Současně ale práce obsahuje několik slabších míst. Postupně ubývá detailů potřebných k pochopení některých komponent systému, některé návrhové kroky nejsou dostatečně ukotveny v literatuře a chybí hlubší diskuse o praktickém nasazení a provozu systému.


Přes uvedené nedostatky hodnotím práci jako nadprůměrnou a navrhuji hodnocení stupněm B (83 bodů).

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Zadání hodnotím jako průměrně obtížné. Student se měl seznámit s existujícími technologiemi v oblasti AI agentů, automatizace a zpracování firemních procesů a následně navrhnout způsob jejich využití pro zlepšení interních procesů společnosti. Samotná implementace stojí převážně na integraci existujících technologií, nicméně práce vyžadovala orientaci v moderních AI nástrojích, business analýze a návrhu automatizačních workflow.

Prezentační úroveň technické zprávy

Práce má celkově dobrou strukturu a čte se poměrně dobře. Pozitivně hodnotím formulaci výzkumných otázek, které jsou jasně definované a vhodně ukotvují experimentální část práce. Velmi dobře je zpracovaná i teoretická část, která systematicky postupuje přes jednotlivé informace a buduje čtenáři potřebný kontext.

Silnou stránkou práce je rovněž analýza a audit firemních procesů. Student vhodně identifikuje problematická místa a přemýšlí nad možnostmi automatizace. Současně mi zde ale chybí větší teoretické ukotvení použitých business analytických metod a auditních technik. V IT prostředí není podobná problematika příliš známá, a proto by bylo vhodné alespoň stručně vysvětlit, z jakých metodických přístupů autor vychází.

Podobně bych ocenil vizualizaci procesů popsaných v sekci 3.3. Některé části práce působí příliš textově a diagramy by zde výrazně pomohly čtenáři orientaci.

V práci je místy obtížné sledovat, co přesně je pouze návrh a co bylo skutečně implementováno. Například sekce 3.5 nejprve uvádí implementaci čtyř částí systému, zatímco předchozí text hovoří především o automatizaci e-mailové komunikace. Až později je zřejmé, že čtyři části představují návrhy možných automatizací a implementována byla pouze jedna z nich. Práce by zde profitovala z explicitnějšího oddělení návrhové a implementační části.

Práce místy trpí nekonzistentní návazností jednotlivých částí. Například explicitní mapování identifikovaných pain points na automation opportunity matrix není příliš zřejmé. Chatbot se například objevuje až v sekci 3.4 bez výraznějšího naznačení v předchozí analýze, proč právě tato automatizace představuje vhodné řešení.

V návrhové části oceňuji diagramy popisující jednotlivé automatizace. Jsou přehledné, dobře čitelné a přesně takto by podobné návrhové diagramy měly vypadat. Na druhou stranu například obr. 5.1 je prakticky nečitelný a kvůli příliš malému písmu není zřejmé, co si z něj má čtenář odnést.

Sekce 5.4 by podle mě více profitovala z diagramu komunikace jednotlivých komponent než z dlouhého textového popisu, který se čte poměrně obtížně.

Práce postupně ztrácí úroveň detailu. Teoretická část věnovaná agentům je velmi dobře zpracovaná, následně ale u business analýzy chybí teoretické pozadí a v implementačních kapitolách postupně mizí informace potřebné k přesnému pochopení fungování některých komponent. Typickým příkladem je e-mailový klasifikátor. V kapitole 5 je popsáno pouze to, co klasifikátor dělá, nikoli jak funguje. Až v sekci 6.2 se čtenář dozvídá, že je použit model GPT-4o-mini, ale stále chybí detailnější vysvětlení způsobu použití modelu, promptingu nebo vyhodnocení klasifikace.

77
Formální úprava technické zprávy

Formální stránka práce je průměrná. V textu se opakovaně objevují nekonzistence v používání referencí typu section/Section. Dále se mi nelíbí, že reference u abstraktu přetékají na novou stránku.

Rozšířený abstrakt obsahuje velké množství detailních informací, které ale bez znalosti zbytku práce nejsou pro čtenáře příliš srozumitelné. Zvolená úroveň detailu je podle mě příliš vysoká a abstrakt tak ztrácí svůj hlavní účel: stručně a srozumitelně shrnout podstatu práce.

75
Realizační výstup

Realizační výstup hodnotím jako nadprůměrný. Student správně uchopil návrh automatizačního systému a experimentální část obsahuje kvalitně zpracovanou metodologii, výzkumné otázky i nastavení experimentů. Celkový přístup k porovnání jednotlivých implementačních variant je nad rámec běžné studentské práce.

Současně zde ale zůstává několik nejasností. Není například zřejmé, jak vznikla testovací data pro klasifikátor a nakolik reprezentují reálný firemní provoz. Očekával bych využití reálných historických zákaznických e-mailů nebo alespoň jejich anonymizované podoby, aby bylo možné lépe simulovat produkční nasazení. Podobně by bylo vhodné využít i reálné odpovědi zaměstnanců pro evaluaci generovaných výstupů.

Testování je provedeno převážně nad syntetickými daty a není úplně jasné, do jaké míry odpovídají reálnému trafficu ve společnosti.

Otazníky mám také kolem bezpečnostní části práce. Není například jasné, z jakých existujících útoků nebo metodik vycházejí testy obrany proti prompt injection. Stejně tak není úplně zřejmé, jak je následně vyhodnocována odolnost systému vůči útokům bez reálného spuštění modelu.

Chybí mi také explicitní definice funkčních a nefunkčních požadavků na implementaci. Bez nich je poměrně obtížné přesně ověřit, zda systém splňuje všechny očekávané vlastnosti.

Pozitivně hodnotím, že si autor řadu těchto omezení uvědomuje a některé z připomínek explicitně zmiňuje v práci.

85
Využitelnost výsledků

Práce má potenciálně vysokou praktickou využitelnost, protože řeší konkrétní firemní problém a navržené automatizace mohou reálně zlepšit interní procesy společnosti.

Současně ale v práci chybí diskuse o reálném nasazení systému. Není zřejmé, zda byl systém skutečně nasazen ve společnosti, jak probíhalo jeho používání a jaké byly reálné reakce uživatelů. Chybí také diskuse o nárocích na infrastrukturu, hardware a provozní náklady, nebo cost-benefit analýza automatizace ve vztahu k ceně provozu modelů a API tokenů. To je vzhledem k praktickému zaměření práce poměrně škoda a komplikuje hodnocení skutečné využitelnosti výsledků.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Zadání bylo splněno v požadovaném rozsahu. Student provedl analýzu procesů společnosti, identifikoval problematická místa a navrhl možnosti automatizace. Následně implementoval vybranou část systému a provedl experimentální porovnání různých přístupů.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Technická zpráva obsahuje přibližně 58 vysázených stran bez referencí, což odpovídá běžnému rozsahu diplomové práce a pohybuje se spíše na jeho horní hranici.

Práce s literaturou

Použité zdroje jsou převážně relevantní odborné publikace a literatura odpovídá tématu práce. Citace jsou založené zejména na odborných článcích a technické dokumentaci, což hodnotím pozitivně.

Na druhou stranu některá návrhová rozhodnutí nejsou dostatečně ukotvena v literatuře nebo alespoň v technické dokumentaci. Například použití limitu 8000 znaků jako ochranu proti prompt injection by si zasloužilo zdůvodnění nebo referenci.

82
Topics for thesis defence:
  1. Byl systém reálně nasazen ve společnosti? Pokud ano, jaké byly zkušenosti z provozu a jak se výsledky lišily oproti experimentálnímu testování?
  2. Jaké požadavky z hlediska AI Actu a GDPR musí navržený systém splňovat, zejména při zpracování osobních údajů v rámci automatického zasílání platebních reminderů a jejich předávání přes API externě hostovanému modelu?
  3. Z jakých existujících útoků nebo metodik vycházejí testy obrany proti prompt injection? Jedná se pouze o vlastní testovací vstupy nebo jsou použity existující benchmarky?
  4. Jaké jsou infrastrukturní a provozní náklady systému, například z pohledu hardware, API tokenů a celkového cost-benefit poměru automatizace?
Points proposed by reviewer: 83

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová