bakalářská práce

Využití dolování sekvenčních vzorů v Google Analytics

Text práce 1.45 MB

Autor práce: Ing. Gergő Viskievič

Ak. rok: 2020/2021

Vedoucí: Ing. Jan Luhan, Ph.D., MSc

Oponent: Ing. Pavel Šabatka

Abstrakt:

Bakalárska práca sa zameriava na návrh a vývoj algoritmu pre dolovanie sekvenčných vzorov v Google Analytics 4 dátach. Predstavuje a analyzuje dostupné algoritmy pre dolovanie sekvenčných vzorov. Analyzuje dátový model a využitie služby Google Analytics 4. Na základe požiadaviek firemných procesov je navrhnutý algoritmus vhodný definovaným očakávaným vstupným dátam.

Klíčová slova:

Google Analytics 4, sekvenčné vzory, Python, dolovanie znalostí z databáz, algoritmus,
sekvenčné pravidlá, dolovanie sekvenčných vzorov

Termín obhajoby

22.06.2021

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

A

Průběh obhajoby

Otázky oponenta Co přesně znamenají uzavřené a neuzavřené sekvenční vzory? - Odpovězeno Na jakých datech jste přesně algoritmus testoval? - Odpovězeno Byl Algoritmus testován i pro samostné URL stránenk? - Odpovězeno

Jazyk práce

slovenština

Fakulta

Ústav

Studijní program

Systémové inženýrství a informatika (BAK-MIn-D)

Studijní obor

Manažerská informatika (BAK-MIn)

Složení komise

doc. RNDr. Bedřich Půža, CSc. (předseda)
Ing. Jiří Kříž, Ph.D. (místopředseda)
Ing. Lenka Širáňová, Ph.D. (člen)
Ing. Jan Luhan, Ph.D., MSc (člen)
Mgr. Eva Michalíková, Ph.D. (člen)

Posudek vedoucího
Ing. Jan Luhan, Ph.D., MSc

Práce je zpracována na velmi dobré (až nadstandardní) úrovni. Hlavní cíl v podobě návrhu podpory pro analýzu chování uživatelů webových stránek prostřednictvím dolování sekvenčních vzorů dle konkrétní specifikace zadavatele byl naplněn. Výstupem práce je návrh algoritmu využitelného pro výše specifikovaný cíl.

V samotné práci je patrný systematický a komplexní přístup k řešení dané problematiky. Dílčí části mají logickou návaznost a směřují k vytyčenému cíli. Pokrývají plně danou problematiku a kombinují různé přístupy pro řešení problému.

Zpracování splňuje požadavky závěrečné práce, přičemž lze nalézt pouze drobné nedostatky ve formátování, stylistice, či drobných jazykových nepřesnostech.

Z práce je zřejmá autorova orientace v dané problematice a systematický přístup pro řešení komplexního problému.

Práci doporučuji k obhajobě.

Otázka k obhajobě:
Jaký je aktuální vývoj v oblasti Vašich návrhů?
Kritérium hodnocení Známka
Splnění stanovených cílů A
Zvolený postup řešení, adekvátnost použitých metod A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Praktická využitelnost výsledků B
Uspořádání práce, formální náležitosti, použitá terminologie a odborná jazyková úroveň B
Práce s informačními zdroji, včetně citací B

Známka navržená vedoucím: A

Posudek oponenta
Ing. Pavel Šabatka

Teoretický úvod pokrývá řešenou problematiku v dostatečném rozsahu. Jsou zde pouze drobné nepřesnosti v popisu Google Analytics 4. Uzavřené a neuzavřené sekvenční vzory jsou vysvětleny zavádějícím způsobem.
V závěru práce je popsáno, že algoritmus byl testován na 2 různých datasetech. Zhodnocení výkonnosti algoritmu a smysluplnost nalezených výsledků pro jednotlivé datasety ale v práci chybí.
Velmi oceňuji číst mapování potřeb firmy a návrh cíle algoritmu. Obecně mi práce s cíli a příjemci dat ve vzdělávání datových analytiků chybí, přitom je pro úspěch projektu klíčová.
Pozitivně také hodnotím volbu nástroje Google Analytics 4 - jedná se o technologii starou necelý rok, stále ještě s nedokonalou dokumentací. Spoustu věcí je zde třeba zjišťovat testováním, což zvyšuje náročnost nastavení i zpracování dat.
Zozsah práce i její náročnost odpovídá požadavkům na bakalářskou práci. Rod House of Řezáč bude algoritmus rozhodně dále využívat.
Kritérium hodnocení Známka
Splnění stanovených cílů B
Zvolený postup řešení, adekvátnost použitých metod A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry C
Praktická využitelnost výsledků B
Struktura práce, použitá terminologie a odborná jazyková úroveň B
Práce s informačními zdroji A
Otázky k obhajobě:
  1. Co přesně znamenají uzavřené a neuzavřené sekvenční vzory? Na jakých datech jste přesně algoritmus testoval? Pro jaká data dává smysluplnější výstupy? Byl algoritmus testován i pro samotné URL stránek? Byl pro taková data dostatečně výkonný? Testoval jste algoritmus podle jména události v GA4? Takové nastavení by dávalo velký smysl.

Známka navržená oponentem: A

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová