Bachelor's Thesis

Hidden Eavesdropping on Mobile Device Users and Ad Targeting on the Web

Final Thesis 2.76 MB

Author of thesis: Matěj Pěta

Acad. year: 2025/2026

Supervisor: Ing. Radek Hranický, Ph.D.

Reviewer: doc. Mgr. Kamil Malinka, Ph.D.

Abstract:

Smartphone users often express concern that mobile devices can influence advertising recommendations by eavesdropping on offline conversations. This thesis explores the plausibility of this claim by designing an experimental environment that simulates verbal social interaction in the vicinity of a smartphone, while autonomously monitoring whether discussed topics become more prevalent in suggested advertisements. Seven distinct experiments were conducted to identify potential links between ambient conversation and targeted ad delivery. The experimental trials yielded inconsistent results, as only two of the fourteen discussions narrowed advertisement themes toward the conversational stimuli. The inability to produce consistent evidence supporting the claim suggests that the phenomenon of electronic eavesdropping is likely a result of advanced profiling architecture and coincidence, rather than unauthorized acoustic surveillance. These findings may alleviate consumer privacy concerns while providing a framework for future audits as advertising networks evolve.

Keywords:

Privacy concerns, Eavesdropping, Advertisement, Smartphone, Conversation

Date of defence

18.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Topics for thesis defence

  1. Použitý způsob pro sběr dat vypadá jako vytvořený na míru a nevypadá, že přežije další update sledované stránky. Jak byste navrhnul experimentální prostředí, aby bylo trvanlivější?
  2. Pro některé experimenty jste použil zvukotěsné prostředí. Nemohlo to vést k detekci toho, že se interakce děje v jakémsi sandboxu, a tím pádem k deaktivaci sledování? Obdobné techniky se využívají např. u malwaru, který se při detekci sandboxu neaktivuje.
  3. Nemohla absence jakékoli historie vést k neaktivování sledování? Dle Vaší analýzy potřebuji algoritmy pro distribuci reklamy více vstupů a pouhá jedna konverzace nemusí být dostatečná.
  4. Odpovídají vaše experimentálně získané výsledky názorům z uživatelských dotazníků?
  5. Bylo by možné váš systém použít i pokud by web nebyl otevřen na mobilním zařízení?

Language of thesis

English

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda)
doc. Ing. Michal Bidlo, Ph.D. (místopředseda)
Ing. Radek Kočí, Ph.D. (člen)
Ing. Jan Pluskal, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)

Supervisor’s report
Ing. Radek Hranický, Ph.D.

Pan Pěta byl během akademického roku aktivní, postupoval systematicky a zadání splnil v celém rozsahu. Oceňuji zejména širokou a poctivě vypracovanou reřerši souvisejících oblastí a zajímavý modulární návrh experimentálního prostředí. Návrh, implementaci i realizaci experimentů student zpracoval, dle mého názoru, kvalitně. Výsledky experimentů prezentoval s přiměřenou mírou opatrnosti a správně reflektoval jejich limity. Práci tedy hodnotím jako velmi dobrou.

Evaluation criteria Verbal classification
Informace k zadání

Cílem práce bylo analyzovat technickou proveditelnost odposlechu uživatelů mobilními aplikacemi. Následně pak experimentálně ověřit spekulace ohledně zneužívání osobních dat k cílení reklam na webu bez vědomí uživatelů. Zadání považuji za splněné v celém rozsahu.

Práce s literaturou

Student využil doporučené literatury a další relevantní zdroje si samostatně dohledal.

Aktivita během řešení, konzultace, komunikace

Student byl během řešení nadprůměrně aktivní, dohodnuté termíny plnil a na schůzky docházel připraven. Oceňuji také, že část implementace vypracoval již v zimním semestru.

Aktivita při dokončování

Práce byla dokončena v dostatečném předstihu před termínem odevzdání. Mé připomínky k technické zprávě student zapracoval.

Publikační činnost, ocenění

Zdrojové kódy svého díla student zveřejnil jako open-source na portálu GitHub pod licencí MIT: https://github.com/Macheesy/ad-analyzer.

Points proposed by supervisor: 87

Grade proposed by supervisor: B

Reviewer’s report
doc. Mgr. Kamil Malinka, Ph.D.

Student prokázal dobrou orientaci v problematice. Textová část je robustně zpracovaná. Výsledné hodnocení je ovlivněno nižší úrovní experimentální části. Naopak, na velmi dobré úrovni jsou kvalita textu práce a implementace podpůrných nástrojů.


Zásadní slabinou experimentů, které ovlivňuje i přenositelnost výsledků, jsou jejich rozsah, počet realizovaných měření a absence kontrolního vzorku. Často také chybí detailnější popisy a informace k experimentu, tak, aby se dal plně replikovat.


Návrhu experimentu by zásadně prospěla i existence kontrolní skupiny (kontrolní měření bez jakéhokoliv ovlivňování) a snaha o vytvoření baseline chování reklam v čase. Bez těchto kontrolních mechanismů nemají výsledky dostatečnou vypovídací hodnotu. Přes množství výtek k metodologii je nutno konstatovat, že úroveň realizované experimentální práce je velmi dobrá. U bakalářské práce se neočekává důkladně zvládnutá metodologie. 


Přes uvedené výtky práce splňuje požadavky na bakalářskou práci a doporučuji ji k obhajobě.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Jedná se o výzkumnou práci, která má za cíl ověřit existenci skrytého odposlechu uživatelů mobilních zařízení. Vedle implementační části práce tak bylo nutno i vhodně navrhnout metodologii experimentů.

Prezentační úroveň technické zprávy

Logická struktura práce je na dobré úrovni. Autor vhodným způsobem předkládá komplexní zpracování problematiky a dobře se orientuje ve všech relevantních oblastech. Některé části práce jsou jen vzdáleně blízké tématu - např. část 3.2. o zneužití dat uživatelů mi přijde nadbytečná. Obsah teoretické kapitoly 4, která se věnuje praktikám digitální reklamy, nebyl dále moc využit.  Dále bych uvítal detailnější analýzu požadavků na navrhované prostředí. Části týkající se návrhu, implementace a popisu experimentů jsou velmi dobře srozumitelné.

85
Formální úprava technické zprávy

Jazyková a stylistická stránka práce i úroveň typografie jsou na dobré úrovni. Obsahuje občasné typografické chyby (např. neúplný název podkapitoly) a malé množství jazykových chyb. Práce je psána anglicky a na výborné jazykové úrovni.

85
Realizační výstup

Realizační výstup zahrnuje primárně implementaci podpůrných experimentálních nástrojů nutných pro sběr dat, a experimentální měření formou simulace sledovaného chování a vyhodnocení výsledků. Kvalita implementace je na velmi dobré úrovni a funkční. Vše mi bylo demonstrováno. Student zvolil vhodné technologie, nicméně práci by prospěla lepší diskuze o jejich alternativách a vysvětlení volby. Zcela mi chybí vyjádření, zda a jak probíhalo testování korektnosti implementace.

Větší výtku mám k metodologii experimentů a jejich reprodukovatelnosti. Metodologie je popsána velmi stručně, nejsou k dispozici záznamy použité konverzace ani její přepis, design experimentů je velmi jednoduchý, není jasné, jak probíhala manuální analýza pro výběr sledovaných kategorií. Chybí i lepší interpretace použitých statistických hodnot.

Za zásadní považuji absenci analýzy chování nabízení reklam, absenci kontrolního měření bez stimulu a hlavně opakované měření ve stejné konfiguraci. Bez těchto informací se nedá seriozně vyhodnotit dopad stimulu. Autor také nijak nebere v potaz flexibilní chování burzy reklam, které může silně ovlivňovat výsledky.

Naopak chválím testování více jazyků a poměrně rozumnou délku experimentů.

85
Využitelnost výsledků

Ačkoliv práce řeší zajímavé a často diskutované téma, z důvodu nevhodného návrhu experimentů nejsou závěry dostatečně robustní a tím pádem ani dále použitelné.  

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Práce splnila všechny body zadání. Části týkající se implementace podpůrných nástrojů jsou na velmi dobré úrovni, naopak experimentální část je výrazně zjednodušená primárně jednoduchým designem experimentů.  

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Rozsah technické zprávy je v obvyklém rozsahu.

Práce s literaturou

Odkazované zdroje jsou relevantní pro téma a vhodně vybrány. Občas u některých použitých pojmů chybí reference. Kap. 4 mohla být bohatější na reference.

75
Topics for thesis defence:
  1. Pro některé experimenty jste použil zvukotěsné prostředí. Nemohlo to vést k detekci toho, že se interakce děje v jakémsi sandboxu, a tím pádem k deaktivaci sledování? Obdobné techniky se využívají např. u malwaru, který se při detekci sandboxu neaktivuje.
  2. Nemohla absence jakékoli historie vést k neaktivování sledování? Dle Vaší analýzy potřebuji algoritmy pro distribuci reklamy více vstupů a pouhá jedna konverzace nemusí být dostatečná.
  3. Použitý způsob pro sběr dat vypadá jako vytvořený na míru a nevypadá, že přežije další update sledované stránky. Jak byste navrhnul experimentální prostředí, aby bylo trvanlivější?
Points proposed by reviewer: 85

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová