Bachelor's Thesis

Analysis of Accident Locations and Traffic Accident Patterns

Final Thesis 13.87 MB

Author of thesis: Maksim Dubrovin

Acad. year: 2025/2026

Supervisor: Ing. Magdaléna Ondrušková

Reviewer: Ing. Jiří Hynek, Ph.D.

Abstract:

This thesis focuses on the analysis of traffic data with an emphasis on identifying accident locations and traffic accident patterns. It first introduces the principles of data analysis, prediction, and machine learning methods suitable for classification, clustering, and the discovery of patterns in traffic datasets. Subsequently, the available data sources—such as open data from the Czech Police and community-generated data from Waze—are examined with regard to their structure and quality. The thesis also analyzes an existing application for processing traffic and police data and proposes its extension with a module for accident location analysis. The resulting solution includes the implementation of this extended functionality, enabling the identification of high-risk areas, data visualization, and the evaluation of accident patterns. The thesis concludes with testing of the implemented solution and an assessment of the achieved results.

Keywords:

traffic accidents, traffic data analysis, accident hotspots, prediction, classification, clustering, behavior patterns, data visualization, Waze data, police data, traffic analytics, geospatial analysis

Date of defence

16.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaDznamka

Grading

D

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.

Topics for thesis defence

  1. Popište, jak byly voleny parametry algoritmu DBSCAN a jak jste ověřoval správnost zvolených hodnot?
  2. Na základě jakých hodnot klasifikujete?

Language of thesis

English

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Ing. Tomáš Martínek, Ph.D. (předseda)
doc. Ing. Michal Španěl, Ph.D. (místopředseda)
Ing. Jiří Hynek, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
Ing. Vladimír Bartík, Ph.D. (člen)

Supervisor’s report
Ing. Magdaléna Ondrušková

Práca spĺňa všetky body zadania a jej výsledkom je funkčná interaktívna webová aplikácia s netriviálnymi prvkami - priestorovým zhlukovaním, predikciou s reálnymi meteorologickými dátami a prehľadná vizualizácia rizikových úsekov sú prínosným rozšírením. Napriek tomu jednotlivé metódy mohli byť viac otestované a doladené.  Navrhujem hodnocení známkou C.

Evaluation criteria Verbal classification
Informace k zadání

Zadanie je súčasťou projektu Analyticity (zameranú na analýzu a vizualizáciu dopravných dát) . Cieľom práce bolo naštudovať problematiku dopravných dát a metódy ich analýzy, preskúmať dostupné datasety, analyzovať existujúcu aplikáciu Analyticity a navrhnúť a implementovať jej rozšírenie o modul pre analýzu nehodových lokalít a vzorcov dopravných nehôd.

Výsledkom je rozšírenie webovej aplikácie (FastAPI + PostGIS + React), ktoré identifikuje nehodové hotspoty pomocou DBSCAN, napája ich na cestnú sieť a pre každý úsek ponúka predikciu nebezpečnosti a materiálnych škôd (Random Forest) obohatenú o aktuálne meteorologické podmienky. Zadanie hodnotím ako priemerne ťažké a považujem ho za splnené.

Práce s literaturou

Študent si naštudoval odporúčanú literatúru a vyhľadal ďalšie relevantné zdroje (celkovo 44 bibliografických odkazov). Niektoré zdroje ale nie sú správne citované (napr. [7], [8]). 

Aktivita během řešení, konzultace, komunikace

Aktivita študenta počas akademického roka bola nepravidelná, komunikácia prebiehala menej často a väčšina práce bola realizovaná v záverečnej fáze riešenia.

Aktivita při dokončování

Práca bola dokončená tesne pred termínom odovzdania; text bol konzultovaný, no na zapracovanie pripomienok zostalo len obmedzené množstvo času.

Publikační činnost, ocenění
Points proposed by supervisor: 70

Grade proposed by supervisor: C

Reviewer’s report
Ing. Jiří Hynek, Ph.D.

Bakalářská práce je na průměrné úrovni. Práce obsahuje výše zmíněné nedostatky jak v technické zprávě, tak v realizačních výstupech – spolehlivost predikčních modelů mohla být lépe doložena. Navrhuji hodnocení stupněm D.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: obtížnější zadání

Cílem práce byla analýza dat o dopravních nehodách za účelem identifikace rizikových lokalit a vzorců, a následná implementace rozšíření webové aplikace o moduly pro prostorové shlukování a predikci rizik v reálném čase. Student se musel seznámit s metodami strojového učení (DBSCAN, Random Forest), prostorovými databázemi (PostgreSQL/PostGIS) a příslušnými backendovými i frontendovými technologiemi. Zadání hodnotím jako obtížnější. Považuji ho za splněné.

Prezentační úroveň technické zprávy

Kapitoly na sebe logicky navazují a práce má přehlednou strukturu. V teoretické části se nicméně občas vyskytují nepřesnosti. Text místy působí strojovým dojmem.

75
Formální úprava technické zprávy

Po jazykové stránce je práce přijatelná. Student dle uvedených informací využil nástroj ChatGPT. Po typografické stránce se vyskytují nedostatky (např. tabulka 3.1 není řádně vysázena a je označena jako obrázek, odkazy na vzorce obsahují závorky, apod.).

70
Realizační výstup

Student rozšířil existující aplikaci Analyticity o modul, který pomocí algoritmu DBSCAN automaticky identifikuje nehodové hotspoty a s využitím modelů Random Forest predikuje aktuální míru rizika a výši škod na základě reálného času a počasí. Bylo by nicméně vhodné lépe popsat, jak byly voleny parametry algoritmu DBSCAN a jak probíhalo testování těchto hodnot. Spolehlivost dosažených výsledků je diskutabilní.

60
Využitelnost výsledků

Výsledky jsou potenciálně využitelné v projektu Analyticity, nicméně budou vyžadovat další dopracování.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce s literaturou

Student kombinuje odborné a online zdroje. Vytkl bych, že některé odkazy nereferují konkrétní články s daty, ale obecné rozcestníky (např. odkazy na web WHO nebo NHTSA).

65
Topics for thesis defence:
  1. Popište, jak byly voleny parametry algoritmu DBSCAN a jak jste ověřoval správnost zvolených hodnot.
Points proposed by reviewer: 68

Grade proposed by reviewer: D

Responsibility: Mgr. et Mgr. Hana Odstrčilová