Master's Thesis

Analysis and modeling of bus transport chronometry

Final Thesis 1.35 MB Appendix 278.01 kB

Author of thesis: Bc. Vojtěch Haviger

Acad. year: 2025/2026

Supervisor: Ing. Vlastimír Nevrlý, Ph.D.

Reviewer: Ing. Ivan Eryganov, Ph.D.

Abstract:

This thesis focuses on the optimization of regional bus timetables based on real-world historical operational data. First, data from localization sensors are subjected to thorough cleaning and statistical analysis. Non-linear quantile regression, among other statistical methods, is utilized for outlier detection and modeling vehicle dwell times at stops. Subsequent spatial-temporal classification and the application of the non-parametric Aligned Rank Transform (ART ANOVA) demonstrate the statistically significant influence of the time of day and the interaction between the type of day and the time of day on vehicle travel times. The core of the thesis is the design of a mathematical optimization model based on quadratic programming, which adjusts departure and arrival times while maintaining the structure of the original timetable. Finally, the functionality and benefits of the proposed model are successfully verified using a stochastic Monte Carlo simulation, which confirms a demonstrable increase in the reliability, fluidity, and overall resilience of the new implemented timetable against operational fluctuations.

Keywords:

regional bus transport, timetable optimization, chronometry, quadratic programming, statistical data analysis, ART ANOVA, Monte Carlo simulation

Date of defence

08.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval práci, školitel i oponent přečetli své posudky. K otázkám oponenta: O jaký model se jedná? - smíšené celočíselné kvadratické programování Bylo ověření provedeno na nezávislých datech nebo na části dat nepoužitých při kalibraci modelu? Nebylo, protože pracoval jen se 14 dny, takže by po odstranění části hodnot k validaci měl málo dat. Jak byla generována data Monte Carlem (nezávislost, korelace) - zodpovězeno. dr.Rozehnalová - Budou jízdní řády použity v praxi? Zatím se neví, podklad k projektu řešeném na ÚPI. doc.Kolář - Jsou data veřejně dostupná? Nejsou, získal je z dopravního podniku.

Language of thesis

Czech

Faculty

Department

Study programme

Mathematical Engineering (N-MAI-P)

Composition of Committee

doc. Mgr. Petr Vašík, Ph.D. (předseda)
doc. RNDr. Martin Kolář, Ph.D. (místopředseda)
prof. Aleksandre Lomtatidze, DrSc. (člen)
Ing. Ivan Eryganov, Ph.D. (člen)
Ing. Petra Rozehnalová, Ph.D. (člen)

Supervisor’s report
Ing. Vlastimír Nevrlý, Ph.D.

Předložená diplomová práce studenta se zabývá vysoce aktuálním a prakticky důležitým tématem analýzy a modelování chronometráže autobusové dopravy. Student k řešení přistoupil s příkladným nasazením. Jako vedoucí práce musím v první řadě vyzdvihnout jeho vynikající přístup k plnění povinností – student se pravidelně každý týden účastnil celodenních konzultací, na které chodil vždy připraven.

Pozitivně hodnotím mimořádnou samostatnost studenta při zpracování takto komplexního tématu. Student prokázal výbornou schopnost orientace v náročné odborné literatuře a vědeckých článcích, z nichž dokázal syntetizovat teoretické poznatky a aplikovat je na zadaný problém. Vedle samotného matematického návrhu je nutné vyzdvihnout silnou implementační stránku práce. Student se musel úspěšně seznámit s rozsáhlým programovacím prostředím a prokazatelně si osvojil i striktní programovací standardy. Velmi oceňuji také jeho bezproblémové zapojení moderních prvků vývoje včetně systematické práce s verzovacím systémem, což se odrazilo na vysoké inženýrské kvalitě a přehlednosti vytvořených zdrojových kódů.

Navržený matematický aparát, kombinující pokročilé statistické metody s modely matematického programování, je robustní a jasně reflektuje reálné datové struktury. Kladně hodnotím také to, že model plně respektuje specifika tuzemské regionální dopravy. Student v práci nejen vybudoval teoretický rámec, ale provedl detailní očištění surových dat a prokázal aplikovatelnost výsledků pro reálné zvýšení stability jízdních řádů.

Práce je logicky strukturovaná a její formální i grafická úprava je na velmi dobré úrovni, přestože nabízí drobný prostor pro celkové vizuální uhlazení a optimalizaci velikosti obrázků. Orientaci čtenáře v navrženém řešení by rovněž prospělo o něco detailnější zpracování formálního zápisu matematického modelu a více prostoru mohlo být věnováno také hlubší interpretaci a diskuzi dosažených výsledků. Tyto menší rezervy však nijak nesnižují vynikající odbornou kvalitu předloženého díla, které jednoznačně doporučuji k obhajobě s navrženým celkovým hodnocením A.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: A

Reviewer’s report
Ing. Ivan Eryganov, Ph.D.

Diplomová práce se zabývá analýzou a modelováním chronometráže regionální autobusové dopravy na základě reálných provozních dat. Řešené téma je aktuální, prakticky významné a svým charakterem vhodně propojuje matematické metody, statistickou analýzu dat a optimalizační přístupy s konkrétní dopravní aplikací.

Za velmi silnou stránku práce považuji zejména její aplikační rovinu. Autor se nezastavil u obecného teoretického návrhu, ale pracuje s reálnými historickými daty, provádí jejich čištění, statistické vyhodnocení, kategorizaci provozních situací a následně navrhuje optimalizační model použitelný pro úpravu jízdních řádů. Z tohoto hlediska považuji práci za velmi zdařilou, prakticky orientovanou a v některých ohledech až mimořádnou. Práce má jasný potenciál pro další využití v regionální autobusové dopravě.

Kladně hodnotím také šíři použitého aparátu. Autor využívá robustní statistické postupy, regresní přístupy, faktorovou analýzu, neparametrickou analýzu rozptylu a optimalizační model. Oceňuji, že si uvědomuje specifika reálných dopravních dat, zejména přítomnost odlehlých hodnot, rozdílné chování linek v různých částech dne a praktický význam předčasných odjezdů. Práce tak působí jako ucelený návrh metodiky od prvotního zpracování dat až po vyhodnocení navrženého jízdního řádu.

Přes celkově vysokou kvalitu práce mám několik připomínek zejména k matematické formalizaci a validaci výsledků. V práci je optimalizační model označován jako kvadratické programování, přičemž nové časy příjezdů a odjezdů jsou definovány jako celočíselné proměnné. V takovém případě se již formálně nejedná o čistou spojitou úlohu kvadratického programování, ale spíše o smíšené celočíselné kvadratické programování. Případně by bylo nutné výslovně vysvětlit, zda byla ve výpočtu řešena spojitá relaxace a jak bylo následně provedeno zaokrouhlení časů. Tato připomínka je významná i proto, že práce v teoretické části sama rozlišuje kvadratické, celočíselné a smíšené celočíselné programování.

Dále by bylo vhodné zpřesnit formální zápis časových vazeb v optimalizačním modelu. Věcná myšlenka omezení je srozumitelná, ale matematický zápis by měl přesněji vymezit množiny indexů, pro něž jednotlivá omezení platí. Zejména by bylo vhodné explicitně rozlišit průjezdné zastávky, zastávky s nenulovou dobou pobytu a konečné zastávky. Tato připomínka nemíří proti základní konstrukci modelu, ale proti její formální úplnosti.

Další omezení práce souvisí s použitým datovým vzorkem. Zadání požaduje zpracování dat mimo jiné s ohledem na typ dne, denní dobu a sezónní vlivy. Analyzovaný datový soubor však pokrývá pouze krátké období v červenci, tedy letní prázdninové období. Práce proto dobře demonstruje navrženou metodiku na reálných datech, ale nemůže plně postihnout sezónnost ve smyslu školního roku, zimních podmínek, odlišné přepravní poptávky nebo mimořádných provozních stavů.

Za důležitou otázku považuji také způsob ověření navrženého jízdního řádu. Práce používá Monte Carlo simulaci a uvádí zlepšení vybraných ukazatelů spolehlivosti. Není však zcela zřejmé, zda bylo provedeno ověření na nezávislém testovacím období, případně na části dat, kterou model při kalibraci nevyužil. Pokud je model kalibrován i testován na rozděleních odvozených ze stejného krátkého období, mohou být dosažené výsledky optimističtější než při skutečné predikční validaci.

Celkově hodnotím práci jako velmi kvalitní. Připomínky se týkají především matematické preciznosti zápisu a rozsahu validace, nikoli základní použitelnosti navrženého postupu. Aplikační stránka práce je výborná až mimořádná a autor prokázal schopnost samostatně zpracovat komplexní problém s reálnými daty. Při přesvědčivém vysvětlení uvedených bodů u obhajoby by práce mohla aspirovat i na hodnocení výborně. V předložené podobě navrhuji hodnocení B – velmi dobře.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita A
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Topics for thesis defence:
  1. V práci je optimalizační model označován jako kvadratické programování, avšak časy příjezdů a odjezdů jsou definovány jako celočíselné proměnné. Jaký je tedy přesný typ řešené optimalizační úlohy? Šlo o spojité kvadratické programování, smíšené celočíselné kvadratické programování, nebo o spojitou relaxaci s následným zaokrouhlením?
  2. Bylo ověření optimalizovaného jízdního řádu provedeno na nezávislém testovacím období nebo na datech, která nebyla použita při kalibraci modelu? Pokud ne, jak by autor navrhl predikční validaci modelu?
  3. Jak byly v Monte Carlo simulaci generovány doby jízdy a stání? Šlo o nezávislé vzorkování po úsecích, nebo byly zachovány korelace mezi navazujícími úseky, typem dne, denní dobou a konkrétním spojem?

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová