Master's Thesis

Statistical models for extreme value analysis in a non-stationary series

Final Thesis 6.04 MB Appendix 2.49 MB

Author of thesis: Bc. Anna Lasovská

Acad. year: 2025/2026

Supervisor: Ing. Jan Holešovský, Ph.D.

Reviewer: doc. Mgr. Zuzana Hübnerová, Ph.D.

Abstract:

This master’s thesis deals with the analysis of extreme values in non-stationary time series. The introductory part summarizes the fundamental concepts of classical extreme value theory and subsequently presents the theoretical background for working with dependent and non-stationary data. Emphasis is placed on the analysis of real meteorological data using several different approaches, their modification and comparison. The statistical analysis is carried out using both the block maxima method and threshold models. Within the peaks over threshold approach, special attention is devoted to the choice of the threshold function as well as to the determination of the threshold level. Subsequently, the influence of the threshold selection on the results is examined. To deal with dependence in threshold models, both declustering and an approach using all exceedances, where the dependence is incorporated through the estimation of the extremal index, are considered. The results include estimates of model parameters and return levels, which are compared with observed values where available.

Keywords:

Extreme values, generalized extreme value distribution, generalized Pareto distribution, block maxima, peaks over threshold, non-stationary time series

Date of defence

08.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Studentka prezentoval práci, školitel přečetl svůj posudek, byl přečten posudek oponentky. Otázku oponentky týkající se použití bootstrapu na získání intervalového odhadu rozdílu návratové úrovně a empirické hodnoty studentka zodpověděla - místo klasického bootstrapu by bylo možné využít parametrický bootstrap. doc.Vašík - Je breakdate důležitý a proto se používá lineárně lomená prahová funkce nebo by bylo možné použít i exponenciální funkci? - zodpovězeno

Language of thesis

Czech

Faculty

Department

Study programme

Mathematical Engineering (N-MAI-P)

Composition of Committee

doc. Mgr. Petr Vašík, Ph.D. (předseda)
doc. RNDr. Martin Kolář, Ph.D. (místopředseda)
prof. Aleksandre Lomtatidze, DrSc. (člen)
Ing. Ivan Eryganov, Ph.D. (člen)
Ing. Petra Rozehnalová, Ph.D. (člen)

Supervisor’s report
Ing. Jan Holešovský, Ph.D.

Práce je zaměřena na statistické modely analýzy extrémních hodnot nestacionárních časových řad s aplikací v oblasti meteorologických dat. Tato problematika je v současnosti vysoce aktuální, a to nejen kvůli obecně rostoucímu zájmu o studium klimatických procesů, ale je také přenositelná do libovolné oblasti inženýrství či ekonomie, kde je vyžadováno stanovení nějakých spolehlivostních limitů.

V literatuře jsou uvažovány nejrůznější modely, které se snaží zobecnit základní postupy analýzy extrémních hodnot. Některé z nich uvažují jednorozměrné časové řady, řada z nich je popsána pro prostorová či časoprostorová data, některé využívají další doprovodné proměnné. Každý z nich ovšem v závislosti na specifických datech a kontextu předpokládá určitá zjednodušení, neboť často velmi komplexní modely narážejí na dosud nerozvinuté postupy v této oblasti. Žádný z publikovaných postupů tak není jednoznačně upřednostňován, resp. univerzálně použitelná metodika není k dispozici. Předložená diplomová práce se zaměřuje na vybraný typ modelu pro jednorozměrné časové řady. Hlavním přínosem je především posouzení citlivosti vybraného typu modelu s ohledem na předpokládané tvary časově závislých parametrů, možnosti ohodnocení jejich vhodnosti a v konečném důsledku posouzení dopadů na odhady návratových úrovní, které jsou nejčastějším výstupem analýzy extrémních hodnot.

Diplomová práce je rozdělena do čtyř hlavních částí: (i) úvod do teorie extrémních hodnot a představení dvou základních modelů pro analýzu, (ii) rozšíření této teorie pro stacionární i nestacionární řady a modifikace modelů s využitím metody maximální věrohodnosti pro odhad parametrů, (iii) diskuze a návrh řešení specifických problémů v kontextu vybraných reálných teplotních řad ze stanice Klementinum, zejména spojených s užitím prahového modelu, (iv) aplikace diskutovaných postupů pro vyhodnocení daných dat, odhady návratových úrovní a jejich vzájemné srovnání.

Cíle práce byly splněny. Studentka při pravidelných konzultacích ukázala vynikající orientaci v problematice a byla vždy velmi dobře připravena. Potřebná témata nastudovala a zpracovala samostatně, a to i výrazně nad rámec obsahu předmětů magisterského studia. Pro zpracování dat a výpočty byla vytvořena řada výpočetních kódů v softwarech R a Matlab. Použité metody a postupy byly zvoleny vhodně.

Celá práce je psána srozumitelně a formálně korektně. Určitá zjednodušení pojmů či výkladu jsou běžná i v odborné literatuře a odpovídají požadavku na rozsah práce. Oceňuji vynikající grafickou i stylistickou úpravu. Veškerá použitá literatura byla řádně uvedena.

Diplomová práce byla prověřena antiplagiátorským systémem Theses.cz. Byla nalezena jen velmi zanedbatelná shoda v přehledové části práce, a to zejména kvůli výskytu ustálených odborných termínů či definic. V hlavní části práce obsahující vlastní analýzu a výsledky nebyla shoda žádná.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: A

Diplomová práce Bc. Anny Lasovské je věnována modelování extrému v nestacionárních časových řadách s možným porušením nezávislosti jednotlivých proměnných v čase. Práce je napsána velmi čtivě; uvedené obrázky názorně vysvětlují jednotlivé pojmy v netriviální teorii extremálních rozdělení.

Přestože se diplomantka věnovala pokročilým metodám, text působil vyrovnaně, jasně a příjemně se četl. To ovšem v literatuře v této oblasti není pravidlem. Velmi si vážím toho, že uvedená analýza reálných dat používá netriviální a obezřetné kroky v souladu s nedávnými výsledky v této oblasti. Zařazení odhadu prahové hodnoty regresním kvantilem, inspirované článkem [15], považuji za velmi nápadité. To také umožnilo aplikaci odhadu extrémálního indexu na základě délky časových intervalů mezi překročeními v nestacionárních řadách. Citlivostní analýza navrhovaného modelu na rozhodnutí u modelování prahu byla dalším milým překvapením.

Celkově jsem si čtení práce velmi užila a cením si kvalitního zpracování netriviálními postupy. Jednoznačně navrhuji hodnocení A.

K práci mám pouze několik níže uvedených poznámek. Není třeba, aby na ně diplomantka reagovala, pokud sama nebude chtít. 

- str. 14, předposlední řádek - Hodilo by se okomentovat, pro která x je tato podmínka splněna při n jdoucím do nekonečna.

- str. 16, poslední řádek a str. 18, první vztah v sekci 2.1.3 – pro přehlednost by asi bylo vhodné původní parametry mu, sigma označit jiným symbolem než nové po reparametrizaci.

- str. 34, úvod sekce 3.3.3, hledání modelu s co největší věrohodností neznamená hledání modelu, který co nejvíce vysvětluje variabilitu – to mohou být obecně dvě různá kritéria.

- str. 35 dole – je odkazováno na [11] v souvislosti s asymptotickým rozdělením LRT statistiky v modelech s GEV rozdělením. Jak je uvedeno v (3.9), nosič rozdělení může záviset na parametrech rozdělení. Nejsou tedy splněny předpoklady tvrzení v [11]. Ve [12] je ale tvrzení uvedeno bez těchto omezujících předpokladů.

- str. 41 – není vysvětleno, co je metoda LOESS.

- str. 44 – T_i bych nazvala délka intervalů, ne interval.

- [6] – chybí rok publikace

- [18] – článek není dohledatelný na stránkách časopisu Revstat.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací B
Topics for thesis defence:
  1. Úspěšnost modelů jste v závěru porovnávala pomocí odchylek odhadnuté návratové úrovně od empirické hodnoty. Napadá mě, jestli by bylo možné o takovém rozdílu říct něco víc pomocí bootstrapu.

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová