Master's Thesis

Badminton Action Recognition for Video-Based Performance Analysis

Final Thesis 19.94 MB

Author of thesis: Ing. Martin Pribylina

Acad. year: 2025/2026

Supervisor: prof. Ing. Adam Herout, Ph.D.

Reviewer: Ing. Bořek Reich

Abstract:

Manually reviewing match footage to analyse badminton strokes is time-consuming and prone to missing important moments. This thesis proposes and implements a system for automatic classification of badminton strokes from ordinary video recordings, requiring no wearable sensors, shuttlecock detection, or broadcast-quality footage. The system uses YOLOv8 for player detection, RTMW3D-X for whole-body 3D joint coordinate estimation, and a custom ST-GCN architecture for action classification. Output predictions are merged into non-overlapping temporal segments using a greedy algorithm and visualised in a web-based player. On a test set from a dataset of 21 players with 5 593 annotated clips across ten action classes, the system achieves 89.5% accuracy and a weighted F1 score of 0.894. By using 3D skeletal coordinates, the system is less sensitive to camera angle than existing approaches that rely on 2D input.

Keywords:

action recognition, stroke classification, skeleton-based representation, 3D pose estimation, graph convolutional networks, ST-GCN, badminton, sports video analysis, computer vision, RTMPose, MMPose, YOLOv8

Date of defence

22.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. V práci jsem nebyl schopen dohledat odůvodnění volby vstupu o délce 31 snímků v souvislosti s délkou badmintonových pohybů. Proč tedy právě 31 snímků? Zkoušel jste i jiné délky?
  2. Jaký vliv na kvalitu výstupu má směr pohledu kamery?
  3. Je možné vaše řešení použít i pro hru čtyř hráčů?

Language of thesis

Slovak

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Application Development (NADE)

Composition of Committee

prof. Ing. Jiří Jaroš, Ph.D. (předseda)
doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda)
doc. Ing. Ondřej Lengál, Ph.D. (člen)
Ing. Jiří Novák, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)
Ing. Vladimír Bartík, Ph.D. (člen)

Supervisor’s report
prof. Ing. Adam Herout, Ph.D.

Řešitel odvedl velké množství práce a vytvořil vynikající řešení. Práce vyžadovala rozsáhlé samostudium odborné literatury. Práce byla oceněna na studentské konferenci Excel@FIT.

Evaluation criteria Verbal classification
Informace k zadání

Zadání bylo značně obtížné. Řešitel dostal hodně širokou úlohu: experimentovat s různými dostupnými modely počítačového vidění a přijít na to, jak s jejich pomocí maximálně využít záznamy z tréninku a hry badmintonu pro zpětnou vazbu hráči. Podařilo se mu vytvořit velice zajímavé a užitečné řešení a navrhnout řadu možností pokračování.

Aktivita při dokončování

Práce byla dokončována s předstihem a technická zpráva byla dostatečně konzultována.

Publikační činnost, ocenění

Práce byla prezentována na Excel@FIT a získala ocenění odborným panelem.

Práce s literaturou

Řešitel musel proniknout dosti hluboko do algoritmů počítačového vidění a strojového učení a při řešení práce se opravdu mnoho naučil samostudiem literatury.

Aktivita během řešení, konzultace, komunikace

Řešitel pracoval intenzivně po oba semestry a pravidelně docházel na domluvené konzultace a vždy měl zajímavé pokroky. Odvedené množství práce je nadstandardní.

Points proposed by supervisor: 97

Grade proposed by supervisor: A

Reviewer’s report
Ing. Bořek Reich

Diplomovou práci navrhuji hodnotit stupněm výborně (A).

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Všechny body zadání byly zcela splněny.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Technická zpráva má obvyklý rozsah.

Prezentační úroveň technické zprávy

Jednotlivé části práce navazují dobře a práce je čtivá a snadno pochopitelná. Pro úplnost práce bych ocenil krátký text shrnující základní badmintonové pohyby (jejich znalost je využita při analýze výsledků). Struktura práce je dobrá, osobně bych však preferoval rozdělení kapitoly 5 na kapitol více.

95
Formální úprava technické zprávy

Typograficky i jazykově je práce v pořádku.

100
Práce s literaturou

Práce dobře odlišuje převzaté prvky od vlastních a zahrnuje vhodnou literaturu. Výhradu mám k použití arXiv preprintů u několika zdrojů, ačkoli existuje finální recenzovaná verze, např. Pose2Mesh [7] (ECCV 2020) nebo Associative Embedding [27] (NeurIPS 2017). Dále pak chybí citace v části podkapitoly 2.2 na stranách 9 a 10.

92
Realizační výstup

Řešení je kvalitní, dobře dokumentované a navržené. Validaci řešení považuji za dobrou. Co mi poněkud chybí, je test na neviděném hráči. Absenci tohoto testu autor obhajuje nevyvážeností datové sady rozdělené podle hráčů. Bylo by však přece jen zajímavé vyhodnotit, zda i s takto malou datovou sadou není model schopen generalizovat a správně fungovat na neviděném hráči. To by dále případně podpořilo tvrzení v podkapitole 5.5, kde autor tvrdí, že použití některých technik pomáhá omezit přetrénování na konkrétních hráčích. Dále by bylo zajímavé vidět srovnání s jinou metodou, která není založená na 3D souřadnicích kostry, a tím dále demonstrovat výhody navržené metody (zejména její invarianci vůči natočení kamery). Aplikace, která demonstruje použitelnost výsledků, je pak povedená. 

93
Využitelnost výsledků

Práce je připravena k praktickému využití jako pomůcka pro hraní badmintonu a má publikační potenciál.

Náročnost zadání

Evaluation level: obtížnější zadání

Zadání je nadprůměrně náročné. Dává za úkol získání datové sady, průzkum a experimentování s vhodnými metodami, praktickou demonstraci, vyhodnocení navržené metody a zpracování dalších výstupů (plakát a video).

Topics for thesis defence:
  1. V práci jsem nebyl schopen dohledat odůvodnění volby vstupu o délce 31 snímků v souvislosti s délkou badmintonových pohybů. Proč tedy právě 31 snímků? Zkoušel jste i jiné délky?
Points proposed by reviewer: 94

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová