Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Ing. Martin Pribylina
Acad. year: 2025/2026
Supervisor: prof. Ing. Adam Herout, Ph.D.
Reviewer: Ing. Bořek Reich
Manually reviewing match footage to analyse badminton strokes is time-consuming and prone to missing important moments. This thesis proposes and implements a system for automatic classification of badminton strokes from ordinary video recordings, requiring no wearable sensors, shuttlecock detection, or broadcast-quality footage. The system uses YOLOv8 for player detection, RTMW3D-X for whole-body 3D joint coordinate estimation, and a custom ST-GCN architecture for action classification. Output predictions are merged into non-overlapping temporal segments using a greedy algorithm and visualised in a web-based player. On a test set from a dataset of 21 players with 5 593 annotated clips across ten action classes, the system achieves 89.5% accuracy and a weighted F1 score of 0.894. By using 3D skeletal coordinates, the system is less sensitive to camera angle than existing approaches that rely on 2D input.
action recognition, stroke classification, skeleton-based representation, 3D pose estimation, graph convolutional networks, ST-GCN, badminton, sports video analysis, computer vision, RTMPose, MMPose, YOLOv8
Date of defence
22.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
Slovak
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Application Development (NADE)
Composition of Committee
prof. Ing. Jiří Jaroš, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda) doc. Ing. Ondřej Lengál, Ph.D. (člen) Ing. Jiří Novák, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen)
Supervisor’s reportprof. Ing. Adam Herout, Ph.D.
Řešitel odvedl velké množství práce a vytvořil vynikající řešení. Práce vyžadovala rozsáhlé samostudium odborné literatury. Práce byla oceněna na studentské konferenci Excel@FIT.
Zadání bylo značně obtížné. Řešitel dostal hodně širokou úlohu: experimentovat s různými dostupnými modely počítačového vidění a přijít na to, jak s jejich pomocí maximálně využít záznamy z tréninku a hry badmintonu pro zpětnou vazbu hráči. Podařilo se mu vytvořit velice zajímavé a užitečné řešení a navrhnout řadu možností pokračování.
Práce byla dokončována s předstihem a technická zpráva byla dostatečně konzultována.
Práce byla prezentována na Excel@FIT a získala ocenění odborným panelem.
Řešitel musel proniknout dosti hluboko do algoritmů počítačového vidění a strojového učení a při řešení práce se opravdu mnoho naučil samostudiem literatury.
Řešitel pracoval intenzivně po oba semestry a pravidelně docházel na domluvené konzultace a vždy měl zajímavé pokroky. Odvedené množství práce je nadstandardní.
Grade proposed by supervisor: A
Reviewer’s reportIng. Bořek Reich
Diplomovou práci navrhuji hodnotit stupněm výborně (A).
Evaluation level: zadání splněno
Všechny body zadání byly zcela splněny.
Evaluation level: je v obvyklém rozmezí
Technická zpráva má obvyklý rozsah.
Jednotlivé části práce navazují dobře a práce je čtivá a snadno pochopitelná. Pro úplnost práce bych ocenil krátký text shrnující základní badmintonové pohyby (jejich znalost je využita při analýze výsledků). Struktura práce je dobrá, osobně bych však preferoval rozdělení kapitoly 5 na kapitol více.
Typograficky i jazykově je práce v pořádku.
Práce dobře odlišuje převzaté prvky od vlastních a zahrnuje vhodnou literaturu. Výhradu mám k použití arXiv preprintů u několika zdrojů, ačkoli existuje finální recenzovaná verze, např. Pose2Mesh [7] (ECCV 2020) nebo Associative Embedding [27] (NeurIPS 2017). Dále pak chybí citace v části podkapitoly 2.2 na stranách 9 a 10.
Řešení je kvalitní, dobře dokumentované a navržené. Validaci řešení považuji za dobrou. Co mi poněkud chybí, je test na neviděném hráči. Absenci tohoto testu autor obhajuje nevyvážeností datové sady rozdělené podle hráčů. Bylo by však přece jen zajímavé vyhodnotit, zda i s takto malou datovou sadou není model schopen generalizovat a správně fungovat na neviděném hráči. To by dále případně podpořilo tvrzení v podkapitole 5.5, kde autor tvrdí, že použití některých technik pomáhá omezit přetrénování na konkrétních hráčích. Dále by bylo zajímavé vidět srovnání s jinou metodou, která není založená na 3D souřadnicích kostry, a tím dále demonstrovat výhody navržené metody (zejména její invarianci vůči natočení kamery). Aplikace, která demonstruje použitelnost výsledků, je pak povedená.
Práce je připravena k praktickému využití jako pomůcka pro hraní badmintonu a má publikační potenciál.
Evaluation level: obtížnější zadání
Zadání je nadprůměrně náročné. Dává za úkol získání datové sady, průzkum a experimentování s vhodnými metodami, praktickou demonstraci, vyhodnocení navržené metody a zpracování dalších výstupů (plakát a video).
Grade proposed by reviewer: A
Responsibility: Mgr. et Mgr. Hana Odstrčilová