Master's Thesis

Analysis of Operator Poses Using Ergonomic Assessment Tool NERPA or RULA and Machine Vision

Final Thesis 13.79 MB Appendix 752.93 kB

Author of thesis: Bc. Michal Adam Kunda

Acad. year: 2025/2026

Supervisor: doc. Ing. Pavel Škrabánek, Ph.D.

Reviewer: Zdeněk Matějů

Abstract:

This master’s thesis deals with the analysis of operator poses using ergonomic assessment tool RULA and machine vision, aiming to automate this process. Currently, the evaluation is performed manually and is time-consuming. Due to the frequent turning of the operator at the workstation is selected 3D measurement using a Luxonis OAK-D Lite RGB-D camera, providing a more accurate determination of limb angles than 2D projection. The proposed methodology utilizes 2D body and hand landmark detection using the AlphaPose Halpe 136 model, which are subsequently transformed into a 3D coordinate system to calculate the final RULA score. Evaluation of the system demonstrated that the exact match with manual assessment reaches 9.4%, while with a tolerance of ± 1, the success rate rises to 44%. The lower accuracy of the exact match is mainly caused by visual occlusion of the operator by the structural elements of the workstation. The entire solution is implemented in the Python programming language.

Keywords:

RULA, NERPA, operator, ergonomics, computer vision, pose estimation, RGB-D, camera, software tool, Python

Date of defence

11.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student obeznámil komisi s výsledky své DP. Po přečtení posudků následovaly dotazy komise: Metodika (Uvažuje váhy?) Dotaz na software použitý v práci (vlastní implementace). Časová náročnost jednotlivých částí. Použití paralelizace (jádra procesoru). Zbytečnost použití Excelu. Vysvětlení k obrázku (DP, str. 19). Nejednotnost popisu obrázků. Komise nebyla se všemi reakcemi studenta na výše uvedené dotazy spokojena.

Language of thesis

Czech

Faculty

Department

Study programme

Applied Computer Science and Control (N-AIŘ-P)

Composition of Committee

doc. Ing. Pavel Škrabánek, Ph.D. (místopředseda)
prof. Ing. Zdeněk Hadaš, Ph.D. (člen)
Ing. Jiří Kurfürst, Ph.D. (člen)
Ing. Jiří Kovář, Ph.D. (člen)
prof. Ing. Dagmar Janáčová, CSc. (člen)
prof. Ing. Jiří Jaroš, Ph.D. (člen)
prof. Ing. Miroslav Fikar, DrSc. (předseda)
prof. Ing. Vladimír Vašek, CSc., dr. h. c., FEng. (člen)

Diplomová práce se zabývá aktuální problematikou automatizace ergonomického hodnocení pracovních poloh s využitím metod počítačového vidění a metodiky RULA. I přes problémy způsobené na straně spolupracující firmy, bylo zadání práce splněno ve všech stanovených bodech. Student vypracoval rozsáhlou rešeršní část zaměřenou na ergonomické metodiky, odhad lidské pózy a dostupná technická řešení. Na základě provedené analýzy navrhl vhodnou hardwarovou i softwarovou architekturu systému, kterou následně implementoval v jazyce Python a ověřil na reálných datech získaných v průmyslovém prostředí. Oceňuji zejména propojení teoretických poznatků s praktickou realizací, výběr vhodné RGB-D technologie a schopnost integrovat pokročilé nástroje pro detekci lidské pózy do funkčního systému.

Práce obsahuje vlastní technický přínos spočívající v návrhu postupu rekonstrukce 3D dat z RGB-D kamery, výpočtu kloubních úhlů a automatizovaném vyhodnocení metodiky RULA. Student rovněž kriticky hodnotí dosažené výsledky a identifikuje hlavní příčiny omezené přesnosti systému, zejména vliv zákrytů a složitosti reálného výrobního prostředí. Diskuse i závěr jsou věcné a ukazují dobrou orientaci autora v problematice. Formální úroveň práce je na velmi dobré úrovni, text je logicky členěn a doplněn odpovídajícím množstvím obrázků, tabulek a literárních zdrojů. Drobné stylistické a jazykové nedostatky nemají zásadní vliv na celkovou kvalitu práce.

Vzhledem k výše uvedenému doporučuji práci k obhajobě a hodnotím ji známkou B.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: B

Reviewer’s report
Zdeněk Matějů

Slovní hodnocení práce

Předložená diplomová práce se věnuje aktuálnímu tématu automatizace ergonomického hodnocení pomocí metod strojového vidění. Autor prokázal schopnost pracovat s moderními algoritmy pro odhad póz (AlphaPose) a technologiemi prostorového snímání (RGB-D kamery). Oceňuji zejména komplexnost řešení, které zahrnuje jak teoretický rozbor, tak praktickou implementaci v jazyce Python s funkčním online i offline režimem. Práce má jasnou logickou strukturu a je podpořena bohatou rešerší literatury. I přes objektivní překážky při zajišťování původně definovaného hardware, které omezily kvalitu vstupních dat a výslednou přesnost (9,4 % přesná shoda u reálných dat). I přesto že výsledný hardware nenaplňoval původní definici, autor se s těmito problémy dokázal aktivně vypořádat. I z této perspektivy dokázal výsledky kriticky zhodnotit a identifikovat příčiny nižší výstupní přesnosti než očekávané, jako byly stísněné podmínky pracoviště a s tím související překážky ve výhledu a absence aktivního stereovidění díky odchylkám v dodaném hardwaru. Práce představuje rozumný výchozí bod pro další zlepšení použitých algoritmů pro aktivní využití v oblasti ergonomické analýzy nově příchozích pracovišť.

Hodnocení dle stanovených kritérií

 

a) Splnění požadavků a cílů zadání: B

Autor naplnil všechny body zadání. Vypracoval rešerši metod, navrhl SW a HW systém, implementoval jej v Pythonu a provedl evaluaci. K mírnému snížení známky vede fakt, že kvůli organizačním potížím na straně ITW nebyl systém otestován na původně zamýšleném ideálním pracovišti, což negativně ovlivnilo výslednou validaci. To ovšem přímo odráží podmínky v reálných provozech, které jsou často ovlivněny změnami v odvolávkách ze stran zákazníků a vyžadují velkou flexibilitu v plánování výroby.

b) Postup a rozsah řešení, adekvátnost použitých metod: A

Zvolený postup od teoretické analýzy 2D/3D snímání přes matematický model rekonstrukce souřadnic až po samotnou extrakci úhlů je metodicky správný a velmi podrobný. Např. použití modelu AlphaPose Halpe 136 pro detailní detekci rukou je pro ergonomii adekvátní volbou.

c) Vlastní přínos a originalita: B

Přínosem je vytvoření uceleného softwarového nástroje, který integruje detekci landmarků s hloubkovou mapou pro výpočet RULA skóre. Originalita spočívá především v použitém hardware kamerového řešení, které by v případě dodání původně zamýšlené konfigurace doplněné o laser-dot-projekci umožnilo významně vyšší přesnost analýz.

d) Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry: B

Autor velmi otevřeně a precizně interpretuje nížší úspěšnost automatického hodnocení na firemních datech. Správně identifikuje vlivy jako rolling shutter efekt, vizuální zákryty konstrukčními prvky a vliv neprofesionální manuální anotace.

e) Využitelnost výsledků v praxi nebo teorii: B (bez korekce kvůli HW by asi bylo C)

V současném stavu je systém kvůli nízké přesnosti v reálném provozu (vlivem nevhodného umístění kamery a HW limitací) prakticky využitelný spíše jako proof-of-concept. Pro ostré nasazení v průmyslu by vyžadoval další ladění a kvalitnější HW. Korektní definice hardware však byla zmíněna v úplném počátku prací a nedodání způsobené na straně ITW by nemělo mít negativní dopad na autora samotného

f) Logické uspořádání práce a formální náležitosti: A

Práce je logicky členěna, obsahuje všechny povinné části včetně abstraktů, seznamů zkratek, obrázků a tabulek. Formální náležitosti jsou na vysoké úrovni.

g) Grafická, stylistická úprava a pravopis: A

Grafické zpracování je velmi kvalitní, s množstvím názorných diagramů, vývojových grafů a vizualizací detekovaných landmarků. Jazyková úprava je precizní, a to jak pravopisně, tak i stylisticky.

h) Práce s literaturou včetně citací: A

Autor pracuje s reprezentativním vzorkem 39 literárních zdrojů, které řádně cituje v textu. Rešerše pokrývá jak klasické ergonomické studie, tak nejnovější trendy v počítačovém vidění z let 2024–2026.
Evaluation criteria Grade
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová