bakalářská práce

Webová aplikace pro klasifikaci morfologie galaxií na platformě Red Hat OpenShift založená na AI

Text práce 7.48 MB

Autor práce: Bc. Artur Sultanov

Ak. rok: 2024/2025

Vedoucí: doc. Mgr. Kamil Malinka, Ph.D.

Oponent: Ing. Milan Šalko

Abstrakt:

Tato práce představuje webovou aplikaci s podporou umělé inteligence pro klasifikaci morfologie galaxií, která využívá strojové učení a architekturu založenou na Vision Transformeru. Pro trénink modelu a zpracování snímků z datové sady Galaxy Zoo 2 je použit framework PyTorch, zatímco augmentace dat zvyšuje schopnost modelu extrahovat robustní rysy. Konečný model CosmoFormer dosahuje konkurenceschopné přesnosti v úlohách klasifikace galaktických snímků. Responzivní webová aplikace plynule integruje backendové API s frontendovým uživatelským rozhraním. Nasazení na platformě Red Hat OpenShift zajišťuje škálovatelnost a spolehlivou orchestraci systému. Tato práce demonstruje, jak lze strojové učení a cloudově nativní technologie kombinovat pro automatizaci analýzy morfologie galaxií v moderních astronomických průzkumech.

Klíčová slova:

Galaxie, Astronomie, Transformer, Umělá Inteligence, Strojové Učení, PyTorch, Python, Red Hat, OpenShift, Web, Aplikace

Termín obhajoby

20.06.2025

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaBznamka

Klasifikace

B

Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Otázky k obhajobě

  1. Můžete se vyjádřit k nepoužití front pro zpracování požadavků?
  2. Jakým způsobem plánuje společnost RedHat využít vytvořené řešení?

Jazyk práce

angličtina

Fakulta

Ústav

Studijní program

Informační technologie (BIT)

Složení komise

prof. RNDr. Alexandr Meduna, CSc. (předseda)
Ing. Martin Hrubý, Ph.D. (člen)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)

Při celkovém hodnocení nejvíce zohledňuji vysokou míru kvality zpracování výsledného řešení. Student při řešení práce postupoval systematicky a velmi dobře si poradil s technickými překážkami a zvládl integrací většího množství technologií. Práce byla po celou dobu pravidelně konzultována, kvalita textu je na výborné úrovni, výsledný návrh a implementace je velmi povedená. Pozitivně hodnotím zpracování v angličtině.

Kritérium hodnocení Slovní hodnocení
Informace k zadání

Jedná se o téma, se kterým přišel student sám. Zadání bylo řešeno ve spolupráci s partnerskou firmou Red Hat. Cílem bylo vytvořit demonstrační aplikaci pro klasifikaci morfologie galaxií, která bude postavena na RedHat technologiích. Všechny body zadání byly ve velmi dobré kvalitě.

Práce s literaturou

Student aktivně vyhledával relevantní dostupnou literaturu a vhodně ji začlenil do své práce. Nicméně počet referencí mohl být větší.

Systému Theses.cz uvádí podobnost 7,8%. Významná část však tvoří podobnosti s definicí a popisem technologií v teoretických částech práce, kde jsou zdroje odkazovány, ale některé části jsou hůře parafrázovány. Přes mé výtky si nemyslím, že by autor překročil hranice citační etiky.

Aktivita během řešení, konzultace, komunikace

Po celou dobu řešení jsme měli pravidelné schůzky, na kterých byly konzultovány dílčí kroky řešení a celkový směr práce. Student byl vždy výborně připraven. Student měl také pravidelné schůzky s konzultantem, který jej hodnotí obdobně.

Aktivita při dokončování

Student obsah práce konzultoval průběžně a její definitivní obsah mi byl zaslán k připomínkování v dostatečném předstihu. Všechny mé připomínky k práci byly zapracovány.

Publikační činnost, ocenění

žádná

Výsledný počet bodů navržený vedoucím: 85

Známka navržená vedoucím: B

Posudek oponenta
Ing. Milan Šalko

Kritérium hodnocení Slovní hodnocení Body
Náročnost zadání

Stupeň hodnocení: průměrně obtížné zadání

Úkolem práce bylo navrhnout model pro detekci morfologické klasifikace galaxií. Student měl za úkol vybrat vhodný model založený na architektuře Vision Transformer (ViT) a následně jej doladit (fine-tuning) na vybraném datovém souboru. V závěrečné fázi měl student vytvořit škálovatelnou webovou aplikaci, která bude integrovat navržený a natrénovaný model.

Prezentační úroveň technické zprávy

Práce je rozdělena do deseti kapitol a z hlediska prezentační úrovně splňuje požadavky kladené na bakalářskou práci. Členění kapitol má logickou posloupnost a přispívá k dobré čtivosti a srozumitelnosti textu.

100
Formální úprava technické zprávy

Z hlediska jazykové úpravy jsem při čtení nezaznamenal vážnější chyby. Z typografického hlediska má práce několik nedostatků, například neuvedený zdroj u obrázku na straně 13. Dále jde o nejednotné uvádění referencí u obrázků, někdy je použit přímý odkaz v popisku, jindy klasická citace. Za významnější nedostatek považuji kapitolu 5, kde chybí číslování podsekcí a část 5.2 neobsahuje žádné odkazy na použité zdroje.

60
Realizační výstup

Student práci osobně odprezentoval. Výstupem je natrénovaný model pro klasifikaci morfologií hvězd, který student publikoval na platformě Hugging Face. Další část práce tvoří webová aplikace běžící na platformě Red Hat OpenShift AI. Aplikace působí intuitivně a má jednoduché uživatelské rozhraní.

Výhradu mám k tomu, že aplikace neobsahuje žádný systém fronty, v případě přetížení požadavky jednoduše zahazuje, což nepovažuji za zcela vhodné řešení. Návrh ani implementace s tímto mechanismem nepočítají, což může snižovat využitelnost aplikace.

Zdrojový kód na GitHubu je logicky členěný a každá jeho část obsahuje soubor README s popisem obsahu.

80
Využitelnost výsledků

Navržená aplikace je nasaditelná online a může být zpřístupněna běžným uživatelům. Po doplnění systému fronty by bylo možné výrazně zvýšit její spolehlivost a dostupnost i při vyšší zátěži. Využití aplikace ve vědeckém výzkumu však v aktuální podobě příliš nevidím.

Rozsah splnění požadavků zadání

Stupeň hodnocení: zadání splněno

Splněno bez výhrad. Všechny body zadání považuji za splněné.

Rozsah technické zprávy

Stupeň hodnocení: je v obvyklém rozmezí

Práce je v obvyklém rozsahu. Všechny její části jsou relevantní k tématu.

Práce s literaturou

Práce obsahuje 29 zdrojů, které se vztahují k tématu samotné práce. Jediným problémem, který vnímám, je část 5.2, kde chybí citace použitých zdrojů.

75
Výsledný počet bodů navržený oponentem: 80

Známka navržená oponentem: B

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová