Bachelor's Thesis

AI-Powered Web Application for Galaxy Morphology Classification on Red Hat OpenShift

Final Thesis 7.48 MB

Author of thesis: Bc. Artur Sultanov

Acad. year: 2024/2025

Supervisor: doc. Mgr. Kamil Malinka, Ph.D.

Reviewer: Ing. Milan Šalko

Abstract:

This thesis presents an AI-powered web application for galaxy morphology classification, which utilizes machine learning and a vision transformer-based architecture. PyTorch is used for training the model and processing images from the Galaxy Zoo 2 dataset, while data augmentation enhances the model's ability to extract robust features. The final CosmoFormer model achieves competitive accuracy in galaxy image classification tasks. The responsive web application seamlessly integrates the backend API and the frontend user interface. Deployment on Red Hat OpenShift provides scalability and reliable orchestration for the system. This work demonstrates how machine learning and cloud-native technologies can be combined to automate galaxy morphology analysis for modern astronomical surveys.

Keywords:

Galaxy, Astronomy, Transformer, AI, Machine Learning, PyTorch, Python, Red Hat, OpenShift, Web, Application

Date of defence

20.06.2025

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Topics for thesis defence

  1. Můžete se vyjádřit k nepoužití front pro zpracování požadavků?
  2. Jakým způsobem plánuje společnost RedHat využít vytvořené řešení?

Language of thesis

English

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

prof. RNDr. Alexandr Meduna, CSc. (předseda)
Ing. Martin Hrubý, Ph.D. (člen)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)

Supervisor’s report
doc. Mgr. Kamil Malinka, Ph.D.

Při celkovém hodnocení nejvíce zohledňuji vysokou míru kvality zpracování výsledného řešení. Student při řešení práce postupoval systematicky a velmi dobře si poradil s technickými překážkami a zvládl integrací většího množství technologií. Práce byla po celou dobu pravidelně konzultována, kvalita textu je na výborné úrovni, výsledný návrh a implementace je velmi povedená. Pozitivně hodnotím zpracování v angličtině.

Evaluation criteria Verbal classification
Informace k zadání

Jedná se o téma, se kterým přišel student sám. Zadání bylo řešeno ve spolupráci s partnerskou firmou Red Hat. Cílem bylo vytvořit demonstrační aplikaci pro klasifikaci morfologie galaxií, která bude postavena na RedHat technologiích. Všechny body zadání byly ve velmi dobré kvalitě.

Práce s literaturou

Student aktivně vyhledával relevantní dostupnou literaturu a vhodně ji začlenil do své práce. Nicméně počet referencí mohl být větší.

Systému Theses.cz uvádí podobnost 7,8%. Významná část však tvoří podobnosti s definicí a popisem technologií v teoretických částech práce, kde jsou zdroje odkazovány, ale některé části jsou hůře parafrázovány. Přes mé výtky si nemyslím, že by autor překročil hranice citační etiky.

Aktivita během řešení, konzultace, komunikace

Po celou dobu řešení jsme měli pravidelné schůzky, na kterých byly konzultovány dílčí kroky řešení a celkový směr práce. Student byl vždy výborně připraven. Student měl také pravidelné schůzky s konzultantem, který jej hodnotí obdobně.

Aktivita při dokončování

Student obsah práce konzultoval průběžně a její definitivní obsah mi byl zaslán k připomínkování v dostatečném předstihu. Všechny mé připomínky k práci byly zapracovány.

Publikační činnost, ocenění

žádná

Points proposed by supervisor: 85

Grade proposed by supervisor: B

Reviewer’s report
Ing. Milan Šalko

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Úkolem práce bylo navrhnout model pro detekci morfologické klasifikace galaxií. Student měl za úkol vybrat vhodný model založený na architektuře Vision Transformer (ViT) a následně jej doladit (fine-tuning) na vybraném datovém souboru. V závěrečné fázi měl student vytvořit škálovatelnou webovou aplikaci, která bude integrovat navržený a natrénovaný model.

Prezentační úroveň technické zprávy

Práce je rozdělena do deseti kapitol a z hlediska prezentační úrovně splňuje požadavky kladené na bakalářskou práci. Členění kapitol má logickou posloupnost a přispívá k dobré čtivosti a srozumitelnosti textu.

100
Formální úprava technické zprávy

Z hlediska jazykové úpravy jsem při čtení nezaznamenal vážnější chyby. Z typografického hlediska má práce několik nedostatků, například neuvedený zdroj u obrázku na straně 13. Dále jde o nejednotné uvádění referencí u obrázků, někdy je použit přímý odkaz v popisku, jindy klasická citace. Za významnější nedostatek považuji kapitolu 5, kde chybí číslování podsekcí a část 5.2 neobsahuje žádné odkazy na použité zdroje.

60
Realizační výstup

Student práci osobně odprezentoval. Výstupem je natrénovaný model pro klasifikaci morfologií hvězd, který student publikoval na platformě Hugging Face. Další část práce tvoří webová aplikace běžící na platformě Red Hat OpenShift AI. Aplikace působí intuitivně a má jednoduché uživatelské rozhraní.

Výhradu mám k tomu, že aplikace neobsahuje žádný systém fronty, v případě přetížení požadavky jednoduše zahazuje, což nepovažuji za zcela vhodné řešení. Návrh ani implementace s tímto mechanismem nepočítají, což může snižovat využitelnost aplikace.

Zdrojový kód na GitHubu je logicky členěný a každá jeho část obsahuje soubor README s popisem obsahu.

80
Využitelnost výsledků

Navržená aplikace je nasaditelná online a může být zpřístupněna běžným uživatelům. Po doplnění systému fronty by bylo možné výrazně zvýšit její spolehlivost a dostupnost i při vyšší zátěži. Využití aplikace ve vědeckém výzkumu však v aktuální podobě příliš nevidím.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Splněno bez výhrad. Všechny body zadání považuji za splněné.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce je v obvyklém rozsahu. Všechny její části jsou relevantní k tématu.

Práce s literaturou

Práce obsahuje 29 zdrojů, které se vztahují k tématu samotné práce. Jediným problémem, který vnímám, je část 5.2, kde chybí citace použitých zdrojů.

75
Points proposed by reviewer: 80

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová