Doctoral Thesis

Intelligent Tool for Content Analysis of Specific Audiovisual Production

Final Thesis 27.21 MB Summary of Thesis 27.21 MB

Author of thesis: Ing. Pavel Sikora

Acad. year: 2025/2026

Supervisor: prof. Ing. Kamil Říha, Ph.D.

Reviewers: doc. PhDr. Martin Flašar, Ph.D., doc. Ing. Rastislav Róka, Ph.D.

Abstract:

This doctoral thesis focuses on developing an intelligent tool for analysing the content of specific audiovisual production by means of modern artificial intelligence techniques. It answers the growing demand for high-quality automated analysis of artistic audiovisual pieces whose distinctive features render conventional analytic procedures inadequate and time-consuming.
The primary objective is to design a robust classification methodology for both visual and audio content and to implement an interactive web-based application that allows art historians to examine bibliographic and content data efficiently.
The study also introduces a thoroughly annotated data set with specially defined categories for training and validating advanced CNN models. The experimental section evaluates the performance of a pre-trained CNN together with VGG, Inception, Xception and NASNet architectures fine-tuned on the curated data set. For audio analysis, CNN 14, ResNet and Wavegram networks are employed. The results verify the suitability of the chosen methods for the data under investigation.
Finally, the work delivers a comprehensive, user-friendly tool that supports interactive exploration of audiovisual material and provides a dedicated interface for detailed data set construction.

Keywords:

Artificial intelligence, artworks, classification, convolutional neural networks, image, web, audio

Date of defence

13.01.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaPznamka

Process of defence

Disertant seznámil komisi s výsledky své vědecké práce. Rozvinula se široká diskuze, po které byli oponenti i členové komise spokojeni s odpověďmi.

Language of thesis

Czech

Faculty

Department

Study programme

Teleinformatics (DKC-TLI)

Composition of Committee

prof. Ing. Zdeněk Smékal, CSc. (předseda)
prof. Ing. Ivan Baroňák, Ph.D. (člen)
prof. Ing. Radim Burget, Ph.D. (člen)
doc. Mgr. Jana Horáková, Ph.D. (člen)
doc. Ing. Jiří Schimmel, Ph.D. (člen)
doc. Ing. Rastislav Róka, Ph.D. (člen)
doc. PhDr. Martin Flašar, Ph.D. (člen)

Supervisor’s report
prof. Ing. Kamil Říha, Ph.D.

Doktorand Ing. Pavel Sikora pracoval na disertační práci pod mým vedením dlouhodobě a systematicky, přičemž se postupně vyprofiloval jako samostatný výzkumník schopný řešit komplexní interdisciplinární problémy na pomezí umělé inteligence, zpracování multimediálních dat a digitálních humanitních věd. V průběhu studia se musel vyrovnat s vysokými nároky plynoucími z práce s reálnými, obtížně strukturovatelnými audiovizuálními daty a z nutnosti úzké spolupráce s odborníky z jiných vědních oblastí, což se promítlo do delší doby řešení, nikoli však do snížení kvality dosažených výsledků. Jádro disertační práce bylo publikováno (mimo jiné) v impaktovaném časopise dle WOS zařazeném do kategorie Q1, což potvrzuje odbornou úroveň i mezinárodní relevanci dosažených výsledků. Doktorand se aktivně podílel na návrhu metodiky, přípravě dat, experimentálním ověřování i realizaci funkčního softwarového nástroje a prokázal schopnost dovést jemu zadané výzkumné úkoly od koncepčního návrhu až k prakticky použitelným výsledkům. Předloženou disertační práci považuji za ucelený výsledek jeho doktorského studia, který splňuje požadavky kladené na disertační práce v daném oboru, a proto ji doporučuji k obhajobě.
viz pdf
File inserted by the reviewer Size
Posudek oponenta [.pdf] 321,33 kB

viz pdf
File inserted by the reviewer Size
Posudek oponenta [.pdf] 919,86 kB

Responsibility: Mgr. et Mgr. Hana Odstrčilová