studijní program

Information Technology

Fakulta: FITZkratka: DIT-ENAk. rok: 2026/2027

Typ studijního programu: doktorský

Kód studijního programu: P0613D140029

Udělovaný titul: Ph.D.

Jazyk výuky: angličtina

Akreditace: 8.12.2020 - 8.12.2030

Profil programu

Akademicky zaměřený

Forma studia

Kombinované studium

Standardní doba studia

4 roky

Garant programu

Oborová rada

Oblasti vzdělávání

Oblast Téma Podíl [%]
Informatika Bez tematického okruhu 100

Cíle studia

Cílem studijního programu je poskytnout vynikajícím absolventům magisterského studia specializované univerzitní vzdělání nejvyššího typu v informatice a výpočetní technice, zvláště pak v oblastech, ve kterých se profilují výzkumné skupiny FIT, a ve vztahu k výzkumným projektům řešeným na FIT:

  • akcelerované síťové technologie,
  • automatizovaná analýza, verifikace a syntéza,
  • efektivní techniky práce s automaty a logikami a jejich aplikace,
  • bezpečnost,
  • dolování dat z řečí,
  • evolvable hardware,
  • formální modely,
  • hardware-software codesign,
  • informační a databázové systémy,
  • inteligentní systémy,
  • management v softwarovém inženýrství,
  • modelování a optimalizace systémů,
  • nekonvenční číslicové obvody,
  • počítačová grafika,
  • počítačové sítě a vestavěné systémy,
  • robotika,
  • superpočítačové technologie,
  • systémy odolné proti poruchám, diagnostika a testování,
  • vysoce náročné výpočty,
  • znalostní technologie a
  • zpracování obrazu a videa.
Vzdělání získané v tomto studijním programu zahrnuje průpravu a atestaci k vědecké práci.

Profil absolventa

Absolventi doktorského studijního programu Information Technology jsou schopni samostatně provádět vědecko-výzkumnou činnost a tvůrčím způsobem řešit složité teoretické, návrhové, verifikační, testovací, implementační a inovační problémy v oblasti informatiky. Jsou vybaveni pokročilými znalostmi jak z teoretické informatiky, tak i z oblasti algoritmizace, tvorby software i hardware a zkušenostmi s jejich uplatněním v různých aplikacích. Hlavní důraz a cíl studia je směřován na vědeckou a tvůrčí činnost a představení výstupů této činnosti vědecké komunitě na mezinárodní úrovni, zejména ve formě publikačních výstupů. Další nedílnou součástí je získání zkušeností s prací v týmu a pravidelná prezentace dosažených výsledků, nejdříve pro kolegy na FIT a později na mezinárodních vědeckých konferencích. Absolventi doktorského studijního programu mají tedy nejen teoretické a specializované znalosti dle svého odborného zaměření, ale zároveň i zkušenosti s publikační činností a uplatněním a prezentací výsledků na mezinárodní úrovni. 

Charakteristika profesí

Absolventi FIT obecně a absolventi doktorského studia zejména nemají problém najít uplatnění jako vědečtí, pedagogičtí či řídicí pracovníci jak v ČR tak v zahraničí.

  • Absolvent doktorského studia je schopen samostatné vědecké, výzkumné a řídicí práce v oblasti informatiky, výpočetní techniky a informačních technologií. Je připraven řešit náročné koncepční, výzkumné a vývojové problémy. V praxi je schopen samostatně vést výzkum, vývoj a výrobu v oblasti moderních informačních technologií.
  • Nachází uplatnění jako tvůrčí pracovník na špičkových vědeckovýzkumných pracovištích, jako vedoucí výzkumných a vývojových týmů a též ve vědecké a pedagogické práci na vysokých školách. Absolventi tohoto programu se mohou také uplatnit při obsazování vyšších funkčních pozic v některých větších institucích a firmách, kde je vyžadována schopnost samostatně tvořivě pracovat, analyzovat složité problémy a navrhovat a realizovat nová, originální řešení.
  • Část absolventů typicky pokračuje jako tzv. "postdoc" v akademické kariéře v ČR nebo v zahraničí.

Podmínky splnění

Jsou vymezeny individuálním studijním plánem studenta, jenž specifikuje studijní předměty, které je student povinen úspěšně absolvovat, předpokládané stáže a účasti na odborných konferencích a minimální pedagogické působení v bakalářském nebo magisterském studijním programu fakulty. Úspěšné ukončení studia je podmíněno:

  • Složením státní doktorské zkoušky, při níž prokazuje student hluboké znalosti metodologických přístupů, teorií a jejích aplikací v souladu se současným stavem poznání v těch vědních disciplinách, které jsou vymezeny předměty individuálního studijního plánu studenta a tématem jeho disertační práce. Obsahem státní doktorské zkoušky je rovněž hodnocení předpokládaných cílů disertační práce, metod řešení a doposud dosažených vlastních výsledků.
  • Absolvováním části studia na zahraniční instituci v délce nejméně jednoho měsíce nebo účast na mezinárodním tvůrčím projektu s výsledky publikovanými nebo prezentovanými v zahraničí nebo jiná forma přímé účasti studenta na mezinárodní spolupráci.
  • Doložením splnění požadavků na tvůrčí činnost.
  • Obhajobou doktorské disertační práce, která je napsána v angličtině.

Student je povinen úspěšně absolvovat zkoušku z anglického jazyka a alespoň 2 předměty ze seznamu nabízených předmětů. Alespoň jeden z nich musí být z kategorie "teoretických" předmětů, kterou tvoří následující předměty: Vybraná témata z analýzy a překladu jazyků, Statistika, stochastické procesy, operační výzkum, Moderní matematické metody v informatice, Optika, Regulované gramatiky a automaty, Moderní teoretická informatika, Matematická logika, Teorie a aplikace Petriho sítí, Teorie kategorií v informatice, Vysoce náročné výpočty. 

Vytváření studijních plánů

Jsou stanovena směrnicí děkana Pravidla o organizaci studia na FIT pro sestavovaní individuálního plánu studenta.  Individuální studijní plán vychází z tématu disertační práce a podléhá schválení oborovou radou.
Předepisuje:

  • obsahové zaměření samostatné vědecké, výzkumné, vývojové činnosti a vlastní vzdělávací činnosti s ohledem na oborovou specializaci a téma disertační práce,
  • studijní předměty, které je student doktorského studia povinen absolvovat, konkrétně celkový počet předmětů a jejich časové zařazení do semestrů,
  • přehled tvůrčí činnosti, zejména stáže a pobyty na jiných pracovištích, účast na konferencích, seminářích, letních školách atp.,
  • publikační plán,
  • pedagogické působení v souladu se směrnicí fakulty Pravidla o organizaci studia na FIT  a
  • časové rozvržení studia v kontextu všech výše uvedených bodů.

Dostupnost pro zdravotně postižené

Vysoké učení technické v Brně umožňuje studium osobám se zdravotním postižením dle § 21, odst. 1 písm. e) zákona 111/1998 Sb. vysokých školách a o změně a doplnění dalších zákonů ve znění pozdějších předpisů a dle požadavků v této oblasti vyplývajících z nařízení vlády č. 274/2016 Sb., o standardech pro akreditace ve vysokém školství, poskytuje uchazečům o studium a studentům se specifickými potřebami služby v rozsahu a formou odpovídající specifikaci uvedené v Příloze č. 3 k Pravidlům pro poskytování příspěvku a dotací veřejným vysokým školám Ministerstvem školství, mládeže a tělovýchovy, specifikující financování zvýšených nákladů na studium studentů se specifickými potřebami.

Služby pro studenty se specifickými potřebami jsou na VUT v Brně realizovány prostřednictvím aktivit specializovaného pracoviště - poradenského centra Alfons, které je součástí Institutu celoživotního vzdělávání VUT v Brně - sekce Poradenství pro studenty.

Aktivity poradenského centra a pravidla zpřístupňování studia univerzita garantuje platnou Směrnicí rektora č. 11/2017 upravující postavení uchazečů o studium a studentů se specifickými potřebami na VUT v Brně. Tato vnitřní norma garantuje minimální standardy poskytovaných služeb.
Služby poradenského centra jsou nabízeny uchazečům o studium a studentům se všemi typy zdravotního znevýhodnění uvedených ve zmíněném Metodickém standardu Ministerstva školství, mládeže a tělovýchovy.

Návaznost na další typy studijních programů

Studijní program navazuje jak na dobíhající navazující magisterský program Informační technologie, tak na nový navazující magisterský program Informační technologie a umělá inteligence.
Studenti mohou dále, podle svých potřeb a mimo své formalizované studium, také absolvovat kurzy a školení týkající se metodologie vědecké práce, publikačních a citačních dovedností, etiky, pedagogiky a tzv. měkkých dovedností, které organizuje VUT či jiné instituce.

Vypsaná témata doktorského studijního programu

3. kolo (podání přihlášek od 21.09.2026 do 31.01.2027)

  1. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  2. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  3. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  4. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  5. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  6. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  7. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  8. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  9. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  10. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  11. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  12. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  13. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  14. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  15. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  16. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  17. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  18. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  19. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  20. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  21. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  22. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  23. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  24. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  25. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  26. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  27. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  28. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  29. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  30. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  31. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  32. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  33. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  34. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  35. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

  36. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

2. kolo (podání přihlášek od 01.06.2026 do 30.08.2026)

  1. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  2. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  3. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  4. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  5. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  6. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  7. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  8. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  9. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  10. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  11. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  12. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  13. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  14. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  15. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  16. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  17. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  18. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  19. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  20. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  21. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  22. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  23. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  24. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  25. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  26. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  27. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  28. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  29. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  30. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  31. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  32. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  33. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  34. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  35. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

  36. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

1. kolo (podání přihlášek od 01.03.2026 do 31.05.2026)

  1. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  2. Automatizované techniky pro hodnocení testů založených na požadavcích

    Hodnocení úplnosti testovacích sad vůči softwarovým požadavkům představuje zásadní problém při verifikaci kritických systémů, zejména v regulovaných doménách. Současná praxe je převážně založena na manuálním posuzování, které je náročné a náchylné k chybám. Disertační práce se zaměří na výzkum formálních a automatizovaných metod pro analýzu pokrytí požadavků testovacími případy, s důrazem na sémantické aspekty požadavků a jejich implicitní chování. Cílem práce je navrhnout formální rámec pro reprezentaci požadavků a testovacích případů a definovat objektivní kritéria pokrytí vycházející ze sémantiky požadavků (např. kombinace podmínek, časová omezení, sekvence akcí či stavové přechody). Na tomto základě budou zkoumány metody pro výpočet míry pokrytí testovací sady a pro identifikaci nepokrytých sémantických případů. Výzkum se zaměří zejména na následující oblasti:

    • návrh a systematické porovnání formálních modelů vhodných pro reprezentaci různých tříd požadavků a testovacích artefaktů, včetně analýzy jejich vyjadřovací síly a analyzovatelnosti;
    • formalizace pojmu pokrytí požadavků a odvození odpovídajících kritérií pokrytí (coverage obligations) z formální sémantiky požadavků;
    • návrh algoritmů pro analýzu pokrytí testovacích sad nad formálními reprezentacemi, včetně identifikace nepokrytých případů a jejich vazby na konkrétní části požadavků;
    • zkoumání metod převodu neformálních požadavků a testovacích případů do formálních modelů, včetně využití technik zpracování přirozeného jazyka a velkých jazykových modelů, s důrazem na spolehlivost a omezení těchto přístupů;
    • experimentální vyhodnocení navržených metod na realistických datech

    Součástí práce bude návrh a implementace prototypových nástrojů podporujících vybrané aspekty navrženého přístupu a jejich ověření na příkladech z oblasti vestavěných a avionických systémů. Důraz bude kladen na propojení formálních metod, testování softwaru a technik automatizace analýzy, s cílem přispět k systematickému a opakovatelnému hodnocení kvality testovacích sad.

    Školitel: Rogalewicz Adam, doc. Mgr., Ph.D.

  3. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  4. Efektivní práce s logikami a automaty (nejen) ve formální analýze a verifikaci

    Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware, ve verifikaci kvantových programů nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu).

    Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či RPTU, Kaiserslautern, Německo (prof. A.W. Lin).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  5. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  6. Human in the loop (HIL) adaptace systémů umělé inteligence

    Téma je řízeno potřebami uživatelů, pro které je soukromí dat klíčové, a zaměřuje se na vylepšení systémů umělé inteligence (zejména rozpoznávání řeči) v případě, že je uživatel schopen identifikovat a opravit chyby způsobené AI systémem. Téma zahrnuje správné vyhodnocení systémů HIL, výběr dat, která mají být navržena k opravě, a samotné techniky jemného doladění/adaptace pracující s rozsáhlými předtrénovanými modely.

    Školitel: Černocký Jan, prof. Dr. Ing.

  7. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  8. Kompetentný reasoning a spoľahlivý výkon algoritmov – ku skutočne kompetentným LLM

    Veľké jazykové modely (LLM) v súčasnosti stoja za veľkou časťou pokroku v oblasti umelej inteligencie, a to najmä vďaka schopnosti vykonávať širokú škálu úloh v zero-shot režime – teda na základe opisu úlohy v prirodzenom jazyku – a tiež vďaka veľkému množstvu poznatkov o svete, ktorými disponujú.

    Napriek tomu má súčasná generácia LLM stále viacero slabín, ktoré obmedzujú ich kompetentnosť pri riešení širokého spektra náročných úloh; napr.:

    • Obmedzená schopnosť korektne a robustne vykonávať algoritmy: Aj najpokročilejšie modely majú problémy so správnym vykonávaním algoritmov (najmä pri väčšom počte krokov).
    • Obmedzená schopnosť bootstrap-ovať komplexné reasoningové zručnosti: Hoci sú už dnes modely explicitne trénované na realizáciu deliberatívneho reasoning-u, viaceré práce ukazujú, že súčasná generácia tréningových metód (ako GRPO, GSPO a pod.) nedokáže úspešne bootstrap-ovať nové a lepšie schopnosti reasoning-u, ale skôr len posilňujú už existujúce reasoningové trajektórie, ktoré sa model naučil pri predtrénovaní.

    Ďalším príkladom je obmedzená schopnosť efektívne sa za behu učiť zo skúseností (čo je zložka toho, ako dosahujú skutočnú kompetenciu ľudia) a mnoho ďalších problémov. Hoci to v značnej miere platí pre všetky dnešné modely, tieto problémy sú typicky oveľa výraznejšie pri malých modeloch. To má, samozrejme, vážne dôsledky pre množstvo aplikácií, ktoré vyžadujú kompaktné modely, ktoré je možné prevádzkovať lokálne.

    Cieľom tohto výskumu je:

    • Diagnostikovať: Preskúmať v čom a prečo majú súčasné modely a tréningové prístupy problémy. V tejto fáze môže študent čerpať z existujúcich poznatkov (ako sú práce o over-squashingu a reprezentančnom kolapse v transformer architektúrach), formulovať vlastné hypotézy a overovať ich nástrojmi mechanistickej interpretovateľnosti, využívať analógie s prípadmi, kde podobné prístupy fungujú (napr. reinforcement learning metódy ako AlphaZero a MuZero – alebo dokonca analógie z kognitívnej vedy týkajúce sa rôznych typov ľudskej pamäte a podobne), atď.
    • Riešiť: Využiť poznatky získané vo fáze diagnostiky na zmiernenie niektorých problémov – úpravou identifikovaných slabín, ako sú obmedzenia vyplývajúce z architektúry, tréningovej metodológie, tréningových dát a spôsobu ich predspracovania atď.

    Súvisiace publikácie:

    • Gurgurov, Daniil, Michal Gregor, Josef van Genabith, Simon Ostermann. "On Multilingual Encoder Language Model Compression for Low-Resource Languages". International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025
    • Vykopal, I., Pikuliak, M., Ostermann, S., Anikina, T., Gregor, M. and Šimko, M., 2025. Large Language Models for Multilingual Previously Fact-Checked Claim Detection. EMNLP 2025 (pp. 15741–15765).

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Gregor Michal, doc. Ing., Ph.D.

  9. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  10. Meta-evaluácia viacjazyčných textov pomocou veľkých jazykových modelov

    Multilingválne schopnosti veľkých jazykových modelov (LLM) umožňujú generovať text v mnohých jazykoch, prípadne viacjazyčný text aj analyzovať. Chýbajú však štandardné metódy a metriky schopné merať kvalitu viacjazyčných textov. Analýza, hodnotenie a anotácia týchto textov ľuďmi je nákladná a časovo náročná, pričom následná replikovateľnosť je otázna (kvôli zabezpečeniu konzistencie anotátorov). V niektorých jazykoch je veľmi náročné získať ľudské anotácie, nehovoriac o vyvážení úrovne expertízy a prípadnej demografickej diverzity anotátorov naprieč jazykmi. Výskumníci už dlhšie experimentujú s použitím samotných LLM na vyhodnotenie rôznych aspektov kvality textov (napr. koherencia, gramatická korektnosť, lingvistická akceptovateľnosť) vo viacerých jazykoch, či už generovaných jazykovými modelmi alebo písaných ľudmi. Aj LLM anotácia môže byť však zaujatá kvôli vnútornej zaujatosti samotných hodnotiacich modelov zapríčinenej trénovacími dátami.

    Je potrebné neustále zvyšovať robustnosť takejto meta-evaluácie (kvôli minimalizovaniu zaujatosti a zvýšeniu objektívnosti), či už zvýšením počtu hodnotiacich LLM alebo zabezpečením diverzity pomocou modifikácie personality hodnotiaceho modelu, s ohľadom na výpočtovú efektívnosť metódy a jej praktickú využiteľnosť. Taktiež je potrebné preukázať koreláciu meta-evaluácie s ľudskými anotáciami a vyhodnotiť pre ktoré aspekty kvality textu a v ktorých jazykoch je takáto meta-evaluácia vhodnou a použiteľnou alternatívou.

    Súvisiace publikácie:

    • Macko, D., Kopal, J., Moro, R., and Srba, I., 2025. MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 727–752, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.36/
    • Zugecova, A., Macko, D., Srba, I., Moro, R., Kopal, J., Marcinčinová, K., and Mesarčík, M., 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Macko Dominik, doc. Ing., Ph.D.

  11. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  12. Multimodální analýza pro hodnocení duševního zdraví

    Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.

    Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.

    Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.

    Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.

    Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz

    Školitel: Malik Aamir Saeed, prof., Ph.D.

  13. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  14. Odporúčacie a adaptívne webové systémy

    Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).

    Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:

    • Dôveryhodné metódy odporúčania pre sekvenčné aplikácie
    • Viac-kritériové odporúčacie systémy
    • Vysvetľovanie odporúčaní
    • Férovosť a spravodlivosť v odporúčaní
    • Skreslenia v odporúčaní

    Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Kompan Michal, doc. Ing., PhD.

  15. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  16. Predikcia aktivity používateľov v prostredí sociálnych médií

    Proliferácia odporúčacích systémov na sociálnych sieťach zvýšila potrebu metód, ktoré dokážu predikovať, ako používatelia interagujú s im prezentovaným obsahom. Kým súčasné prístupy označované aj ako digitálne dvojča (angl. digital twin) simulujú správanie konkrétnych jednotlivcov, tento projekt je motivovaný potrebou predpovedať ďalšiu interakciu archetypov používateľov, teda person definovaných demografickými a záujmovými charakteristikami. S rýchlym vývojom generatívnych modelov umelej inteligencie, vrátane LLM a multimodálnych systémov, zostávajú ich schopnosti predpovedať akcie používateľov – ako je kliknutie, označenie „páči sa mi“, preskočenie alebo zotrvanie pri obsahu – stále málo preskúmané.

    Hlavným cieľom doktorandského výskumu je preskúmať a porovnať prístupy založené na AI na predikciu ďalšej interakcie používateľa v prostredí sociálnych médií, so zameraním na používateľské archetypy namiesto jednotlivcov. Na tento účel sa práca zameria na generatívne modelovacie stratégie (napr. prediktory založené na LLM), multimodálne enkodéry a hybridné architektúry schopné spracovávať a reagovať na streamovaný online obsah. Významná časť dizertačnej práce sa bude venovať anotácii obsahu v reálnom čase, identifikácii textových, obrazových a video atribútov, ktoré najlepšie predpovedajú používateľské správanie, napr. s využitím PEFT tehcník na rýchlu a efektívnu adaptáciu modelov. Projekt bude tiež analyzovať metodiky hodnotenia sekvenčných predikcií používateľských interakcií vrátane simulačných benchmarkov, ktoré odrážajú realistickú dynamiku platforiem.

    Oblasťou aplikácie bude algoritmické auditovanie, výskumná oblasť skúmajúca, ako algoritmické systémy fungujú a či spĺňajú právne, etické alebo výkonnostné požiadavky. Presnejšie modely na predikciu ďalšej interakcie môžu prispieť prístupom algoritmického auditovani, ktoré budú viac autentické, keďže umožnia simulovaným agentom správať sa organickejšie a prirodzenejšie pri interakcii s odporúčacími systémami. Takéto vylepšenia môžu posilniť validitu auditov, umožniť testovanie vo veľkom rozsahu a priniesť hlbšie porozumenie vplyvu dizajnu odporúčacích systémov na rôzne používateľské archetypy.

    Súvisiace publikácie:

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Srba Ivan, Ing., Ph.D.

  17. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  18. Rozpoznávání řeči a zpracování dat pro komunikaci ATC-pilot v letectví

    Téma je zaměřeno na rozpoznávání řeči a zpracování dat pro komunikaci mezi řídícím letového provozu a pilotem v letectví. Bude zahrnovat všechny komponenty automatického rozpoznávání řeči (ASR), tj. zpracování dat, akustický model, slovní zásobu (včetně speciální letecké terminologie), jazykový model a interakci se zdroji metadat (radarové informace, letiště). Zvláštní pozornost bude věnována použití rozsáhlých předtrénovaných modelů, přepínání jazyků (code-switching), spolehlivé identifikaci jazyka z krátkých segmentů a adaptaci na podmínky daného letiště s využitím veřejných dat.

    Školitel: Černocký Jan, prof. Dr. Ing.

  19. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  20. Spracovanie textu s obmedzenými zdrojmi za pomoci syntézy dát

    Aj napriek rozšíreniu veľkých jazykových modelov s proklamovanou univerzálnou použiteľnosťou, zostáva veľa úloh automatického spracovania textu nedostatočne vyriešených. Úlohy, ktoré je potrebné riešiť v jazykoch s malým množstvom zdrojov sú riešené s nižšou úspešnosťou. Problematickými tiež zostávajú úlohy, ktoré vyžadujú citlivosť na detaily, kontext, či čerstvé informácie. Príklady úloh na priesečníku oboch týchto dimenzií zahŕňajú spracovanie dát zo sociálnych médií za účelom detekcie naratívov, analýzy diskurzu, detekcie toxického obsahu, detekciu organizovaných vplyvových kampaní, odhaľovanie manipulácie, podpora fact-checkingu, či auditovanie odporúčačov sociálnych médií.

     

    Keďže vyššie uvedený problém možno chápať ako nedostatok dát pre špecifické úlohy, ako jedno z riešení sa ponúka využívať schopnosti veľkých jazykových modelov. Nejde tu však o samotné riešenie, ale o generovanie či augmentovanie dátových vzoriek, na ktorých je následne možné vytvoriť špecializované (menšie) modely. Výhoda takéhoto prístupu je určitý vyšší stupeň kontroly nad konečným modelom (vieme kontrolovať generované dáta), ako aj nižšia cena a stopa využívania konečného modelu (je menší). Na druhej strane, nevýhodou takéhoto prístupu je jeho nižšia priamočiarosť a metodologická nejednoznačnosť. Práve tá však v súčasnosti predstavuje príležitosť na výskum.

     

    Téma dizertačnej práce predpokladá výskum metód a metodológie vytvárania automatických prístupov na klasifikáciu (či iné automatické spracovanie) textov v heterogénnych a nestálych doménach, ktoré sú charakteristické nedostatkom zdrojov, predovšetkým označkovaných dát, no sekundárne aj obmedzenej výpočtovej sily.

     

    Súvisiace publikácie:

    • Cegin, J., Simko, J. and Brusilovsky, P., 2023. ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing https://aclanthology.org/2023.emnlp-main.117/
    • Cegin, J., Pecher, B., Simko, J., Srba, I., Bieliková, M. and Brusilovsky, P., 2024, August. Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics https://aclanthology.org/2024.acl-long.710/

     

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Jakub, doc. Ing., PhD.

  21. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  22. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  23. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  24. Úspěšnost detekce hlasových podvrhů lidmi a stroji

    Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (AVSpoof, WildSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.

    Školitel: Černocký Jan, prof. Dr. Ing.

  25. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  26. Uživatelská zkušenost v moderních uživatelských rozhraních

    Cílem doktorského studia je analyzovat vlastnosti moderních a populárních uživatelských rozhraní se zaměřením na kognitivní zátěž, techniky pro rozvoj závislosti, vnímání obsahu generovaného pomocí AI, vnímání reklamy a další současné závažné fenomény. Student bude prototypovat prvky uživatelských rozhraní a navrhovat a realizovat uživatelské testy, které umožní hlubší pochopení studovaných fenoménů, upozorní na existující rizika a povedou k návrhu prvků uživatelských rozhraní, které budou představovat uživatelsky prospěné alternativy.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  27. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  28. Využití formálních metod v návrhu a analýze kvantových programů

    Vývoj v oblasti kvantových počítačů jde nezadržitelně kupředu. Pro efektivní využití kvantového hardware je však potřeba mít správnou podporu na úrovni software, tj. kvantových algoritmů pro řešení problémů, ale i nástrojů pro kompilaci, optimalizaci a syntézu kvantových programů, jejich mapování na konkrétní kvantovou technologii, jejich mapování na protokol pro zajištění ochrany vůči chybám, analýzu, simulaci a ladění kvantových programů, atd. 

    Předmětem dizertační práce bude primárně rozvoj současného poznání v oblasti použití formálních metod pro podporu vývoje kvantových programů. Hlavní zaměření zde bude na využití teorie automatů, automatického usuzování a rozhodovacích diagramů. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači, registry apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení.

    Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Taiwan (prof. Y. Chen);  Uppsala University, Švédsko (prof. P.A. Abdulla, prof. R. S. Thinniyam); či Leiden Institute for Advanced Computer Science, Leiden, Nizozemsko (prof. A. Laarman).

    Školitel: Lengál Ondřej, doc. Ing., Ph.D.

  29. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  30. Využitie strojového učenia pri riešení problémov energetiky a životného prostredia

    Medzi aktuálne výzvy, ktorým v súčasnej dobe čelí energetika, možno zaradiť zachovanie stability v energetickej sieti, agregáciu flexibility, prevádzku energetických komunít, smart nabíjanie elektromobilov aj efektívne využitie batériových úložísk. Obnoviteľné zdroje sú silne závislé od počasia, preto centrom záujmu je aj predikcia počasia.

    ENVIRO tím v KInITe sa venuje spomínaným úlohám, pričom spoločnou črtou navrhovaných riešení sú prístupy založené na strojovom učení a umelej inteligencii. Skúmame a experimentujeme s rôznymi metódami ako zohľadnenie fyzikálnych zákonitostí v modeloch strojového učenia (physics-informed machine learning), s prístupmi ako transfer či federative learning ako aj reinforcement learning, v súčasnosti populárnym prístupom na optimalizáciu rozhodovania v dynamickom prostredí. Zaujímavý smer výskumu ponúkajú aj foundational modely a ich porovnanie s tradičnými prístupmi. Riešime úlohy, ktoré spracovávajú časové rady, ako aj obrazové dáta metódami počítačového videnia.

    Cieľom PhD práce bude navrhnúť riešenie vybraného problému energetiky alebo životného prostredia (napríklad agregácia flexibility alebo modelovanie klímy / predpoveď počasia) aplikovaním pokročilých prístupov umelej inteligencie. Výber vhodných metód strojového učenia bude závisieť od špecifík riešeného problému a voľby doktoranda.

    Relevant publications:

    Školitel: Rozinajová Věra, Doc., Ph.D.

  31. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  32. Výzkum a rozvoj vizualizační, interakční a AI techniky Malleable Glyph

    Cílem doktorského studia bude rozvíjet nově navrženou techniku Malleable Glyph z oblasti interakce člověka s počítačem, vizualizace a počítačového vidění. Řešitel bude vyvíjet algoritmy strojového učení a počítačového vidění nad glyphy. Řešitel bude dále spoluorganizovat výzvu The Malleable Glyph Challenge, navrhovat nové modality glyphů, vyhodnocovat glyphy dodané studenty a lidmi z třetích institucí a vytvářet taxonomii glyphů.

    Školitel: Herout Adam, prof. Ing., Ph.D.

  33. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  34. Zlepšovanie interakcie človeka s veľkými jazykovými modelmi

    Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh a v rôznych kontextoch interaktívnym (četovacím) spôsobom. Je pritom výzvou, aby táto interakcia bola v súlade s ľudskými očakávaniami a hodnotami a zároveň, aby neposilňovala skreslenia alebo negatívne spoločenské prejavy modelu, ako sú napríklad podlízavosť, manipulatívnosť a pod. Aby sme to dosiahli, potrebujeme jednak vedieť merať mieru pozitívnych alebo negatívnych prejavov modelu a tiež mať (ideálne) veľké dátové súbory interakcií človeka s veľkými jazykovými modelmi spolu s ľudskými preferenciami, ktoré môžu byť použité na trénovanie modelov. Na tento účel môžu byť v niektorých prípadoch použité aj syntetické dáta generované pomocou modelov trénovaných na reálnych používateľských dátach.

    Hlavným cieľom práce je zlepšiť interakciu človeka s veľkými jazykovými modelmi pomocou použitia vstupov od ľudí (napr. v podobe ich preferencií) za účelom trénovania konverzačných schopností týchto modelov a súčasnej kontroly nechceného správnia (ako sú napr. skreslenia, podlízavosť, manipulatívnosť, a pod.). Alternatívne sa téma môže zamerať na meranie negatívnych alebo pozitívnych prejavov spoločenského správania modelov v rôznych situáciách a kontextoch alebo na zlepšovanie bezpečnosti modelov pri zohľadnení kontextu a používateľských preferencií.

    Aplikačné domény sú rôzne, vrátane (ale nielen) auditovanie bezpečnosti veľkých jazykových modelov vzhľadom na rôzne skupiny používateľov (vrátane detí a mladistvých), zneužitie modelov na generovanie dezinformácií alebo detekcia signálov kredibility a ich vyhodnocovanie.

    Súvisiace publikácie:

    • Aneta Zugecova, Dominik Macko, Ivan Srba, Robert Moro, Jakub Kopál, Katarína Marcinčinová, and Matúš Mesarčík. 2025. Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 780–797, Vienna, Austria. Association for Computational Linguistics. https://aclanthology.org/2025.acl-long.38/
    • Ivan Srba, Olesya Razuvayevskaya, João A. Leite, Robert Moro, Ipek Baris Schlicht, Sara Tonelli, Francisco Moreno García, Santiago Barrio Lottmann, Denis Teyssou, Valentin Porcellini, Carolina Scarton, Kalina Bontcheva, and Maria Bielikova. 2025. A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models. ACM Trans. Intell. Syst. Technol. Just Accepted (September 2025). https://doi.org/10.1145/3770077

    Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Móro Róbert, Ing., Ph.D.

  35. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

  36. Zlepšovanie spracovania prirodzeného jazyka

    Rýchly rozvoj veľkých jazykových modelov (LLMs) a ďalších foundation modelov zásadne zmenil spracovanie prirodzeného jazyka (NLP) a umožnil vznik aplikácií, ako sú konverzační asistenti, pomocníci pri programovaní či pokročilé systémy prístupu k informáciám. Tieto technológie už dnes ovplyvňujú každodenný život a menia spôsob, akým organizácie pracujú s textom a vedomosťami.

    Napriek veľkým úspechom zostáva mnoho otvorených výskumných problémov. Mnohé modely sa správajú ako „čierne skrinky“, môžu generovať halucinujúci obsah, reprodukovať spoločenské biasy a zlyhávať pri prenose do nových domén, úloh či nízkozdrojových jazykov. Zároveň rastie dopyt po modeloch, ktoré sú dôveryhodné, efektívne, ľahko prispôsobiteľné a zároveň rešpektujú požiadavky na bezpečnosť, súlad s reguláciou a ochranu dát.

    Táto dizertačná práca sa bude zaoberať metódami porozumenia, adaptácie a riadenia veľkých jazykových modelov so špeciálnym dôrazom na dôveryhodnosť a NLP pre nízkozdrojové a doménovo špecifické prostredia. Práca môže prepájať teoretické aspekty, návrh modelov aj praktické experimenty na reálnych dátach.

    Príklady zaujímavých výskumných výziev:

    • Vlastnosti veľkých jazykových modelov – analýza a zmierňovanie halucinácií, robustnosť, typické režimy zlyhania.
    • Dôveryhodné NLP – detekcia a zmierňovanie biasov, bezpečnosť a spoľahlivosť, vysvetliteľnosť a interpretovateľnosť rozhodnutí modelu.
    • Adaptácia LLM na konkrétny kontext a úlohy – napr. parameter-efficient fine-tuning (PEFT), retrieval-augmented generation (RAG), inštrukčné doladenie, kontinuálne učenie.
    • Pokročilé techniky učenia – transferové a multilingválne učenie, aktívne učenie, low-shot a nízkozdrojové prístupy pre nedostatočne pokryté jazyky.
    • Doménovo špecifické NLP aplikácie – extrakcia informácií a textová klasifikácia v špeciálnych doménach (napr. právo, financie, technické texty, zákaznícka podpora), zlepšovanie kvality dialógu v konverzačných asistentoch, budovanie úloho-orientovaných asistentov.

    Téma ponúka vysokú mieru flexibility a dá sa prispôsobiť záujmom doktoranda – od teoretickejšie zameraného výskumu správania modelov až po aplikovaný výskum v spolupráci s akademickými či priemyselnými partnermi.

    Súvisiace publikácie:

    • Vykopal, I., Ostermann, S., Simko, M. Soft Language Prompts for Language Transfer. In Proceedings of the 2025 Conference of the NAACL: Human Language Technologies (Volume 1: Long Papers), pages 10294-10313, ACL, 2025. https://doi.org/10.18653/v1/2025.naacl-long.517
    • Pikuliak, M., Hrčková, A., Oreško, Š., Šimko, M. Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 3060-3083, ACL, 2024. https://doi.org/10.18653/v1/2024.findings-emnlp.173

    Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.

    Školitel: Šimko Marián, doc. Ing., Ph.D.

Struktura předmětů s uvedením ECTS kreditů (studijní plán)

2. ročník, zimní semestr
ZkratkaNázevJ.Kr.Pov.Prof.Uk.Hod. rozsahSk.Ot.
JADZkouška z jazyka anglického pro Ph.D.cs, en0Povinně volitelný-drzkS - 13Zkouška z angličtinyano
2. ročník, letní semestr
ZkratkaNázevJ.Kr.Pov.Prof.Uk.Hod. rozsahSk.Ot.
JADZkouška z jazyka anglického pro Ph.D.cs, en0Povinně volitelný-drzkS - 13Zkouška z angličtinyano
Libovolný ročník, zimní semestr
ZkratkaNázevJ.Kr.Pov.Prof.Uk.Hod. rozsahSk.Ot.
JA6DAngličtina pro doktorandycs, en0Povinně volitelný-drzkP - 13 / S - 26 / Cj - 13Zkouška z angličtinyano
PDDAplikace paralelních počítačůcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
FADFormální analýza programůcs, en0Povinně volitelný-drzkP - 26 / KK - 26Odborný předmětano
MSDModelování a simulacecs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
SWDOntologie a sémantický webcs, en0Povinně volitelný-drzkP - 26Odborný předmětano
DPC-TK1Optimalizační metody a teorie hromadné obsluhycs0Povinně volitelný-drzkS - 39Odborný předmětano
ORIDOptimální řízení a identifikacecs, en0Povinně volitelný-drzkP - 26 / KK - 26 / PR - 13Odborný předmětano
PGDPočítačová grafikacs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
PBDPokročilé biometrické systémycs, en0Povinně volitelný-drzkP - 26 / KK - 26 / PR - 4Odborný předmětne
PNDPokročilé techniky návrhu číslicových systémůcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
TJDTeorie programovacích jazykůcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
ZPDZpracování přirozeného jazykacs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
ASDZpracování řeči a audia člověkem a počítačemcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
MIDModerní matematické metody v informaticecs, en0Povinně volitelný-drzkP - 26 / KK - 26Teoretický předmětano
MMDModerní metody zobrazování 3D scénycs, en0Povinně volitelný-drzkP - 39 / KK - 26Teoretický předmětano
TIDModerní teoretická informatikacs, en0Povinně volitelný-drzkP - 39 / KK - 26 / PR - 13Teoretický předmětano
OPDOptikacs, en0Povinně volitelný-drzkP - 39 / KK - 26 / PR - 13Teoretický předmětano
RGDRegulované gramatiky a automatycs, en0Povinně volitelný-drzkP - 39 / KK - 26 / PR - 13Teoretický předmětano
DPC-MA1Statistika. stochastické procesy, operační výzkumcs0Povinně volitelný-drzkS - 39Teoretický předmětano
APDVybraná témata z analýzy a překladu jazykůcs, en0Povinně volitelný-drzkP - 39 / KK - 26 / PR - 13Teoretický předmětano
VDDVědecké publikování od A do Zcs, en0Volitelný-drzkKK - 26 / S - 8ano
Libovolný ročník, letní semestr
ZkratkaNázevJ.Kr.Pov.Prof.Uk.Hod. rozsahSk.Ot.
BIDBezpečnost informačních systémů a kryptografiecs, en0Povinně volitelný-drzkP - 39 / KK - 26 / PR - 4Odborný předmětano
BSDBlockchainové systémy a konsensuální protokolycs, en0Povinně volitelný-drzkP - 39 / PR - 10Odborný předmětano
EUDEvoluční a neurální hardwarecs, en0Povinně volitelný-drzkP - 26 / KK - 26Odborný předmětano
EVDEvoluční výpočetní technikycs, en0Povinně volitelný-drzkP - 26 / KK - 26Odborný předmětano
ISDInteligentní systémycs, en0Povinně volitelný-drzkP - 26 / KK - 26 / PR - 26Odborný předmětano
ATNDPokročilá témata v neurozobrazováníen0Povinně volitelný-drzkOdborný předmětano
SODSystémy odolné proti poruchámcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
MADVybrané kapitoly z matematikycs, en0Povinně volitelný-drzkP - 26 / KK - 26Odborný předmětano
VPDVybrané problémy informačních systémůcs, en0Povinně volitelný-drzkP - 39 / KK - 26Odborný předmětano
KRDKlasifikace a rozpoznávánícs, en0Povinně volitelný-drzkP - 39 / KK - 26Teoretický předmětano
MLDMatematická logikacs, en0Povinně volitelný-drzkP - 26 / KK - 26Teoretický předmětano
TADTeorie a aplikace Petriho sítícs, en0Povinně volitelný-drzkP - 39 / KK - 26 / Cp - 8Teoretický předmětano
VNDVysoce náročné výpočtycs, en0Povinně volitelný-drzkP - 39 / KK - 26 / Cp - 26Teoretický předmětano
9TKDZáklady teorie kategoriícs, en0Povinně volitelný-drzkP - 20Teoretický předmětano
Všechny skupiny volitelných předmětů
Sk. Počet předm. Předměty
Teoretický předmět 1 - 9 MID, MMD, TID, OPD, RGD, DPC-MA1, APD, KRD, MLD, TAD, VND, 9TKD
Zkouška z angličtiny 1 - 9 JAD zimní/letní sem., JA6D