Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
studijní program
Fakulta: FITZkratka: DIT-ENAk. rok: 2025/2026
Typ studijního programu: doktorský
Kód studijního programu: P0613D140029
Udělovaný titul: Ph.D.
Jazyk výuky: angličtina
Akreditace: 8.12.2020 - 8.12.2030
Profil programu
Akademicky zaměřený
Forma studia
Kombinované studium
Standardní doba studia
4 roky
Garant programu
prof. Ing. Lukáš Sekanina, Ph.D.
Oborová rada
Předseda :prof. Ing. Lukáš Sekanina, Ph.D.Člen interní :doc. Ing. Jan Kořenek, Ph.D.prof. Dr. Ing. Jan Černockýprof. Ing. Adam Herout, Ph.D.prof. Ing. Tomáš Hruška, CSc.doc. Dr. Ing. Petr Hanáčekprof. Dr. Ing. Pavel Zemčík, dr. h. c.prof. RNDr. Alexandr Meduna, CSc.prof. Dr. Ing. Zbyněk Raidaprof. RNDr. Josef Šlapal, CSc.prof. Ing. Pavel Václavek, Ph.D.prof. Ing. Tomáš Vojnar, Ph.D.Člen externí :prof.,RNDr. Jiří Barnat, Ph.D.
Oblasti vzdělávání
Cíle studia
Cílem studijního programu je poskytnout vynikajícím absolventům magisterského studia specializované univerzitní vzdělání nejvyššího typu v informatice a výpočetní technice, zvláště pak v oblastech, ve kterých se profilují výzkumné skupiny FIT, a ve vztahu k výzkumným projektům řešeným na FIT:
Profil absolventa
Absolventi doktorského studijního programu Information Technology jsou schopni samostatně provádět vědecko-výzkumnou činnost a tvůrčím způsobem řešit složité teoretické, návrhové, verifikační, testovací, implementační a inovační problémy v oblasti informatiky. Jsou vybaveni pokročilými znalostmi jak z teoretické informatiky, tak i z oblasti algoritmizace, tvorby software i hardware a zkušenostmi s jejich uplatněním v různých aplikacích. Hlavní důraz a cíl studia je směřován na vědeckou a tvůrčí činnost a představení výstupů této činnosti vědecké komunitě na mezinárodní úrovni, zejména ve formě publikačních výstupů. Další nedílnou součástí je získání zkušeností s prací v týmu a pravidelná prezentace dosažených výsledků, nejdříve pro kolegy na FIT a později na mezinárodních vědeckých konferencích. Absolventi doktorského studijního programu mají tedy nejen teoretické a specializované znalosti dle svého odborného zaměření, ale zároveň i zkušenosti s publikační činností a uplatněním a prezentací výsledků na mezinárodní úrovni.
Charakteristika profesí
Absolventi FIT obecně a absolventi doktorského studia zejména nemají problém najít uplatnění jako vědečtí, pedagogičtí či řídicí pracovníci jak v ČR tak v zahraničí.
Podmínky splnění
Jsou vymezeny individuálním studijním plánem studenta, jenž specifikuje studijní předměty, které je student povinen úspěšně absolvovat, předpokládané stáže a účasti na odborných konferencích a minimální pedagogické působení v bakalářském nebo magisterském studijním programu fakulty. Úspěšné ukončení studia je podmíněno:
Vytváření studijních plánů
Jsou stanovena směrnicí děkana Pravidla o organizaci studia na FIT pro sestavovaní individuálního plánu studenta. Individuální studijní plán vychází z tématu disertační práce a podléhá schválení oborovou radou.Předepisuje:
https://www.fit.vut.cz/fit/info/smernice/sm2018-13.pdf
Dostupnost pro zdravotně postižené
Vysoké učení technické v Brně umožňuje studium osobám se zdravotním postižením dle § 21, odst. 1 písm. e) zákona 111/1998 Sb. vysokých školách a o změně a doplnění dalších zákonů ve znění pozdějších předpisů a dle požadavků v této oblasti vyplývajících z nařízení vlády č. 274/2016 Sb., o standardech pro akreditace ve vysokém školství, poskytuje uchazečům o studium a studentům se specifickými potřebami služby v rozsahu a formou odpovídající specifikaci uvedené v Příloze č. 3 k Pravidlům pro poskytování příspěvku a dotací veřejným vysokým školám Ministerstvem školství, mládeže a tělovýchovy, specifikující financování zvýšených nákladů na studium studentů se specifickými potřebami.Služby pro studenty se specifickými potřebami jsou na VUT v Brně realizovány prostřednictvím aktivit specializovaného pracoviště - poradenského centra Alfons, které je součástí Institutu celoživotního vzdělávání VUT v Brně - sekce Poradenství pro studenty.Aktivity poradenského centra a pravidla zpřístupňování studia univerzita garantuje platnou Směrnicí rektora č. 11/2017 upravující postavení uchazečů o studium a studentů se specifickými potřebami na VUT v Brně. Tato vnitřní norma garantuje minimální standardy poskytovaných služeb.Služby poradenského centra jsou nabízeny uchazečům o studium a studentům se všemi typy zdravotního znevýhodnění uvedených ve zmíněném Metodickém standardu Ministerstva školství, mládeže a tělovýchovy.
Návaznost na další typy studijních programů
Studijní program navazuje jak na dobíhající navazující magisterský program Informační technologie, tak na nový navazující magisterský program Informační technologie a umělá inteligence.Studenti mohou dále, podle svých potřeb a mimo své formalizované studium, také absolvovat kurzy a školení týkající se metodologie vědecké práce, publikačních a citačních dovedností, etiky, pedagogiky a tzv. měkkých dovedností, které organizuje VUT či jiné instituce.
Vypsaná témata doktorského studijního programu
Cílem této disertační práce je vyvinout systém detekce anomálií přizpůsobený pro síťovou komunikaci s využitím pokročilých technik strojového učení. Projekt se zaměří na profilování jednotlivých stanic nebo skupin podobných stanic v rámci sítě pomocí předtrénovaných modelů a jejich adaptaci pomocí technik Active Learning a Few-Shot Learning.
Cíle
Novost této disertační práce spočívá v komplexním přístupu k detekci anomálií kombinací několika aktuálních technik strojového učení, konkrétně, využití modelů normálního i škodlivého chování k vytvoření diferencovaného porozumění síťovému provozu, využití aktivního učení (Active Learning, Few Shot Learning) k neustálému zdokonalování detekčních modelů na základě nových dat bez nutnosti jejich anotace a možnost sdílení adaptovaných modelů pomocí federativního učení mezi různými cílovými infrastrukturami.
Školitel: Ryšavý Ondřej, doc. Ing., Ph.D.
Veľké jazykové modely (LLM) predstavujú silný nástroj uplatniteľný v škále rôznych aplikácií a v súčasnosti sú z viacerých dôvodov aj hlavnou hnacou silou pokroku v oblasti umelej inteligencie (AI) – napr. vďaka tomu, že pomáhajú do systémov AI inkorporovať širokú škálu všeobecných poznatkov o svete, dokážu sa riadiť inštrukciami v prirodzenom jazyku, vďaka schopnosti učiť sa v rámci kontextu vedia realizovať veľa úloh vo few-shot režime, na základe malého počtu príkladov a sú schopné integrovať aj ďalšie modality (napr. obraz a audio).
Napriek bezprecedentným výsledkom trpia LLM aj obmedzeniami, ktoré v súčasnosti v mnohých doménach bránia ich širšiemu a bezpečnému používaniu. Ide napr. o tendenciu generovať odpovede, ktoré nemajú oporu v tréningovom korpuse ani vo vstupnom kontexte (halucinácie), obmedzenú schopnosť realizovať viackrokové uvažovanie a plánovanie, ale aj ťažkosti spojené s integráciou iných dátových modalít, napr. obmedzenú schopnosť rozpoznávať jemné vizuálne koncepty. LLM majú tiež pri získavaní nových poznatkov a zručností omnoho nižšiu vzorkovú účinnosť než ľudia, čo často predstavuje výzvu – najmä pri jazykoch s nízkym množstvom zdrojov.
Cieľom výskumu je preskúmať takéto obmedzenia a – po zameraní sa na jedno alebo dve z nich – navrhnúť stratégie na ich zmiernenie. Také stratégie môžu zahŕňať napr.:
Aplikačnou doménou môže byť napr. podpora overovania faktov a boja proti dezinformáciám, kde sú mnohé z obmedzení kritické – existuje však aj rad ďalších možností.
Súvisiace publikácie:
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Gregor Michal, doc. Ing., Ph.D.
Cílem této disertační práce je tvorba řešiče Maxewllových rovnic pro aplikace v medicínských zobrazovacích technikách (MR). Numerické řešení Maxwellových rovnic bude založeno na technice k-Wave (korigovaná pseudospektrální metoda). Vzhledem k rozsahu řešený domén a akceptovatelnému času výpočtu je jedinou možností využití rozsáhlých superpočítačových systémů.Výzkum bude zahájen tvorbou prototypu řešiče v jazyce MATLAB. Po ověření funkčnosti algoritmu dojde k jeho převodu na heterogenní masivně paralelní systémy. Zde očekáváme především multi-GPU systémy Karolina v IT4Innovations a LUMI ve Finsku.Základní výzkumnou otázku je zde dosažení maximální rychlosti při zachování akceptovatelné přesnosti.
Školitel: Jaroš Jiří, prof. Ing., Ph.D.
Tématicky se tato disertační práce orientuje na bezpečnost různých systémů, které mají zajistit anonymitu nebo pseudonymitu uživatelů internetu (například sítí typu TOR). Práce by měla obsahovat:
Očekává se účast na relevantních mezinárodních konferencích a publikování v odborných či vědeckých časopisech.
Školitel: Hanáček Petr, doc. Dr. Ing.
Pseudonymita a absence centrální kontrolní entity u majority kryptoměnových sítí přitahuje pozornost útočníků, kteří chtějí zneužít blockchainové technologie k páchání trestné činnosti. Z tohoto důvodu forenzní analýza krytoměnových sítí nabývá na důležitosti a dostupnost otevřeného výzkumu je klíčovou složkou k zajištění dlouhodobého a udržitelného potírání kybernetické kriminality využívající tato pseudonymní platidla. Stávající výzkum se věnuje převážně deanonymizaci transakcí za pomoci shlukovacích metod, jako např. nejvyužívanější common-spent shluková heuristika [1], která s příchodem coinjoin transakcí se stává obsoletní. Aktuální trend ukazuje, že tradiční metody již nedostačují, nebo nebudou v blízké době dostačovat a do popředí se dostávají metody využívající strojové učení jako např. behaviorální analýza za použití jak tradičních metod strojového učení [2], tak i hlubokých neuronových sítí, převážně grafových [3].
Úkolem této práce je analýza a následný návrh, doplněný o experimentální ověření, nových metod pro analýzu kryptoměnových sítí s využitím strojového učení. Práce si bude klást za cíl experimentovat s metodami, které mají potenciál praktického využití pro boj s kyberkriminalitou využívající tyto technologie.
Předpokládané fáze řešení:
Reference
Tematicky se tato disertační práce orientuje na bezpečnost bezdrátových lokálních sítí. V rámci řešení by mělo dojít k seznámení se s vybranými bezdrátovými sítěmi a jejich zabezpečením. Kroky práce by měly obsahovat: prostudování teorie bezdrátových sítí, jejich vlastností a možností provedení útoků, odzkoušení základních typů útoků, navržení nového způsobu ochrany, experimenty, zhodnocení výsledků a návrh směru dalšího výzkumu.
Na vedení práce se bude podílet školitel-specialista dr. Kamil Malinka.
Disertační práce je zaměřená na prozkoumání a rozvoj inovativních metod umožňujících automatizaci zpracování a analýzy logovacích dat.Hlavním cílem této práce je zkoumat metody poskytující hlubší vhled do informací, které jsou obsaženy v logovacích datech reportovaných z aplikací, operačních systémů a infrastrukturních zařízení. Pro naplnění tohoto cíle bude práce zkoumat pokročilé techniky pro automatickérozpoznávání sémantiky dynamických parametrů logů, významů logů z pohledujejich kategorizace a korelace logů s dalšími datovými zdroji. Výstupy zkoumání podpoří navazující výzkum usilující o rozšíření schopností detekovat podezřelé aktivity v log datech pomocípostupů založených na statistickém modelování či strojovém učení. Uvedená problematika je velmi aktuální a nabízí vhodný prostor pro jak akademickývýzkum, tak praktické aplikace v oblasti kybernetické bezpečnosti včetně spolupráce na výzkumných projektech. Výsledky disertační práce lze aplikovat při podpoře a automatizaci činnostíčlenů Security Operation Centre, Network Operation Centre, CSIRT či CERT týmůči administrátora sítě.Při řešení práce se předpokládá úzká spolupráce s výzkumným týmem Liberouter(www.liberouter.org) a získávání zpětné vazby od SOC týmu CESNET a dalších partnerů. V případě zodpovědného přístupu k řešení zadaného tématu může být student zapojen do řešení projektů bezpečnostního výzkumu MV ČR nebo TAČR či EU projektu z výzvy Digital Europe. Školitelem specialistou k tématu disertační práce je dr. Martin Žádník.
Doporučená literatura
Školitel: Kořenek Jan, doc. Ing., Ph.D.
Cílem této práce je prozkoumat prostředí autentizačních metod, zkoumat jejich bezpečnost, použitelnost a vhodnost jak pro tradiční web2, tak pro nově vznikající ekosystém web3, zejména kryptopeněženky.
Metody Web2: Práce kriticky analyzuje bezpečnostní slabiny a omezení použitelnosti tradičních metod, jako jsou hesla, jednorázová hesla (OTP) a přihlašování pomocí sociálních sítí. Zabývá se pokroky, které nabízejí přístupové klíče, standardy FIDO (Fast Identity Online) a protokoly jako OAuth a OpenID Connect, a hodnotí jejich silné stránky při zlepšování uživatelského komfortu a snižování bezpečnostních rizik.
Metody Web3: Výzkum zkoumá jedinečné výzvy a příležitosti, které představuje decentralizovaná povaha webu3. Zkoumá inovativní mechanismy ověřování, jako např:
Práce by měla provést srovnávací analýzu autentizačních metod web2 a web3 a zdůraznit jejich silné a slabé stránky z hlediska bezpečnosti, použitelnosti, soukromí a decentralizace. Trendovým tématem, které se zaměřuje na použitelnost webových3 peněženek, jsou zejména vestavěné peněženky pro kryptoměny. Práce by měla navrhnout nové přístupy nebo vylepšit ty stávající.
Školitel: Homoliak Ivan, doc. Ing., Ph.D.
Cílem této práce je teoreticky a prakticky analyzovat vybrané kategorie konsensuálních protokolů z hlediska propustnosti a bezpečnosti. Práce by měla obsahovat vyhodnocení konsensuálních protokolů pomocí simulací umožňujících testovat odezvu protokolů za různých síťových podmínek a sílu poctivého/adverzního konsensu. Měly by být zkoumány nové scénáře útoků -- např. za předpokladu porušení předpokladů protokolu nebo pobídek. Práce by také měla využívat principy teorie her a statistické analýzy. Příklady útoků, které je třeba zkoumat, jsou sobecké útoky na těžbu, útoky specifické pro pool, útoky na dvojí utrácení, útoky na střepy, útoky na poškození posteriorů, odepření služby vedoucímu výboru, útoky na dlouhé vzdálenosti, útoky na nic v sázce, útoky na rozmělnění atd. Toto téma je široké a může být dále rozděleno na více doktorandů.
Cílem této práce je nejprve prozkoumat současný stav decentralizovaných financí s důrazem na systémovou bezpečnost a ochranu soukromí systému. Příklady uvažovaných aplikací by zahrnovaly strážní věže a různé swapy likvidity, decentralizované sady a burzy, úvěrové platformy, balancéry atd. V práci budou navrženy nové přístupy k decentralizovaným financím a empiricky vyhodnoceny výsledky. Důraz bude kladen na analýzu bezpečnosti a soukromí navrhovaných přístupů.
Výzkumný problém: Mezi všemi typy demence je Alzheimerova choroba (AD) nejběžnější formou, přičemž 70 % lidí postižených demencí má AD. Vzhledem k tomu, že prevalence AD se zvyšuje s věkem, očekává se, že počet lidí žijících s AD v příštích desetiletích poroste v důsledku lepší kvality života, která má za následek zvýšení věku v mnoha zemích. To vše vedlo ke zvýšenému zaměření na zajištění pre-start detekce AD a odpovídající intervenci, což může vést ke zpomalení progrese onemocnění poskytnutím adekvátní diagnostiky.
Problémy se současnými řešeními: K preklinické AD dochází 10 až 15 let před vypuknutím nemoci, což má za následek změny v mozku, aniž by se projevily nějaké skutečné příznaky nemoci, jako je ztráta paměti atd. Pre-onset znamená detekci AD v preklinickém stádiu nebo před ním. Stávající nejmodernější metody se zaměřují především na detekci pozdějších stádií AD a detekce preklinické AD je stále otevřeným výzkumným problémem. Tento výzkum se proto zaměřuje na detekci AD před propuknutím (tj. včasnou detekci preklinické AD), protože to bude mít obrovský dopad na životy lidí. To může vést k včasnému zásahu a může vést k dalšímu zpomalení progrese onemocnění.
Výzvy: Ve fázi preklinické AD nejsou související příznaky a symptomy jasné, a proto lidé v této fázi nevyhledávají žádnou pomoc. Proto by metoda pro detekci AD před nástupem měla být součástí pravidelného procesu zdravotního screeningu, a proto by měla být dostupná v malých klinických zařízeních.
Téma práce: Způsob detekce preklinické AD bude zahrnovat zkoumání základních mozkových mechanismů pro sledování a sledování změn souvisejících s pre-propuknutím detekce AD. Zobrazování magnetickou rezonancí (MRI) bude použito jako reference pro zkoumání dynamiky mozku, ale v praxi jej nelze použít kvůli jeho vysoké ceně a specializovanému prostředí, které omezuje jeho použití ve fázi screeningu. V tomto výzkumu bude použit elektroencefalogram (EEG), který je široce dostupný, má nízkou cenu, má dobré časové rozlišení a má vysokou mobilitu. Proto si tento projekt klade za cíl prozkoumat změny v základních mozkových mechanismech pomocí EEG k vývoji neuromarkeru založeného na EEG pro detekci AD před propuknutím. Neuromarker bude zahrnovat extrakci funkcí a odpovídající vývoj modelu strojového učení.
Pár slov o školiteli: Dr. Malik nedávno nastoupil na FIT VUT v Brně. Má desetiletou zkušenost s prací v oblasti zpracování neuro-signálů a neuro-obrazu. V současné době je v procesu zakládání výzkumné skupiny v této oblasti na FIT. Jedná se o multidisciplinární projekt, který bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT. Jedná se o vývoj nové metody analýzy EEG signálů. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Školitel: Malik Aamir Saeed, prof., Ph.D.
V posledních letech došlo ke zvýšení využití neuronových sítí pro generování syntetického obsahu, které jde ruku v ruce s nárůstem nových výzev v oblasti kybernetické bezpečnosti. Generativní modely mohou mít různé vlivy na kybernetickou bezpečnost, od pozitivních až po negativní.Významnou oblastí je bezpečnost nasazení a provozu generativních modelů, primárně pak velkých jazykových modelů.Cílem této práce je ve vybrané doméně nasazení a provozu LLM identifikovat problémové oblasti (např. útoky na inferenci modelů, krádeže modelů, či krádeže informací) a analyzovat nové trendy, přístupy, obrany a jejich vlastnosti, dopady a potenciální aplikace. Práce by poté měla na základě analýzy a výzkumu stavu bezpečnosti pro vybrané oblasti navrhnout nové metody ochrany.
Doporučené oblasti zaměření práce:Útoky a obrany v oblasti postranních kanálů velkých jazykových modelůÚtoky a obrany v oblasti inference velkých jazykových modelůObrany v oblasti adverzních (z angl. "adversarial") útoků na velké jazykové modely
Školitel: Malinka Kamil, Mgr., Ph.D.
Budeme vyvíjet techniky pro práci s konečnými automaty s aplikacemi v automatickém usuzování, ve verifikaci a rozhodování logik.Obecně, přestože jsou automaty základním a konceptem informatiky s obrovským množstvím aplikací, velmi dobře pochopeným v základní teoretické rovině, techniky jejich použití v praxi a související rozšíření konečných automatů jsou stále velmi bohatým a živým polem výzkumu.Oblast má silnou praktickou motivaci v oblastech jako verifikace a testování, vyhledávání regulárních vzorů, umělá inteligence a automatické usuzování, rozhodování logik a SMT-solving, návrh a analýza systémů, automatická syntéza systémů.Například, nejefektivnější algoritmy pro vyhledávání regulárních vzorů jsou založeny na automatech, ale stále není jasné, jak tyto algoritmy zobecnit na zpětné reference, čítače opakování, nebo takzvané look-arounds. Rozhodování logik o řetězcích, string-solving, má aplikace ve verifikaci programů s řetězci, zejména v analýze bezpečnosti webových aplikací (náchylnost na útoky typu SQL-injection, cross-site-scripting), analýze uživatelských politik přítupu ke cloudovým zdrojům, verifikaci kritického avionického software. Otevřeným problémem je efektivní implementace automatových rozhodovacích procedur pro celočíselnou aritmetiku a další logiky. Regulární model-checking je automatová metoda použitelná pro verifikaci široké škály systémů s nekonečným stavovým prostorem, jako jsou programy s dynamickými datovými strukturami nebo komunikační protokoly. Automatovými technikami je možno automaticky syntetizovat programy, například komunikační rozhraní a drivery.V těchto a dalších oblastech existuje řada hlubokých teoretických otázek o rozhodnutelnosti a složitosti problémů.Například, jak modelovat zpětné-reference pomocí konečných automatů? Co vše je rozhodnutelné o programech manipulujících řetězce, jako jsou webové aplikace, nebo o programech s dynamickými datovými strukturami? Za jakou cenu?Praktické otázky se týkají efektivní implementace existujících automatových algoritmů a teoretických poznatků.Jak zabránit stavové explozi při komplexních manipulacích automatů? Jak je kompaktně reprezentovat, pomocí technik minimalizace, syntaktických rozšíření, abstrakce, aproximace?Jak efektivně pracovat s kompaktními reprezentacemi automatů, jako jsou alternující automaty, symbolické automaty, automaty s čítači a registry? Jaké jsou teoretické vlastnosti těchto rozšíření? Jak vyvíjené techniky efektivně implementovat, aby opravdu fungovaly na konkrétních praktických problémech?Tímto a souvisejícím výzkumem se kromě L. Holíka zabývá část skupiny VeriFIT, prof. Vojnar, dr. Lengál, doc. Rogalewicz, doc. Češka. Skupina dosahuje špičkové mezinárodní úrovně, se stovkami publikací na nejprestižňějších fórech, desítkami softwarových nástrojů, řadou meznárodních ocenění, a intenzivní mezinárodní spoluprací s prestižními výzkumnými institucemi (Microsofr research, Redmond; Academia Sinica, Taipei, Uppsala Univerisy, Univerity of Braunschweig, University of Edinburgh, Univeristy of Kaserslautern, University of Paris, Univerité Grenoble Alpes, Chinese Academy of Sciences).Spolupracujeme s průmyslem (Red Hat, Honeywell). Naši absolventi doktorského studia tak mají příležitosti získat zajímavé a specializované pozice v průmyslu nebo smysluplně pokračovat v akademické sféře. Skupina je úspěšná v získávání grantů, doktorští studenti tak mohou být nadstandardně finančně ohodnoceni.
Školitel: Holík Lukáš, doc. Mgr., Ph.D.
Téma je zaměřeno na algoritmy embedded zpracování obrazu, videa a/nebo signálu. Hlavním cílem je zkoumat možnosti "chytrých" a "malých" zařízení, která by měla nové vlastnosti, a bylo možné je efektivně nasadit do aplikací vyžadujících malé, skryté, distribuované, nízkopříkonové, mechanicky nebo klimaticky namáhané jednotky schopné zpracovávat signálové vstupy. Nasazení takových jednotek je perspektivní a široké a předpokládá se i propojení do klient/server a/nebo cloud systémů. Samotné jednotky mohou být založeny na efektivním CPU/GPU/DSP, na programovatelném hardware, případně na kombinaci těchto technologií. Může se jednat i o smart kamery. Aplikace, které jsou v oblasti zájmu tohoto tématu:
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných projektech TAČR, H2020, ECSEL (potenciálně možnost stipendia či pracovního poměru).
Školitel: Zemčík Pavel, prof. Dr. Ing., dr. h. c.
Tématem disertační práce jsou pokročilé metody zpracování a editace obrazu a generativní metody umělé inteligence pro syntézu obrazu. Cílem práce je výzkum nových metod s využitím strojového učení, zejména hlubokých neuronových sítí.
Školitel: Čadík Martin, doc. Ing., Ph.D.
Prohlášení o problému: Duševní stres, úzkost a deprese jsou stavy duševního zdraví, které se často vyskytují společně. V takovém případě je člověk ve stresu a není schopen obavy ovládat, a to odpovídajícím způsobem ovlivňuje jeho sociální a pracovní aktivity. Proto je nutné řádné posouzení a diagnostika duševního stresu, úzkosti a deprese, aby se člověk mohl efektivně podílet na svých běžných denních úkolech a činnostech.
Problémy se současnými řešeními: Bohužel konvenční hodnotící a diagnostická opatření jsou subjektivní povahy a používají se pouze tehdy, jsou-li symptomy již zjevné v důsledku pokročilého stádia duševního stresu, úzkosti a deprese. Psychický stres, úzkost a deprese však nevznikají přes noc, spíše jde o dlouhodobý proces. Detekce příznaků je tedy vyžadována v raných fázích duševního stresu, úzkosti a deprese, protože to může vést k vyléčení nebo alespoň oddálit nástup vážných duševních problémů s nimi spojených.
Výzvy: Na rozdíl od jiných nemocí, kde příznaky jako horečka a kašel umožňují lidem vyhledat pomoc, příznaky v raných fázích duševního stresu a úzkosti nejsou snadno identifikovatelné. Proto je třeba, aby byl mozek neustále sledován, zda se u něj neobjevují žádné známky změny nebo zhoršení, aby se příznaky odhalily v raném stádiu.
Řešení: Řešení spočívá ve vývoji objektivní a kvantitativní metody, která dokáže odhalit duševní stres, úzkost a depresi v raném stadiu. Vnímání duševního stresu, úzkosti a deprese má původ v mozku; proto tento výzkum zkoumá neurofyziologické rysy extrahované ze signálu mozkového elektroencefalogramu (EEG) k měření duševního stresu, úzkosti a deprese v raném stádiu. To bude vyžadovat vývoj metody pro extrakci prvků a také přístup k rozpoznávání vzorů, aby bylo možné poskytnout řešení. Pro tento projekt je již k dispozici datový soubor EEG.
Pár slov o supervizi: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Cílem této práce je nejprve prozkoumat současný stav interoperability různých decentralizovaných blockchainů. Za druhé bude práce hloubkově analyzovat výhody a nevýhody uvažovaných řešení s důrazem na bezpečnost systému. Za třetí práce navrhne nové přístupy k interoperabilitě. Navržené přístupy budou empiricky vyhodnoceny a bude analyzována jejich bezpečnost a ochrana soukromí.
Konverzační agenti se pomalu stávají běžnou součástí rozhraní pro (prvotní) komunikaci se zákazníkem a odpovídání na jeho otázky. Výzkum v oblasti počítačového zpracování přirozeného jazyka se zaměřuje na vytvoření automatické klasifikace prvotní komunikace a, zejména, otázky uživatele, do předem daných tříd, k nimž existují konkrétní texty. Není však uspokojivě vyřešeno rozšiřování "znalostí" komunikačních agentů při aktualizaci strukturovaných dat, případně při přidání dalších textových materiálů.Cílem disertační práce je rozvinout existující přístupy využívající obrovské kolekce neanotovaných textových dat a způsoby kombinování strukturované a nestrukturované znalosti a optimalizace procesů při rozšiřování funkcionality stávajících i nových konverzačních agentů. Součástí práce bude i aplikace zkoumaných metod v rámci evropských projektů, na jejichž řešení se školitel podílí.
Školitel: Smrž Pavel, doc. RNDr., Ph.D.
Tématicky se tato disertační práce orientuje na bezpečnost IoT systémů. Práce by měla obsahovat:
S nástupom veľkých jazykových modelov (LLM) vyvstávajú výskumné otázky ako merať kvalitu a vlastnosti ich výstupov. Tieto merania sú dôležité pre porovnávanie a vylepšovanie modelov či ladenie ich vstupov (prompts). Niektoré techniky vyhodnocovania sa vzťahujú k špecifickým doménam a scenárom použitia (napr. ako presne model odpovedá na faktické otázky v konkrétnej doméne? ako dobre sa dajú generované príklady použiť na trénovanie malého modelu na konkrétnu úlohu?). Iné techniky sú všeobecnejšie (napr. aká je rozmanitosť parafráz generovaných LLM? ako jednoduché je detegovať, že je obsah generovaný?).
Prostredníctvom replikačných štúdií, porovnávacích experimentov, návrhov metrík, konštrukcie vstupov a iných prístupov, doktorand/ka posunie poznanie v metódach a experimentálnych metodológiách vyhodnocovania výstupov veľkých jazykových modelov. Za pozornosť pritom stoja dva všeobecné scenáre:
Doktorand/ka si vyberie jeden z uvedených scenárov (no nebude ním obmedzený/á) a ďalej ho rozpracuje a primerane zúži na špecifické výskumné otázky, ktoré experimentálne overí.
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Šimko Jakub, doc. Ing., PhD.
V poslední době se stává čím dál patrnější, že k překlenutí propasti mezi současnými nejlepšími modely strojového učení a lidským učením nestačí jen zvyšovat počty parametrů a čekat na výkonnější hardware, který zvládne zpracování bilionů parametrů. Zdá se, že je třeba hledat nové modely, schopné objevovat a uvažovat na úrovni vysokoúrovňových pojmů a vztahů mezi nimi.Cílem disertační práce je výzkum nových modelů strojového učení, které překonají potřebu enormního množství příkladů, které jsou potřeba pro naučení chování, zvládnutelného lidmi velmi rychle (například počítač potřebuje sehrát velké množství her ke zvládnutí jednoduché videohry, zatímco člověk to zvládne velmi rychle, lidé ze sady proměnných rychle určí, jaká je příčinná souvislost mezi nimi, dokáží argumentovat sledem úvah atd.), a omezí problém sebejistého chybování (overconfident incorrectness) současných modelů. Budou zkoumány postupy učení, přidávající iterativně nové relevantní informace a také metody, podporující přímé pravděpodobnostní odvozování. Výsledky budou demonstrovány na vybraných problémech, zahrnujících mj. vysvětlování videa či tvorbu inferenčních grafů, operujících nad pojmy a vztahy mezi nimi.
Tématem jsou algoritmy počítačové grafiky a syntézy obrazu. Hlavním cílem je zkoumat nové a moderní algoritmy počítačové grafiky, související datové struktury, související otázky získávání a zpracování 3D modelů a další aspekty algoritmů tak, aby bylo lépe rozumět jejich vlastnostem a možnostem, zlepšovat a připravovat nové. Je možno pracovat na různých platformách, včetně paralelních CPU jáder x86/64, ARM, Xeon PHI, GPU apod. v OpenCL, CUDA, v FPGA ve VHDL, případně i jinak. Možné algoritmy zahrnují:
Po dohodě je možné zpracovávat i individuálně vybrané algoritmy, které ve výše uvedeném seznamu nejsou, ale patří do dané tématiky.
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných projektech TAČR, H2020, ECSEL (možnost stipendia či pracovního poměru).
Cílem práce je seznámit se s aktuálními problémy počítačového vidění a používaného strojového učení (hluboké konvoluční neuronové sítě) a identifikovat zajímavé problémy k rozvinutí a dalšímu výzkumu. Řešitel má získat nadhled v problematice a experimentovat s populárními algoritmy a identifikovat jejich vhodné okrajové případy, na kterých bude možné dosáhnout zajímavých výsledků a pokroků.Konkrétně se řešitel má zaměřit na následující:
Školitel: Herout Adam, prof. Ing., Ph.D.
Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.
Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.
Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.
Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.
Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Tématem jsou algoritmy grafiky, zpracování obrazu a videa, tedy "Visual Computing", například HDR (High Dynamic Range) obrazu, multispektrálního obrazu, stereoobrazu, případně obrazu doplněného o vlastnosti materiálu, teplotě, apod. Cílem je lépe porozumět jejich vlastnostem a možnostem, ale i aplikacim, algoritmy do hloubky analyzovat, zlepšovat a připravovat nové. Možné algoritmy zahrnují:
Je možnost spolupráce i na grantových projektech, zejména TAČR, MPO, H2020, ECSEL (potenciálně možnost stipendia či pracovního poměru).
Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).
Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:
Nové metódy strojového učenia pre adaptívne a odporúčacie systémy
Dôveryhodné metódy odporúčania pre viac-kritériové aplikácie
Vysvetľovanie odporúčaní
Férovosť a spravodlivosť v odporúčaní
Skreslenia v odporúčaní
Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.
Školitel: Kompan Michal, doc. Ing., PhD.
Cílem disertační práce je výzkum v oblasti tzv. generativní umělé inteligence - ať už se jedná o difusní a adversiální modely pro generování videa, generativní textové modely pro vytváření příběhů, automatické generování počítačového kódu, hudby, reprezentaci znalostí fyziky a chemie a podporu vědecké kreativity, případně kombinace všech těchto přístupů. Práce se zaměří na řešení problémů interakce člověka s generovanými mezivýsledky, přirozeného označování jednotlivých částí a konceptů tak, aby bylo možné na průběžné výsledky navazovat, a na vývoj metod úpravy datových sad a postupů učení, aby bylo možné řešit společenské problémy, spojené s vytvářenými kreativními modely - otázky spravedlivosti modelů, předpojatosti a začlenění konceptů tzv. zodpovědné umělé inteligence.
Tématem jsou algoritmy zpracování obrazu, videa a/nebo signálu. Hlavním cílem je zkoumat a do hloubky analyzovat příslušné algoritmy a hledat nové tak, aby měly nové potřebné vlastnosti, a bylo možné je efektivně implementovat. Taková efektivní implementace může , ale nemusí být součástí práce, ale důležité je algoritmy připravit tak, aby šly efektivně zpracovávat například v CPU, v CPU s akcelerací SSE instrukcemi, v embedded systémech, i v kombinaci s FPGA, v Intel Xeon PHI, v systémech s extrémně nízkým příkonem, případně v jiném prostředí. Je možné i využití algoritmů umělé inteligence, včetně neuronových sítí, zejména CNN. Důležité jsou též aplikační možnosti algoritmů s tím, že samotná aplikace může, ale nemusí být součástí řešení. Možné algoritmy/aplikace zahrnují:
Po dohodě je možné zpracovávat i individuálně vybrané téma, které ve výše uvedeném seznamu není, ale patří do dané tématiky.
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných TAČR, MPO, H2020, SCSEL (potenciálně možnost stipendia či pracovního poměru).
Digitalizace veřejných institucí (např. logických samospráv nebo úřadů) přinesla zásadní změny v prezentaci informací, které jsou nyní stále častěji poskytovány v elektronické podobě (příkladem je portál data.brno.cz). Tento trend reflektuje snahu institucí zvýšit efektivitu, transparentnost a dostupnost informací pro občany. Elektronická prezentace umožňuje veřejným institucím poskytovat informace online prostřednictvím webových stránek, mobilních aplikací nebo elektronických bulletinů. Díky tomu mají občané okamžitý přístup k důležitým dokumentům, zprávám a oznámením. Zároveň umožňuje interaktivní prezentace dat a informací, což podporuje angažovanost veřejnosti a umožňuje občanům účinněji se zapojovat do veřejného života. Digitalizace tak představuje klíčový prvek modernizace veřejné správy a posiluje otevřenost a dostupnost informací ve prospěch občanů a dalších zúčastněných stran.
Jedním z hlavních problémů prezentace takových dat je nejednotnost formátů a struktury dat na různých webových stránkách různých samospráv. Každá samospráva může používat odlišné platformy a informace mohou být prezentovány různými způsoby, což značně komplikuje automatizovaný proces extrakce. Dalším aspektem je proměnlivost obsahu na webových stránkách samospráv, která může být překážkou pro konzistentní a spolehlivou extrakci dat. Často se stává, že informace, které jsou pro veřejnost relevantní, jsou umístěny na různých částech webových stránek, a tyto lokální změny mohou vyžadovat pružné a dynamické nástroje pro extrakci.
Za účelem výše zmíněných problémů vznikají iniciativy standardizace otevřených dat ve veřejné správě. Příkladem je Portál otevřených dat ČR (data.gov.cz, opendata.gov.cz), repositář Otevřená data ČR @ MVČR (github.com/opendata-mvcr) nebo portál otevřených dat města Brna (data.brno.cz).
Cílem této disertační práce je aplikovat přístupy strojového učení na klasifikaci a vyhodnocování otevřených dat v ČR a ve světě. Zejména se bude jednat o:
Školitel: Burget Radek, doc. Ing., Ph.D.
Internet věcí (IoT) je klíčovou technologií současné digitální éry, která propojuje fyzické a virtuální světy. Chytrá zařízení, jako jsou senzory, domácí spotřebiče, průmyslové stroje nebo autonomní vozidla, umožňují sběr, analýzu a sdílení dat v reálném čase. Díky této propojenosti dochází ke zvýšení efektivity procesů, zlepšení kvality služeb a snížení provozních nákladů. Pro správnou funkci těchto zařízení je nezbytné nejen jejich propojení, ale také efektivní vyhodnocování získaných dat a řízení jejich činností. To zahrnuje schopnost optimalizovat provoz jednotlivých prvků systému, reagovat na změny prostředí a zajišťovat jejich vzájemnou koordinaci. Bez těchto schopností by IoT systémy ztratily svou funkčnost a přidanou hodnotu.
Automatické řízení chytrých zařízení je nezbytné pro realizaci pokročilých IoT systémů. Především v průmyslu nebo inteligentních domácnostech je kladen důraz na minimalizaci lidského zásahu a maximální autonomii systémů. S tímto trendem úzce souvisí koncept "digital twin" (digitální dvojče), který umožňuje simulaci chování chytrých zařízení a systémů ještě před jejich implementací. Digital twin slouží jako digitální replika fyzického zařízení, která umožňuje testování různých scénářů, optimalizaci výkonu a detekci potenciálních chyb bez nutnosti fyzické intervence. Tato technologie se stává klíčovým nástrojem při vývoji programů pro chytrá zařízení, protože snižuje riziko chyb, urychluje nasazení a přispívá k vyšší spolehlivosti celého systému.
Přestože technologie digital twin a simulace chytrých zařízení nabízejí obrovský potenciál, stále existuje řada výzev, které je třeba překonat. Výzkum v této oblasti je klíčový pro zajištění dalšího pokroku a umožnění efektivního využití IoT systémů. Mezi možné směry výzkumu patří:
Řešení těchto výzev může výrazně přispět k dalšímu rozvoji IoT systémů a poskytnout nové možnosti pro jejich uplatnění.
Téma se zabývá pokročilými metodami syntézy obrazu. Cílem práce je výzkum nových metod pro fotorealistické (fyzikálně založené) i nefotorealistické (NPR) simulace světelné interakce ve scéně. Předpokládá se intenzivní spolupráce a stáže na špičkových institucích a firmách v oboru (Adobe, USA, MPII Saarbrücken, Německo, Disney Curych, Švýcarsko, INRIA Bordeaux, Francie).
Téma se zabývá pokročilými metodami výpočetní fotografie. Cílem práce je výzkum nových metod pro výpočetní fotografii. Mezi oblasti výzkumu patří zpracování HDR obrazu a videa, převod barevného obrazu na černobílý, spektrální obraz, pokročilé generování obrazu pomocí metod umělé inteligence a mnoho dalších.
Modely vytvárané strojovým učením môžu byť len tak dobré, aké dobré sú dáta, ktoré použijeme na ich trénovanie. Aj preto sa výskumníci a inžinieri snažia získavať čo najlepšie trénovacie dáta. Nie je pritom zriedkavé vynakladať značné ľudské úsilie (pri čistení či anotovaní) s cieľom dosiahnuť potrebnú všeobecnú kvalitu. Niekedy je však ťažké, prípadne nemožné dostatočne pripraviť vzorku dát.
V takýchto prípadoch môžu pomôcť riešenia založené na princípe “človek v procese” (angl. human in the loop), ktorý využíva ľudské úsilie na vylepšovanie strojovo naučených modelov prostredníctvom ľudských zásahov priamo počas trénovania a/alebo počas nasadenia modelov (napr. spätná väzba pri automatickom preklade). Tieto riešenia sú špeciálne užitočné pri cielených zlepšeniach trénovacích dát prostredníctvom identifikácie a riešenia sporných prípadov.
Prístupy s človekom procese zahŕňajú pestrú paletu techník z oblastí ako aktívne a interaktívne učenie, ľudské počítanie či čerpanie z davu (spolu s motivačnými schémami ako gamifikácia a hry s účelom). S nástupom veľkých jazykových modelov sa tiež otvárajú možnosti využiť tieto techniky pri generovaní veľkých syntetických trénovacích sád s relatívne malým ľudským úsilím.
Aplikačné domény sú predovšetkým tie s veľkou mierou heterogenity a nestálosti. Takéto domény zahŕňajú napríklad aj detekciu falošných informácií, šírenie informácií online (vrátane šírenia naratívov a mémov), auditovanie algoritmov sociálnych médií a ich tendencií šíriť dezinformácie, podpora manuálneho/automatického overovania informácií (fact-checking) a ďalšie.
Po desaťročia bolo správanie systémov vo fyzickom svete modelované numerickými modelmi založenými na rozsiahlych vedeckých poznatkoch o základných prírodných zákonoch. Rastúce schopnosti algoritmov strojového učenia však začínajú tieto zaužívané postupy meniť. Pri použití dostatočne veľkých datasetov sú tieto algoritmy schopné objaviť opakujúce sa vzory v dátach.
Modely strojového učenia majú však zvyčajne slabú interpretovateľnosť a potrebujú veľké datasety na trénovanie, čo môže byť v mnohých oblastiach problém. Tieto nevýhody sa snaží odstrániť “strojové učenie zohľadňujúce doménovo špecifické vedecké poznatky” (Scientific Machine Learning - SciML) – rozvíjajúca sa disciplína v rámci komunity dátových vedcov. Ide o snahu zahrnúť vedecké poznatky z danej oblasti do procesu učenia. Cieľom SciML je vyvinúť nové metódy pre škálovateľné, robustné, interpretovateľné a spoľahlivé učenie.
Neurónové siete zohľadňujúce fyzikálne poznatky sú súčasťou SciML učenia, kde do modelu zahŕňame fyzikálne obmedzenia prostredníctvom vhodných účelových funkcií alebo úprav architektúry modelu. Prostredníctvom tohto prístupu môžeme vytvárať modely neurónových sietí, ktoré sú fyzikálne konzistentné, efektívne a dôveryhodné.
Cieľom výskumu je preskúmať, ako začleniť vedecké poznatky do modelov strojového učenia vytváraním hybridných modelov založených na SciML princípoch, ktoré obsahujú komponenty založené na dátach aj na znalostiach z domény. Výskum je možné orientovať aj na kombináciu SciML a transfer learning (ktoré opätovne využíva vopred natrénovaný model na riešenie nového podobného problému) - cieľom takejto kombinácie je využiť výhody oboch prístupov.
SciML je možné aplikovať v mnohých doménach – zameriavame sa najmä na energetiku (napr. podporu širšieho zavedenia obnoviteľných zdrojov) alebo geovedy (s dôrazom na pozitívny vplyv na životné prostredie, zlepšujúci odolnosť voči zmene klímy), ale výsledky výskumu je možné aplikovať v ľubovoľnej inej oblasti.
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave pod vedením výskumníkov zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Rozinajová Věra, Doc., Ph.D.
Tato disertační práce se zaměří na vývoj pokročilých systémů pro automatické rozpoznávání řeči v prostředí s více mluvčími, využívajících velké předtrénované modely a latentní reprezentace. Klíčovou výzvou v těchto systémech je efektivní zpracování překrývající se řeči, což se tradičně řeší pomocí postupů zahrnujících diarizaci mluvčích, separaci zdrojů a rozpoznávání řeči jednotlivých mluvčích. Tato disertační práce bude zkoumat, jak mohou nedávné pokroky v oblasti neurálních audio kodeků a samořízeného učení přispět k integrovanějšímu a efektivnějšímu přístupu. Výzkum bude zahrnovat porozumění stávajícím metodologiím, navrhování nových architektur a hodnocení jejich výkonu na standardních datových sadách, s celkovým cílem zlepšit robustnost a škálovatelnost systémů rozpoznávání řeči pro více mluvčích v reálných scénářích.
Školitel: Burget Lukáš, doc. Ing., Ph.D.
Jedním z cílů této práce je navrhnout škálovatelný decentralizovaný systém elektronických voleb založený na chytrých smlouvách, s maximálním soukromím voličů, odolností proti chybám a nátlaku. Prvním úkolem je optimalizovat náklady na provoz nákladného ověřování důkazů ZK znalosti u chytrých kontraktů. Druhou výzvou je škálovatelnost s ohledem na počet účastníků a voleb hlasů, která závisí na vhodném typu blockchainu a jeho konsensuálním mechanismu, jako jsou semi-permissionless blockchainy (PoS) a permissioned blockchainy (PoA). Dalším tématem tohoto směru jsou částečné tally-hiding protokoly a jejich aplikace v kontextu veřejných blockchainů. Posledním tématem je oprávněnost účastníků a její veřejná ověřitelnost/záruka.
Práce začne seznámením se základy problematiky detekce hlasových podvrhů (voice deepfake detection, DFD), terminologií, dostupnými technikami, daty a evaluacemi (zejména AVSpoof), s historií a SotA v oblasti technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se SotA v oblasti technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Téma se pak zaměří na vyhodnocení výkonu člověka a stroje v DFD, přičemž se soustředí na aspekt motivace lidských subjektů k simulaci skutečných útoků na lidi. Doktorand pak bude postupovat jak v (1) technickém směru (pokrok v technologii generování a detekce deepfake), tak (2) lidském aspektu. Práce počítá se spoluprací s odborníky z oblasti psychologie a sociologie.
Školitel: Černocký Jan, prof. Dr. Ing.
Cílem disertační práce je výzkum modelů vestavěné inteligence, která explicitně pracuje s energetickou náročností konkrétních operací a optimalizuje svoji činnost na základě konkrétních omezení na straně jednotlivých zařízení, případně celého systému. Součástí bude i realizace vybraných modelů na vhodném typu hardware, který bude možné využít v mezinárodních projektech, na jejichž řešení se vedoucí podílí.
Projekt se zabývá geo-lokalizací obrazu a videa v neznámém prostředí pomocí metod počítačového vidění a počítačové grafiky. Hlavním cílem je výzkum a návrh nových metod registrace obrazu s geo-lokalizovanou obrazovou databází nebo s 3D modelem terénu. Cílem je též implementace navržených metod na mobilních zařízeních a hledání jejich dalších aplikací např. v oblastech zpracování obrazu, výpočetní fotografie a rozšířené reality.
Téma se zabývá metrikami pro odhad vizuální kvality obrazu a videa. Cílem práce je výzkum nových metod, které by odstranily některé nedostatky existujících metrik zejména s ohledem na vlastnosti vizuálního vnímání člověka. V úvahu přicházejí např. problémy z oblasti vjemu HDR obrazu a využití přídavných informací (metadata, 3D, atd.) o testovaných scénách pomocí metod strojového učení (např. neuronových sítí).
Zkoumejte výpočetní muzikologií a formálními modely používané v této vědecké oblasti, včetně vhodných gramatik a automatů. Studujte jejich vlastnosti, např sílu či složitost popisu. Zkoumejte jak formalizovat vybrané hudební pojmy prostřednictvím těchto modelů. Navrhněte metody tvorby počítačové hudby na bázi těchto modelů. Aplikujte navržené metody v hudbě, např. pro klasifikaci či tvorbu vybraných hudebních pasáží. Implementujte tyto aplikace . Vyhodnoťte takto vzniklé implementace pomocí vhodné metody, indikátorů a ukazatelů. Porovnejte je s obdobnými existujícími implementacemi. Veškeré poznatky publikujte na špičkové mezinárodní úrovní, např. v prestižních mezinárodních časopisech.
Školitel: Meduna Alexandr, prof. RNDr., CSc.
Použití některých metod strojového učení, například v poslední době populárních hlubokých neuronových sítí, přináší problémy architektury tzv. černé skříňky, která sice může v některých případech správně rozhodovat, ale není možné snadno interpretovat způsob rozhodování, ověřovat, v jakém kontextu jsou závěry ještě věrohodné a nakolik mohou vést drobné změny vstupu ke zcela jiným závěrům.Cílem disertační práce je rozvinout existující přístupy k měření "dokazatelně správných" modelů umělých neuronových sítí a propojit je s technikami generování konfliktních (adversarial) příkladů, aby bylo možné kontrolovat a revidovat existující řešení, využívaná v praxi. Součástí práce bude i aplikace zkoumaných metod v rámci evropských projektů, na jejichž řešení se školitel podílí.
Táto práce je určena pro zkoumání možných aplikací ZK konstruktů v kontextu systémové bezpěčnosti a taky veřejných blockchainů. ZK konstrukty slouží k veřejnému ověření správnosti určitého výpočtu nebo operace, aniž by byly odhaleny jakékoli soukromé údaje související s výpočtem/operací. Tímto způsobem je možné implementovat například veřejné hlasovací nebo aukční protokoly, které zachovávají soukromí dat veřejně vytvářených distribuovanými účastníky. Nejběžnější konstrukce ZK jsou často instanciovány schématy, která poskytují homomorfní šifrování, jako je ElGammalovo šifrování. Proveditelnost těchto konstrukcí v doméně veřejného blockchainu však může být různá z důvodu možných vysokých nákladů, případně bezpečnostních aspektů. Úkolem této práce je analyzovat a kvantifikovat tyto existující možnosti a navrhnout nové nejsmysluplnější aplikace v systémové bezpečnosti.
Výzkumný problém: Závislost na alkoholu je chronická a komplexní mozková porucha způsobující zničující individuální i sociální problémy. Kromě toho alkohol způsobuje 3,3 milionu úmrtí ročně na celém světě, což je téměř 6 % všech úmrtí. Mnoho z těchto úmrtí je spojeno se závislostí na alkoholu. Proto je důležité prozkoumat metody pro diagnostiku a léčbu závislosti na alkoholu.
Problémy se současnými řešeními: Obvykle se screening a hodnocení problémů souvisejících s alkoholem zakládá hlavně na zprávách z autotestů. Přesnost zpráv o autotestech však byla zpochybněna, zejména u silných pijáků, protože zprávy z autotestů mohou zkreslovat diagnózu kvůli ztrátě paměti pacienta (pacienti nemohou měřit spotřebu alkoholu) a/nebo nečestnému chování. Proto tento výzkum navrhuje vyvinout objektivní a kvantitativní metodu pro detekci závislosti na alkoholu.
Výzvy: Vzhledem k tomu, že závislost na alkoholu vede ke změnám v dynamice mozku, je životně důležité prozkoumat a vyvinout metodu založenou na mozkové aktivitě. Hlavní výzva při vývoji takové objektivní a kvantitativní metody však spočívá v její implementaci pro screening v menších klinických zařízeních. To omezuje vyšetřování na elektroencefalogram (EEG), který je levný, vysoce mobilní a má dobré časové rozlišení. Jiné modality, jako je MRI, PET atd., není možné použít v menších klinických zařízeních.
Téma práce: Se současnými inovacemi v mozkových EEG signálech lze zkoumat mozkové dráhy zapojené do závislosti. V posledních několika desetiletích byl výzkum EEG používán k pochopení komplexních základních procesů spojených s patofyziologií závislosti. Interpretace takových procesů pomocí mozkových sítí pomocí EEG může pomoci nejen při diagnostice závislosti, ale také pomoci při léčbě závislosti. Tento výzkum si klade za cíl vyvinout neuromarkery založené na interpretaci mozkové sítě pomocí EEG. Neuromarker bude zahrnovat extrakci funkcí a odpovídající vývoj modelu strojového učení.
Pár slov o školiteli: Dr. Malik nedávno nastoupil na FIT VUT v Brně. Má desetiletou zkušenost s prací v oblasti zpracování neuro-signálů a neuro-obrazu. V současné době je v procesu zakládání výzkumné skupiny v této oblasti na FIT. Jedná se o multidisciplinární projekt, který bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT. Jedná se o vývoj nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Nedávny rozvoj veľkých jazykových modelov (large language models, LLM) ukazuje potenciál hlbokého učenia a umelých neurónových sietí pre mnoho úloh spracovania prirodzeného jazyka (natural language processing, NLP). Pokroky v ich automatizácii majú významný dopad na množstvo inovatívnych aplikácií ovplyvňujúcich každodenný život.
Aj keď sú veľké jazykové modely úspešne využívané pri riešení veľkého množstva úloh, stále zostávajú viaceré výskumné výzvy týkajúce sa jednotlivých úloh spracovania prirodzeného jazyka, aplikačných domén a samotných jazykov. K nim pribúdajú ďalšie výzvy vychádzajúce z podstaty veľkých jazykových modelov a netransparentnej povahy modelov založených na neurónových sieťach (tzv. black-box modely).
Je potrebný ďalší výskum a prieskum súvisiacich javov, špeciálnu pozornosť v poslednej dobe púta problém dôveryhodnosti modelov pre NLP (tzv. trustworthy NLP) alebo nové paradigmy učenia adresujúce problém nízkej dostupnosti zdrojov potrebných pre učenie (tzv. low-resource NLP).
Zaujímavé výskumné výzvy, na ktoré sa možno v rámci témy zamerať (príkady):
Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Šimko Marián, doc. Ing., Ph.D.
Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh, pri ktorých vykazujú dobrú výkonnosť pri použití v podmienkach bez priameho príkladu (zero-shot) alebo s niekoľkými príkladmi (few-shot), a to aj v porovnaní so špecializovanými dotrénovanými modelmi. Platí to predovšetkým pre úlohy, pri ktorých môžu veľké jazykové modely využiť znalosti, ktoré získali počas ich predtrénovania. Avšak pri úlohách, ktoré vyžadujú špecifickejšie doménové znalosti či adaptáciu, veľké jazykové modely aktuálne zaostávajú. Okrem toho trpia rôznymi problémami, ako sú napr. halucinácie (generovanie koherentného výstupu, ktorý je však fakticky nesprávny alebo nezmyselný) alebo generovanie textu obsahujúceho predsudky naučené z dát použitých počas predtrénovania. Boli navrhnuté rôzne prístupy na riešenie týchto problémov, napr. lepšie stratégie tvorby dopytov (vrátane kontextuálneho učenia), generovanie obohatené o vyhľadávanie alebo adaptácia veľkých jazykových modelov pomocou efektívneho dotrénovania.
Každý z týchto prístupov (alebo ich kombinácia) predstavuje príležitosť pre nové objavy. Ortogonálne k týmto prístupom stoja vlastnosti modelov ako miera ich zhody s ľudskými hodnotami, robustnosť, vysvetliteľnosť alebo interpretovateľnosť, ktoré sú dôležitým faktorom a prínos v tomto smere je vítaný (v rámci uvádzaných techník aj všeobecne v umelej inteligencii).
Existuje veľa úloh, kde sa metódy adaptácie veľkých jazykových modelov dajú uplatniť. Nachádzajú sa medzi nimi aj veľmi aktuálne oblasti detekcie nepravdivých informácií (dezinformácií), detekcie signálov kredibility obsahu, auditovanie algoritmov sociálnych médií a ich tendencií šíriť dezinformácie, či podpora overovania informácií (fact-checking).
Školitel: Bieliková Mária, prof. Ing., Ph.D.