Detail předmětu
Získávání znalostí z databází
FIT-ZZNAk. rok: 2019/2020
Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
- Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází.
- Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
- Student se naučí odborné terminologii v českém i anglickém jazyce.
- Student získá zkušenost s řešením projektů v malém týmu.
- Student se zdokonalí v prezentaci a obhajobě výsledků projektu.
Prerekvizity
- Znalost základů pravděpodobnosti a statistiky.
- Znalost databázových technologií na úrovni bakalářského předmětu.
Literatura
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
Způsob a kritéria hodnocení
Podmínky zápočtu:
Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.
Jazyk výuky
Cíl
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2 magisterský navazující
obor MBS , libovolný ročník, zimní semestr, 5 kreditů, povinně volitelný
obor MMI , libovolný ročník, zimní semestr, 5 kreditů, volitelný
obor MMM , libovolný ročník, zimní semestr, 5 kreditů, volitelný
obor MPV , libovolný ročník, zimní semestr, 5 kreditů, povinně volitelný - Program MITAI magisterský navazující
specializace NBIO , libovolný ročník, zimní semestr, 5 kreditů, povinný
specializace NISY , libovolný ročník, zimní semestr, 5 kreditů, povinný
specializace NIDE , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NCPS , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NSEC , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NMAT , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NGRI , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NNET , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NVIZ , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NSEN , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NMAL , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NHPC , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NVER , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NEMB , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NADE , libovolný ročník, zimní semestr, 5 kreditů, volitelný
specializace NSPE , libovolný ročník, zimní semestr, 5 kreditů, volitelný - Program IT-MGR-2 magisterský navazující
obor MBI , 2. ročník, zimní semestr, 5 kreditů, povinný
obor MIS , 2. ročník, zimní semestr, 5 kreditů, povinně volitelný
obor MIN , 2. ročník, zimní semestr, 5 kreditů, povinný
obor MGM , 2. ročník, zimní semestr, 5 kreditů, volitelný
obor MSK , 2. ročník, zimní semestr, 5 kreditů, povinně volitelný - Program MITAI magisterský navazující
specializace NISD , 2. ročník, zimní semestr, 5 kreditů, povinný
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
- Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie.
- Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
- Předzpracování dat v procesu získávání znalostí - metody předzpracování.
- Datové sklady a technologie OLAP pro získávání znalostí z databází.
- Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
- Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
- Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
- Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
- Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
- Další metody shlukování. Dolování v biologických datech.
- Úvod do dolování v proudech dat, časových řadách a posloupnostech.
- Úvod do dolování v grafech, časoprostorových datech, datech pohybujících se objektů a multimediálních datech.
- Dolování textu a na webu.
Projekt
Vyučující / Lektor
Osnova
- Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.