diplomová práce

Klasifikace webových stránek

Text práce 999.78 kB

Autor práce: Ing. Roman Kolář

Ak. rok: 2007/2008

Vedoucí: Ing. Vladimír Bartík, Ph.D.

Oponent: doc. Ing. Radek Burget, Ph.D.

Abstrakt:

Práce se zabývá problematikou automatické klasifikace webových stránek s využitím asociačního klasifikátoru. Je představena klasifikace, jakožto jeden z oborů dolování znalostí z databází; zvláštní prostor je věnován klasifikaci textových dat. Jsou diskutovány různé metody klasifikace textových dokumentů se zdůrazněním výhod klasifikátorů využívajících pro rozhodování asociační pravidla.
Cílem práce je pokusit se přizpůsobit vybranou klasifikační metodu pro relační data a navrhnout systém pro klasifikaci webových stránek podle vizuálních vlastností - rozložení jednotlivých oblastí na stránce, nikoliv podle čistého textového obsahu.  K tomu je využitý asociační klasifikátor ARC-BC kombinující výhody známých klasifikačních metod.

Klíčová slova:

klasifikace, klasifikátor, Web, dolování znalostí, asociační pravidlo, přesnost, data, diskretizace, kategorie, struktura, atribut, podpora, spolehlivost, text, interval

Termín obhajoby

17.06.2008

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

A

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Informační technologie (IT-MGR-2)

Studijní obor

Informační systémy (MIS)

Známka navržená vedoucím: A

Známka navržená oponentem: A

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová