Publication detail

Získávání znalostí z Webu

KUNC, M.

Original Title

Získávání znalostí z Webu

English Title

Web Mining Overview

Type

conference paper

Language

Czech

Original Abstract

Metody získávání znalostí z Webu lze rozdělit do tří kategorií podle typu informace, kterou chceme získat: Získávání znalostí z obsahu, struktury a užití Webu. Získávání znalostí z obsahu Webu je proces extrakce užitečné informace z obsahu Webových dokumentů. Získávání znalostí ze struktury Webu využívá hypertextovou strukturu Webu. Získávání znalostí z užití Webu je aplikací technik získávání znalostí z dat k nalezení užitečných vzorů, což může pomoci k personalozaci Webu. Tento příspěvek je přehledem těchto technik.

English abstract

Methods of Web data mining can be divided into three categories according to a type of mined information and goals that particular categories set: Web content mining, Web structure mining and Web usage mining. Web content mining is the process of extracting useful information from the content of Web documents. Web structure mining uses the hyperlink structure of the Web to yield useful information, including definitive pages specification, hyperlinked communities identification, Web pages categorization and Web site completeness evaluation. Web usage mining is the application of data mining techniques to discover usage patterns from Web data, in order to understand and better serve the needs of Web-based applications. This paper is an overview of these techniques.

Keywords

Získávání znalostí z Webu, hypertext, strojové učení.

Key words in English

Web mining, hypertext, machine learning.

Authors

KUNC, M.

RIV year

2007

Released

26. 4. 2007

Publisher

Vysoké učení technické v Brně

Location

Brno

ISBN

80-214-3410-3

Book

Proceedings of the 13th Conference STUDENT EEICT 2007 Volume 4

Pages from

391

Pages to

395

Pages count

5

BibTex

@inproceedings{BUT25904,
  author="Michael {Kunc}",
  title="Získávání znalostí z Webu",
  booktitle="Proceedings of the 13th Conference STUDENT EEICT 2007 Volume 4",
  year="2007",
  pages="391--395",
  publisher="Vysoké učení technické v Brně",
  address="Brno",
  isbn="80-214-3410-3"
}