Applied result detail

Český stemmer v jazyce Snowball

HELLEBRAND, D.; CHMELAŘ, P.

Original Title

Český stemmer v jazyce Snowball

English Title

Czech Snowball Stemmer

Type

Software

Abstract

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

Abstract in English

The product is a stemming algorithm for Czech language based on grammatical rules, in addition to methods of using vocabulary for searching and mining the Czech text. Snowball stemmer implementations of the Czech language is created on the basis of a complete set of all prefixes, suffixes and endings, which may occur in the Czech language.

See the Snowball web at http://snowball.tartarus.org/ and the thesis text at http://www/study/DP/rpfile.php?id=7988 (in Czech). The publication describing the product in Czech at www.fit.vutbr.cz/research/view_pub.php.en?id=9473.

Keywords

Lemmatization, stemming, Snowball, Czexh language, grammar.

Key words in English

Lemmatization, stemming, Snowball, Czexh language, grammar.

Location

http://www.fit.vutbr.cz/research/view_product.php?id=133

Possibilities of use

only the provider uses the result

Licence fee

In order to use the result by another entity, it is always necessary to acquire a license

www

Documents