Detail aplikovaného výsledku

Český stemmer v jazyce Snowball

HELLEBRAND, D.; CHMELAŘ, P.

Originální název

Český stemmer v jazyce Snowball

Anglický název

Czech Snowball Stemmer

Druh

Software

Abstrakt

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

Abstrakt aglicky

The product is a stemming algorithm for Czech language based on grammatical rules, in addition to methods of using vocabulary for searching and mining the Czech text. Snowball stemmer implementations of the Czech language is created on the basis of a complete set of all prefixes, suffixes and endings, which may occur in the Czech language.

See the Snowball web at http://snowball.tartarus.org/ and the thesis text at http://www/study/DP/rpfile.php?id=7988 (in Czech). The publication describing the product in Czech at www.fit.vutbr.cz/research/view_pub.php.en?id=9473.

Klíčová slova

Lemmatization, stemming, Snowball, Czexh language, grammar.

Klíčová slova anglicky

Lemmatization, stemming, Snowball, Czexh language, grammar.

Umístění

http://www.fit.vutbr.cz/research/view_product.php?id=133

Možnosti využití

výsledek využívá pouze poskytovatel

Licenční poplatek

K využití výsledku jiným subjektem je vždy nutné nabytí licence

www

Dokumenty