Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
Detail publikačního výsledku
CHMELAŘ, P.; HELLEBRAND, D.; HRUŠECKÝ, M.; BARTÍK, V.
Originální název
Nalezení slovních kořenů v češtině
Anglický název
Czech Stemming Algorithm
Druh
Článek recenzovaný mimo WoS a Scopus
Originální abstrakt
Cílem bylo vytvořit stematizační algoritmus pro český jazykzaložený na gramatických pravidlech jako doplněk k metodám používa-jícím slovník pro vyhledávání a dolování českého textu. Článek obsahujezáklady slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů.Hlavním přínosem této práce je Snowball implementace stematizačníhoalgoritmu českého jazyka na základě kompletní sady všech předpon apřípon, které se mohou v českém jazyce vyskytovat.
Anglický abstrakt
The goal was to create an algorithm for stemming Czech language based ongrammatical rules, in addition to methods using vocabulary for retrieval andmining of Czech texts. The article includes the basics of Czech word formationfor different word classes, description of problems and several stemming and lemmatization algorithms. The main contribution of this work is the implementationof the Snowball stemming algorithm for the Czech language based on completesets of all prefixes and suffixes, which may occur in Czech words.
Klíčová slova v angličtině
Lemmatization, stemmization, Snowball, Czech, grammar.
Autoři
Rok RIV
2012
Vydáno
03.11.2011
Nakladatel
Aachen University of Technology
Místo
Aachen
Kniha
Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)
ISSN
1613-0073
Periodikum
CEUR Workshop Proceedings
Svazek
2011
Číslo
802
Stát
Spolková republika Německo
Strany od
1
Strany do
12
Strany počet
URL
http://www.ceur-ws.org/Vol-802
BibTex
@article{BUT91156, author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}", title="Nalezení slovních kořenů v češtině", journal="CEUR Workshop Proceedings", year="2011", volume="2011", number="802", pages="1--12", issn="1613-0073", url="http://www.ceur-ws.org/Vol-802" }