Přístupnostní navigace
E-application
Search Search Close
Applied result detail
GALÁŽ, Z.; MEKYSKA, J.; SMÉKAL, Z.
Original Title
Software pro předběžnou statistickou analýzu
English Title
Preliminary Statistical analysis tool
Type
Software
Abstract
Předběžná statistická analýza slouží ke zjištění statistických vlastností uvažované množiny dat. V oblasti zpracování patologické řeči je častým postupem analýzy řečového signálu parametrizace řečového korpusu za účelem extrakce klinicky signifikantních parametrů popisujícím poškození řečové produkce. Výstupem parametrizace je tzv. parametrizační matice obsahující hodnoty vypočtených parametrů pro všechny uvažované řečníky. Tento software umožnuje tuto matici analyzovat. Balík PSA obsahuje funkce pro výpočet korelačního koeficientu mezi hodnotami parametrů a klinických stavem řečníka, dále umožnuje výpočet tzv. společné informace. Tento software je také možné využít k individuální analýze parametrů za účelem binární klasifikace nebo také predikce klinické škály hodnotící zdravotní stav řečníka (odhad spojité škály – regresní analýza). Aktuální verze softwaru PSA poskytuje 6 různých klasifikačních technik (metoda podpůrných vektorů, naivní Bayesovy sítě, diskriminační analýza, k-nejbližších sousedů, klasifikační stromy a Gaussovy smíšené modely), a jednu regresní metodu založenou na algoritmu klasifikačních a regresních stromů. Software obsahuje také 18 metrik pro hodnocení klasifikace (klasifikační přesnost, senzitivita, specificita, atd.) a 10 metrik pro regresi (gini index, absolutní chyba, střední kvadratická chyba, atd.). K otestování tohoto balíku je možné použít přiložené skripty demo_classification.m a demo_regression.m, které načítají data ze souboru test_classification.mat a test_regression.mat (obsahují matici parametrů „feat_matrix“: sloupce popisují parametry; řádky popisují pozorování vektor tzv. labelů „labels“ (pro klasifikaci jsou to skupiny, např. 0/1 – zdravý/nemocný a pro regresi to je spojitá škála hodnot) a také vektor obsahující názvy jednotlivých parametrů).
Abstract in English
Preliminary statistical analysis is used as a tool to obtain a statistical insight into the analysed dataset. In the field of pathological signal processing the common methodology is to perform so called parametrization process in order to extract clinically useful information from the data to describe the deterioration of the speech production. The output of this process is the feature matrix, constructed of the computed feature labels for all speakers (speech recordings) in the dataset. This software can be used to calculate the correlation coefficient and the mutual information between the feature vectors and the associated clinical diagnosis. It can also be used to perform the individual feature analysis in the direction of the binary classification or regression task (continuous clinical scale estimation) computation. The actual version of PSA software toolbox provides the possibility of using 6 worldwide used classification techniques (Support Vector Machines, Naive Bayes Networks, Discriminant Analysis, k-Nearest Neighbour, Classification Trees and Gaussian Mixture Models) one regression technique based on the Classification and Regression Trees algorithm. The software also provides 18 metrics to evaluate the classification process (classification accuracy, sensitivity, specificity, etc.) and 10 metrics to evaluate the regression task (gini index, absolute error, root mean squared error, etc.). The testing scripts demo_classification.m and demo_regression.m are also provided. The scripts load the data from the test_classification.mat and test_regression.mat files, which include the parametrization matrix (feat_matrix): rows are determined for the observations; columns are determined for the parameters, and the vector of labels (labels) (e.g. for the classification task: 0/1 – healthy/disordered and for the regression task it is the numeric continuous scale, and the vector of feature names).
Keywords
Statistical analysis, classification, regression, correlation coefficient, mutual information
Key words in English
Location
http://splab.cz/en/download/software/software-pro-predbeznou-statistickou-analyzu
Possibilities of use
only the provider uses the result
Licence fee
Use of the result by another entity is possible without acquiring a license (the result is not licensed)
www
http://splab.cz/download/software/software-pro-predbeznou-statistickou-analyzu