Detail předmětu

Biostatistika a zpracování dat

FCH-MC_BZDAk. rok: 2022/2023

Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací. 


Jazyk výuky

čeština

Počet kreditů

2

Výsledky učení předmětu

Absolvováním tohoto předmětu posluchači rozšíří své znalosti v oblasti pokročilého statistického zpracování experimentálních dat. Naučí se ovládat komplexní statistický software Statistica. Tyto nové znalosti a dovednosti jsou široce aplikovatelné v mnoha technických a přírodovědných oborech. Dalším benefitem je přímé propojení tohoto předmětu s realizací diplomových prací. Může tak přispět k vyšší kvalitě VŠKP realizovaných na FCH VUT.


Prerekvizity

Dobrá znalost matematiky. Základní dovednosti práce v excelu. Schopnost základní analýzy a zpracování chemických a biologických dat.

 

Plánované vzdělávací činnosti a výukové metody

Přednáška -(2 vyučovací hodiny 1 za 14 dní): frontální výuka s využitím názorně demonstračních metod (PowerPoint, tabule).
Cvičení - (2 vyučovací hodiny 1 za 14 dní): výuka na pc - software Statistica, workshop, samostatné práce, diskuse.
Elektronická podpora: kurz Biostatistika zpracovaný v e-learningovém systému Moodle, video databáze přednášek a cvičení v platformě MS Stream


Způsob a kritéria hodnocení

1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10 bodech. Minimum pro úspěch: 5 bodů/úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu. 

2. Zápočet sestává z testu (max. 50 bodů, minimum pro úspěch je 25 bodů), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.

Finální hodnocení vychází z průměru hodnocení domácích úloh (váha 33,3 %), zápočtového testu (váha 33,3 %) a prezentace (váha 33,3 %). Klasifikovaný zápočet bude přidělen podle klasifikace ECTS.

Osnovy výuky

Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.

Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.

1. Úvod do biostatistiky, základní statistické pojmy a metody
2. Teorie pravděpodobnosti, distribuce dat, centrální limitní věta
3. Z a T distribuce, standardizace hodnot pomocí Z a T skóre, interval spolehlivosti, bodové odhady střední hodnoty, intervalové odhady střední hodnoty, posouzení správnosti a shodnosti výsledků, systematizace a eliminace chyb
4. Základní deskriptivní analýza dat – grafy, testy normality, identifikace odlehlých výsledků
5. Výběr a návrh designu experimentu
6. Parametrické hypotézové testy (T-testy, ANOVA)
7. Neparametrické hypotézové testy (U-test, Kruskal Wallisova ANOVA)
8. Korelační a regresní analýza dat
9. Aplikace lineární regrese v biotechnologické a chemické praxi. Polynomická regrese, určení stupně polynomu. Tvorba modelů.
10. Vícerozměrná analýza dat  – Shluková analýza – hierarchická, K-průměr
11. Vícerozměrná analýza dat  – Analýza hlavních komponent (PCA)
12. Vícerozměrná analýza dat – Diskriminační analýza
13. Tvorba klasifikačních modelů pomocí diskriminační analýzy 

Cvičení přímo navazuje na přednášky, kde studenti řeší konkrétní statistické problémy za použití softwarů Statistica a Excel.

Učební cíle

Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.

  

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10-ti bodech. Minimum pro úspěch: 5 bodů / úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.

2. Zápočet sestává z testu (minimum pro úspěch je polovina správných odpovědi), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.

 

 

Základní literatura

Meloun M., Militký J.: Statistická analýza experimentálních dat. Academia, Praha 2004. (CS)
Lepš J., Šmilauer P.: Biostatistika. Nakladatelství Jihočeské univerzity, České Budějovice, Česká republika, 2016. (EN)

Doporučená literatura

Meloun M.: Počítačová analýza vícerozměrných dat, Academia, Praha, Česká republika, 2005. (EN)
Meloun M.: Statistická analýza vícerozměrných dat v příkladech, Karolinium, Praha, Česká republika, 2017. (EN)

Elearning

Zařazení předmětu ve studijních plánech

  • Program NKCP_CHPL magisterský navazující 2 ročník, zimní semestr, povinně volitelný
  • Program NPCP_CHPL magisterský navazující 2 ročník, zimní semestr, povinně volitelný
  • Program NPCP_PCHBT magisterský navazující 2 ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

13 hod., nepovinná

Vyučující / Lektor

Konzultace v kombinovaném studiu

26 hod., nepovinná

Vyučující / Lektor

Cvičení

13 hod., povinná

Vyučující / Lektor

Elearning