Detail předmětu

Analýza biologických sekvencí

FEKT-FABSAk. rok: 2011/2012

Předmět pokrývá statistické základy a přehled hlavních metod analýzy biologických sekvencí. Témata zahrnují základy pravděpodobnosti, skryté Markovovy modely a testování více hypotéz. Metody analýzy sekvencí zahrnují zarovnávání, optimální párování pro lokální zarovnávání, optimální párování pro globální zarovnávání a zarovnávání více sekvencí, vyhledávání genů a využití fylogenetických stromů.

Jazyk výuky

čeština

Počet kreditů

6

Výsledky učení předmětu

Praktické znalosti návrhu metod pro analýzu biologických sekvencí.

Prerekvizity

Jsou požadovány znalosti na úrovni bakalářského studia.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Podmínky pro úspěšné ukončení předmětu stanoví každoročně aktualizovaná vyhláška garanta předmětu.

Osnovy výuky

Pravděpodobnostní přístup v molekulární biologii. Metody pro párování v zarovnávání. Dynamické programování. Markovovy modely a skryté Markovovy modely (HMM). Použití HMM pro vyhledávání genů. Ostatní algoritmy pro vyhledávání genů.

Učební cíle

Cílem předmětu je poskytnout znalosti o pokročilých metodách analýzy biologických sekvencí založených na pravděpodobnostním přístupu včetně využití skrytých Markovových modelů. Aplikace zahrnují zejména zarovnávání sekvencí, vyhledávání genů a využití fylogenetických stromů.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.

Základní literatura

Durbin, R. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press, 2002. ISBN: 978-0521629713 (EN)
Rosypal, S. Nový přehled biologie. Scientia, Praha 2003. ISBN 80-7183-268-5 (CS)

Doporučená literatura

Pevzner, P. A. An Introduction to Bioinformatics Algorithms (Computational Molecular Biology. The MIT Press, 2004. ISBN: 978-0262101066 (EN)

Zařazení předmětu ve studijních plánech

  • Program BTBIO-F magisterský navazující

    obor F-BTB , 1. ročník, letní semestr, povinný

  • Program EEKR-CZV celoživotní vzdělávání (není studentem)

    obor ET-CZV , 1. ročník, letní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

1. Pravděpodobnostní přístup v molekulární biologii.
2. Klasické a moderní metody pro párování v zarovnávání.
3. Statistická významnost skóre zarovnávání a interpretace výstupů zarovnávacích algoritmů.
4. Mechanismus a využití dynamického programování .
5. Implementace Needlemanova-Wunchova a Smithova-Watermanova algoritmu.
6. Vícenásobné zarovnávání a fylogenetická rekonstrukce.
7. Evoluce sekvencí předpokládaná různými modely a algoritmy.
8. Pravděpodobnostní přístup k fylogenetické rekonstrukci.
9. Markovovy modely a skryté Markovovy modely (HMM) v kontextu genomiky.
10. Hlavní metody pro inferenci v HMM.
11. Použití HMM pro vyhledávání genů.
12. Ostatní algoritmy pro vyhledávání genů.
13. Identifikace významných statistických přístupů v bioinformatice.

Cvičení na počítači

26 hod., povinná

Vyučující / Lektor

Osnova

1. Klasická a Bayesovská pravděpodobnost.
2. Metody pro párování v zarovnávání.
3. Výpočet skóre zarovnávání a interpretace výstupů zarovnávacích algoritmů.
4. Algoritmy dynamického programování .
5. Implementace Needlemanova-Wunchova a Smithova-Watermanova algoritmu.
6. Vícenásobné zarovnávání.
7. Sledování evoluce sekvencí.
8. Fylogenetická rekonstrukce.
9. Markovovy modely v genomice.
10. Skryté Markovovy modely v genomice.
11. Vyhledávání genů pomocí skrytých Markovových modelů I.
12. Vyhledávání genů pomocí skrytých Markovových modelů II.
13. Vyhledávání genů pomocí dalších algoritmů.

Ostatní aktivity

13 hod., povinná

Vyučující / Lektor

Osnova

Samostatné projekty zaměřené na různé varianty z oblasti analýzy biologických sekvencí.