Detail předmětu

Advanced methods in Bioinformatics

FEKT-MPAN-PMBAk. rok: 2026/2027

Předmět je orientován především na získáních praktických dovedností v oblasti bioinformatického zpracování rozsáhlých datových sad. Zaměřuje se především na analýzy bakteriálních genomů a transkriptomů. Pro složitost takových analýz pak přináší i základní pochopení práce s příkazovou řádkou, vytvářeních vlastních pipelines a využití vzdálených výpočtů. To vše při pochopení toho, jak jsou tyto analýzy aplikovatelné na odvození znalosti využitelné v medicíně, biotechnologii či genomovém inženýrství.
Dnešní bioinformatika zpracovává větší množství dat, které není možné provádět na osobních počítačích. Téměř bez výjimky tak spoléhá na vzdálené výpočty na výkonných výpočetních serverech. To vyžaduje využívání plánovače úloh a ve spolupráci se základním skriptováním kódu dává téměř neomezené možnosti v analýze i tzv. nemodelových organismů. Výpočetní analýzy jsou tak využitelné s velkým přesahem v mnoha vědcích disciplínách, především biotechnologii, a to jak medicínské, tak průmyslové.

 

Jazyk výuky

angličtina

Počet kreditů

4

Vstupní znalosti

Jsou vyžadovány základní znalosti algoritmů využívaných v bioinformatice pro analýzu podobnosti sekvencí, jejich skládání do delších úseků, či algoritmů odvozujících informaci z primární struktury sekvence, například predikci ORF. Je také důležité mít základní pochopení funkčních vztahů v živých organismech na buněčné úrovni vycházející z centrálního dogma molekulární biologie.

 

Pravidla hodnocení a ukončení předmětu

Kritéria pro získání klasifikovaného zápočtu:

- připravit report shrnující vlastní výsledky ze všech témat přiřazených k řešení během semestru (max. 100 bodů)

Cvičení na počítači a semináře jsou nepovinné, absence nemusí být nahrazovány.

Pro úspěšné absolvování kurzu je nutné získat alespoň 50 bodů za závěrečné zprávu. Konečné skóre je určeno z bodů získaných za závěrečnou zprávu.

 

Učební cíle

Cílem předmětu je poskytnout studentům pokročilé, prakticky zaměřené znalosti v oblasti zpracování sekvenačních dat s využitím dávkových úloh a vysokovýkonostního počítání při využití moderních výpočetních nástrojů tak, aby byli schopní si poskládat vlastní pipelines pro komplexní analýzu genomů.
Absolvent předmětu je schopen:
- pracovat s výpočetními zdroji pomocí dávkových úloh při využití plánovače
- provést pročištění surových sekvenačních dat, a to genomických i transkriptomických
- seskládat kompletní genom a tento anotovat
- provést sledování variant v mutantních či jinak příbuzných genomech
- provést zevrubnou analýzu transkriptomu

 

Základní literatura

MCLEAN, Daniel D. R Bioinformatics cookbook: use R bioconductor to perform RNAseq, genomics, data visualization, and bioinformatic analysis. Packt Publishing, 2019. ISBN 978-1789950694. (EN)

Zařazení předmětu ve studijních plánech

  • Program MPA-BTB magisterský navazující 2 ročník, zimní semestr, povinný
  • Program MPCN-BTB magisterský navazující 2 ročník, zimní semestr, povinně volitelný

Typ (způsob) výuky

 

Seminář

12 hod., nepovinná

Vyučující / Lektor

Osnova

1. Úvod do vysoko-výkonnostních výpočtů
2. Kontaminace a chyby v sekvenačních datech, skládání genomů
3. Populační genomika a variabilita genomů
4. Základy strukturní a funkční anotace genomů
5. Základy transkriptomiky
6. Analýzy transkriptomů

 

Projekt

52 hod., povinná

Vyučující / Lektor

Osnova

Práce na zadaných úkolech nezbytných pro vypracování závěrečné zprávy. Je nutné vypracovat všechna zadaná témata.

 

Individuální příprava na ukončení

20 hod., nepovinná

Vyučující / Lektor

Osnova

Požadavky na závěrečnou zprávu

Závěrečná zpráva nemá přesně definovanou strukturu, je možné se volně inspirovat vědeckými články, projektovými zprávami, nebo i bakalářskými/diplomovými pracemi. Zpráva by měla obsahovat:

1) Úvod
Stručný úvod do současného stavu techniky, obecný popis tématu a 2–3 věty shrnující obsah zprávy.

2) Materiály a metody
Tato kapitola by měla obsahovat odkazy na vstupní data, odkud byla získána, včetně přístupových čísel, použitých výpočetních nástrojů, včetně konkrétních verzí a případných referencí, v případě, že je třeba citovat volně dostupný nástroj.

3) Popis a diskuse výsledků
Dosažené výsledky, včetně vhodných obrázků, grafů a tabulek, by měly být shrnuty v samostatné kapitole. Tu lze rozdělit do dalších podkapitol reflektujících jednotlivá témata probíraná v průběhu semestru. Výsledky lze přímo diskutovat, nebo lze diskusi zařadit do samostatné kapitoly.

4) Závěr/shrnutí
Zpráva by měla také obsahovat stručné shrnutí všeho, co se podařilo, respektive nepodařilo.

 

Cvičení na počítači

14 hod., nepovinná

Vyučující / Lektor

Osnova

1. Metacentrum, sratoolkit, hodnocení kvality surových sekvenačních dat
2. Čištění a příprava dat, de novo skládání genomu
3. Skládání genomu k referenci, sledování variant
4. Anotace genomů
5. RNA-Seq pøedzpracování, mapování, demultiplikace
6. RNA-Seq – tabulka exprese
7. Konzultace