Detail předmětu

Advanced methods in Bioinformatics

FEKT-MPAN-PMBAk. rok: 2026/2027

The course is mainly oriented towards acquiring practical skills in the field of bioinformatics processing of big data. It mainly focuses on analyses of bacterial genomes and transcriptomes. For the complexity of such analyses, it also brings a basic understanding of working with the command line, creating your own pipelines and using remote calculations. All this while understanding how these analyzes are applicable to the knowledge inference that can be used in medicine, biotechnology or genome engineering. Current bioinformatics processes big data that cannot be processed on personal computers. Therefore, it relies on remote calculations on high performance computational servers. This requires the use of a job scheduler and, in cooperation with basic code scripting, gives almost unlimited possibilities even in the analysis of so-called non-model organisms. Computational analyses can thus be used in many scientific disciplines, especially biotechnology, both medical and industrial. 

Jazyk výuky

angličtina

Počet kreditů

4

Vstupní znalosti

Jsou vyžadovány základní znalosti algoritmů využívaných v bioinformatice pro analýzu podobnosti sekvencí, jejich skládání do delších úseků, či algoritmů odvozujících informaci z primární struktury sekvence, například predikci ORF. Je také důležité mít základní pochopení funkčních vztahů v živých organismech na buněčné úrovni vycházející z centrálního dogma molekulární biologie.

 

Pravidla hodnocení a ukončení předmětu

Criteria for obtaining classified credit:
- prepare a report summarizing your own results on all topics assigned during the semester (max. 100 points)
Computer exercises and semminars are not mandatory, absences do not need to be compensated.
To successfully complete the course, it is necessary to obtain at least 50 points for the final report. The finals score is determined from the points obtained for the final report.

Učební cíle

Cílem předmětu je poskytnout studentům pokročilé, prakticky zaměřené znalosti v oblasti zpracování sekvenačních dat s využitím dávkových úloh a vysokovýkonostního počítání při využití moderních výpočetních nástrojů tak, aby byli schopní si poskládat vlastní pipelines pro komplexní analýzu genomů.
Absolvent předmětu je schopen:
- pracovat s výpočetními zdroji pomocí dávkových úloh při využití plánovače
- provést pročištění surových sekvenačních dat, a to genomických i transkriptomických
- seskládat kompletní genom a tento anotovat
- provést sledování variant v mutantních či jinak příbuzných genomech
- provést zevrubnou analýzu transkriptomu

 

Základní literatura

Compeau P., Pevzner P.A.: Bioinformatics Algorithms: An Active Learning Approach. Active Learning Publishers, 2018. (EN)
McLean, Daniel D. R Bioinformatics cookbook: use R bioconductor to perform RNAseq, genomics, data visualization, and bioinformatic analysis. Packt Publishing, 2019. ISBN 978-1789950694. (EN)

Zařazení předmětu ve studijních plánech

  • Program MPA-BTB magisterský navazující 2 ročník, zimní semestr, povinný
  • Program MPCN-BTB magisterský navazující 2 ročník, zimní semestr, povinně volitelný

Typ (způsob) výuky

 

Seminář

12 hod., nepovinná

Vyučující / Lektor

Osnova

1. Introduction to high performance computing
2. Contamination and sequencing errors, genome assembly
3. Population genomics and variability in genomes
4. Basics of structural and functional genome annotation
5. Basics in transcriptomics
6. Analyses of transcriptomes

 

Projekt

52 hod., povinná

Vyučující / Lektor

Osnova

Work on assigned tasks necessary for the preparation of the final report. It is required to work on all assigned topics. 

Individuální příprava na ukončení

20 hod., nepovinná

Vyučující / Lektor

Osnova

Requirements for the final report:
The final report does not have a precisely defined structure, it is possible to freely draw inspiration from scientific articles, project reports, or even bachelor/diploma theses. The report should contain:
1) Introduction
A brief introduction to the state-of-the-art, a general description of the topic and a 2-3 sentence summary of what the report contains.
2) Materials and methods
This chapter should contain references to the input data, where they were obtained, including accession numbers, computational tools used, including specific versions and any references, in case a freely available tool needs to be cited.
3) Description and discussion of results
The achieved results, including suitable figures, plots and tables, should be summarized in a separate chapter. This can be divided into further subchapters reflecting individual topics addressed during the semester. The results can be directly discussed, or the discussion can be placed into a separate chapter.
4) Conclusion/summary
The report should also include a brief summary of everything that was successful, or failed.

Cvičení na počítači

14 hod., nepovinná

Vyučující / Lektor

Osnova

1. Metacentrum, sratoolkit, quality assessment for raw sequencing data
2. Quality trimming and data preparation, de novo genome assembly
3. Reference-based assembly, variant calling
4. Genome annotation
5. RNA-Seq preprocessing, mapping, demultiplication
6. RNA-Seq – count table
7. Consultations