Bachelor's Thesis

Assembly of bacterial transcriptomes with emphasis on non-coding elements

Final Thesis 4.55 MB Appendix 9.56 MB

Author of thesis: Petr Kovář

Acad. year: 2025/2026

Supervisor: Ing. Kristýna Heřmánková

Reviewer: Ing. Jana Musilová, Ph.D.

Abstract:

This bachelor's thesis focuses on the bacterial transcriptome, with an emphasis on non-coding elements. These non-coding elements, specifically the sRNA (small RNA) genes, have as their product sRNAs, which are key molecules for the survival and regulation of the bacteria. To better understand and quantify these RNAs, an analysis of an assembly of the transcriptome from RNA sequencing data is one of the viable methods.
This work introduces a modular analysis pipeline designed to distinguish putative sRNAs from non-sRNA transcripts and predict their target genes. Multiple steps are employed to achieve this distinction, described in detail in the text. The pipeline was then tested on data from RNA-Seq of the bacterium Rhodospirillum rubrum. The final output is in the form of a GFF annotation file, with appended putative sRNAs and their target genes.

Keywords:

non-coding RNA, small RNA, RNA-Seq, transcriptome assembly, bacteria, sRNA target prediction

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Jakubíčková se zeptala na základě tabulky v práci, zda je jeden z nástroju (Trinity) vhodný? Tušíte kolik nástrojů existuje? Na základě čeho jste vybral dané nástroje? Nacházel jste malé RNA i na plazmidu? Byly tam nějaké geny, které se překrývají? Ing. Ředina se zeptal: Proč tolik SW? Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

English

Faculty

Department

Study programme

Biomedical Technology and Bioinformatics (BPC-BTB)

Composition of Committee

doc. Ing. Petr Kudrna, Ph.D. (předseda)
Ing. Markéta Jakubíčková, Ph.D. (místopředseda)
MUDr.Ing. Richard Ředina (člen)
Ing. Martin Králík (člen)
Ing. Jiří Vitouš (člen)
doc. Ing. Radim Kolář, Ph.D. (člen)

Supervisor’s report
Ing. Kristýna Heřmánková

Student Petr Kovář ve své bakalářské práci řeší problematiku analýzy transkriptomických dat se zaměřením na identifikaci nekódujících elementů, především malých RNA (sRNA).
Teoretická část práce obsahuje kvalitně zpracovanou literární rešerši zaměřenou na organizaci bakteriálního genomu a transkriptomu, metody měření transkriptomu a postupy jeho následného zpracování, včetně metod de novo skládání transkriptomických dat. Text je přehledně strukturován, srozumitelný, psaný odborným anglickým jazykem a doplněný odpovídajícím množstvím relevantních citací.
Hlavním přínosem práce je návrh a implementace výpočetní metody pro detekci malých RNA. Navržené řešení kombinuje informace získané z transkriptomických dat naměřených technologií RNA-Seq s biologickými charakteristikami odvozenými z genomických dat, jako jsou predikce promotorových a terminačních oblastí či výpočty energetických parametrů. Tyto příznaky jsou integrovány do hybridního nástroje, jehož výstupem je soubor anotací obsahující kandidátní malé RNA společně s jejich hodnocením prostřednictvím zavedeného skórovacího systému. Navržený přístup umožňuje uživateli volit požadovanou míru spolehlivosti predikcí a představuje praktický nástroj pro následné biologické analýzy. Současně je vhodné zdůraznit, že definitivní potvrzení existence a funkce predikovaných malých RNA vyžaduje laboratorní validaci.
Po formální stránce je práce zpracována na velmi dobré úrovni. Text je čtivý, logicky uspořádaný a obsahuje pouze minimum jazykových či typografických nedostatků. Student během řešení práce pravidelně konzultoval dosažené výsledky i navrhované postupy, aktivně přicházel s vlastními nápady na zlepšení řešení. Práce přináší zajímavé výsledky s potenciálem dalšího rozvoje v navazujícím výzkumu a nabízí předpoklady pro budoucí publikační využití dosažených výsledků. Zadání bakalářské práce bylo splněno v plném rozsahu.
Bakalářskou práci hodnotím klasifikačním stupněm A (95 bodů). Points proposed by supervisor: 95

Grade proposed by supervisor: A

Reviewer’s report
Ing. Jana Musilová, Ph.D.

Zadání považuji za zcela splněné; krok 5) byl navíc rozpracován nad rámec běžných požadavků, a to využitím dvou nástrojů a s pokročilým statistickým vyhodnocením.

Kapitoly teoretické části jsou kvalitně zpracované a obsahují všechny informace potřebné pro pochopení navazující praktické části.

Po prezentační a formální stránce je text čitelný, logicky navazující a s minimem překlepů. Na pár místech informace mírně přeskakují, takže čtenář bez znalosti datasetu či transkriptomiky by se v nich mohl hůře orientovat (nejde však o nic zásadního).

Práce s literaturou je na výborné úrovni, stejně jako rozsah práce. Drobnou připomínku mám k citacím, které jsou vedeny podle českého standardu (roč., č., s.), ačkoli je práce psána anglicky.

Popis dílčích úloh a řešení je srozumitelný a výběr metod i nástrojů považuji za vhodný. Oceňuji detailní a přehledné README a velmi dobře zpracované skripty.

Popis výsledků je zdařilý, také oceňuji sekci o možnostech optimalizace pipeline. Diskuze výsledků je spíše stručná; např. popis tabulky 5.3 by mohl zahrnovat informaci, zda jsou některé z dosažených hodnot biologicky relevantní a které ze skóre by tak bylo nejvhodnější.

Využitelnost výsledků hodnotím jako velmi dobrou; práci by dále zhodnotilo zveřejnění pipeline, např. na GitHub.

Práci doporučuji k obhajobě a navrhuji hodnocení B / 89 bodů. Topics for thesis defence:
  1. Výsledky použitých assemblerů se výrazně liší a, jak uvádíte, počet ORF nalezených nástroji rnaSPAdes a SOAPdenovo-trans je velmi nízký. Bylo by možné tyto rozdíly ovlivnit změnou parametrů při spuštění nástrojů?
Points proposed by reviewer: 89

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová