Master's Thesis

Applying Quantum Computing to Solve Biological Problems

Final Thesis 17.97 MB

Author of thesis: Ing. Michal Plšek

Acad. year: 2025/2026

Supervisor: Ing. Miloš Musil, Ph.D.

Reviewer: doc. Ing. Tomáš Martínek, Ph.D.

Abstract:

This Master's thesis summarizes the current state of quantum computing applications in bioinformatics, focusing on the calculation of ground and excited states of molecular systems and molecular fragmentation. Using the specific protein complex (luciferase) as a model, it demonstrates the application of MBE-2 fragmentation, quantum-mechanics/molecular-mechanics (QM/MM) simulations, and active space calculations on fragments. To determine the ground-state energy of smaller fragments within the QM region of the system, variational methods (VQE) and sample-based quantum diagonalization methods (SQD) are applied.
  The calculations were performed on both a quantum simulator and a physical quantum computer and were compared with several classical methods. Despite the~significant limitations of current NISQ quantum hardware, the results highlight the future potential for the use in systems that are strongly correlated or involve chemical bond dissociation.

Keywords:

protein, luciferase, molecular docking, quantum mechanics, quantum chemistry, atomic orbitals, molecular orbitals, ground state energy calculation, QM/MM simulation, DFT, Hartree-Fock, molecular fragmentation, quantum computers, quantum computation, NISQ, quantum simulators, Tangelo, Qiskit, Qulacs, PySCF, VQA, VQE, ansatz, LUCJ, SQD, QAOA, active space, AVAS

Date of defence

23.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných, např. ohledně doby práce na tomto projektu, využití LLM modelů a přístupu k reálnému exempláři kvantového počítače. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A - výborně.

Topics for thesis defence

  1. Do jaké míry je vámi vytvořená pipeline aplikovatelné i na jiné proteiny? Popř. jaké úpravy by vyžadovala?
  2. Ve své práci uvádíte, že hybridní metoda SQD u testovaných molekul překonává čistě variační algoritmy (VQE). Vidíte budoucnost kvantové chemie spíše v těchto hybridních metodách, nebo věříte, že s příchodem lepšího hardwaru se VQE opět dostane do popředí?

Language of thesis

English

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Bioinformatics and Biocomputing (NBIO)

Composition of Committee

doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda)
doc. Ing. Tomáš Martínek, Ph.D. (místopředseda)
Ing. Zbyněk Křivka, Ph.D. (člen)
Ing. Ivana Burgetová, Ph.D. (člen)
Ing. Matěj Grégr, Ph.D. (člen)
Ing. Šárka Květoňová, Ph.D. (člen)

Supervisor’s report
Ing. Miloš Musil, Ph.D.

Jedná se o mimořádně náročné zadání realizované ve spolupráci s Loschmidtovými laboratořemi, které propojuje oblasti kvantového počítání, informatiky, kvantové fyziky a výpočetní biologie. V průběhu řešení projektu si student do hloubky nastudoval problematiku kvantových algoritmů i oblast simulací molekulární dynamiky a vazby ligandů do aktivního místa receptoru. Rozsah prostudované literatury, množství vědeckých článků i hloubka porozumění dané problematice byly podle mého názoru mimořádné a odpovídaly úrovni získané spíše během několikaletého specializovaného studia či výzkumné práce.


Výsledkem je rozsáhlý text zpracovaný v anglickém jazyce na velmi vysoké odborné i stylistické úrovni, který by mohl sloužit jako studijní materiál a současně má potenciál pro další rozpracování pro publikační výstup v impaktovaném časopise. S ohledem na výše uvedené hodnotím práci z pohledu vedoucího známkou A (100 b) a doporučuji komisi zvážit udělení dalšího ocenění za mimořádně kvalitní zpracování a odborný přínos práce.

Evaluation criteria Verbal classification
Informace k zadání

Práce se zabývá kvantovými algoritmy pro řešení biologických problémů, což považuji za mimořádně náročné zadání. Kombinuje několik rozsáhlých oblastí, konkrétně informatiku, kvantovou fyziku a výpočetní biologii, které svým rozsahem výrazně přesahují standardní rámec studia na FIT VUT. Současně jde o novou oblast s výrazně výzkumným a experimentálním charakterem, kde existuje jen omezené množství dostupných zdrojů a zavedených postupů.

Výsledky práce předčily má očekávání. Oceňuji také velmi vysokou úroveň anglického jazyka celé práce, která je zpracována mimořádně kvalitně a v některých částech by mohla sloužit i jako studijní materiál.

Aktivita při dokončování

Práce byla dokončena v dostatečném předstihu. I přes značný rozsah textové části jsem měl tedy příležitost si práci přečíst a mé připomínky byly zapracovány.

Publikační činnost, ocenění

Výsledky práce mají potenciál být zapracovány do publikace s IF.

Práce s literaturou

Student obdržel základní studijní materiály. Zbytek zdrojů si dohledával sám.

Aktivita během řešení, konzultace, komunikace

Student byl velmi aktivní po celou dobu řešení projektu a postup projektu byl pravidelně konzultován.

Points proposed by supervisor: 100

Grade proposed by supervisor: A

Předložená diplomová práce představuje vysoce nadstandardní a mimořádně přínosné dílo, které dalece přesahuje běžné požadavky na tento typ závěrečných prací. Student prokázal hluboké porozumění složité problematice kvantových výpočtů v kontextu bioinformatiky a chemie, úspěšně propojil teoretické znalosti s náročnou implementací a dokázal navržená řešení validovat jak na simulátorech, tak na reálném kvantovém hardwaru. Zásadním pozitivem je obrovský přesah do praxe v podobě vytvoření automatizované výpočetní pipeline a také oprava/vylepšení současných open-source softwarových nástrojů. I přes určité výhrady týkající se vyváženosti textu v rámci teoretické a praktické části textové zprávy hodnotím tuto práci jako mimořádnou a navrhuji hodnocení stupněm výborně (A) a doporučuji komisi zvážit případná další ocenění této práce.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno a práce obsahuje podstatná rozšíření

Zadání bylo splněno ve všech bodech. Student nad rámec zadání práce implementoval a ohodnotil řadu různých metod pro spuštění kvantových algoritmu na kvantovém počítači resp. simulátoru. Za zmínku také stojí oprava několika chyb v současných kvantových frameworcích (Tangelo, Qulacs) včetně implementace výkonových optimalizací na GPU. Bez těchto úprav by podle autora nebylo možné experimenty v rozumném čase vůbec dokončit.

Rozsah technické zprávy

Evaluation level: přesahuje obvyklé rozmezí

Technická zpráva významně přesahuje obvyklé rozmezí pro diplomovou práci (zhruba dvojnásobně). Převážnou část textu tvoří teoretický úvod obsahující popis problematiky kvantové mechaniky a chemie, kvantového počítání a kvantových algoritmů v oblasti výzkumu proteinů. Popis provedených experimentů je stručnější s tím, že výsledky těchto experimentů (v podobě grafů) tvoří primární část příloh. Dle mého názoru by bylo vhodnější, kdyby teoretická část byla kratší, a naopak provedené experimenty byly popsány podrobněji a doplněny např. vybranými grafy z příloh.

Prezentační úroveň technické zprávy

Jak již bylo uvedeno výše, uvítal bych kratší teoretickou část a podrobnější popis implementace a provedených experimentů. Čitelnost a srozumitelnost textu pro mě byla obtížnější, což může být způsobeno jednak samotnou problematikou, ale také velkým počtem vzorců, jejichž pochopení by si vyžádalo ještě podrobnější a rozsáhlejší popis v teoretické části. Osobně bych uvítal spíše stručnější, avšak srozumitelný popis základních myšlenek a principů v oblasti kvantové mechaniky, chemie a kvantového počítání.

80
Formální úprava technické zprávy

Po typografické stránce je text na vysoké úrovni. Podobně, po jazykové stránce není co vytknout. Práce je navíc psaná v anglickém jazyce.

90
Práce s literaturou

Práce s literaturou je na velmi vysoké úrovni. Seznam literatury obsahuje 158 zdrojů. Autor vybírá z kvalitních publikací z oblasti kvantové mechaniky a chemie, kvantového počítání a kvantových algoritmů v oblasti bioinformatiky. Všechny převzaté prvky jsou v textu řádně odlišeny a odděleny od vlastního přínosu.

100
Realizační výstup

Mezi hlavní výstupy diplomové práce patří automatizovaná softwarová pipeline, která umožňuje komplexní přípravu (fragmentaci přes MBE-2, redukci aktivního prostoru přes AVAS) a následnou kvantovou simulaci částí proteinu luciferázy. Kromě vlastní pipeline student také významně přispěl do open-source komunity skrze nově napsané komunikační rozhraní (pro hardware od IBM a výpočetní centrum LRZ), včetně implementace chybějící GPU podpory do simulátoru Qulacs.

Po výzkumné stránce pak práce přináší rozsáhlou srovnávací analýzu (benchmarking), která na reálných datech z fyzických kvantových počítačů i simulátorů dokazuje současné limity variačních (VQE) a vzorkovacích (SQD) kvantových algoritmů při řešení složitých biochemických úloh s ohledem na omezení současné NISQ éry (vysoká chybovost a dekoherence při hlubších obvodech).

100
Využitelnost výsledků

Tato vysoce nadstandardní diplomová práce není pouze kompilací dosavadních znalostí, ale přináší zcela nové poznatky a nástroje s praktickým přesahem do oblasti bioinformatiky a kvantové chemie. Autor v ní řeší výpočetně náročnou simulaci bioluminiscence (proteinu luciferázy) pomocí algoritmů VQE a SQD, přičemž experimenty realizoval jak na výkonných GPU simulátorech, tak i na reálném kvantovém hardwaru (IBM QPU, LRZ).

Zásadním vědeckým a praktickým výstupem je naprogramování automatizované pipeline pro fragmentaci molekul a přímé obohacení open-source komunity (opravy frameworku Tangelo, dodání GPU podpory do simulátoru Qulacs a tvorba nových backendů). Ačkoliv nasazení na reálných kvantových počítačích zatím naráží na limity současného zašuměného hardwaru (NISQ éra) a brání tak výpočtům složitějších obvodů, vytvořený software a benchmarky představují vysoce hodnotný základ, který je plně připraven pro využití v budoucnu s pokročilejšími kvantovými technologiemi.

Náročnost zadání

Evaluation level: značně obtížné zadání

Student měl za úkol nastudovat současný stav poznání v oblasti kvantových počítačů a jejich využití pro výpočty v bioinformatice (např. skládání proteinů, protein-proteinové interakce, dokování ligandů). Na základě získaných znalostí bylo požadováno implementovat a ověřit funkčnost vybraných algoritmů na kvantovém počítači nebo jeho simulátoru. V závěru práce bylo nutné implementované algoritmy ohodnotit a porovnat s tradičními přístupy. Zadání považuji za značně obtížné, jelikož bylo nutné nastudovat a pochopit velmi náročnou problematiku. Navazující implementace vybraných algoritmů, jejich spuštění a ohodnocení na kvantovém počítači resp. simulátoru je pak skutečnou výzvou, která svou složitostí spadá nad rámec běžných požadavků pro diplomovou práci.

Topics for thesis defence:
  1. Do jaké míry je vámi vytvořená pipeline aplikovatelné i na jiné proteiny? Popř. jaké úpravy by vyžadovala?
  2. Ve své práci uvádíte, že hybridní metoda SQD u testovaných molekul překonává čistě variační algoritmy (VQE). Vidíte budoucnost kvantové chemie spíše v těchto hybridních metodách, nebo věříte, že s příchodem lepšího hardwaru se VQE opět dostane do popředí?
Points proposed by reviewer: 98

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová