bakalářská práce

Detekce a rozpoznávání kmene stromů v obrazech

Text práce 3.4 MB Příloha 418.54 kB

Autor práce: Ing. Filip Šalomon

Ak. rok: 2022/2023

Vedoucí: Mgr. Jana Procházková, Ph.D.

Oponent: Mgr. Jana Hoderová, Ph.D.

Abstrakt:

Tato práce se zabývá detekcí kruhovitých tvarů v obrazech – řezech skenů lesa. Pro segmentaci obrazu je použit algoritmus Freemanova řetězce. Pro měření průměrů je použit algoritmus Ransac (Random Sample Consensus). Navržený algoritmus je testován na datech z Žofínského pralesa.

Klíčová slova:

Ransac, Freemanův řetězec, analýza obrazu, konvoluce, morfologické operace

Termín obhajoby

13.06.2023

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

A

Průběh obhajoby

Student prezentoval svou práci, byly přečteny posudky školitele a oponenta. Otázky oponenta zodpovzeny v rámci prezentace. Doc. Vašík: Vztah reflexe a dilatace v rámci postupu. Proběhla konstuktivní diskuse. Doc. Vašík: Výpočetní náročnost v případě zvýšení rozlišení. Je to možné a není nutné, aby tím byla zvýšena výpočetní náročnost. Morfologické operace byla slepá ulička.

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Matematické inženýrství (B-MAI-P)

Složení komise

prof. RNDr. Miroslav Doupovec, CSc., dr. h. c. (předseda)
doc. Mgr. Petr Vašík, Ph.D. (místopředseda)
Ing. Josef Bednář, Ph.D. (člen)
Ing. Mgr. Eva Mrázková, Ph.D. (člen)
RNDr. Radovan Potůček, Ph.D. (člen)

Student vypracoval velice pěknou aplikační práci týkající se měření pozice a velikosti stromů v lese. Ta se měří ve výšce 130 cm jako poloměr řezu. Jedná se tedy o detekci kružnic, jejich středů a poloměrů. Práce se skládá z úvodní teoretické části, kde jsou představeny možné metody, které lze použít – konvoluci, morfologické operace a dále iterační algoritmus Ransac. V práci vysvětluje úskalí jednotlivých metod a možnosti jejich použití. Jako nejvhodnější je zvolena detekce kružnic pomocí algoritmu Ransac. Student v práci vysvětluje obecný popis a také aplikaci na hledání kružnic. Jako segmentační algoritmus by zvolen Freemanův řetězec.

Nejobtížnější částí bylo odstranění šumu (větve, listy) při zachování přesnosti detekce. Bylo nutné nastavit optimálně dva parametry, první – minimální poměr inlierů ku outlierům – a druhý – maximální vzdálenost pixelu od modelu – tak, aby se maximalizoval počet nalezených stromů a minimalizoval počet chybně nalezených oblastí šumu. Navržený postup student velmi pečlivě otestoval a aplikoval na reálná data ze Žofínského pralesa. Práce je velmi čtivá, přehledná a neobsahuje chyby. Vzhledem k povaze vstupních dat (rozlišení řezu v pixelech), nebylo možné detekovat stromy s menšími poloměry. To však otvírá možnost pokračování v diplomové práci. Bakalant pravidelně docházel na konzultace, pracoval velmi samostatně. Práce splnila zadání a doporučuji k obhajobě s hodnocením A.
Kritérium hodnocení Známka
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací B
Samostatnost studenta při zpracování tématu A

Známka navržená vedoucím: A

Bakalářská práce Filipa Šalomona je členěna na teoretickou kapitolu 2, ve které zavádí pojmy a praktické kapitoly 3 a 4, ve kterých se věnuje implementaci a testování svého programu. Přílohou je  fungující program s návodem k použití a jeden testovací obrázek.

Práce je velmi čtivá, je jasně zřetelný myšlenkový vývoj autora při studování dané tématiky. Oceňuji například rozbor morfologických operací v sekci 2.3 a následně i zdůvodnění, proč je není vhodné aplikovat na řešený problém v sekci 3.2

V práci je několik nepřesností, které při čtení jinak příjemně plynoucího textu čtenáře zarazí:
Vztah (2.2.2) není zakomponován do textu. Věta pod ním a popisek obrázku 5 dokonce mluví o rovnici, přestože jde o 3 samostatné matice.
sekce 2.5 Ransac: V úvodním odstavci je velmi stručně řečeno, že to „…je metoda zpracování dat, přesněji proložení experimentálních dat teoretickým modelem…“, popis algoritmu začíná slovy „Mějme model M,…“ ale není vysvětleno, co si pod takovým modelem představit. Čtenář bez předchozí znalosti algoritmu Ransac až do příkladu uvedeného v druhé polovině stránky netuší, co může být vstupem algoritmu. Doporučovala bych podrobnější úvodní odstavec s bohatším popisem motivace k zavedení algoritmu Ransac.
sekce 3.1. Úvodní obrázek kapitoly, obrázek 14 je příkladem point-cloud, tedy mračna bodů. V textu pak píšete: „Výstupem této metody je point-cloud (česky mračno bodů, obrázek 14), který je nutné dále zpracovat. Pro účely této práce vyžadujeme obraz, proto point-cloudem vedeme řez. Řez je ve výšce 130 cm nad zemí.“ Váš popis je zavádějící, protože se řez nevztahuje na právě zmíněný obrázek 14. Ani formulace, že: …“vyžadujeme obraz…“ není dostatečně návodná.

V kapitolách 3 a 4 je z textu cítit, že se autor do tématiky hluboce ponořil, jednotlivé kroky algoritmu do detailu promyslel a bohatě komentoval, což je hlavním přínosem této práce. Je zřejmé, že téma by se dalo rozvinout a tento vhled do problematiky zpracování obrazů je výborným odrazovým můstkem.

Práce je velmi pěkná a i přes uvedené připomínky ji hodnotím známkou A/výborně.

Dodatek: V textu je pár překlepů, drobností a nedostatků, které s přibývajícími zkušenostmi autor jistě v budoucnu nebude opakovat.
str. 12, řádek 8. shora překlep: …základ tato práce.
Definice 2.1.2 překlep: …𝑓 ∈ {0, 1, . . . 𝜔 − 1}
Definice 2.1.3 nepřesná formulace barevného obrazu: …se stejnými hodnotami 𝑥, 𝑦,omega.
Je tím myšleno s hodnotami x,y ze stejných množin 𝑥 ∈ {1, 2, . . .𝑚}, 𝑦 ∈ {1, 2, . . . 𝑛}?
Obrázek 3: Binární obraz. Jen poznámka, že by bylo vhodné uvést v popisku hodnotu prahu t, jde-li o prahování konkrétního obrázku 2.
vztah (2.1.6): …kde a je prvkem…by mělo být precizněji formulováno jako a_ij s vymezením i, j.
str. 26: V textu se odkazujete na číslo strany 17, kde je konvoluce. Pro příště doporučuji využít křížových odkazů na příslušné definice, sekce, atd. Později jsem náhodně zjistila, že nejen uvedené číslo strany funguje jako odkaz a skočí na příslušnou stranu. Proč není funkčnost odkazů nějak graficky zvýrazněna?
str. 31 Náhodný výběr: Uvedení zdroje [10] není úplně korektně zapsáno. Zápisem: „V jazyku C++ je například funkce rand. [10]“ říkáte, že věta „V jazyku C++ je například funkce rand.“ byla převzata z [10]. Korektní zápis by měl být: „V jazyku C++ je například funkce rand, [10]
str. 31 3. řádek zdola překlep: Rovnice (3.4.4) je pro neznámé a,b,r lineární… (místo r má být c)
str. 32 překlep: 𝑡 = 0.7 V češtině píšeme desetinnou čárku, je to s anglickou desetinnou tečkou na více místech v práci
Celkově se mi nezdá optimální rozmístění obrázků vzhledem k textu. Dost často (obrázek 14, 17, …) jsou umístěny dříve, než je o nich zmínka v textu. Zdá se mi, že jsou bez nějakého hlubšího důvodu uměle umístěny do horní části stránek.
Kritérium hodnocení Známka
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací B
Otázky k obhajobě:
  1. Na str. 21 v části hledání hraničního pixelu popisujete procházení obrazu cituji:„…zleva doprava a shora dolů…“. Kdy změníte směr na shora dolů?
  2. Shrňte, jak pracuje Freemanův řetězec zavedený v sekci 3.3 v případě, že je obrys stromu přerušený, tedy že by v 8-okolí posledně nalezeného pixelu žádný další neležel (viz například obrázek 22)? Jak jste v tomto případě vyhodnotil, že jde o kmen stromu?
  3. Je pojem reflexe (zrcadlení) zavedený Definicí 2.3.1 jednoznačný? Na obrázku 6 je ukázka reflexe ve smyslu vaší poznámky za definicí 2.3.1, jde o středovou souměrnost. Ovšem v softwarech se pojem reflexe (zrcadlení) používán jinak, jako souměrnost osová.

Známka navržená oponentem: A

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová