Bachelor's Thesis

Tree trunk detection and recognition in images

Final Thesis 3.4 MB Appendix 418.54 kB

Author of thesis: Ing. Filip Šalomon

Acad. year: 2022/2023

Supervisor: Mgr. Jana Procházková, Ph.D.

Reviewer: Mgr. Jana Hoderová, Ph.D.

Abstract:

This thesis deals with detection of circular shapes in images -- forest scan cross-sections. Freeman chain code algorithm is used for image segmentation. Ransac (Random Sample Consensus) algorithm is used for diameter measurement. The designed algorithm is tested on data from Žofín Forest.

Keywords:

Ransac, Freeman chain code, image analysis, convolution, morphological operations

Date of defence

13.06.2023

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval svou práci, byly přečteny posudky školitele a oponenta. Otázky oponenta zodpovzeny v rámci prezentace. Doc. Vašík: Vztah reflexe a dilatace v rámci postupu. Proběhla konstuktivní diskuse. Doc. Vašík: Výpočetní náročnost v případě zvýšení rozlišení. Je to možné a není nutné, aby tím byla zvýšena výpočetní náročnost. Morfologické operace byla slepá ulička.

Language of thesis

Czech

Faculty

Department

Study programme

Mathematical Engineering (B-MAI-P)

Composition of Committee

prof. RNDr. Miroslav Doupovec, CSc., dr. h. c. (předseda)
doc. Mgr. Petr Vašík, Ph.D. (místopředseda)
Ing. Josef Bednář, Ph.D. (člen)
Ing. Mgr. Eva Mrázková, Ph.D. (člen)
RNDr. Radovan Potůček, Ph.D. (člen)

Supervisor’s report
Mgr. Jana Procházková, Ph.D.

Student vypracoval velice pěknou aplikační práci týkající se měření pozice a velikosti stromů v lese. Ta se měří ve výšce 130 cm jako poloměr řezu. Jedná se tedy o detekci kružnic, jejich středů a poloměrů. Práce se skládá z úvodní teoretické části, kde jsou představeny možné metody, které lze použít – konvoluci, morfologické operace a dále iterační algoritmus Ransac. V práci vysvětluje úskalí jednotlivých metod a možnosti jejich použití. Jako nejvhodnější je zvolena detekce kružnic pomocí algoritmu Ransac. Student v práci vysvětluje obecný popis a také aplikaci na hledání kružnic. Jako segmentační algoritmus by zvolen Freemanův řetězec.

Nejobtížnější částí bylo odstranění šumu (větve, listy) při zachování přesnosti detekce. Bylo nutné nastavit optimálně dva parametry, první – minimální poměr inlierů ku outlierům – a druhý – maximální vzdálenost pixelu od modelu – tak, aby se maximalizoval počet nalezených stromů a minimalizoval počet chybně nalezených oblastí šumu. Navržený postup student velmi pečlivě otestoval a aplikoval na reálná data ze Žofínského pralesa. Práce je velmi čtivá, přehledná a neobsahuje chyby. Vzhledem k povaze vstupních dat (rozlišení řezu v pixelech), nebylo možné detekovat stromy s menšími poloměry. To však otvírá možnost pokračování v diplomové práci. Bakalant pravidelně docházel na konzultace, pracoval velmi samostatně. Práce splnila zadání a doporučuji k obhajobě s hodnocením A.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací B
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: A

Reviewer’s report
Mgr. Jana Hoderová, Ph.D.

Bakalářská práce Filipa Šalomona je členěna na teoretickou kapitolu 2, ve které zavádí pojmy a praktické kapitoly 3 a 4, ve kterých se věnuje implementaci a testování svého programu. Přílohou je  fungující program s návodem k použití a jeden testovací obrázek.

Práce je velmi čtivá, je jasně zřetelný myšlenkový vývoj autora při studování dané tématiky. Oceňuji například rozbor morfologických operací v sekci 2.3 a následně i zdůvodnění, proč je není vhodné aplikovat na řešený problém v sekci 3.2

V práci je několik nepřesností, které při čtení jinak příjemně plynoucího textu čtenáře zarazí:
Vztah (2.2.2) není zakomponován do textu. Věta pod ním a popisek obrázku 5 dokonce mluví o rovnici, přestože jde o 3 samostatné matice.
sekce 2.5 Ransac: V úvodním odstavci je velmi stručně řečeno, že to „…je metoda zpracování dat, přesněji proložení experimentálních dat teoretickým modelem…“, popis algoritmu začíná slovy „Mějme model M,…“ ale není vysvětleno, co si pod takovým modelem představit. Čtenář bez předchozí znalosti algoritmu Ransac až do příkladu uvedeného v druhé polovině stránky netuší, co může být vstupem algoritmu. Doporučovala bych podrobnější úvodní odstavec s bohatším popisem motivace k zavedení algoritmu Ransac.
sekce 3.1. Úvodní obrázek kapitoly, obrázek 14 je příkladem point-cloud, tedy mračna bodů. V textu pak píšete: „Výstupem této metody je point-cloud (česky mračno bodů, obrázek 14), který je nutné dále zpracovat. Pro účely této práce vyžadujeme obraz, proto point-cloudem vedeme řez. Řez je ve výšce 130 cm nad zemí.“ Váš popis je zavádějící, protože se řez nevztahuje na právě zmíněný obrázek 14. Ani formulace, že: …“vyžadujeme obraz…“ není dostatečně návodná.

V kapitolách 3 a 4 je z textu cítit, že se autor do tématiky hluboce ponořil, jednotlivé kroky algoritmu do detailu promyslel a bohatě komentoval, což je hlavním přínosem této práce. Je zřejmé, že téma by se dalo rozvinout a tento vhled do problematiky zpracování obrazů je výborným odrazovým můstkem.

Práce je velmi pěkná a i přes uvedené připomínky ji hodnotím známkou A/výborně.

Dodatek: V textu je pár překlepů, drobností a nedostatků, které s přibývajícími zkušenostmi autor jistě v budoucnu nebude opakovat.
str. 12, řádek 8. shora překlep: …základ tato práce.
Definice 2.1.2 překlep: …𝑓 ∈ {0, 1, . . . 𝜔 − 1}
Definice 2.1.3 nepřesná formulace barevného obrazu: …se stejnými hodnotami 𝑥, 𝑦,omega.
Je tím myšleno s hodnotami x,y ze stejných množin 𝑥 ∈ {1, 2, . . .𝑚}, 𝑦 ∈ {1, 2, . . . 𝑛}?
Obrázek 3: Binární obraz. Jen poznámka, že by bylo vhodné uvést v popisku hodnotu prahu t, jde-li o prahování konkrétního obrázku 2.
vztah (2.1.6): …kde a je prvkem…by mělo být precizněji formulováno jako a_ij s vymezením i, j.
str. 26: V textu se odkazujete na číslo strany 17, kde je konvoluce. Pro příště doporučuji využít křížových odkazů na příslušné definice, sekce, atd. Později jsem náhodně zjistila, že nejen uvedené číslo strany funguje jako odkaz a skočí na příslušnou stranu. Proč není funkčnost odkazů nějak graficky zvýrazněna?
str. 31 Náhodný výběr: Uvedení zdroje [10] není úplně korektně zapsáno. Zápisem: „V jazyku C++ je například funkce rand. [10]“ říkáte, že věta „V jazyku C++ je například funkce rand.“ byla převzata z [10]. Korektní zápis by měl být: „V jazyku C++ je například funkce rand, [10]
str. 31 3. řádek zdola překlep: Rovnice (3.4.4) je pro neznámé a,b,r lineární… (místo r má být c)
str. 32 překlep: 𝑡 = 0.7 V češtině píšeme desetinnou čárku, je to s anglickou desetinnou tečkou na více místech v práci
Celkově se mi nezdá optimální rozmístění obrázků vzhledem k textu. Dost často (obrázek 14, 17, …) jsou umístěny dříve, než je o nich zmínka v textu. Zdá se mi, že jsou bez nějakého hlubšího důvodu uměle umístěny do horní části stránek.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací B
Topics for thesis defence:
  1. Na str. 21 v části hledání hraničního pixelu popisujete procházení obrazu cituji:„…zleva doprava a shora dolů…“. Kdy změníte směr na shora dolů?
  2. Shrňte, jak pracuje Freemanův řetězec zavedený v sekci 3.3 v případě, že je obrys stromu přerušený, tedy že by v 8-okolí posledně nalezeného pixelu žádný další neležel (viz například obrázek 22)? Jak jste v tomto případě vyhodnotil, že jde o kmen stromu?
  3. Je pojem reflexe (zrcadlení) zavedený Definicí 2.3.1 jednoznačný? Na obrázku 6 je ukázka reflexe ve smyslu vaší poznámky za definicí 2.3.1, jde o středovou souměrnost. Ovšem v softwarech se pojem reflexe (zrcadlení) používán jinak, jako souměrnost osová.

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová