Dissertation Topics

Využití hlubokého učení pro sémantickou segmentaci a rozpoznávání struktury dokumentů

Code
P0732D260027-11155-00240
Departments
Department of Geomatics
Study program
P0732D260027 – Geodézie a kartografie
Annotation

Téma se zaměřuje na výzkum a vývoj pokročilých metod hlubokého učení pro sémantickou segmentaci a rozpoznávání struktury a obsahu obrazových a textových dokumentů (mapových výstupů, technických podkladů a dokumentací). Pro řešení budou využity modely založené na architektuře Transformer (popř. jiné vhodné), které dokážou efektivně kombinovat vizuální a textové příznaky. Pozornost bude věnována sémantické segmentaci, jejímž cílem je klasifikovat jednotlivé komponenty dokumentu, jako jsou nadpisy, odstavce, obrázky, grafy či tabulky. Následně budou modelovány vztahy mezi těmito prvky pro stanovení vzájemné hierarchie. Důležitou součástí práce bude vytvoření anotovaných datových sad potřebných pro trénování robustních modelů s ohledem na vysokou variabilitu rozvržení dokumentů a nestandardní formátování. Výstupem bude framework schopný převádět dokumenty do strojově srozumitelné reprezentace. Výsledky práce najdou široké uplatnění v systémech pro digitalizaci historických archivů či při automatizovaném zpracování dokumentace katastru nemovitostí.