2012
Low-cost ontology development
GRÁC, Marek a Adam RAMBOUSEKZákladní údaje
Originální název
Low-cost ontology development
Název česky
Levný vývoj ontologie
Autoři
GRÁC, Marek (703 Slovensko, domácí) a Adam RAMBOUSEK (203 Česká republika, garant, domácí)
Vydání
Matsue, Japan, 6th International Global Wordnet Conference Proceedings, od s. 299-304, 6 s. 2012
Nakladatel
Toyohashi University of Technology
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
Informatika
Stát vydavatele
Japonsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/12:00057239
Organizace
Fakulta informatiky – Masarykova univerzita – Repozitář
ISBN
978-80-263-0244-5
Klíčová slova česky
ontologie; WordNet; anotace; VerbaLex
Klíčová slova anglicky
ontology; WordNet; annotation; VerbaLex
Návaznosti
GAP401/10/0792, projekt VaV. GA102/09/1842, projekt VaV. LC536, projekt VaV. LM2010013, projekt VaV. VF20102014003, projekt VaV.
Změněno: 9. 7. 2022 02:58, RNDr. Daniel Jakubík
V originále
In this paper, we present the project building new lexical resource -- shallow ontology derived from the corpora. The ontology should be used primarily for machine translation, syntactic parsing and word sense disambiguation. Currently, the ontology for Czech language is developed, but the methodology and tools are suitable for other languages with similar structure. Ontology is based on BushBank corpus, which improves handling of ambiguity in natural language. BushBank data and tools are application-driven, thus reducing the time and costs needed to annotate the corpora and develop new lexical resources.
Česky
V článku je představen projekt budování nového lexikálního zdroje - mělké ontologie odvozené z korpusu. Ontologie by měla být primárně použita pro strojový překlad, syntaktické parsování a dezambiguaci významu slov. V současné době probíhá tvorba ontologie pro češtinu, ale metodologie a nástroje jsou vhodné i pro další jazyky s podobnou strukturou. Ontologie je založena na korpusu BushBank, který vylepšuje práci s nejednoznačnostmi v přirozeném jazyce. Data a nástroje BushBank jsou založena na aplikacích, tím se redukuje čas a náklady potřebné k anotaci korpusu a tvorby lexikálních zdrojů.