D 2012

Low-cost ontology development

GRÁC, Marek a Adam RAMBOUSEK

Základní údaje

Originální název

Low-cost ontology development

Název česky

Levný vývoj ontologie

Autoři

GRÁC, Marek (703 Slovensko, domácí) a Adam RAMBOUSEK (203 Česká republika, garant, domácí)

Vydání

Matsue, Japan, 6th International Global Wordnet Conference Proceedings, od s. 299-304, 6 s. 2012

Nakladatel

Toyohashi University of Technology

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

Informatika

Stát vydavatele

Japonsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/12:00057239

Organizace

Fakulta informatiky – Masarykova univerzita – Repozitář

ISBN

978-80-263-0244-5

Klíčová slova česky

ontologie; WordNet; anotace; VerbaLex

Klíčová slova anglicky

ontology; WordNet; annotation; VerbaLex

Návaznosti

GAP401/10/0792, projekt VaV. GA102/09/1842, projekt VaV. LC536, projekt VaV. LM2010013, projekt VaV. VF20102014003, projekt VaV.
Změněno: 9. 7. 2022 02:58, RNDr. Daniel Jakubík

Anotace

V originále

In this paper, we present the project building new lexical resource -- shallow ontology derived from the corpora. The ontology should be used primarily for machine translation, syntactic parsing and word sense disambiguation. Currently, the ontology for Czech language is developed, but the methodology and tools are suitable for other languages with similar structure. Ontology is based on BushBank corpus, which improves handling of ambiguity in natural language. BushBank data and tools are application-driven, thus reducing the time and costs needed to annotate the corpora and develop new lexical resources.

Česky

V článku je představen projekt budování nového lexikálního zdroje - mělké ontologie odvozené z korpusu. Ontologie by měla být primárně použita pro strojový překlad, syntaktické parsování a dezambiguaci významu slov. V současné době probíhá tvorba ontologie pro češtinu, ale metodologie a nástroje jsou vhodné i pro další jazyky s podobnou strukturou. Ontologie je založena na korpusu BushBank, který vylepšuje práci s nejednoznačnostmi v přirozeném jazyce. Data a nástroje BushBank jsou založena na aplikacích, tím se redukuje čas a náklady potřebné k anotaci korpusu a tvorby lexikálních zdrojů.

Přiložené soubory