D 2012

Normalization of Digital Mathematics Library Content

FORMÁNEK, David, Martin LÍŠKA, Michal RŮŽIČKA a Petr SOJKA

Základní údaje

Originální název

Normalization of Digital Mathematics Library Content

Název česky

Normalizace obsahu digitální matematické knihovny

Autoři

FORMÁNEK, David (203 Česká republika, domácí), Martin LÍŠKA (703 Slovensko, domácí), Michal RŮŽIČKA (203 Česká republika, domácí) a Petr SOJKA (203 Česká republika, garant, domácí)

Vydání

Aachen, CEUR Workshop Proceedings, Volume 921, od s. 91-103, 12 s. 2012

Nakladatel

Neuveden

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

Informatika

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/12:00067426

Organizace

Fakulta informatiky – Masarykova univerzita – Repozitář

ISSN

Klíčová slova česky

normalizace MathML; kanonizace; digitálním matematické knihovny; DML; presentation MathML

Klíčová slova anglicky

MathML normalization; canonicalization; digital mathematics libraries; DML; presentation MathML

Návaznosti

LA09016, projekt VaV. 250503, interní kód Repo.
Změněno: 1. 9. 2020 12:34, RNDr. Daniel Jakubík

Anotace

V originále

Paper discusses the needs for data normalization in a Digital Mathematics Library (DML). Specifically, emphasis is given to canonicalizing formulae encoded in Presentation MathML notation which starts to be available in several DMLs and is used by DML applications. This is a prerequisite for advanced processing – namely math enabled fulltext searching or semantic filtering and automated classification. Different sources of MathML and their specifics are described. Several use cases of possible formulae canonicalization transformations are listed and discussed in detail. Findings are finally concluded and a design of a to-be-developed canonicalization tool is outlined.

Česky

V tomto článku je rozebrána potřeba normalizace dat v digitální matematické knihovně (DML). Zejména je kladen důraz na kanonizaci formulí zapsaných v Presentation MathML, které jsou dostupné v různých digitálních matematických knihovnách a toto značkování je užíváno různými nástroji v této oblasti užívanými. Normalizace je předpokladem pro pokročilé zpracování, jmenovitě plnotextové vyhledávání s podporou hledání matematiky nebo sémantickou filtraci a automatické třídění dokumentů. V článků jsou popsány různé zdroje, z nich může MathML zápis pocházet, a jsou popsána jejich specifika. Popsáno je také několik příkladů možných kanonizačních transformací, kterou jsou shrnuty v návrhu normalizačního nástroje, který bude vyvinut.

Přiložené soubory