2012
Normalization of Digital Mathematics Library Content
FORMÁNEK, David, Martin LÍŠKA, Michal RŮŽIČKA and Petr SOJKABasic information
Original name
Normalization of Digital Mathematics Library Content
Name in Czech
Normalizace obsahu digitální matematické knihovny
Authors
FORMÁNEK, David (203 Czech Republic, belonging to the institution), Martin LÍŠKA (703 Slovakia, belonging to the institution), Michal RŮŽIČKA (203 Czech Republic, belonging to the institution) and Petr SOJKA (203 Czech Republic, guarantor, belonging to the institution)
Edition
Aachen, CEUR Workshop Proceedings, Volume 921, p. 91-103, 12 pp. 2012
Publisher
Neuveden
Other information
Language
English
Type of outcome
Proceedings paper
Field of Study
Informatics
Country of publisher
Germany
Confidentiality degree
is not subject to a state or trade secret
Publication form
printed version "print"
References:
RIV identification code
RIV/00216224:14330/12:00067426
Organization
Fakulta informatiky – Repository – Repository
ISSN
Keywords (in Czech)
normalizace MathML; kanonizace; digitálním matematické knihovny; DML; presentation MathML
Keywords in English
MathML normalization; canonicalization; digital mathematics libraries; DML; presentation MathML
Links
LA09016, research and development project. 250503, interní kód Repo.
Changed: 1/9/2020 12:34, RNDr. Daniel Jakubík
V originále
Paper discusses the needs for data normalization in a Digital Mathematics Library (DML). Specifically, emphasis is given to canonicalizing formulae encoded in Presentation MathML notation which starts to be available in several DMLs and is used by DML applications. This is a prerequisite for advanced processing – namely math enabled fulltext searching or semantic filtering and automated classification. Different sources of MathML and their specifics are described. Several use cases of possible formulae canonicalization transformations are listed and discussed in detail. Findings are finally concluded and a design of a to-be-developed canonicalization tool is outlined.
In Czech
V tomto článku je rozebrána potřeba normalizace dat v digitální matematické knihovně (DML). Zejména je kladen důraz na kanonizaci formulí zapsaných v Presentation MathML, které jsou dostupné v různých digitálních matematických knihovnách a toto značkování je užíváno různými nástroji v této oblasti užívanými. Normalizace je předpokladem pro pokročilé zpracování, jmenovitě plnotextové vyhledávání s podporou hledání matematiky nebo sémantickou filtraci a automatické třídění dokumentů. V článků jsou popsány různé zdroje, z nich může MathML zápis pocházet, a jsou popsána jejich specifika. Popsáno je také několik příkladů možných kanonizačních transformací, kterou jsou shrnuty v návrhu normalizačního nástroje, který bude vyvinut.