D 2018

MIaS: Math-Aware Retrieval in Digital Mathematical Libraries

SOJKA, Petr; Michal RŮŽIČKA a Vít NOVOTNÝ

Základní údaje

Originální název

MIaS: Math-Aware Retrieval in Digital Mathematical Libraries

Autoři

SOJKA, Petr; Michal RŮŽIČKA a Vít NOVOTNÝ

Vydání

Torino, Italy, Proceedings of the 27th ACM International Conference on Information and Knowledge Management (CIKM '18), od s. 1923-1926, 4 s. 2018

Nakladatel

Association for Computing Machinery

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

URL, URL

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/18:00100679

Organizace

Fakulta informatiky – Masarykova univerzita – Repozitář

ISBN

978-1-4503-6014-2

UT WoS

000455712300261

EID Scopus

2-s2.0-85058006184

Klíčová slova česky

vyhledávání matematiky; DML; EuDML; digitální matematické knihovny

Klíčová slova anglicky

Math Information Retrieval; DML; EuDML; Digital Mathematical Libraries

Návaznosti

MUNI/A/1213/2017, interní kód Repo. 1ET200190513, projekt VaV. 250503, interní kód Repo.
Změněno: 6. 9. 2020 04:24, RNDr. Daniel Jakubík

Anotace

V originále

Digital mathematical libraries (DMLs) such as arXiv, Numdam, and EuDML contain mainly documents from STEM fields, where mathematical formulae are often more important than text for understanding. Conventional information retrieval (IR) systems are unable to represent formulae and they are therefore ill-suited for math information retrieval (MIR). To fill the gap, we have developed, and open-sourced the MIaS MIR system. MIaS is based on the full-text search engine Apache Lucene. On top of text retrieval, MIaS also incorporates a set of tools for preprocessing mathematical formulae. We describe the design of the system and present speed, and quality evaluation results. We show that MIaS is both efficient, and effective, as evidenced by our victory in the NTCIR-11 Math-2 task.
Zobrazeno: 6. 5. 2026 19:20