D 2019

An Algorithm for Message Type Discovery in Unstructured Log Data

TOVARŇÁK, Daniel

Základní údaje

Originální název

An Algorithm for Message Type Discovery in Unstructured Log Data

Autoři

TOVARŇÁK, Daniel

Vydání

Prague, Proceedings of the 14th International Conference on Software Technologies - Volume 1: ICSOFT, od s. 665-676, 12 s. 2019

Nakladatel

SciTePress

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Stát vydavatele

Portugalsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

URL, URL

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14610/19:00110676

Organizace

Ústav výpočetní techniky – Masarykova univerzita – Repozitář

ISBN

978-989-758-379-7

ISSN

EID Scopus

2-s2.0-85073116482

Klíčová slova anglicky

log abstraction; message type discovery; log management; logging; unstructured data

Návaznosti

EF16_019/0000822, projekt VaV.
Změněno: 9. 9. 2020 05:52, RNDr. Daniel Jakubík

Anotace

V originále

Log message abstraction is a common way of dealing with the unstructured nature of log data. It refers to the separation of static and dynamic part of the log message, so that both parts can be accessed independently, allowing the message to be abstracted into a more structured representation. To facilitate this task, so-called message types and the corresponding matching patterns must be first discovered, and only after that can be this pattern-set used to pattern-match individual log messages in order to extract dynamic information and impose some structure on them. Because the manual discovery of message types is a tiresome and error-prone process, we have focused our research on data mining algorithms that are able to discover message types in already generated log data. Since we have identified several deficiencies of the existing algorithms, which are limiting their capabilities, we propose a novel algorithm for message type discovery addressing these deficiencies.
Zobrazeno: 6. 5. 2026 22:48