J 2024

Hands-on Cybersecurity Training Behavior Data for Process Mining

OŠLEJŠEK, Radek; Martin MACÁK a Karolína DOČKALOVÁ BURSKÁ

Základní údaje

Originální název

Hands-on Cybersecurity Training Behavior Data for Process Mining

Autoři

OŠLEJŠEK, Radek; Martin MACÁK a Karolína DOČKALOVÁ BURSKÁ

Vydání

Data in Brief, Amsterdam, Elsevier, 2024, 2352-3409

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Stát vydavatele

Nizozemské království

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Organizace

Fakulta informatiky – Masarykova univerzita – Repozitář

UT WoS

001140661000001

EID Scopus

2-s2.0-85185848046

Klíčová slova česky

kybernetická bezpečnost; praktická cvičení; procesní analýza; data o chování

Klíčová slova anglicky

cybersecurity training; process mining; learning analytics; behavioral data collection

Návaznosti

MUNI/A/1389/2022, interní kód Repo.
Změněno: 5. 3. 2024 03:59, RNDr. Daniel Jakubík

Anotace

V originále

The research on using process mining in learning analytics of cybersecurity exercises relies on datasets that reflect the real behavior of trainees. Although modern cyber ranges, in which training sessions are organized, can collect behavioral data in the form of event logs, the organization of such exercises is laborious. Moreover, the collected raw data has to be processed and transformed into a specific format required by process mining techniques. We present two datasets with slightly different characteristics. While the first exercise with 52 participants was not limited in time, the second supervised exercise with 42 trainees lasted two hours. Also, the cybersecurity tasks were slightly different. A total of 11757 events were collected. Of these, 3597 were training progress events, 5669 were Bash commands, and 2491 were Metasploit commands. Joint CSV files distilled from the raw event data can be used as input for existing process mining tools.

Česky

Ačkoli moderní kybernetické simulátory (angl. cyber ranges), v nichž se pořádají praktická bezpečnostní cvičení, mohou shromažďovat data o chování účastníků v podobě záznamů událostí, organizace takových cvičení je pracná. Použití těchto dat pro analýzu cvičení prostřednictvím technik modelování a dolování procesů navíc vyžaduje shromážděná surová data zpracovat a transformovat do specifického formátu. V článku představujeme předzpracované dvě datové sady vhodné pro procesní analýzu chování účastníků. Zatímco první cvičení s 52 účastníky nebylo časově omezeno, druhé cvičení se 42 účastníky bylo časově omezeno na dvě hodiny, což může chování ovlivnit. Také úlohy kybernetické bezpečnosti byly mírně odlišné. Celkem bylo shromážděno 11757 událostí. Z toho 3597 událostí zachycuje celkový průběh výcviku, 5669 událostí jsou příkazy Bash a 2491 příkazy Metasploit použité při řešení bezpečnostních úkolů.

Přiložené soubory