D 2018

Annotated Corpus of Czech Case Law for Reference Recognition Tasks

HARAŠTA, Jakub, Jaromír ŠAVELKA, František KASL, Adéla KOTKOVÁ, Pavel LOUTOCKÝ et. al.

Základní údaje

Originální název

Annotated Corpus of Czech Case Law for Reference Recognition Tasks

Autoři

HARAŠTA, Jakub (203 Česká republika, domácí), Jaromír ŠAVELKA (203 Česká republika), František KASL (203 Česká republika, domácí), Adéla KOTKOVÁ (203 Česká republika, domácí), Pavel LOUTOCKÝ (203 Česká republika, domácí), Jakub MÍŠEK (203 Česká republika, domácí), Daniela PROCHÁZKOVÁ (203 Česká republika, domácí), Helena PULLMANNOVÁ (203 Česká republika, domácí), Petr SEMENIŠÍN (203 Česká republika, domácí), Tamara ŠEJNOVÁ (203 Česká republika, domácí), Nikola ŠIMKOVÁ (703 Slovensko, domácí), Michal VOSINEK (203 Česká republika, domácí), Lucie ZAVADILOVÁ (203 Česká republika, domácí) a Jan ZIBNER (203 Česká republika, domácí)

Vydání

Cham, Text, Speech, and Dialogue: 21st International Conference, od s. 239-250, 12 s. 2018

Nakladatel

Springer Nature Switzerland AG

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Stát vydavatele

Švýcarsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

URL URL

Kód RIV

RIV/00216224:14220/18:00101155

Organizace

Právnická fakulta – Masarykova univerzita – Repozitář

ISBN

978-3-030-00793-5

ISSN

UT WoS

000611532300026

Klíčová slova česky

rozpoznávání referencí; dataset; právní texty; manuální anotace

Klíčová slova anglicky

Reference recognition; dataset; legal texts; manual annotation

Návaznosti

GA17-20645S, projekt VaV.
Změněno: 23. 3. 2021 01:44, RNDr. Daniel Jakubík

Anotace

V originále

We describe an annotated corpus of 350 decisions of Czech top-tier courts which was gathered for a project assessing the relevance of court decisions in Czech law. We describe two layers of processing of the corpus; every decision was annotated by two trained annotators and then manually adjudicated by one trained curator to solve possible disagreements between annotators. This corpus was developed as training and testing material for reference recognition tasks which will be further used for research on assessment of legal importance. However, the overall shortage of available research corpora of annotated legal texts, particularly in Czech language, leads us to believe that other research teams may find it useful.
Zobrazeno: 20. 10. 2024 00:25