Podrobný výpis o publikaci
2018
Annotated Corpus of Czech Case Law for Reference Recognition Tasks
HARAŠTA, Jakub, Jaromír ŠAVELKA, František KASL, Adéla KOTKOVÁ, Pavel LOUTOCKÝ et. al.Základní údaje
Originální název
Annotated Corpus of Czech Case Law for Reference Recognition Tasks
Autoři
HARAŠTA, Jakub (203 Česká republika, domácí), Jaromír ŠAVELKA (203 Česká republika), František KASL (203 Česká republika, domácí), Adéla KOTKOVÁ (203 Česká republika, domácí), Pavel LOUTOCKÝ (203 Česká republika, domácí), Jakub MÍŠEK (203 Česká republika, domácí), Daniela PROCHÁZKOVÁ (203 Česká republika, domácí), Helena PULLMANNOVÁ (203 Česká republika, domácí), Petr SEMENIŠÍN (203 Česká republika, domácí), Tamara ŠEJNOVÁ (203 Česká republika, domácí), Nikola ŠIMKOVÁ (703 Slovensko, domácí), Michal VOSINEK (203 Česká republika, domácí), Lucie ZAVADILOVÁ (203 Česká republika, domácí) a Jan ZIBNER (203 Česká republika, domácí)
Vydání
Cham, Text, Speech, and Dialogue: 21st International Conference, od s. 239-250, 12 s. 2018
Nakladatel
Springer Nature Switzerland AG
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Stát vydavatele
Švýcarsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Kód RIV
RIV/00216224:14220/18:00101155
Organizace
Právnická fakulta – Masarykova univerzita – Repozitář
ISBN
978-3-030-00793-5
ISSN
UT WoS
000611532300026
Klíčová slova česky
rozpoznávání referencí; dataset; právní texty; manuální anotace
Klíčová slova anglicky
Reference recognition; dataset; legal texts; manual annotation
Návaznosti
GA17-20645S, projekt VaV.
Změněno: 23. 3. 2021 01:44, RNDr. Daniel Jakubík
Anotace
V originále
We describe an annotated corpus of 350 decisions of Czech top-tier courts which was gathered for a project assessing the relevance of court decisions in Czech law. We describe two layers of processing of the corpus; every decision was annotated by two trained annotators and then manually adjudicated by one trained curator to solve possible disagreements between annotators. This corpus was developed as training and testing material for reference recognition tasks which will be further used for research on assessment of legal importance. However, the overall shortage of available research corpora of annotated legal texts, particularly in Czech language, leads us to believe that other research teams may find it useful.
Přiložené soubory
http://is.muni.cz/repo/1434357/Annotated_Corpus_of_Czech_Case_Law_for_Reference_Recognition_Tasks-text.pdf
http://is.muni.cz/repo/1434357/Annotated_Corpus_of_Czech_Case_Law_for_Reference_Recognition_Tasks-dataset.zip