D
2013
A learner corpus of Czech: Current state and future directions.
ŠKODOVÁ, Svatava; Barbora ŠTINDLOVÁ; Alexandr ROSEN a Jiří HANA
Základní údaje
Originální název
A learner corpus of Czech: Current state and future directions.
Autoři
ŠKODOVÁ, Svatava (203 Česká republika, domácí); Barbora ŠTINDLOVÁ (203 Česká republika, domácí); Alexandr ROSEN (203 Česká republika) a Jiří HANA (203 Česká republika)
Vydání
Louvain-la-Neuve, Twenty Years of Learner Corpus Research: Looking back, Moving ahead. Corpora and Language in Use – Proceedings 1, od s. 435-446, 12 s. 2013
Nakladatel
Presses universitaires de Louvain
Další údaje
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/46747885:24510/13:#0001080
Organizace
Fakulta přírodovědně-humanitní a pedagogická – Technická univerzita v Liberci – Repozitář
Klíčová slova anglicky
multi-level annotation
V originále
The paper describes CzeSL, a learner corpus of Czech, together with basic properties of its design. It starts with a brief introduction of the project within the context of AKCES, a programme addressing Czech acquisition corpora; in connection with the programme we are also concerned with groups of respondents, including differencies due to their L1; further we comment on the choice of sociocultural metadata recorded with each text and related both to the learner and the text production task. Next we describe the intended uses of CzeSL. The main parts of the text deal with transcription and annotation. We explain the issues involved in transcrition of the handwritten texts and present the concept of a multi-level annotation scheme including taxonomy of captured errors. We conclude by mentioning results from an evaluation of the error annotation and presenting plans for future research.
Zobrazeno: 28. 9. 2025 22:49