D 2013

A learner corpus of Czech: Current state and future directions.

ŠKODOVÁ, Svatava; Barbora ŠTINDLOVÁ; Alexandr ROSEN a Jiří HANA

Základní údaje

Originální název

A learner corpus of Czech: Current state and future directions.

Autoři

ŠKODOVÁ, Svatava (203 Česká republika, domácí); Barbora ŠTINDLOVÁ (203 Česká republika, domácí); Alexandr ROSEN (203 Česká republika) a Jiří HANA (203 Česká republika)

Vydání

Louvain-la-Neuve, Twenty Years of Learner Corpus Research: Looking back, Moving ahead. Corpora and Language in Use – Proceedings 1, od s. 435-446, 12 s. 2013

Nakladatel

Presses universitaires de Louvain

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/46747885:24510/13:#0001080

Organizace

Fakulta přírodovědně-humanitní a pedagogická – Technická univerzita v Liberci – Repozitář

ISBN

978-2-87558-199-0

Klíčová slova anglicky

multi-level annotation
Změněno: 10. 3. 2015 13:50, RNDr. Daniel Jakubík

Anotace

V originále

The paper describes CzeSL, a learner corpus of Czech, together with basic properties of its design. It starts with a brief introduction of the project within the context of AKCES, a programme addressing Czech acquisition corpora; in connection with the programme we are also concerned with groups of respondents, including differencies due to their L1; further we comment on the choice of sociocultural metadata recorded with each text and related both to the learner and the text production task. Next we describe the intended uses of CzeSL. The main parts of the text deal with transcription and annotation. We explain the issues involved in transcrition of the handwritten texts and present the concept of a multi-level annotation scheme including taxonomy of captured errors. We conclude by mentioning results from an evaluation of the error annotation and presenting plans for future research.