Detailed Information on Publication Record
2020
RapCor, Francophone Rap Songs Text Corpus
PODHORNÁ-POLICKÁ, AlenaBasic information
Original name
RapCor, Francophone Rap Songs Text Corpus
Name in Czech
RapCor, frankofonní korpus textů rapových písní
Authors
PODHORNÁ-POLICKÁ, Alena (203 Czech Republic, guarantor, belonging to the institution)
Edition
1. vyd. Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2020, p. 95-102, 8 pp. 2020
Publisher
Tribun EU
Other information
Language
English
Type of outcome
Stať ve sborníku
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
Publication form
printed version "print"
References:
RIV identification code
RIV/00216224:14210/20:00117499
Organization
Filozofická fakulta – Repository – Repository
ISBN
978-80-263-1600-8
ISSN
UT WoS
000655471300010
Keywords in English
French; text processing; rap music; hip hop; lyrics; substandard; neology; written orality; corpus building
Links
MUNI/A/1262/2019, interní kód Repo.
Změněno: 2/2/2022 02:02, RNDr. Daniel Jakubík
V originále
The paper introduces the RapCor corpus, which is a specific text corpus for French, based on francophone rap songs’ texts from the last three decades when rap music became one of most popular music genres. An overview of more than ten years of rap corpora building presents our motivations, text processing methods, annotation decisions, as well as achievements and problematic issues. The published part of rap corpora, available in Sketch Engine manager for interdisciplinary research, the RapCor 1288, consists of 709,057 words of 1288 francophone rappers’ texts. It had been used mainly for the detection and longitudinal observation of so-called “identitary neologisms”, i.e. expressions emerging from communication between peers, motivated by search for group belonging, playfulness and expressivity. Rappers’ language is also a valuable resource for investigating metaphors and idioms that have been formed by assigning a new meaning to existing language items. The main goal of this largely substandard linguistic corpora is to uncover the phonemic and semantic innovations and trends in modern French.
In Czech
Článek představuje rapový korpus RapCor, což je specifický textový korpus pro francouzštinu, založený na textech frankofonních rapových písní z posledních tří desetiletí, kdy se rap stal jedním z nejpopulárnějších hudebních žánrů. Ve shrnutí více než desetiletého budování rapového korpusu jsou představeny hlavní motivace, metody zpracování textu, rozhodovací procesy při anotaci, ale i dosažené úspěchy a problematická témata. Publikovaná část korpusu pro mezioborový výzkum je dostupná skrze korpusový manažer Sketch Engine, kde je označena jako RapCor 1288 (skládá se totiž z 1288 textů, 709 057 slov, frankofonních raperů). Lze jej využít především k detekci a pozorování difúze takzvaných „identitárních neologismů“, tj. výrazů vycházejících z komunikace mezi vrstevníky, motivovaných hledáním příslušnosti ke skupině, hravostí a expresivitou. Jazyk rapu je také cenným zdrojem pro zkoumání metafor a resemantizovaných výrazů. Hlavním cílem tohoto jazykového korpusu převážně substandardní francouzštiny je možnost pozorování fonemických a sémantických inovací a trendů v moderní francouzštině.