Přehled o publikaci
2023
MUNI-NLP Systems for Low-resource Indic Machine Translation
SIGNORONI, Edoardo a Pavel RYCHLÝZákladní údaje
Originální název
MUNI-NLP Systems for Low-resource Indic Machine Translation
Autoři
SIGNORONI, Edoardo a Pavel RYCHLÝ
Vydání
Singapore, Proceedings of the Eighth Conference on Machine Translation, od s. 959-966, 8 s. 2023
Nakladatel
Association for Computational Linguistics
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Stát vydavatele
Spojené státy
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/23:00138713
Organizace
Fakulta informatiky – Masarykova univerzita – Repozitář
ISBN
979-8-89176-041-7
EID Scopus
Klíčová slova anglicky
low-resource;machine translation;NLP
Návaznosti
LM2023062, projekt VaV.
Změněno: 31. 7. 2025 00:50, RNDr. Daniel Jakubík
Anotace
V originále
The WMT 2023 Shared Task on Low-Resource Indic Language Translation featured to and from Assamese, Khasi, Manipuri, Mizo on one side and English on the other. We submitted systems supervised neural machine translation systems for each pair and direction and experimented with different configurations and settings for both preprocessing and training. Even if most of them did not reach competitive performance, our experiments uncovered some interesting points for further investigation, namely the relation between dataset and model size, and the impact of the training framework. Moreover, the results of some of our preliminary experiments on the use of word embeddings initialization, backtranslation, and model depth were in contrast with previous work. The final results also show some disagreement in the automated metrics employed in the evaluation.