A Data Augmentation Technique to Improve the Document-level Machine Translation Performance

Dokyoung Kim,Changki Lee

Jeongbogwahakoe keompyuting-ui silje nonmunji(2023)

引用 0|浏览0
暂无评分
摘要
최근 전체 문서의 문맥을 파악해 자연스러운 번역을 하기 위한 문서 단위 기계 번역 연구가 활발히 이루어지고 있다. 본 논문에서는 문서 전체의 문맥을 고려할 수 있는 G-Transformer를 한국어-영어 문서 단위 기계 번역에 적용하고, 문서 단위 병렬 코퍼스의 부족 문제를 해결하기 위해 문서 단위 기계 번역을 위한 데이터 증강 기법을 제안한다. 실험 결과, 본 논문에서 제안한 데이터 증강 기법들을 이용하여 문서 단위 기계 번역의 성능을 기본 모델(Transformer with Sentence Level Data)에 비해 S-BLEU 4.42 향상시킬 수 있었다.
更多
查看译文
关键词
data augmentation technique,translation,document-level
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要