Volume 3,Issue 9
Fall 2025
基于数据增强技术的藏汉机器翻译方法研究
藏汉机器翻译在促进藏汉文化传播和交流、推动藏区信息化建设、促进藏区经济发展等方面发挥着重要的作用,扮演着重要的角色。然而由于缺乏藏汉平行语料、藏汉机器翻译性能不足等问题的影响,导致藏汉机器翻译的发展受到一定限制。而数据增强技术能够有效解决上述问题,通过对原始数据进行扩展、变换等操作,生成大量训练数据,从而有效提升藏汉机器翻译质量和性能。对此,本文就基于数据增强技术的藏汉机器翻译方法进行简要分析,希望为广大读者提供一些有价值的借鉴和参考。
[1]格桑加措,尼玛扎西,群诺,等 .基于长尾词分布的藏汉机器翻译数据增强方法研究 [J/OL].计算机科学,1-10[2025-04-22].
[2]格桑加措 ,尼玛扎西 ,嘎玛扎西 ,等 .基于领域术语词典和句式框架的藏汉机器翻译领域数据增强方法研究 [J].高原科学研究 ,2024,8(03):92-101+132.
[3]仁青卓玛 ,拥措 ,唐超超 .面向藏汉神经机器翻译的数据筛选方法 [J].计算机与现代化 ,2024,(06):19-24.
[4]刘文静 .面向中医文化传播的中医古籍机器翻译研究 [D].南京中医药大学 ,2024.
[5]仁青卓玛 .藏汉神经机器翻译研究综述 [J].西藏科技 ,2024,46(02):76-80.
[6]杨丹 ,拥措 ,仁青卓玛 ,等 .基于 mRASP的藏汉双向神经机器翻译研究 [J].计算机技术与发展 ,2023,33(12):200-206.
[7]桑杰端珠 .基于深度学习的藏汉(汉藏)机器翻译关键技术研究 [D].青海师范大学 ,2023.
[8]汪超 .基于数据增强技术的藏汉机器翻译方法研究 [D].西藏大学 ,2023.
[9]申影利 ,周毛克 ,赵小兵 .基于多任务学习的民汉神经机器翻译数据增强方法 [J].中文信息学报 ,2023,37(02):97-106.
[10]杨丹 ,孙义栋 ,拥措 .基于数据增强的藏汉神经机器翻译研究 [J].计算机与数字工程 ,2022,50(11):2473-2477.
[11]鲍薇 ,董建 ,徐洋 ,等 .藏汉跨语言文本剽窃检测数据集 [J].中国科学数据 (中英文网络版 ),2022,7(02):50-58.
[12]严威 .中小学教育资源汉藏翻译系统的设计与实现 [D].西北民族大学 ,2022.
[13]色差甲·藏文律诗自动生成研究 [D].青海师范大学 ,2022.
[14]吴春壮 .基于数据增强的低资源神经机器翻译研究 [D].北京交通大学 ,2022.
[15]蔡子龙 ,杨明明 ,熊德意 .基于数据增强技术的神经机器翻译 [J].中文信息学报 ,2018,32(07):30-36.