2019机器翻译(西湖)论坛几点观察和感想

       
  • Home
  • /
  • 博客
  • /
  • 2019机器翻译(西湖)论坛几点观察和感想
博客
2019机器翻译(西湖)论坛几点观察和感想

5月25日,2019机器翻译论坛在西湖大学举行。会议有来自中科院、华为诺亚方舟实验室、微软亚洲研究院等知名机构的自然语言处理专家,以及来自翻译工具厂商、翻译服务业和教学界的90多名参会者。

在会议发言环节,专家们分享了机器翻译研究的最新成果,讯飞听见介绍了讯飞机器翻译的落地应用,对外经贸大学崔启亮博士就机器翻译的应用提出了问题和建议。下午,东北大学朱靖波老师主持了机器翻译技术发展与应用落地研讨会,与会者就机器翻译技术应用的场景、商业模式、质量评估、发展前景等进行了热烈讨论。

我在会上认真听专家发言,会下跟NLP专家、翻译工具厂商、翻译公司同行进行了交流。以下几点观察和个人思考,权当会后交流。

  1. 真正的专家们看到的都是问题,没有陶醉于自己的研究成果,也没有被一些宣传所困扰。在会上做分享报告的专家讲的更多是问题和解决方案。向这些专家致敬!
  2.  自然语言处理技术通过神经网络翻译技术(NMT)获得突破后,又进入了新的瓶颈期,质量提升缓慢,同质化问题比较明显。参会专家和厂商普遍提到优质语料匮乏及对提升机器翻译质量的制约:拥有语料的翻译公司对语料知识产权保护比较谨慎,语料清洗成本高,机翻公司购买语料容易碰到坑,等等。
  3.  机器翻译技术在特定场景已经有很不错的应用,比如情报、辅助阅读和日常沟通等,甚至C端的应用探索也有成功的范例,如科大讯飞的翻译机等产品。

4. 机器翻译技术在专业翻译领域的应用还有待于突破。传统CAT工具的用户基本是职业译员和翻译公司,机器翻译虽然已经成为了非专业译员的另类“CAT工具”,但在专业翻译领域的应用较难普及,也缺乏盈利模式。对于机器翻译+译后编辑(PE)和类似Lilt的交互式应用的前景,见仁见智,有待于更多验证。

5.  机器翻译质量评测方法需要革新,长期使用的Bleu值评测系统很过时,会上也有专家提到这个问题。建议NMT质量评估纳入翻译和本地化行业的译文质量评价模型,以克服Bleu值评测的缺陷。

6.  机器翻译专家和工具产商都在摸索NMT的落地应用场景,中科院自动化所等都组建了公司团队来开发用户需求牵引的机器翻译系统。传统翻译公司不应该排斥,应该积极牵手机译厂商一起探索。

7. 翻译圈和技术圈都应有更大的包容性。对于一些技术应用探索,翻译学术和教学圈比较抵触,大可不必。比如,科大讯飞的翻译机,受限于技术本身,从学术圈来看,其缺点是明显的。但翻译机产品本身无疑是语音识别和机器翻译技术的成功应用,帮助不懂外语的人们更便捷地获得即时翻译服务。翻译圈在比较翻译质量时,应区分应用环境或场景。如,不宜用笔译的质量要求来衡量会议现场的口语翻译。同时,应多从用户角度来看这样的产品是否有意义。毕竟专业译员的服务不是随时随地可以获得,也不是所有人都能用得起。从市场或传播学的角度,能帮助用户解决问题的产品就是好产品。

8. 机器厂商在做产品宣传时,注意机译的工具属性,不要动辄就拿人类译员来做比较,更不要将机器和译员描述误导成替代关系。这种做法,就像把汽车和人来做比较一样荒唐。汽车应该和人力车或火车或飞机等交通运输工具做比较,而不是和人比较。此外,建议找些不懂中文的外国听众来对人类译员的同传和机器同传做比较,评价哪种方式信息传达更好,或者他们更愿意使用哪种服务。这样的比较结果或客户反馈才有真正的说服力。

最引人思考的一个问题在讨论环节。论坛主持人问阿里达摩院陈博兴下一代机器翻译技术是什么样子?陈博士回答“好问题,不过我也不知道”。其在朋友圈做了解释:“颠覆第一代规则翻译系统的人不是做规则的,颠覆第二代统计翻译模型的人不是做统计翻译的,同样,颠覆第三代神经机器翻译系统的人不会是我们现在这批做神经机器翻译的人。所以,作为一个目前在从事神经机器翻译技术研究的,我也不知道下一代机器翻译技术会是什么样的,但是我知道肯定不是基于神经网络的。”“我相信在我的有生之年,我能看到第四代甚至第五代机器翻译技术的出现。”这样的回答体现了求实的科学精神,引人思考,也给人期待。

以上仅为个人观察和思考,不是会议总结。感谢会议承办单位西湖大学和赞助单位小牛翻译、语言桥、深知无限。再次向与会专家学者致敬!

译直播为本次会议提供了直播,完整视频回放链接:http://ttv.cn/archives/4042

prev
next
关注公众号
微博首页