正在阅读: 机器翻译系统挑战CET6翻译考试 5秒钟答一题,轻松得“优秀”

机器翻译系统挑战CET6翻译考试 5秒钟答一题,轻松得“优秀”

2018-12-19 17:10来源:光明日报客户端

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

12月18日下午,合肥师范学院举办了一场特殊的考试。说它特殊,是因为“考生”只有一个,而且是一套机器翻译系统。

考题来自三天前刚结束的大学英语六级考试,评分的是两位具有六级阅卷经验的高校资深专家。“考生”一口气做了三道翻译题,每道题满分15分,它得到13分的均分,每题用时只有5秒。

“这套机器翻译系统的表现让我们惊喜,翻译得很地道。”对于成绩,专家的鉴定是:优秀!

看似普通的系统背后,是机器翻译领域近一个世纪的技术积累,也包含着科大讯飞创新实现的领域翻译技术突破以及最新推出的行业翻译解决方案。

CET6

12月18日,合肥师范学院一教室内,试题输入人员在公证人员的见证下现场给科大讯飞机器翻译系统录入试题

成绩:轻松获大学英语六级翻译“优秀”

大学英语六级翻译测试共有三道考题。按规定,考生们只需作答一题,时间是半小时。

词汇量是第一需要具备的,目前六级词汇量要求达到6000个,其中不乏生僻词汇和短语;由于汉英间表达习惯的不同,逻辑、语序调整也十分重要。

“经过三百年的发展,唐代中国成为世界上最繁荣的强国,其首都长安是世界上最大的都市,这一时期,经济发达,商业繁荣,社会秩序稳定,甚至边境也对外开放,随着城市化的财富的增加,艺术和文学也繁荣起来。”

这是去年六月的一道翻译题,一连8个逗号,考验着考生们的逻辑,不少考生连呼“太烧脑”。正因为如此,大学英语六级,每次通过率只有30%左右。

科大讯飞团队12月14日就将机器和系统封存在公证处,“此举旨在确保在断网和无人工干预的情况下测评。”科大讯飞负责机器翻译的研发人员说。12月18日,在公证人员的见证下,考官分别打开三道考题,由人工输入电脑后系统作答,不到5秒便导出了文本。

成绩令人惊喜:每道题取三位评分专家的平均分,再计算三道题的平均分,最终机器翻译系统拿下13分。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。

现场两位评分专家来自上海交通大学外语学院,“这套系统翻译出来的语言质量很高、语法也很地道,表现好过我们得预期让我们惊喜。” 她们给出的评价称:机器翻译能准确表达原文意思、译文流畅、结构清晰,可以较好的辅助不同语言的信息沟通。

据悉,在参加此次评测前,科大讯飞研发人员在2014年6月到2018年6月的大学英语六级26道翻译考题上进行了测试,平均分达到12.8分,与此次测试结果基本持平,“这也说明机器翻译可以稳定在高水平。”

难点:自然语言的复杂性

“但到目前为止,机器翻译到底达到了什么样的水平,还没有人能够给出明确答案。”科大讯飞负责机器翻译的研发人员说。

大学英语六级考试正是一种权威客观的衡量方式,“借助于六级中的翻译考题,我们想客观公正地给出当前以汉译英为例的机器翻译技术水平的评估,包括还存在哪些差距。”这样一方面为后续研究提供思路,另一方面也可进一步指导机器翻译技术应用。

据了解,科大讯飞自2012年启动机器翻译的研发工作,目前很多技术已达到世界领先水平。2014年,在IWSLT口译翻译比赛上就取得了中英互译的第一名;2015年在NIST国际openMT机器翻译比赛,中英人工主观分获得冠军;刚刚过去的2018年IWSLT比赛,在端到端的语音翻译上再次以显著优势取得第一名的成绩。

“但机器翻译还是很难,主要是其处理的对象——自然语言存在复杂性。”研发人员介绍,自然语言是人类在社会生活中,通过不断的重复性使用而自然进化形成的沟通媒介(语言),并且在此过程中缺少规划和设计,使得语言本身就存在诸多不确定性,“同样一句话,在不同的语境中不同人就有不同的理解。”

创新:不让器翻译系统“偏科”

机器翻译系统何以在大学英语翻译权威评测中获得好成绩?

“一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已发展有三代技术、取得了长足的进步。

“最新一代技术是基于端到端的神经机器翻译。” 神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。但想拿到高分,少不了“独门秘笈”。

“六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。”科大讯飞为了破解这一难题,对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。

其中一项技术是领域个性化。“传统翻译模型一般针对具体应用场景搜集该领域相关语料,但在实际应用中,由于‘精力不够’会导致其他领域的翻译效果受影响。”这就好比学习中的“偏科”,从而影响了总分。为此,科大讯飞研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,“可最大程度实现目标领域和其他领域翻译性能的兼顾。”

“翻译中常会遇到行业术语,有的机器可能没有见过、有的见过却在不同行业有不同翻译方式。”科大讯飞给出的解决方案是:提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。

基于上述领域翻译技术,科大讯飞推出了面向行业的翻译解决方案。

应用:有请“行业翻译官”

早在2016年,科大讯飞就发布了讯飞翻译机产品,并在业界第一个推出了纯离线的神经网络的离线口语翻译系统。而今,讯飞翻译机的用户遍及全球170个国家。

未来,有了最新的翻译技术,它们会有什么改变?

在某跨国医疗技术峰会现场,你可以拿出最新升级的讯飞翻译机2.0,和与会外宾专家畅聊。从“口袋里的翻译官”升级为“行业翻译官”,这台小机器在通用翻译模式下新增行业翻译模式,正是使用了该技术;除了金融,在医疗、计算机等行业专业场景下都可以实现中文与英文的及时互译。

环保论坛会前,有了最新的机器翻译技术,不仅领域和行业术语定制的又准又好,整体的翻译效果也不会打折扣。

即便你是职场新人,当上司给你布置了厚厚一叠出口产品说明书的翻译时,你也不必挑灯夜战了。因为最新的机器翻译技术可以辅助笔译,“可让机器先翻译一遍、人工再精修。”

让人类更便捷的交流、更轻松的工作,机器翻译技术的发展也正在是实现着用人工智能建设美好世界的愿景。

“由于语言本身的复杂性,机器翻译还有很长的路要走。”科大讯飞负责机器翻译的研发人员告诉记者,对翻译技术的研究是为了更好地辅助人类进行语言沟通,帮助普通人达到一定的外语水平;但也需要人工来帮助机器完成无法处理的问题、更好的解决自身局限,“专业翻译人员在翻译过程中积累的语料和知识,反过来也能促进机器进化,这是人机协同的逻辑。”(光明融媒记者 常河)

[责编:孙满桃]

阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 张灯结彩迎新年

  • 南昌:动车组蓄势待发迎春运

独家策划

推荐阅读
长城脚下,北京延庆,肃穆的海坨山和官帽山遥相对望,拥抱着冰封的妫河。新华社记者 张晨霖 摄  北京世园会国际馆(1月11日无人机拍摄)。新华社记者 张晨霖 摄  北京世园会中国馆(1月16日无人机拍摄)。
2019-01-19 16:24
志愿者们通过参观车站陈列室,了解春运故事,学习医疗急救、服务礼仪等技能,备战即将到来的春运。
2019-01-19 08:43
近年来,泾源县通过发掘民间剪纸文化,结合当地旅游资源,在乡村推广传统剪纸技艺,打造剪纸系列旅游产品,走出一条民间文化助力脱贫攻坚的发展路径。
2019-01-19 08:43
江苏南通迎春灯会亮灯仪式在南通探险王国举行,各式彩灯造型独特,吸引游人观赏游玩。
2019-01-19 08:42
冰封的冬季纳木错,静静地依偎在雪山的怀抱中,相互陪伴共度寒冬。
2019-01-19 08:41
珠海长隆国际海洋王国在2018年12月的13天内,相继成功繁育一雄两雌的三头小白鲸,预计近期还将迎来第四头白鲸宝宝。
2019-01-19 08:40
当日,中国第35次南极科学考察队昆仑队在南极昆仑站完成小型视宁度测量望远镜KL-DIMM的安装,展开观测调试。当日,中国第35次南极科学考察队昆仑队在南极昆仑站完成小型视宁度测量望远镜KL-DIMM的安装,展开观测调试。
2019-01-18 08:23
1月17日,游客在拍摄从调兵山站出发的蒸汽机车。据了解,本届蒸汽机车旅游推广季主题活动为期5天,包含蒸汽机车博物馆游览、试驾蒸汽机车、专列观光摄影、《火车上的中国人》影展等内容。
2019-01-18 08:15
1月16日,参观者在展览现场欣赏展出的瓷器作品。当日,由中国陶瓷工业协会、人民美术出版社主办的“瓷乐陶陶——瓷都景德镇、陶都宜兴艺术家作品首都北京汇报展览”在位于北京的人民美术出版社美术馆开幕,展出5名来自瓷都景德镇的艺术家及其学生、7名来自陶都宜兴的艺术家多年来的创作成果数十件。
2019-01-17 10:20
15年前,台湾作家白先勇携青春版《牡丹亭》掀起一股昆曲美学旋风。今年2月,白先勇将再度携手苏州昆剧院,推出《玉簪记》《白罗衫》《潘金莲》三部经典昆曲的新版系列演出,和台湾观众分享昆曲之美。新华社记者李响 摄
2019-01-17 10:19
加载更多