2018年将迎来BAT和科大讯飞的翻译之战!

品途商业评论 2018-01-16 1599

《圣经》中有一句这样的预言:“看哪!他们成为一样的人民,都是一样的言语,以后他们所要做的事就没有不成就的了。”


当今,翻译软件已经成为了出国旅行必备品。虽然有时它还不够精准,但是不能否认的是:机器翻译的未来注定是无限接近于人。


巨头腾讯也看好机器翻译的广阔前景。在过去两年,腾讯内部成立了三个关于人工智能机器翻译的部门,悄悄的开始布局这一领域。翻译君成为了三个团队中走出来的队伍。其项目负责人李学朝向品途商业评论透露:“腾讯的风格就是这样,在产品有成果之前保持低调。”


如今翻译君的成果包括:可以完成同声传译、拍照翻译、词典查询、口语跟读等工作。其中的实时语音对话功能,能够为出境旅游、外语学习、日常工作生活等跨语种交流提实时、准确、快速的同步翻译服务。



从腾讯翻译君看机器翻译的突破


事实上,在过去两年,深度学习已经完全改写了机器翻译方法。对语言翻译一无所知的深度学习研究人员正在利用相对简单的机器学习解决方案,打败世界上顶级翻译学家建造的语言翻译系统。


腾讯踩在了技术突破的节点提前进入翻译赛道。在2016年初,腾讯开始研发AI翻译产品。但是那个时候,整个机器翻译技术采用的还是一种叫做SMT的统计机器翻译技术,其背后的核心算法是基于短语的机器翻译,错误率较高。


直到2016年底谷歌在机器翻译领域取得重大突破,其发布了神经网路机器翻译系统(Google Neural Machine Translation),简称GNMT,实现了迄今为止机器翻译质量的最大提升。在不同的语言对比中,GNMT把PBMT与人工翻译的鸿沟缩小了58% ~85%,接近了人工翻译的水平。


谷歌翻译准确率


这一突破背后的技术被称为序列到序列学习sequence to sequence learning。这是一项非常强大的技术,除了应用于翻译,这个算法还可以应用于编写AI聊天机器人和描述图片。


这项技术突破后,许多人工翻译工作者感慨到:“作为翻译,看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。”


NMT算法虽然成为巨大突破,但由于但不幸的是,NMT 系统的训练成本非常高,限制了这一技术的大范围使用,仅有少数互联网巨头能够投入并使用得起这样的技术。


正是看到这门技术的高门槛和为整个行业带来的大突破后,腾讯翻译君团队很快调转走向,采用了NMT技术。翻译君团队基于神经网络的算法和腾讯的数据开发了TNMT算法。


2017年翻译君悄然上线,目前,翻译君支持中英日韩法德意土等15种语言和80个语种的对翻译。

“不同于基于短语的机器翻译,腾讯翻译君采用神经网络机器翻译技术,能从语料库中自主学习自动翻译,并将整个句子视作翻译的基本单元,使译文更准确,更符合各个国家的语言习惯。”


根据BLEU以及专业人工评测数据显示,腾讯翻译君各项翻译能力均领先业界,尤其在中英互译方面领先优势明显。其主要的应用场景包括,出国旅游、跨语言社交和会议翻译等。除了2C的应用场景外,腾讯翻译君还向各行业开放了翻译服务能力,目前与金山词霸、VIPKID、大众点评等多领域头部平台达成合作。


李学朝介绍,例如在VIPKID上外国教师对于幼儿的评价,家长可以直接点击翻译成中文。而对于美团和途家等布局海外的企业,翻译君也可以直接将点评翻译成不同的语言。在腾讯内部,翻译君也服务了国际版QQ、QQ邮箱、QQ浏览器和腾讯云等产品以及腾讯多次国际会议。目前翻译君的日服务请求量已经超过3亿次。


腾讯入局,国内的机器翻译大战一触即发


虽然背靠腾讯这个流量制造机,但是翻译君确实属于入行比较晚。在腾讯内部PK胜出后,翻译君将要面临的首先是国内的机器翻译企业的残酷竞争。目前的国内翻译市场,已经有百度、科大讯飞、阿里巴巴和网易等巨头行动在前,还有外来者谷歌和微软等外来者的强势入侵。翻译君的前途注定充满挑战。


百度是国内最早布局机器翻译领域的公司,2016年,12 月 21 日,在百度机器翻译技术开放日上,百度技术委员会联席主席、自然语言处理部技术负责人吴华博士表示,百度早于谷歌一年多,就率先发布了世界上首个互联网 NMT 系统,引领机器翻译进入神经网络翻译时代。


百度还结合OCR技术和语音识别技术,发布了具有丰富实用功能的翻译 APP ,可以实时的通过摄像头的取景框来翻译外文景点指示牌、菜单、说明书和实物等。结合语音技术的会话翻译,可以帮助实现不同语种的无障碍交流。


除了百度,在机器翻译领域一直走在前列的就是科大讯飞,从诞生之提起,讯飞就开始布局语言和翻译领域的项目。在我们2016年度发布会上,科大讯飞CEO胡郁与外国友人为大家现场演示了如何通过一款“神器”,来进行中英文之间的无碍沟通。


基于深度神经网络算法上的创新和突破,科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名;在2015年又在由美国国家标准技术研究院组织的机器翻译大赛中取得全球第一的成绩。


2017年科大讯飞而且还推出了多款硬件翻译产品,其中晓译翻译机1.0plus将世界上最先进的神经网络翻译系统,从在线系统优化成一个离线系统。它可以在没有网络的情况下提供基本的翻译服务,能够做到这一点的目前似乎只有讯飞。


相比于百度和科大讯飞,阿里巴巴和腾讯都属于机器翻译领域的后来者。


不过马云可能不服,因为马云爸爸在创立阿里之前就是做翻译服务的。2015年6月份,阿里就已收购国内最大的众包翻译平台——365翻译。当时把阿里翻译平台定位为阿里巴巴的语言服务平台,将瞄准人机结合模式,在语言服务领域进行更多创新。


2017年7月12日,阿里巴巴披露的一份技术资料显示,阿里翻译团队通过使用阿里云机器学习平台PAI实现了模型训练效率5倍的飞跃,并已应用在英俄电商翻译质量优化项目中。


在阿里巴巴内部,阿里翻译负责为1688国际站、全球速卖通等提供多语言服务,中国卖家填写的一些中文信息会被机器自动翻译成多国语言。该团队同时还为钉钉、东南亚电商Lazada等提供服务。目前阿里的翻译聚焦在电商领域。


除了BAT网易和搜狗也布局了机器翻译。2017年5月,网易有道在GMIC(全球移动互联网大会)未来创新峰会上公布:由网易公司自主研发的神经网络翻译( Neural Machine Translation,以下简称NMT)技术正式上线。作为受到丁磊亲自“过问”、网易最重要技术创新之一,此次在有道上线的NMT技术,由网易有道与网易杭州研究院历时两年合力研发,将服务于有道词典、有道翻译官、有道翻译网页版、有道e读等产品。


2017年,搜狗机器翻译团队获得 WMT (是机器翻译领域的国际顶级评测比赛之一)中英机器翻译冠军。



搜狗机器翻译团队成立于 2016 年,是搜狗知音引擎的重要技术方向,成立之初,基于知音引擎团队在语音技术方面的积累,半年内自研完成了搜狗自有的神经网络机器翻译技术,目前机器翻译技术已经应用在搜狗同传和搜狗输入法的语音、文本翻译中。


巨头扎推商业模式多元化


既然NMT的技术成本如此之高,为什么巨头还扎推来做呢?因为这门技术如果落地到商业领域将带来非常广阔的前景。


搜狗王小川认为,机器翻译类似于“语音识别”,独立存在的商业模式有限。最好的方式是把这个技术融入到其他产品中去升级其他产品,让其他产品更强大。


机器翻译最广阔的商用场景就是赋能。在商用方向,百度翻译有超过1万个第三方应用接入,例如华为将翻译服务集成到其Ascend Mate7手机的摄像头翻译应用中,带有翻译功能的手机被销往法国、德国等30多个国家和地区;B2B跨境电子商务平台「敦煌网」使用「百度翻译」进行跨境贸易,促进了对外贸易的发展。据统计,百度翻译为企业每年节省的人工翻译成本折合人民币高达2亿元。这为百度带来丰厚的利润。


在C端领域商用中,科大讯飞也实现了变现,晓译翻译机可以满足80%的出国人员在各种各样情况下使用翻译系统。其背后设置了SOS的紧急联络按钮。在遇到紧急情况的时候,按下键三秒钟,所在的位置就会在讯飞后台专业服务中心的大屏幕上呈现出来,还可以接通紧急联系人或大使馆的电话。这样的产品在京东上售价2999,好评率达到98%。其在京东上已经有数万的销量和评论。



在商业模式上,翻译君负责人李学朝认为,腾讯自己做机器翻译不仅可以省掉腾讯公司内部的翻译费用,未来还可以赋能给社交产品、甚至腾讯整个生态。


如今仅翻译君团队就有20多位人工智能专家全职支持这个项目,可见腾讯想要拿下这个领域的决心。


腾讯在全球合作伙伴大会发布8大AI应用场景


人工智能技术在机器翻译领域确实表现出了让人惊喜的水准。无论是说走就走的出国旅游,还是跨洋交流的留学办公,使用语音翻译软件来实现“说中文,出英文”的功能效果,基本都能满足与外国人的日常的短语交流,大大提升彼此的沟通效率。


虽然在长句子和情感的翻译上,机器翻译还有很大误差,但是从巨头花费大价钱和精力竞相投入到该领域的力度就可以看出它未来广阔的前景。


据统计,全世界有5000余种语言。其中使用人口达5000万的有19种。能够掌握10种语言以上的人也寥寥无几,语音识别与同传翻译的组合,提供了沟通无障碍的可能,这影响的不仅是翻译本身这件事,它还将带来更多文化上的碰撞。

来源:品途商业评论 ,如若转载,请注明出处。
“看完这篇文章觉得还不够?如果您关注教育行业产业链上下游动态发展,善于发现业内具备创新与机遇的公司和产品,亦或是能对行业政策及市场变化进行深入解读,那就快给我们投稿吧,投稿邮箱是:,您的来稿或许就会影响教育未来!”
0
相关推荐
    查看更多推荐
    Copyright © 2017 决胜网 juesheng.com All Rights Reserved.
    京ICP备13009167号-1