Build 2018:微软释出可订制化的全新翻译器,更贴近行业别翻译需求
2018-05-09 12:45:49 | 来源:ithome | 投稿:米阳 | 编辑:dations

原标题:Build 2018:微软释出可订制化的全新翻译器,更贴近行业别翻译需求

微软最近在2018年的Build大会上推出可订制化的翻译器Translator△text△API△V3,除了通过神经机器翻译(Neural△Machine△Translation, NMT)在翻译前撷取文章中整个句子,提供更高品质翻译结果,再通过更像人声的模式输出翻译结果,还提供用户建立和部署订制化的神经翻译系统。

微软表示,订制化的翻译系统功能不仅支援文字,也提供语音的翻译,NMT模型在特定业务和产业的翻译上有些许的限制,因为要重新训练一个特定的翻译模型需要很高的运算力,也需要许多成本和时间,但是高品质的机器翻译很重要的一个组成因素就是要做到订制化,提供适合企业所在产业或是专业术语的翻译结果。

举例来说,“Check”一词在不同的应用场景中,会代表不同的意义,银行中代表支票、在汽车产业中是指检验等,但是现在的翻译系统多半都将Check翻译成同一个结果,而微软这次推出新的订制化翻译功能更能分辨出这样的差异。

在每一对翻译的语言组中(如英文和中文),句子中的每一个字都会被转译为500个维度向量来表示该字汇的特征,根据训练资料,神经网络会自动定义每个字的维度,例如,性别的概念可以细分为男性、女性和中性等,词性可分为动词、名词等,但是在训练资料中,还是会有不明显的特征,系统会将这些词编译成更高的维度向量,用上下文和完整的句子来分辨单词的特征。

微软表示,NMT模型非常复杂,每种鱼研究有超过1,000万个参数,在训练模型的过程中不断进行调整,需要大量的训练资料和运算资源,一般的企业要自行训练出自己行业别的翻译系统是非常困难的。

微软指出,要训练出专属行业别的翻译系统,需要该领域2,000组对等语意句子资料集,像是人类翻译的结果,用越多资料来训练翻译模型,将会得到较准确的翻译结果,微软用业界评估翻译品质的标准BLEU△score来比较通用型和行业别的翻译结果,结果显示订制化的结果品质较高。

除此之外,Translator△text△API△V3还能一次翻译成多种语言,过去输入一种语言,只能翻译成另一种语言,现在不需要通过多个API就能根据单一语言的输入,翻译出多种语言。

另外,Translator△text△API△V3也提供音译的功能,也就是说,若用户通过翻译器将英文翻译为阿拉伯语,但是用户不会阅读阿拉伯语,系统可以提供用英文字母书写而成的阿拉伯语。

新的双语字典功能可以显示从英文翻译或是翻译成英文的替代翻译结果,通过提供范例的字来让用户选择更好的翻译结果。

tags:

上一篇  下一篇

相关:

Build 2018:微软认知服务大更新,提供企业更多将产品AI化的工具

在图像中框住指定的物件,定义标签,以训练订制化视觉模型Custom△Vision分辨特定物品的能力。 图片来源: 微软 微软近日于2018年的Build大会上公开Azure平台上认知服务的更新,包含统一的语音服务、Bing视觉搜寻、

机器学习开发不知从何处入手? 脸书释出视频教你怎么做

图片来源: 脸书 脸书AI研究院最近公开机器学习模型的开发教学视频The△Facebook△Field△Guide△to△Machine△Learning,脸书广告机器学习团队将建立模型的过程,分成6堂课程的系列视频,分享实际应用机器学习,来解

Build 2018:微软对话式AI工具大翻新,助企业打造更聪明的Chatbot

图片来源: 微软 微软近日于2018年度的Build大会上发表一系列对话式AI工具的更新,包含推出Bot△Builder△SDK预览版V4、改善Bot框架模拟器、新增Bot△Builder工具和调度、更新自然语言理解服务,以及Q&A生成器等,要

基础架构管理工具Terraform也登上Azure,微软联手HashiCorp合推Azure Terraform Resource Provider

提供基础架构管理工具的HashiCorp,近日与微软一起联手,以自家基础架构组态管理工具Terraform为基础,推出公有云资源管理工具Azure△Terraform△Resource△Provider。微软表示,使用Azure的企业用户,既有的Azure资

AP市集平台Bitnami与微软合作,加速应用程序上云

图片来源: Bitnami 过去应用平台市集Bitnami与微软合作,多半局限在应用程序市集,由Bitnami预先将各类开源专案、软件服务打包,再于Azure市集上架贩卖。不过这一次,Bitnami和微软则是加强应用平台上云端的合作,让

站长推荐: