Google为视频、电话和虚拟助理量身打造语音分辨模型,提高语音转文字准确性
2018-04-10 16:47:26 | 来源:ithome | 投稿:小唯 | 编辑:dations

原标题:Google为视频、电话和虚拟助理量身打造语音分辨模型,提高语音转文字准确性

继Google在上个月推出通过DeepMind高传真人声合成技术WaveNet开发的云端文字转语音服务之后,9日宣布更新云端语音转文字服务(Cloud△Speech-to-Text),不但加入针对特定模式的语音分辨模型,也提高了分辨的准确度,还提供自动加入标点符号的功能,该服务两年前刚推出时名为Cloud△Speech△API。

云端语音转文字服务是在2016年推出,在大约一年前推出正式版,该服务每半年的使用量都是双倍成长,这次Google更新了语音转文字服务,并加入新功能,包括电话和视频模式的语音转文字服务,目前这两个模型可支援英文,未来还会陆续支援其他语言。

目前语音转文字服务支援多项功能,举例来说,该服务内建预先建立的语音分辨模型,来增加文稿的准确度,还有自动加入标点符号的功能,来增加文稿可读性,该服务还有一项通过标注和分类语音转文字改善准确率的机制,用户可以标注像是购物的语音、篮球比赛电视节目等类别,来描述语音的主题,增加该服务的准确度,此外,因为该服务目前是正式版,提供99.9%可靠性的SLA保证。

由于语音分辨有多种不同的模式,包含视频、电话或是人机命令式的互动,这次的更新将加入针对不同模式的订制化模型,像是针对电视转播篮球比赛的语音分辨,讲话的人可能会超过4个,背景的杂音会有观众的欢呼声、音乐、篮球或是跳跃的声音,语音分辨的长度也可能长达2个小时以上。

以处理电话语音为例,Google以往会先将打进来的电话转录到针对电话语音优化过的模型,现在则是可以让企业自行选择最适合的模型,而不用依赖自动推荐的模型。

Google表示,许多云端厂商会用语音数据来优化自家的产品,Google为了保障用户的隐私权,避免这样的做法,而是让用户选择是否要分享语音数据,由于还是有用户期望Google通过真实的数据,提供更准确的语音分辨模型。

因此,Google建立了另一套模型Enhanced△phone_call,通过自愿提供真实数据的用户资料来改善模型,自愿加入这项计划的用户可以使用该模型之外,也能使用其他自愿用户优化过的模型。Google指出,与一般的模型相比,Enhanced△phone_call模型的语音分辨错误率减少了54%。

除此之外,Google也推出了针对视频语音分辨模型,该模型经过多个管道和人声的优化,通过类似于YouTube自动产生字幕的机器学习技术,优化过后该模型错误率相比以往下降了64%。

最后,Google团队最近建立长短期记忆(Long△Short-Term△Memory,LSTM)神经网络,来改善长篇语音转文字的自动下标点符号功能,可以自动提供逗号、句号、问号等,目前还是测试版。

tags:

上一篇  下一篇

相关:

Google更新云端语音转文字服务,听写电话的错误率减少54%

图片来源: Google 继上个月发表云端文字转语音(Cloud△Text-to-Speech)服务之后,Google在周一(4/9)更新了云端语音转文字(Cloud△Speech-to-Text)服务,提供全新的视频及电话转录模型,也新增了自动化标点符号

微软用语音分辨将讲课内容即时转成文字,让听力受损学生学习无障碍

图片来源: 微软 微软5日于官方的博客发表用AI技术协助失聪学生学习的成果Presentation△Translator,通过语音分辨技术,将课堂上教授的演讲内容转为文字,来帮助失聪的学生可以同步得到最完整且准确的资讯,并通过AI

Google第二代行动装置版电脑视觉神经网络模型出炉!让手机执行影像分辨更快更准,

Google在去年6月推出行动装置版的电脑视觉神经网络模型MobileNetV1,近日则在官方博客中宣布推出第二代MobileNetV2,改善了分类、物件侦测和语义分割(Semantic△Segmentation)技术,不论是速度和准确率都有所提升,

逃出生天游戏内置语音怎么关闭 [游戏攻略]

逃出生天游戏内置语音并不是很清晰,所以推荐玩家使用其他的语音软件。下面给大家带来逃出生天游戏内置语音关闭方法,有需要的一起来了解一下吧。逃出生天游戏内置语音关闭方法游戏内置语音效果奇烂,建议用第三方语

促进机器学习模型再利用,Google释出模组打包函式库TensorFlow Hub

为促进机器学习TensorFlow生态系的发展,让开发者的努力可互相交流与再次使用。Google发表TensorFlow△Hub,提供机器学习模组打包函式库,帮开发者把TensorFlow的训练模型发布成模组,方便再次使用或是与社交共享成果

站长推荐: