微软Azure视频索引器正式上线,新加入情绪侦测、语言分辨模型,自动判别讲者情绪及使用语言
2018-09-14 17:43:28 | 来源:ithome | 投稿:小艾 | 编辑:dations

原标题:微软Azure视频索引器正式上线,新加入情绪侦测、语言分辨模型,自动判别讲者情绪及使用语言

图片来源:

微软

自今年5月微软在公有云平台释出视频索引器(Video△Indexer)后,近日该公司宣布,视频索引器服务正式上线。这款服务结合了人工智能,自动帮使用者分析视频中由话语、人脸、人物和表情,建立索引后提供使用者搜寻服务。同时,视频索引服务也能搭配迁入式套件,让开发者可以将该服务与其他应用程序整合。

微软表示,视频索引器搭配了数组机器学习模型,分别能处理声音、演说,以及视觉资料。而这一次正式上线后,微软新加入了数组机器学习模组。第一组机器学习模型可分析进行情绪侦测(emotion△detection),结合视频中的演说情境以及语片,判定影音资料中的情绪内容,例如愤怒、恐惧、悲伤以及欢乐等。

情绪侦测功能也是这次视频索引器上线的新亮点,利用相异颜色划分情绪种类,在时间轴列出该视频中出现情绪的时间比例。图片来源:微软

第二组机器学习模型的功能,则是自动判定视频中使用的语言,未来使用者批次上传视频档时,不需要再手动标注,视频索引服务自动就能分析。目前微软能支援自动判定的语言,包含英语、法语、日语、葡萄牙语、西班牙文、中文等大宗语言。

再者,现在视频索引服务也变得更聪明,开始能辨别该视频的议题、内容。微软解释,此功能意即让系统根据视频中的演说内容、视觉提示(Visual△cues)资讯,理解高层次的议题。在关键字撷取模型中,演说内容必须出现关键字,系统才能判定该演说的范畴。而微软表示,这个新模型可以根据演说内容,推论该议题的重点,“即便关键字未出现在其中。”

除了新增视频索引器内建的机器学习模型,该服务的既有功能也进行加强。例如视频索引器中名人分辨(celebrity△recognition)模型,微软就利用外部资料来源,如大型电影资料库IMDb、维基百科、LinkedIn等,作为模型训练的素材。

视频索引服务上线后,内建的名人分辨功能也有加强。在上图示范中,视频上传至该分析工具,系统就分辨出微软执行长Satya△Nadella的出现长度,总共占据17%。而在该使用介面,还可以直接搜索与该人相关的资料、简历。图片来源:微软

tags:

上一篇  下一篇

相关:

微软释出ML.NET 0.5,开始支援深度学习TensorFlow模型

微软在5月释出由微软研究院开发、发展了十年的机器学习框架ML.NET,今释出了ML.NET△0.5,最大的更新便是开始支援TensorFlow,开发者可以在ML.NET中直接使用已经训练好的TensorFlow模型,进行评分(Scoring)。另外,

突破语言沟通障碍,脸书自动机器翻译以三大策略再新增24种语言

脸书现在以神经机器翻译(Neural△Machine△Translation,NMT)技术,支援每天将近60亿次翻译服务,虽然脸书在使用神经网络后,比起传统方法,翻译模型的速度与品质有了大幅改进,但是技术终究遇到瓶颈,使他们无法再

微软Windows 10测试版企图阻拦用户安装其它浏览器

有测试者反映,尝试安装其他浏览器时,系统跳出视窗试图拦阻。 图片来源: Twitter Windows△10 insider△build△17744的测试者发现,当他们想要安装Firefox或Chrome等其它浏览器时,系统会跳出通知,告诉他们系统上

北京乘公交微信扫码上线 [热事件]

大家都知道现在是一个互联网时代,如今随着互联网的流行,好多人在买菜、吃饭时都是喜欢拿手机扫一扫。但是现在,就连乘车也加入了扫码服务,近日北京乘公交微信扫码上线了,对于广大市民来说出行更加方便了。可享受

微软修补61个安全漏洞,包含已有攻击程式现身的零时差漏洞

示意图,与新闻事件无关。 图片来源: 微软 微软于本周二(9/11)的每月例行性修补中,修补了61个安全漏洞,当中有17个属于重大(Critical)漏洞,以及一个概念性验证攻击程式已经出炉的零时差漏洞CVE-2018-8440。C

站长推荐: