微软Azure视频索引器正式上线，新加入情绪侦测、语言分辨模型，自动判别讲者情绪及使用语言

2018-09-14 17:43:28 | 来源：ithome | 投稿：小艾 | 编辑：dations

原标题：微软Azure视频索引器正式上线，新加入情绪侦测、语言分辨模型，自动判别讲者情绪及使用语言

图片来源:

微软

自今年5月微软在公有云平台释出视频索引器（Video△Indexer）后，近日该公司宣布，视频索引器服务正式上线。这款服务结合了人工智能，自动帮使用者分析视频中由话语、人脸、人物和表情，建立索引后提供使用者搜寻服务。同时，视频索引服务也能搭配迁入式套件，让开发者可以将该服务与其他应用程序整合。

微软表示，视频索引器搭配了数组机器学习模型，分别能处理声音、演说，以及视觉资料。而这一次正式上线后，微软新加入了数组机器学习模组。第一组机器学习模型可分析进行情绪侦测（emotion△detection），结合视频中的演说情境以及语片，判定影音资料中的情绪内容，例如愤怒、恐惧、悲伤以及欢乐等。

情绪侦测功能也是这次视频索引器上线的新亮点，利用相异颜色划分情绪种类，在时间轴列出该视频中出现情绪的时间比例。图片来源：微软

第二组机器学习模型的功能，则是自动判定视频中使用的语言，未来使用者批次上传视频档时，不需要再手动标注，视频索引服务自动就能分析。目前微软能支援自动判定的语言，包含英语、法语、日语、葡萄牙语、西班牙文、中文等大宗语言。

再者，现在视频索引服务也变得更聪明，开始能辨别该视频的议题、内容。微软解释，此功能意即让系统根据视频中的演说内容、视觉提示（Visual△cues）资讯，理解高层次的议题。在关键字撷取模型中，演说内容必须出现关键字，系统才能判定该演说的范畴。而微软表示，这个新模型可以根据演说内容，推论该议题的重点，“即便关键字未出现在其中。”

除了新增视频索引器内建的机器学习模型，该服务的既有功能也进行加强。例如视频索引器中名人分辨（celebrity△recognition）模型，微软就利用外部资料来源，如大型电影资料库IMDb、维基百科、LinkedIn等，作为模型训练的素材。

视频索引服务上线后，内建的名人分辨功能也有加强。在上图示范中，视频上传至该分析工具，系统就分辨出微软执行长Satya△Nadella的出现长度，总共占据17％。而在该使用介面，还可以直接搜索与该人相关的资料、简历。图片来源：微软

tags：

相关：

微软释出ML.NET 0.5，开始支援深度学习TensorFlow模型

微软在5月释出由微软研究院开发、发展了十年的机器学习框架ML.NET，今释出了ML.NET△0.5，最大的更新便是开始支援TensorFlow，开发者可以在ML.NET中直接使用已经训练好的TensorFlow模型，进行评分（Scoring）。另外，

突破语言沟通障碍，脸书自动机器翻译以三大策略再新增24种语言

脸书现在以神经机器翻译（Neural△Machine△Translation，NMT）技术，支援每天将近60亿次翻译服务，虽然脸书在使用神经网络后，比起传统方法，翻译模型的速度与品质有了大幅改进，但是技术终究遇到瓶颈，使他们无法再

微软Windows 10测试版企图阻拦用户安装其它浏览器

有测试者反映，尝试安装其他浏览器时，系统跳出视窗试图拦阻。图片来源: Twitter Windows△10 insider△build△17744的测试者发现，当他们想要安装Firefox或Chrome等其它浏览器时，系统会跳出通知，告诉他们系统上

北京乘公交微信扫码上线 [热事件]

大家都知道现在是一个互联网时代，如今随着互联网的流行，好多人在买菜、吃饭时都是喜欢拿手机扫一扫。但是现在，就连乘车也加入了扫码服务，近日北京乘公交微信扫码上线了，对于广大市民来说出行更加方便了。可享受

微软修补61个安全漏洞，包含已有攻击程式现身的零时差漏洞

示意图，与新闻事件无关。图片来源: 微软微软于本周二（9/11）的每月例行性修补中，修补了61个安全漏洞，当中有17个属于重大（Critical）漏洞，以及一个概念性验证攻击程式已经出炉的零时差漏洞CVE-2018-8440。C

热点 / Hot

站长推荐：