图像分辨优化新作法,不必手动标记,脸书AI研究院用35亿张Hashtag图片改善图像分辨模型
2018-05-04 08:09:00 | 来源:ithome | 投稿:米娜 | 编辑:dations

原标题:图像分辨优化新作法,不必手动标记,脸书AI研究院用35亿张Hashtag图片改善图像分辨模型

图片来源:

脸书

脸书AI研究院最近发表一项通过主题标签(Hashtag)当作标签的方法,来训练出更准确的图像分辨模型,脸书预计未来会将这项研究成果应用到脸书回顾的功能中,也计划将这项成果整合到模型中,并开源释出,让研究社交可以用来开发更高阶的任务。

图像分辨是脸书AI研究院和的研究重心之一,研究人员和工程师都希望能在电脑视觉技术上有所突破,应用在真实的世界中带给人类帮助,举例来说,脸书过去曾开发用AI自动生成图片叙述的应用,帮助视力受损的用户了解贴文图片的内容。

为了要改进电脑视觉系统和训练系统能够分辨出大规模多样化的物体,现在大多需要数十亿图像规模的资料集,而不是数百万的图片资料集就能训练出这样的图像分辨模型。

由于现有的模型,都是通过人类手动标记图片来当作训练资料集,即使监督式学习的方法能够训练出较准确的分辨模型,大量的资料集若都需要通过人工标记,所花费的成本和时间都非常可观,要手动标记数十亿的训练资料集几乎是不可行。

于是,脸书的研究团队用带有Hashtag的公开分享图片当作训练资料,巧妙地解决了大量图片需要人工标记的问题,最大的资料集由1万7千个Hashtag的35亿张图片组成,这个方法的关键是用由用户提供的现有和公开Hashtag来当作图片的标签(Label),取代以往用人工的方式将每张图片分类。

在脸书AI研究院测试实验中,通过1,500个Hashtag的10亿图片来训练电脑视觉系统,经过常见的图像分辨测试工具ImageNet,分辨正确率可达85.4%,这是在ImageNet中目前最高的准确率,比第二高的准确率高出2%,

研究团队认为,这项研究成果将可以让研究人员更近一步了解,如何从监督式转移到弱监督训练(Weakly△supervised△training)方法,也就是用现有的标签,而不是用为特定AI训练模型创造的标签。

脸书AI研究院认为,大多数的使用者都会为自己的贴文图片加上Hashtag,这些图片将会是很理想的训练资料来源,不过,Hashtag包含了多种层次的概念,像是#tbt是回顾上周四,也包含一些较模糊的概念,像是#party,有可能是形容一个活动或是一个场景,包含模糊概念或是与图片不相关的主题标签,都会混淆深度学习模型。

研究团队将这类型的主题标签视为标签杂讯,标签杂讯会影响大规模的训练工作,因此,研究团队开发了一套专门用Hashtag进行监督式图像分辨的方法,将每张图片的多个Hashtag通过同义词排序,并平衡频繁出现和较稀少的Hashtag,为了确保Hashtag对图像分辨模型训练有效,团队还训练了一套预测主题标签的模型,这个方法显示出在转移学习上有很不错的成果,也意味着这套图像分辨模型可以应用到更多、更广的AI系统中。

虽然这项成果是电脑视觉技术的一大突破,但是在研究的过程中,也发现了一些问题和挑战,像是大规模的训练和标签杂讯,增加训练资料通常能够增加图像分类的正确性,但是也会产生新的问题,选择与特定分辨物体相关的标签是非常重要的,若没有经过挑选,模型分辨能力可能会下降,而如何充分利用所有1万7千个Hashtag来训练模型也是一个待研究的课题。

在处理标签杂讯的部分,研究团队没有用复杂的去除杂讯方法,而是将相似的标签配对,将不相似的标签减少权重来计算,在训练的过程中,只有稍微调整标签,而实验结果也证明,标签杂讯对大规模的训练集影响不大。

在未来,脸书也预想除了用Hashtag来当作分辨的标签之外,Hashtag也可以让脸书更了解视频和图片内容,作为动态墙的排序,或是Hashtag还能指出图片中更具体的子类别,举例来说,一般的分类只能分辨出一只鸟在树林中,若通过Hashtag还能知道鸟和树的种类。

tags:

上一篇  下一篇

相关:

自主机器人也能主动解决问题,脸书AI研究院靠虚拟环境,成功训练机器人解答指定生活问题

图片来源: 脸书 脸书AI研究院最近发表一项训练机器人拥有自主能力的研究成果,通过以目标为导向的方式,让机器人在虚拟的环境中,利用感知、移动和沟通的能力找寻答案,再以自然语言的方式回复问题。脸书AI研究团队指

重现能自我学习的AlphaGo Zero,脸书AI研究院开源释出ELF OpenGo

脸书AI研究院于2日发布开源释出电脑围棋AI模型ELF△OpenGo,ELF△OpenGo成功复制了DeepMind日前打造的自我学习电脑围棋AI模型AlphaGo△Zero,建立在脸书现有专为强化学习研究设计的可扩展、轻量级框架(ELF),目前脸

于洋:一带一路的图像表达与展陈之道 推荐

作为超越地缘政治的开放性合作架构,“一带一路”不仅是社会经济层面基于互利共赢理念的务实合作平台,也是以和平、交流与共享的方式重新缔结中国与世界关系的积极实践。当我们以人类命运共同体的宏观视域审视自身的

对脸书隐私作法有歧见,WhatsApp执行长Jan Koum即将离职

华盛顿邮报(The△Washington△Post)周一(4/30)报道,WhatsApp创办人暨执行长Jan△Koum因与母公司脸书(Facebook)在用户隐私与加密机制上产生歧见,将离开自己创办的WhatsApp。当天Koum即在自己的脸书上发文证实

AI趋势周报第37期:恶意程式训练样本也有开源资料集了!EMBER提供百万PE档,可训练ML模型

由于美国网络安全的法律限制,EMBER中的110万个Windows△PE档案并不是档案本身,而是从PE档案里撷取的档案特征。另外,EMBER也提供用这些特征训练出来的基准模型。 图片来源: EMBER△GitHub 重点新闻(0420~0426)?

站长推荐: