YouTube视频推荐怎么知道你想看什么？关键就在机器学习

2017-11-02 18:49:41 | 来源：ithome | 投稿：米娜 | 编辑：dations

原标题：YouTube视频推荐怎么知道你想看什么？关键就在机器学习

不少人观赏YouTube上的视频内容，会发现YouTube会推荐许多你可能感兴趣的内容，Google今天揭露这项服务背后的关键技术为机器学习，通过机器学习过滤出使用者可能感兴趣的内容，以提供用户个人化的体验。

全球每分钟约有超过500小时的视频被上传到YouTube，这些大量的内容中，如何找出使用者可能感兴趣的内容推荐给他们，成为YouTube服务团队的任务之一。YouTube工程研发副总裁Cristos△Goodrow表示，YouTube的工作之一就是帮用户在大量的内容中找到他们想看的，进而改善他们的服务体验、提升满意度。

为了达到这个目标，YouTube持续优化服务，例如2011、2012年间将演算法从观看次数（Views）改为观看时间（watchtime），虽然这么做导致了观看次数在一天内下降20%，但观看时间却从平均120秒提高到140秒，到如今，2017年全球每天YouTube观看时数已达到10亿小时。从观看次数转为观看时数，代表YouTube更看重使用者的黏着度，也就是用户可能感兴趣的内容。

由于观看行为的改变，人们从PC观看YouTube逐渐转向在手机、平板电脑上观看，据统计现已有超过60%观看时间是在行动装置上，YouTube也在2014年到2015年优化行动网页，让页面的排版更个人化外，还导入了Google△Brain团队的机器学习技术，改善YouTube视频推荐的准确性，让视频观赏经验更个人化。

去年到今年YouTube大大小小共推出190个更新，目的为提升用户满意度、维持新鲜感，让网页更个人化，并重新设计行动首页，使介面更简洁，首页显示和使用者相关的个人化推荐视频。种种改善造就现今超过70%的观看时间来自YouTube自动推荐的内容，YouTube首页每天推荐2亿支不同内容视频，在首页点击推荐视频的观看时间，三年来成长了20倍之多。

全球YouTube用户超过7成的观看时间来自自动推荐视频，YouTube如何在庞大的影音内容中挖掘出使用者可能感兴趣的内容推荐给用户，背后的功臣是Google在2015年开源的TensorFlow的机器学习技术，打造YouTube视频推荐系统。

以TensorFlow架构的机器学习模型，让深度神经网络系统更快运作、更有弹性：

TensorFlow被运用在Google△Photos及翻译服务中，而在YouTube视频推荐系统结合了两个神经网络，候选生成模型（Candidate△Generation△Model）及排名模型（Ranking△Model）。

如上图所示，推荐系统会先从候选生成模型，考量使用者过去的浏览视频历史、捜寻历史、人口变项等变数，将YouTube的影音资料库中的数百万个影音资料筛选出数百个和使用者相关的影音资料，以贴近使用者的喜好。

接下来再经过排名模型（Ranking△Model），通过提名特征（Nominating△features），特征包括了人口统计资如地理位置、最受欢迎影音、使用者语言、视频使用的语言、近期观看纪录、使用者和该频道过去的连结等等特征，以权重评分找出和使用者有关链性的讯号（Signals），以产生数十个视频推荐给使用者。为使用户感受到YouTube了解使用者的喜好，YouTube随时会准备100小时用户可能感兴趣的内容。

Cristos表示，候选生成模型就像去卖场购物时，将商品从货架上放到购物车中，而排名模型则是从中排序，挑出你想要的。通过机器学习技术打造的推荐系统，让YouTube能够自动推荐使用者想看的。

值得注意的是，YouTube的推荐系统不仅针对个人喜好，还细致化到个人所使用的不同装置。YouTube大中华与纽澳技术管理负责人叶佳威表示，YouTube为实现个人化体验，随时会为用户准备100小时用户感兴趣的内容，即便相同的使用者在不同的装置上观看YouTube，系统也会依不同的装置推荐适合的视频给用户，例如在家通过Chromecast在电视上看YouTube，通常观看的时间会比较长，而和在外面以手机看YouTube, 观看时间会比较短，不适合推荐较长时间的内容，因此系统会考量不同的使用装置推荐YouTube内容。

在推荐系统上采用机器学习，提供用户个人化的内容，让使用者可以更容易的在YouTube上找到他们想要看的，推荐的内容更合乎使用者的心意，YouTube认为对广告主、内容创作者也有好处，广告主更容易锁定目标群，创作者的上传内容也容易被感兴趣的人看到，但YouTube也承认自动化的视频推荐可能让受欢迎的内容变得更受欢迎，影响其他内容被看到的机会，也是未来还需克服的。

除了YouTube推荐系统采用机器学习，为避免YouTube遭到滥用，散布恐怖主义、暴力内容，今年6月YouTube也开始用机器学习协助分辨不当内容，过去依赖使用者检举不当内容，运用机器学习后，YouTube团队审核了超过100万部视频，作为机器学习训练实例，提升辨别的准确度，根据9月的数据，83%的暴力极端主义内容在被检举前就被分辨出来。

另外，Google也尝试以AVA（Atomic△Visual△Actions,原子视觉化动作）数据学习模式，运用机器学习了解YouTube视频中的人物行为动作，做法是从YouTube视频中截取15分钟的片段，再将片段均分为300组时间只有3秒的小片段，已事先定义的人类原子动作下标签，例如走路、踢球、握手，再依标签下注解，AVA将人类行为分为姿势或移动、人与物互动行为、人与人互动三类。目前以AVA分析超过57万个视频片段，产生21万个标签，标注了9.6万组人类动作，日前已释出了这些人类行为资料集，希望抛砖引玉，吸引更多研究投入，发展出更多应用。

tags：

相关：

你曾想过自杀吗？研究：用AI就能知道你的自杀倾向

示意图，与新闻事件无关。来自卡内基梅隆大学（Carnegie△Mellon△University）与匹兹堡大学（University△of△Pittsburgh）的研究团队利用功能性核磁共振（functional△magnetic△resonance△imaging，fMRI）与人

Sony机器狗Aibo重回来了! 咕溜大眼还多了AI功能

图片来源: Sony 一如传闻，消失10年的机器狗Aibo周三在Sony的宣布下，准备重出江湖。?和十年前的版本相较，新版Aibo具备更逼真的外型，可在和主人互动时摆动头部、尾巴和眨眼，做出滚球、趴下、好奇等动作，还会依情

Walmart靠机器人盘点50家分店背后的秘密，关键技术是电脑视觉

图片来源: Walmart 全球零售商龙头沃尔玛（Walmart）于上周四（10/26）宣布，在美国的沃尔玛超市将使用机器人和人工智能（AI）技术，来处理具重复性、可预测性的人工任务，如扫描货架上缺货的物品、替换不正确的价格

Walmart在逾50家门市导入机器人扫瞄货架上的商品

图片来源: Walmart 美国大型连锁超市Walmart上周宣布将扩大机器人实验至全美逾50个门市，由机器人负责瑣碎的货架扫瞄服务，让员工能专心地售货及服务客户。Walmart原本只在阿肯色州、宾州与加州的少数门市进行机器人

【5千万张eID普及关键】拥抱国际标准，德国让国民eID能通行全欧

德国联邦印制厂资深副总裁Roland△Heise表示，德国政府让民众知道该卡片储存了何种资料，并将所有相关周边如卡片终端机、读卡机等技术规格，一并在网络上公开，借此能赢得该国民众的信任。（摄影／洪政伟）素以注

热点 / Hot

站长推荐：