Google前中国研究院院长：用迁移学习训练医疗诊断ML应用，小数据也能训练出精准模型

2017-11-10 02:24:10 | 来源：ithome | 投稿：尤慧 | 编辑：dations

原标题：Google前中国研究院院长：用迁移学习训练医疗诊断ML应用，小数据也能训练出精准模型

HTC健康医疗事业部总经理张智威从在2006年就加入Google研究院，随后还担任了Google中国研究院院长，在人工智能的领域已经投入多年，张智威已经回来台湾5~6年，但是因为较低调，鲜少人知道他其实已经回台湾一段时间。

他指出，类神经网络从1980年代就诞生了，10年前就有一篇ＭoGo的论文，预测了电脑下围棋会赢过人类，果真AlphaGo在今年初打败人类世界围棋冠军，他认为，资料量的规模和运算能力的成长，是AI近来兴起的关键。

不过，云端计算的能力在2008年就已经商业化，大数据也在2006年就开始兴起，像是Google好几年前就拥有庞大的数据库，成为世界第一大的搜寻引擎，但是当时Google为何没有用AI-他的答案是：“当时并没有用AI的急迫性！”

当时Google搜寻引擎的网页评分系统和广告推荐都并不需要用AI，就能提供给使用者的准确的结果，再加上，其实搜寻的结果和广告推荐都没有真实的数值（Ground△Truth），因此，就连Google拥有丰富的数据和运算能力，也没有采用深度学习的模型。

现在，AI技术较成熟，他用一张实测的图显示，5种不同的演算法，针对不同资料量来训练时，数据越多，演算法的准确率就越高，因此，他表示，如果数据够多，就选择便宜的演算法较佳，但若是数据不够多，不管是多厉害的论文发表的演算法，其实效果都不彰。“大量资料是必要的，没有资料就没办法做AI！”张智威直言，AI系统的准确度，依赖训练的资料量。

他将眼光放向台湾其中一项强项，那就是医疗，他认为医疗诊断需要更好的典范转移，他举例自己过去看诊的过程，发现自己心脏不适后，到医院挂号等待，终于轮到自己看诊时，医生却只有5分钟的时间可以看诊，在5分钟的时间内也无法确诊，要另外安排其他的相关检验检查，检验完毕后再回来看诊，确诊后医生开药给病患回家吃，来来回回就耗费了好几天，如果下次又感受到身体不适，又得重复一样的流程，他认为，医疗的诊断还可以有更有效率的流程。

他指出，未来医院不再需要集中在城市的某些地方，而是一个分散的系统，分散在一个地区的各地，让民众到达医疗机构变得方便，而医院不再需要非常完整且精密的医疗仪器，而是一个病人与医生的互动场所，因为许多病患的医疗资讯收集工作，可以在平时就完成。

他举出，应该要有设备能够平时追踪病患的健康状态，将这些平时的资料存放在云端，健康系统发现病患身体状况可能有问题时，可以传送警示给病患，建议病患到医院检查，而医生也因为有更多足够的数据，就能够更容易确诊病患的问题，病患的身体状况也能得到更好的照顾。

“台湾的优势是医疗，但是最后的关键还是需要数据！”张智威直言，没有数据，预测系统是做不来的，他以HTC研究与健康医疗部门所开发的医疗诊断检测设备来解说AI在医疗上的应用，医疗诊断检测设备包含验血验尿诊断、呼吸诊断、光学诊断、生命特征诊断，以及问诊。

验血验尿诊断可侦测糖尿病、贫血、肺炎、白细胞增多症和尿道感染，而呼吸诊断则是可以侦测阻塞性肺炎疾病，光学诊断能够侦测中耳炎和黑色素瘤，生命特征诊断即是心律不整、高血压等疾病。

他指出，医生的问诊就是缩减病患需要做的检查和潜在症状可能性的过程，通过最少的问题，定义出最准确的诊断猜测，现在有些网站提供病患自行搜寻症状，系统经过分析后再给予使用者可能疾病结果，但是，他表示，这样的使用者体验不够友善。

张智威试想如何将AlphaGo成功的经验，移转到到医疗诊断系统上，他通过增强学习，让代理人（Agent）询问病患病症，根据病患回复的病症给予病患预测的状态，并用报酬的机制，答对给予奖励，判断错误或是问太问题就扣分，不断的训练。

他比较了AI在围棋与医疗诊断的差别，首先围棋的棋谱可能性是有限的集合，而人类身体的状况有无限种可能，再者，围棋的输出是二元结果，只有输和赢两种，但是人体的疾病大约有800种，最后围棋可以出其不意，探索新的下棋法，但是医疗诊断必须遵循用药指示，不能轻易尝试新方法。

有鉴于医疗诊断和围棋的差异，张智威将人体用阶层式分层，将身体的分成不同部分，主代理人选择一个身体部分的代理人问诊，需要考虑的包含病患医疗资料、身体的部位和疾病的好发时间，最后，达成大约7.24个问题，就可以完成问诊。

光学诊断的部分，他以中耳炎的判读为例，用CNN△和DNN演算法分辨，但是因为训练样本不足，只有1,000多个图像样本，导致演算法的准确率大约只有75％，于是，团队开始想办法，在网络上找了各式各样的影像，不是只局限于耳道的影像，并将这些网络上找来的图片分类，通过CNN模型，将原本的图片和处理后的图片比对，当输入一张图片到CNN模型时，就会产生相对应的编号和分辨结果，像是中耳炎的图片可能对应到柳丁或是拉花咖啡，他表示，这样对应的关系，就是将某个领域的知识转移到不同的领域上，也就是所谓的迁移学习，因此，通过这些与中耳炎无关的影像，最后分辨的模型稕确率高达90%以上。

不过，他也认为，目前AI都还指示擅长分辨物件，AI只学习到了人脑的额叶（Frontal△Lobe）运作，离真正的AI还很远。

他表示，现在很多企业都还在鼓励年轻人开发App，但是他指出，现在App如果不收费，只靠广告赚钱的话，至少要有15亿的使用者下载App△才有办法赚钱，而台湾根本没有这么大的人口市场。台湾的AI人才很多，重点是要有开发AI应用的动机，他也建议，网络上有许多开源的AI课程，有兴趣往AI发展的开发人员都可以多多利用。

tags：

相关：

美国州参议员称中国是美国的未来 [生活]

美国州参议员称中国是美国的未来美国州参议员称中国是美国的未来，要让美国孩子讲中文提倡双语教育。近年来，欧美兴起学中文热潮，一些幼儿园开设中文课，“从娃娃抓起”。这股热潮主要是因为中国经济崛起，不可小觑

你熟人里有他们吗?中国重名最多50个姓名 [生活]

怎么给宝宝起名字一直是父母发愁的问题，如何起个好听的名字又能避免重名呢？七零后和八零后这批年轻爸妈，为了给孩子取一个“洋气值”赶超自己的名字，可谓煞费苦心。不过，小编总结发现，那么多好听的名字，竟然都

全球1500队竞逐台湾HITCON CTF竞赛创新高，中国首度没进Top 10决赛名单

即将在12月8日～9日举办HITCON△CTF决赛，发挥创意，首度采用美食街的形式，全世界前10名的CTF团队和2队台湾队伍，都将为了可以吃到台湾美食而努力解题。图片来源: HITCON△CTF官网预计在12月8日～9日在台湾举办

OPNFV专案推新NFV平台也拥抱容器技术，要让虚拟网络功能也能跑在容器上

OPNFV专案在最新释出的开源NFV平台Euphrates中，开始初步支援了容器技术，要让虚拟化网络功能（VNF）也可以在容器中来执行，让企业在NFV环境中管理与调度VNF功能变更容易，这也是OPNFV迈向云端原生应用跨出的重要一

3亿中超巨星再为中国足球长脸 [生活]

3亿中超巨星再为中国足球长脸，西媒狂赞:他配得上巴萨，保利尼奥把西媒打服。10月25日，西班牙《马卡报》撰文对效力于西甲巴塞罗那队的巴西球星保利尼奥进行了赞扬。自打保利尼奥以高达3亿人民币的身价从中超联赛转会

热点 / Hot

站长推荐：