【资料治理怎么做】灾防科技中心让全民变成政府灾情搜集器,掌握未知灾情再早一步
2017-10-09 20:46:14 | 来源:ithome | 投稿:阿呆 | 编辑:dations

原标题:【资料治理怎么做】灾防科技中心让全民变成政府灾情搜集器,掌握未知灾情再早一步

国家灾害防救科技中心从2年前开始用上百个社交媒体的灾害资讯,来帮助政府能有效掌握未知的新灾情。上图右至左为负责系统开发的主要成员苏文瑞、刘致灝。(摄影/洪政伟)

去年7月8日,强台尼伯特横扫东台湾,破表的17级风更在台东肆虐,造成重大灾情,挟带的豪大雨,更导致多处淹大水,台风期间,中央也赶在第一时间,在国家灾害防救科技中心(简称:灾防科技中心)3楼成立临时灾害应变中心严阵以待,并由内政部长叶俊荣现场坐镇指挥,随时紧盯前方荧幕墙上不断回传更新的民众第一手灾情报讯,并依这些情报现场马上下达指令。

只要一有民众在社交网站贴出新灾情,隔没多久,应变中心的社交灾害情报平台,就能看到这些灾害资讯,这些网站每增加一笔灾害情报,荧幕墙上就会新增多一笔,并依时间排列,每一张社交灾害资讯上,皆会以照片形式来呈现,照片下方还会搭配日期时间、地点描述、资料来源,甚至还会在荧幕墙右侧的大型地图上,显示灾害发生的定位资讯。

政府救灾也开始结合社交情报

尼伯特台风警报从早上6点发布后,不到25分钟,应变中心从社交网络已经得知台东市区路上开始出现灾情,台风登陆3小时后,也收到高雄市三民区淹大水的情报,隔了5小时,台南市仁德区也传出相同的淹水情形,直到下午4点,台风登陆的9小时后,指挥中心已经可以大致掌握主要灾情分布,指挥官可以马上指挥动员救灾。

从台风登陆到警报解除期间,应变中心搜集到的社交灾情报料超过4万5,000件,可供政府掌握全台即时救灾情报来使用。

尼伯特台风并不是政府第一次开始结合社交情报救灾的重大灾害事件,早在5个月前的高雄美浓6.4大地震时,政府就已经开始运用社交舆情来救灾。尼伯特袭台之后,从9月的莫兰蒂及马勒卡双台,以及中台梅姬,到今年7月的尼莎和海棠过境时,也都结合社交情报,来缩短灾情通报时间,让现场指挥官可以依据民众提供的即时灾情,迅速调度人力来支援救灾。

“以前因为救灾速度太慢,所以政府常被批评是看媒体找灾情。”长期担任政府灾害科技技术支援的灾防科技中心系统开发专案组组长苏文瑞很有感。他表示,这其实是和过去政府救灾资讯情报的掌握速度太慢有关。

苏文瑞表示,过去发生紧急灾害后,政府在搜集这些灾害资料时,多半都得靠民众的通报才知道,如拨打119电话,等到消防单位到现场处理后,才由各局将各地灾情报讯统一汇整回传中心,“但这样的速度,用在现场救灾应变上,反应还是太慢,所以才会惹得背负骂名。”他说。

随着社交媒体窜红,成为时下最热门的资料传递与散布的新管道,甚至取代了传统媒体。苏文瑞表示,政府的紧急灾害应变也有新作法,开始结合社交情报的力量,只要民众将灾害情报,以文字、照片或视频等方式,发布到社交网络上,政府马上可以从这些地方搜集到最新灾害资讯,来加快救灾,等于是“全民都变成政府的资料搜集器。”他说。

政府的社交大数据灾情搜整及分析平台,自2年前开始推出上线后,现在每当发生重大紧灾害事件时,只要有民众在社交网站贴出新灾情,隔没多久,中央灾害应变中心的社交灾害情报平台,就能快速看到整理筛选过的最新社交灾情报讯,能依照时间排列,以照片来呈现每一件社交灾情报讯,还会显示发生时间、地点、资料来源,也会直接在大型地图上,显示灾害发生位置。(摄影/余至浩)

掌握灾情的速度能比媒体更快20分钟

有了社交媒体情报来救灾后,苏文瑞表示,现在,不一定要靠民众通报,也能够很快知道哪里有灾情发生,掌握救灾情报速度更快,而且是第一手消息,资讯更即时,如果跟传统媒体相比,“甚至能做到比传统媒体还提前快20分钟知道。”他说。

通过社交媒体取得灾害资料,还有另一个好处,苏文瑞指出,民众以前只有在灾情严重时才会通报,还没酿灾就不会通报,只会在社交媒体上分享,而直接搜集社交平台上的公开资料,也可以帮助政府提前知道哪些区域需要特别注意,针对可能即将有灾情发生的地点,及早提高警觉,加强各项防灾工作。

政府之所以能在发生紧急灾害后,可以很快取得社交网络发布或讨论的最新灾害资讯,靠的是灾防科技中心在2015年建立的一套社交大数据灾情搜整及分析平台,可以即时搜集来自不同社交讨论的最新灾情报讯,以便提供给现场指挥官即时作判断,才可以迅速掌握救灾情报。

苏文瑞表示,目前可用来搜集灾情的社交平台来源,共有213个,其中包含了许多台湾民众常用的社交媒体,例如脸书(FB)、噗浪(Plurk),或是讨论区及论坛,如批踢踢(PTT)或Mobile01等,但并不包含社交通讯软件Line。至于搜集的资料内容,主以网民在社交网站上发布的文字、照片,以及视频连结为主。

政府之所以能在发生紧急灾害后,可以很快取得社交分享或讨论的最新灾害资讯,靠的是灾防科技中心在2015年建立的一套社交大数据灾情搜整及分析平台,可以透资料攀爬,即时搜集来自不同社交网络发布的最新灾情报讯,并经过滤及筛选后,可供政府迅速掌握救灾情报。(图片来源/国家灾害防救科技中心)

社交灾害情报搜集分3阶段

当一有紧急灾害发生,政府就会立刻启动社交灾害情报的搜集活动,整个社交灾情舆情的搜集流程分成3阶段:社交灾情文章列表、重点灾害情报应用,以及灾情发布。

一开始资料搜集,会利用爬虫程式,从社交网站或论坛,来分批抓取灾情报料,再将资料汇入到后端资料库可以被查询。攀爬机制也经过设计,例如只针对社交网站或讨论区较可能出现与灾情相关的地方来搜集,如PTT地方版等,以防止捞到与灾害无关的资料。不同资料来源的管道,资料撷取的次数频率也有所不同,整体来说,“只要社交媒体一有新资讯出现,到汇入我们系统可以查询得到,只须20分钟。”他表示。

不过,苏文瑞也提到,即使有利用攀爬程式来抓资料,但有时还是会遇到少数灾情报料无法取得的情况,像是台风期间才出现的临时性活动,如民众在脸书成立的灾情回报专区等,因为不在原来程式设定抓取的范围,因此就可能会漏掉,所以这时还是得通过人工的方式,将这些新出现的灾情回报热点,手动列入到攀爬的名单。

苏文瑞也指出,将这些资料搜集下来以后,并不是全部的资料都会变成政府参考的重要灾害情报,而是会先经过二阶段筛选的步骤,“毕竟这些都是即时灾情的资讯,使用上也相对要更加谨慎。”他说。

每次资料搜集完后,会先以“关键字”搜寻的方式,针对这些杂乱未经过整理的原始资料,进行初步过滤的动作,只保留内容有符合特定关键字的资讯,例如“豪大雨”、“淹水”、“台风”或“地震”等。

苏文瑞表示,灾防科技中心还自行建立一套灾害关键词字库,内含许多相关的灾害关键词可以搭配组合,再通过关键字过滤出的第一步资料,就会在社交灾情平台上列表,也是社交情报发布过程的第一阶段。

针对灾情报料特征的快筛过程,也结合机器学习

紧接着,针对这些过滤后的资讯,还会再进一步的快筛,通过分析资料特征,找出符合政府救灾可用的资讯特征,这些特征有4大,包括了时间、地点、灾害描述,以及照片资讯。全部特征都必须具备后,才可以列入重点灾害情报的候选名单,进到下一阶段的人工判断,如果缺少其中一项,例如照片等,就会先不处理,优先处理其他还没筛选过的资料,除非是前面过滤的资料已经比对完毕后,才会针对原先不完整的资料,重新确认有无更新的灾害资讯进来。

苏文瑞还指出,在进行文本分析时,也借助了机器学习,将这些搜集起来的社交灾害资料进行分类,找出哪些可能是符合灾情的正确特征,来分别进行过滤。苏文瑞表示,灾防科技中心也建立一套大数据分析平台,并找来800篇的社交媒体灾情文章,来持续做为机器学习训练,以建立预测模型,目前学习效果的准确度约70~80%。

苏文瑞表示,若以地址资讯来说,通过这套预测模型,可以直接从每篇社交灾害资料中,分辨出哪些是灾害描述的地址,即使是分散在文章不同段落,也可以自动重组拼凑,找出可能相近的地址,之后再通过门牌地址定位服务TGOS,或如Google的地址位置查寻,以取得经纬度的座标,以便之后可以在实际地图上定位。

不过,苏文瑞也坦言,如果原来的资讯本身就不够完整时,例如路名不清楚等,最后还是需要人工来判断。

人工做最后把关还是不可少

如何确保网友分享的灾害资料是正确可信的?苏文瑞表示,靠的是背后建立的3道筛检关卡,前两道是通过系统来自动筛选过滤,先将一些与灾害资讯无关或资讯不完整的资料剔除,只保留与灾情相关且重要可用的资讯,即使筛选通过后,再上架到政府社交灾害情报平台前,还要由人工判断做最后的把关,以确认资讯真伪,才可以实际用来当作政府灾害情报的发布使用。

之所以最后仍要由人工来帮忙把关,苏文瑞解释,这是因为目前电脑还没办法完全辨识资料的真假,所以一旦民众提供的是假资讯时,如假造的照片等,系统收到后并没有办法判别讯息真假。

苏文瑞也回忆说,去年梅姬台风期间,就曾经有民众贴出一张假照片,照片中地点的确有淹大水,而且灾情描述也都正确,但后来发现民众用的是好几年前的旧照片,“这就不是系统可以自己判断得了的,还是得靠人工方式来找资讯佐证。”他表示,在人工判断上,像是可以通过即时观测的雨量资料,或是调阅现场附近交通监视器的影像画面,来进行交互比对,确认照片所在地区现在的雨量,是不是真的已经造成淹水情形。

也因为通过这3道筛检机制,来进行层层把关,才可以确保这些网友发布的灾情报料是正确且可信的,才可以被政府所采用。

若以去年的梅姬台风为例,根据灾防科技中心的数据统计,台风期间,总共搜集的社交灾情文章共有128,161篇,虽然经过系统过滤及人工筛选后,到最后实际能用的灾情报讯,只有84个,大约占了梅姬台风全台灾情923处的8.6%。

但不能小看这84件灾情的重要性,因为这些通过社交网站资讯所发现的每一件灾情,是以原有政府监测机制、各种通报机制、民众报案系统都没能发现的新灾情,等于这个从社交平台搜集灾害舆情的作法,让政府更快掌握那过去看不见的近1成灾害事件,而能让救灾资源的调度再早一步,甚至也能用来加快灾害风险评估,让现场指挥官可以针对有潜在高风险的偏远乡区,提早拟定疏散撤离的计划,以保障民众生命安全。

tags:

上一篇  下一篇

相关:

【资料治理怎么做】环保稽查也要科学办案,环保署靠AI才识破不肖工厂排污

环保署环境监测及资讯处处长张顺钦表示,初期将以空气污染的环境监测为主,不过未来也考虑推出水质感测装置,可在底下安装水质的感测点,将可投放在与农地污染有关的灌溉取道,来提升民众食用作物的安全,另外也可用

【用实际数据制定未来施政方向】美国马里兰州政府工作绩效全公开,用成果取代目标定政策

马里兰州政府的网站不但提供每年度的绩效报告,还提供民众查询政府过去的经费开销记录,凡超过25,000美元(台币75万元)的支出,就能查询。(图片来源/马里兰州政府) 美国马里兰州早在好几年前,就意识到资料治理

糗大了!Yahoo的30亿用户资料全都外泄了

由Yahoo及AOL合并的新公司Oath在周二(10/3)宣布,经过详细的调查之后,显示Yahoo在2013年遭到骇客入侵时,约30亿的所有Yahoo帐号都受到影响,而不仅是2016年底所揭露的10亿帐号。Yahoo在2016年12月坦承,该公司在2

甲骨文发表可自动修补漏洞的新一代资料库18c

示意图,与新闻事件无关。 图片来源: Oracle 甲骨文于本周日(10/1)举行的Oracle△OpenWorld开发者大会上发表了全新的资料库Oracle△18c,它能够在运作时自动修补安全漏洞,而不必再因手动修补而让资料库暂时停摆

Google:今年上半年政府调阅用户资料创新高

全球政府向Google调阅用户资料的请求(蓝色)及调阅涉及的帐户数(红色)在上半年创下新高。 图片来源: Google Google与苹果本周相继公布了今年上半年的透明度报告,揭露全球政府向业者调阅民众资料的现况,其中,Goog

站长推荐: