零点有数对公安情报分析业务的研究,除了聚焦传统的多源数据融合、业务模型建设以外,对时空大数据分析也有一定探索成果。
时空大数据分析最早可以追溯到维多利亚时代的伦敦,当时的伦敦每4-5年都会爆发一次霍乱,由于无法确认传染源,疫情无法得到控制。医师约翰·斯诺(JohnSnow)在研究病例时发现某个社区四周遍布疫情高发区域,却在社区内部鲜有死亡病例。在走访中他发现该社区私设水井,居民日常用水并非取自当时垄断伦敦用水的几个自来水厂。在此经验下,约翰·斯诺绘制地图,将取自来水饮用的人们与未取水饮用的人们绘在同一张图上,将每个社区的死亡人数标在上面,最终发现,自来水厂的水泵覆盖区域与霍乱高发区域高度重合,越远离水泵,死亡人数越少。约翰·斯诺确认水才是霍乱传播途径,水厂是传染源头。那是英国最后一次发生大型霍乱。之后人们开始修建下水道,构建城市公共设施,保证水源的清洁,避免与污物处理源进行接触。这张“死亡地图”拯救了伦敦市,也创造了一种全新的数据分析方式。
零点有数始终相信情报分析的形式是自由多变的,脱离于表格和数字之外的时空大数据分析也是可行的方向。数据上图不仅仅是点位直观的呈现、布局宏观的展示,通过多源数据的网格化投图、叠加、重合度分析,数据上图不仅可用于指挥口,亦可用于情报分析口。
基于此,零点有数专门开发了服务于公安系统的情指一体化数据智能平台“优警通”,其网格化地图将全市划分为若干几何网格、社区网格、警格、责任区等不同形式的围栏,利用自研的网格归属算法投入多源数据,将警情、案情、人员、场所、智感设备等点状数据投置于统一的电子围栏之下。以网格作为分析范式,使得地图获取了三种新能力:
网格作为区域范围,可以将割裂的点状数据统计起来,迅速定位治安乱点、案情高发点。
网格允许投点位置出现少量偏差。投点精准性一直是时空大数据分析的重中之重,网格处理辅以地址标准化等手段,降低了人员位置、场所位置、警情/案情位置等文本地址投点时的精度要求。
网格化分析后,产生全新的网格颗粒数据,又衍生出后续的分析方法,例如将网格视为集合的叠加分析、将网格视为图片像素的相似度分析等。
叠加分析是网格分析的核心,分析人员将多张网格化处理后的图层,如医生处理X光片版一层层叠加,探索特定场所、特定人员位置、特定警情/案情发生地间的关联关系,形成人、事、地、时、物五维分析,输出集合运算后的图层叠加度、饱和度等量化指标。零点有数一直在不断探索如何将整套分析方法打造为数据处理中台,完善配套分析工具、提高分析维度自由度、提升运算效率、提升线索自动挖掘能力,并不断拓宽数据源,辅助情报分析人员形成自身独特技能战法。
零点有数“优警通”数据平台的网格化地图在舟山、台州、湖州等公安局均已落地。以网格化地图为核心,舟山公安建立网格化分析平台,精细化治理多源数据,将高发区定位从片区缩小至百米网格,结合舟山实际情况,锁定特定敏感场所。以网格化地图为核心,台州公安建立决策支撑平台,打通数据中台多源数据,切片式分析各数据图层,开展交集、并集、连续月内高发等分析叠加模式。同时,开拓了网格图层冻结、分析范式共享、本地数据在线网格化等全新分析方法,探索数据间关联,成为分析决策的支撑。湖州公安在情指行一体化平台中,以网格化地图作为情报分析的核心载体,以网格作为统一围栏打通多源数据,绘制单一网格的体检报告,使数据治理维度整体从派出所级下沉至网格级,精准研究情报线索。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有