做个大数据“捕鼠器”,让金融诈骗无所遁形

做个大数据“捕鼠器”,让金融诈骗无所遁形
2016年12月13日 18:27 DT财经

 SODA数据侠十强争霸④

摘要: 12月22日上海开放数据创新应用大赛(SODA)的决赛即将展开。作为战略合作伙伴兼好基友,DT君独家采访了入围决赛的10支队伍,近年来,不同形式的金融诈骗开始频繁地出现在普通人的生活中,今天DT君带来了系列专访的第4篇。两家大企业强强联手组成了参赛队伍,使用交叉数据,开发了一整套打击金融诈骗的解决方案。

文/DT财经 程一祥

电信银联强强联手,围剿金融诈骗

SODA比赛的决赛团队中,有一支“背景深厚”的队伍——电信银策联队。他们的作品目标,也是指向解决当下社会生活中最迫切需要解决的问题之一,可以保护每个人的金融安全。

现在通过各种通讯进行金融诈骗的花样越来越多:手机收到陌生人要求汇款的短信,或者收到银行卡盗刷、套现的警告提醒等等……这些各种类型的金融犯罪为城市安全笼上了一层阴影。据公安机关统计,2015年全国因电信诈骗产生的经济损失高达222亿元。随着技术的发展,电信诈骗的套路也越来越深,很多有组织有纪律的诈骗团伙甚至从境外进行犯罪活动。

但是无论诈骗套路如何变化,几乎所有的金融诈骗,都离不开通讯和交易这两条渠道:一方面,诈骗团伙需要借助电话、互联网等通讯工具与被害人联系;另一方面,完成联络后,他们还要通过刷卡、取现、转账等金融行为实现资金的非法占有。

而SODA的这支十强队伍,对通讯和交易这两条渠道都有十分深厚的专业理解。他们的团队成员来自于上海电信和银联智策——在电信大数据和消费大数据的产品化和多场景应用上都具有丰富的实战经验。在比赛中,他们开发了一整套基于大数据的通信金融安全解决方案,用来打击各类电信金融犯罪。

交叉数据:用来描摹电话诈骗人的画像

打蛇要打七寸。针对越来越泛滥的电话短信金融诈骗,电信银策团队针对手机金融诈骗的特点,电信银策团队通过串联电信大数据和消费大数据,构建了一个反诈骗模型。

(图片来源:电信银策)

他们以真实诈骗数据为样本,结合了手机的通讯数据和银行卡消费数据两部分来源,分析了基于通话时长、频次、生命周期、交互维度的用户通讯行为以及基于转账、消费、取现时间、额度等用户资金行为后,用机器学习的方法描摹出诈骗人的画像。

(图片来源:电信银策)

紧接着,团队通过决策树的分类算法不断迭代优化,提高数据辨认的准确度。最终,模型对大量的用户进行分类,构建“诈骗人号码库”和“骚扰人号码库”两个数据库,方便电信运营商、公安机关、普通民众对诈骗信息进行快速、准确的甄别。

语义分析:帮助找到互联网金融传销窝点

而针对互联网金融传销,电信银策团队也拿出了他们的解决方案。

互联网传销也叫微传销,是一种新型的传销手段。它通常以智能手机为工具,在微信等平台上打着虚拟货币、金融互助、慈善救助等旗号进行传销活动。他们以互助的名义,诱以短期高额收入,会员巨幅优惠,以及拉入新人的巨额返利来欺骗投资者。

(图片来源:电信银策)

电信银策团队首先锁定了一些被证实的传销网站作为样本。他们通过对这些网站的文本信息进行语义分析处理,根据关键词的组合挖掘了其他潜在的金融传销网站。

之后,他们通过爬虫技术采集了高频访问这些网站的用户数据,构建了目标人群数据库,找出了传销链条中可能的组织者和其他核心节点。

下一步再结合电信的地理位置数据,团队甚至锁定了一些高度疑似网络传销的团伙窝点。他们告诉DT君:“在某些街道小区,我们发现有好几个外来用户频繁地访问这些传销网站。‘他们’年轻,没有工作并且聚集在一起。这些用户特征让我们有理由怀疑,这可能是网络传销的窝点。”

从模型到应用,还有很长的路要走

除了上述两类反金融诈骗的解决方案之外,电信银策团队还基于大数据技术和分析思路提供了针对其他金融诈骗犯罪的“利器”。

比如,通过对手机和银行卡的定位,当持卡人所使用的手机和银行卡消费所在的地位置不匹配时,大数据就可以有效提醒发卡机构采取安全措施,向持卡人确认甚至冻结交易,避免持卡人的经济损失,这样越来越多的手机银行卡盗刷问题也可得到有效解决。

另外,针对银行卡套现问题,团队也建立了社交网络模型用于挖掘套现商户。这样的模型旨在准确发现经常套现的持卡人及专业套现的商户,有助金融机构在贷款审核及贷后跟踪阶段迅速识别套现个人和商户,降低逾期及坏账风险。

当然,从模型到应用,还有很长的路要走。

“我们建立了很多模型,但这些模型的落地和完善其实还需要更多的开放数据,”队长汪科科告诉DT君,“更确切的说,是更真实的、多维度的开放数据。”

他觉得,大数据好玩儿的地方之一,就在于交叉融合的价值。未来,就像‘互联网+’一样,‘大数据+’也会变成一种基层要求,成为社会进步的新动力。

不过,数据融合的价值是一方面,如何保护数据安全则是另一方面。

DT君在想,“开放数据分级”可能是一种解决方式。数据可以分成不同的程度进行开放,例如原始数据、半加工数据、脱敏数据、交易数据等。国家也需要制定相应的行业标准,规范开放数据的细则。

数据侠门派

电信银策是由上海电信和银联智策联合组成的团队。

汪科科:电信银策团队负责人。上海电信大数据运营中心产品推广经理。目前主要专注金融安全大数据产品构建,以及视频大数据精准营销领域。

陈国润:电信银策联队成员。目前就职于上海理想信息产业(集团)有限公司大数据部,主要负责电信大数据产品研发和模型算法研究。

丁峰:电信银策联队成员。目前就职于银联智策顾问(上海)有限公司数据实验室,专攻金融大数据应用领域的研究,重点关注金融大数据在金融风险管理、行业研究等方面的应用。

王佩璐:电信银策联队成员。目前就职于银联智策顾问(上海)有限公司应用开发部,主要负责公司互联网产品与大数据计算平台的架构设计与开发

如何加入数据侠

“数据侠”栏目网罗全球最IN的大数据侠客,利用人工智能、机器学习以及各种前瞻算法,打造理性而酷炫的数据可视化盛宴。过去,我们用文字,视频,图片传达信息。现在,我们用大数据阐述事实及其背后逻辑趋势。

DT时代超级英雄正在组队!你也想要成为成为数据侠吗?请将你脑洞大开的数据作品,发到数据侠联盟盟主程一祥邮箱吧:chengyixiang@dtcj.com。

欢迎关注12月22日SODA决赛

上海开放数据创新应用大赛(SODA)是一个城市级别数据创新平台,通过众筹政府与企事业单位数据资源,面向社会大众众包创新解决方案,从而解决城市问题,促进数据流动。2015年SODA举办第一届大赛,聚焦城市交通,吸引全球500余创新方案。

2016年SODA的主题为城市安全,覆盖交通、食品、治安等多个领域,来自全球优秀的数据侠们,从不同角度应用大数据,守卫城市安全。

2016年SODA决赛路演将于12月22日(周四)在上海举办,来自上海、武汉、天津、杭州、英国等地的10支决赛队伍将现场路演其城市安全创新解决方案,涉及警力优化、食品安全评价、社会协同治理、环境安全可视化、大规模人群应急响应等现实问题,最终将通过现场评审,角逐出20万元SODA大奖得主。

关注DT财经微信公众号“DTcaijing”,获取SODA决赛观众门票。赛前主办方将发送确认信,确定是否报名成功。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部