机器之心发布
金融壹账通
近日,平安集团旗下金融科技公司金融壹账通于上海金茂大厦顺利召开了「GAMMA 智能贷款解决方案发布会」,发布了一系列 AI 产品。在这些新技术中,贷款面审系统因为可以抓取客户面部的微小表情,察言观色来判断一个客户是否欺诈而引起了人们的关注。本文将对此功能背后的技术进行详细解读。
在信贷审批环节,存在很多痛点,例如,客户身份真实,但口述内容造假(又称「一方欺诈」),这种情况风控人员很难辨别。这次平安发布的微表情面审辅助系统,是基于客户回答问题时的微表情,来识别「一方欺诈」。下面是发布会上展示的欺诈识别流程。
体验者首先被要求输入几个信息,这些信息可以有真有假,微表情面审系统会通过简单的几个交互,完成信息真假的识别。
演示模拟了一个信贷面审场景,体验者作为贷款客户接受风控人员的面审。不过,全过程,风控人员并不需要说任何话或进行任何干涉,生成问题、提问、判断这些步骤全部由机器自动完成。
系统根据体验者输入的职业、地址等个人信息,自动生成核验问题。例如,它会根据家庭地址生成其附近的地标建筑,让体验者判断哪一个不是附近的地标。这个提问环节,主要是对体验者进行「应激」,因为一个人的微表情,只有在适当强度的应激下,才会被激发出来。
体验者对应激问题的回答,全部被摄像头捕捉到,并送至微表情分析系统进行分析。该分析系统能识别体验者的数十种面部动作和 54 钟微表情,并基于此对其是否欺诈进行判断。
其判断有两个维度,一是将体验者的表情动作与人群平均相比。例如,相比于人群,该体验者的皱眉次数比较多,可能预示其思索不到答案时懊恼的心理。
另一个维度是将体验者的表情动作与自己之前的回答相比。例如,体验者回答第三个问题用了 800ms 进行反应,而回答第一个问题的反应时只有 100ms,如此微小的差别对风控人员来说难以捕捉,但机器却很擅长这种分析。最终微表情面审辅助系统会依据综合考量给出当前风险高低的预测结果。
微表情面审系统技术介绍
微表情面审辅助系统通过察言观色来判断一个客户是否欺诈。这其中涉及了三个子任务:1. 基于客户动态图像识别其面部动作;2. 基于面部动作判断其情绪类型;3. 基于情绪表现识别欺诈概率。
检测人脸面部动作的变化无论对于传统的机器学习模型还是如今的深度学习来说都已经是十分成熟的技术。
不同情绪之间即使只有微小的区别,也会导致面部动作有所差别。例如,当一个人真心发笑时,动用的脸部肌肉至少需要 6 块。然而欺诈者在假笑时通常只会刻意重现最明显的肌群动作,比如鼓起颧大肌,但是外眼轮匝肌的则没有被牵动。
欺诈者拥有与非欺诈者不同的情绪状态,从而展露出不同的面部表情。因此我们可以由因溯果,通过检测面部动作来判断当事人的表情,分析其心理状态,最后对是否欺诈做出判断。
优质的数据是人工智能背后的助力,平安集团也从未忽视对各类数据的积累和对数据质量的严格把控。此次发布会背后成功的基石之一正是庞大的微情绪数据库。
目前各大研究机构所公布或使用的公开数据集中,大多都只有七类基础表情的数据,并且在数据量级上远远不足。此次平安集团旗下金融壹帐通所设立的 GammaLab 依照现代心理学理论,基于上述七大类情绪的框架,又细分至 54 种微表情。对每一种表情,都通过精心设计的心理实验完成相应人脸表情数据的采集,总计多达数十万张图像数据。下面的流程图中详尽展示了实验的方法。
情绪数据的收集与一般性物体分类数据的收集有所不同。例如,我们若需要一只豹子的图片我们可以轻易地获得大量高质量的数据。但是人脸情绪数据很容易受主观因素制约,通过实验模拟得到的情绪表现也易与 Spontaneous(即自发式的)情绪有所不同。为了解决这一困境,我们分派的数据采集人员都是心理学专业出身,并且在采集过程中,工作人员会主动与被试者攀谈,了解他们的基本生活情况,并在之后的实验中针对性地营造真实场景来激发他们的情绪。比如曾有一名女被试者家中有一个弟弟,于是采集员就在设计「委屈」这一情绪场景时,让她通过回忆小时候弟弟曾打碎花瓶却被妈妈错怪时的情景,来展现委屈的表情,力求逼真。
为了应对如此庞杂的情绪细分类,智能面审系统主要从两个层次来设计解决以求突破——数据提纯和模型架构。
所谓磨刀不误砍柴工,数据提纯的目的正是为了提升数据的质量和利用率,为后续的模型训练做好铺垫。首先我们将采集到的原始视频中各个情绪片段进行标注和切割,之后再应用实时的人脸检测和校正技术去除背景干扰。同时我们会提取视频中的关键帧,将出现面部遮挡或模糊的多余动作去除。这一步既能提高视频数据质量,也能帮助生成以图片为单位的图片数据库。
在模型方面,仅仅选用 Alexnet、VGG 等经典的神经网络则明显捉襟见肘。于是我们选择使用复合式的多网络结构。模型中一部分负责自主提取人脸特征,并学习区分不同表情的细微差别;另一部分负责分析数据内部的关系,包括但不限于各情绪之间的联系以及人脸在时域上的共享特征。不同的子网络各司其职,共同决策。
了解完技术层面的实现思路,接下来不妨看一组有趣的表情识别对比。以上两张图片中,左图和右图分别是真诚赞美和假意恭维时的人脸表情。根据实验统计,若单独展示一张人脸或一段人脸情绪视频,人类从 54 类情绪中选出正确答案的几率都要低于深度学习模型,尤其是对于赞美和恭维这般相似的情绪。
这里,我们通过可视化工具,可以显性地描绘出神经网络在判别这两种情绪时的关键区域。从下图中我们不难看出,恭维与赞美相比,眼睑的收紧程度更强,嘴角会相对下垂。对面部表情准确的洞察力要归功于合理的数据提纯和精细的模型设计。
正如同微表情数据的收集,平安同样重视构建其他的数据库。对于情绪-欺诈关系数据库,平安从真实贷款场景中收集了许多贷款面审视频,对贷款者的每一个问题的回答进行切割。问题分为身份类、家庭类、工作类、地址类和资产类等问题。最后根据风控人员提供的面审意见与电核结果对每一个问题的回答视频进行风险类型的标注。
如上图所示,借贷人频繁的低头查看,不熟悉个人信息被判定为疑似风险;而出示伪造证明时的不自然表情被捕捉到后则被视为确定风险。其他正常的面审回答则被认定为无风险。
由于一个人在回答问题时,大部分时间面部都没有特别的表情,所以向模型里直接输入整段视频会有非常多的无用信息。故此我们通过关键帧检测提取面部表情变化的时间段,在过滤无用片段的同时也不错过细微的表情流露。例如眼球向左上方看,肉眼不易发现的突然皱眉等等,都能被关键帧检测抓取到,这样的做法会显著提高模型的判断效果。
最后,如上图所展示的,实验统计初了欺诈者和非欺诈者在面审时出现的情绪占比。可以看到欺诈者在行骗时,常常会伴有几类特定情绪的展现。而且这些情绪出现的比例要明显更大,这一现象对于信贷等业务中的风控体系是大有助益的。
尽管微表情面审系统有着令人惊艳的表现,但这并没有宣判着面审工作人员的「末日」来临。相反,要让面审系统臻于完美,我们还有很长的路要走。在这漫漫征途中,既少不了技术人员的创新探索,也少不了业务人员对面审系统提供专业的反馈,让我们一同拭目以待。
在 AI 技术飞速发展的今天,无论是金融、医疗、教育还是其他各行各业,都免不了与它产生密切的关联,人工智能技术必将继续向传统领域不断渗透。金融壹账通正在瞄准中小金融机构在信贷场景中的痛点,为金融科技领域树立典范。在感受了智能终端中微表情面审系统的威力后,我们有理由相信覆盖金融领域的 AI 时代或许已经到来!
作者:徐国强 麻省理工博士 金融壹账通Gammalab资深AI科学家;郑子奇 金融壹账通Gammalab AI工程师。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有