非银行支付的反欺诈识别,主要通过大数据技术以及反欺诈模型技术实现。本文探究网络支付反欺诈模型在数据安全监管新态势下的优化方向。首先,分析了大数据源的重要性及问题,并给出了优化的建议。
其次,针对日趋变化的欺诈风险因素,提出反欺诈模型采取基于行为分析的大数据技术与机器学习技术进行优化,以此提高反欺诈模型的自主迭代及风险识别能力。最后,在调研国内非银行支付机构反欺诈技术发展现状的基础上,结合国内的行业背景与监管要求,提出了优化建议。
1、非银行支付机构网络支付的欺诈模型
本文所指非银行支付机构是依法取得《支付业务许可证》、获准办理各类支付业务的非银行机构。按照支付方式,可将非银行支付机构网络支付分为互联网支付、移动电话支付、固定电话支付、数字电视支付等。
支付欺诈是指犯罪分子通过骗取或者盗取账户所有人的身份信息,直接或通过技术手段绕过非银行支付机构的身份核验,或者通过虚构事实、隐藏真相的方法获取账户所有人的信任,引诱账户所有人配合完成支付中所需要的验证环节,最终实现盗取账户所有人的财产。网络支付欺诈与其他欺诈相比,犯罪手段更隐蔽、多样,得逞的速度更快,追溯更困难,对社会的危害更大。
我国最早出现的与网络支付反欺诈有关的立法是1997年的刑法第二百八十七条“利用计算机实施金融诈骗、盗窃、贪污、挪用公款、窃取国家秘密或者其他犯罪的,依照本法有关规定定罪处罚”。
在2011年,最高人民法院与最高人民检察院发布的《关于办理诈骗刑事案件具体应用法律若干问题的解释》中的第二条,对诈骗罪从严处罚的解释中提到“通过发送短信、拨打电话或者利用互联网、广播电视、报刊杂志等发布虚假信息,对不特定多数人实施诈骗。”这些法律条款为司法机关打击网络支付欺诈提供了法律依据。
为了减少和消除欺诈的发生,非银行支付机构需要建立并不断完善包含了反欺诈模型的风险控制系统。根据央行发布的《支付业务许可证》续展公示信息,截至2019年7月,全国已获得《支付业务许可证》的非银行支付机构总计238家,已经达到较大的规模。与银行相比,非银行支付机构的成立时间较短,网络支付反欺诈的经验以及系统建设方面都较为薄弱。
非银行网络支付已经成为支付欺诈事件的高发领域,因此研究如何提高非银行支付机构的反欺诈能力是非常有意义的。
2、反欺诈模型的不足
欺诈风险识别的准确度是判断反欺诈模型好坏的重要标准之一,主要受两个因素的影响,一是数据模块的质量,另一个是风险识别模块的有效性。因此,本文重点分析非银行支付机构反欺诈模型的数据模块及风险识别模块,对现有反欺诈模型的不足进行分析。
其中,数据模块负责反欺诈数据的接入、筛选、清洗和预处理;风险识别模块负责对网络支付业务中的欺诈风险进行识别。
1. 反欺诈模型数据模块
数据模块对接入的基础数据进行筛选、清洗及预处理,可以形成设备或账户的数据画像等数据,供风险识别模块后续使用。因此,丰富的数据源接入是实现精准风险识别的基础。受限于接入数据源的范围与更新频率、数据通道的审核规范和准入标准等,部分非银行支付机构的数据模块并不完善。
(1)在数据源类型方面,部分机构的反欺诈模型引入的数据源类型较为单一。数据源以金融行业数据为主,其他行业的数据相对较为缺失。这种情况导致建模的过程缺少多种类型和多层次数据的支持,无法构建基于多维数据的欺诈风险识别模型。
(2)由于可能会受到诸如监管政策变动、转接网络环境波动、接口调用不能正常进行等影响,上游数据源提供的服务可能会发生中断或数据更新不及时。
(3)支付机构可以使用日常运营中积累的用户数据进行数据分析及建模等处理,但将用户个人隐私分享给其他机构则具有一定的法律风险。
2. 反欺诈模型风险识别模块
目前,欺诈风险的识别主要基于黑名单、规则引擎、机器学习算法等实现。黑名单记录的是曾经发生过风险事件的设备码、收款人信息等,当这些信息再次出现时,可相应的进行交易拦截或账户冻结等处理。规则引擎则是对专家经验的总结,对发生过的欺诈事件进行总结,建立专家规则并应用于欺诈检测,可以及时地发现欺诈现象。
这两种方法可以直观地得到欺诈的逻辑,在支付机构中被广泛采用。然而,受限于黑名单及规则的更新频率以及适用性,这两种方法的处理能力及准确性相对较低,灵活度也较差。基于机器学习算法的欺诈检测是近年来的主流研究方向。与前两种检测方法相比,该方法可以挖掘出数据中更多的隐藏信息,具有欺诈识别准确性更高、规则更新更及时的优点。
基于机器学习算法的欺诈检测需要支付机构建设更为完善的反欺诈模型风险识别模块。一方面,对大量交易数据的实时分析以及不断更新的作案手法要求风险识别具有更强的数据实时处理能力及更新迭代的能力,从而迅速地响应支付过程中实时反欺诈及迅速更新风控规则的要求。另一方面,模型的具体算法需要不断更新完善,从而实现更为精准的风险识别。
3、反欺诈模型的优化建议
1. 建设高质量的数据模块。
保证数据源的质量对提高模型风险识别的准确率具有非常大的作用。数据模块需对接于实际支付场景和用户类型强相关的数据源、官方可靠的数据源和一手的数据源,减少或避免使用缓存数据的情况。接入新的数据源时,应严格测试数据的质量,根据数据的准确性、更新的时效性、接口的稳定性和可支持的并发量等指标建立数据源的质量评审标准。
反欺诈模型的数据模块需要对接多维度的数据类型,满足在不同类型、不同规模的支付场景下,反欺诈风险识别的差异化需求。2018年5月,我国第一家获央行批准的个人征信牌照公司百行征信的成立,标志着个人征信数据将在接下来的时间内快速进入金融反欺诈的领域中,个人征信数据将为传统的反欺诈数据产品提供极大的支持与补充。
截至2019年底,百行征信与最高人民法院执行局、三大电信运营商、中国银联、学信网、社保中心和公积金管理中心等机构建立了征信数据方面的合作关系。随着国家对征信数据平台建设的推进,更多的“数据孤岛”会被连接。非银行支付机构在建设反欺诈模型的过程中,需结合自身需要,引入多维的个人征信数据产品,为风险识别模型提供多种类型和多层次数据支撑。
2. 基于大数据技术提高数据处理能力。
支付业务的实时性要求欺诈风险识别模块对每笔交易进行更精细的分析,这可能涉及到神经网络、卷积神经网络、图神经网络等一系列深度学习模型的建立及使用。这要求在处理超大规模数据及复杂关系网络环境下的规律学习能力,对大数据的处理能力要求较高。
目前,Hadoop、Flink等大数据处理开源产品正逐步发展完善,提供大数据平台建设服务的相关服务商也在不断涌现。同时,面对不断扩大的网络安全数据,针对数据进行分类处理的挑战也在增大,基于XGBoots等算法的创新对数据进行根据特征的处理和提取分类,也具有重要的意义。
主要原因在于其降低了大数据平台的构建难度,给非银行支付机构定制化建立大数据分析平台提供了更大的可能性。基于相关大数据技术,结合支付机构自身的业务特点建立大数据分析平台,可以极大的提高数据处理能力,从而针对交易风险进行实时分析、定期更新风控规则、提供风控服务提供基础保障。
3. 基于行为分析技术及智能化技术提高欺诈风险识别准确度。
风险识别模块引入基于机器学习的行为分析技术及智能化技术,可以进一步提高风险识别模型对不断变化的欺诈风险态势和作案手段的适应能力,充分挖掘风险识别规则无法覆盖的潜在行为规律。
对发起支付请求方的行为规律进行总结后,可针对某个支付发生的特定场景,分析和判断发起支付请求方的行为是否符合这个特定场景的行为规律。用户行为分析通过多样化的算法对不同支付场景下的正常交易行为进行画像,引入知识图谱,将欺诈风险指标进行可视化分析。
通过分析海量的模型实践和欺诈风险事件案例,总结不同类型的欺诈风险事件特征,通过对关键信息进行标记引入,将风险因素与风险管理的指标建立映射关系,从而识别不同支付场景中的异常行为。
4、结束语
大数据在接入多维数据的时候,会因为不同数据的标准不一,需要特征提取与语义分析。通过深度学习技术,将数据的结构模型与语义模型结合、匹配相应算法,以提高模型的大数据处理效率与智能化水平。
智能化的风险识别模型可以对支付平台的交易行为数据进行多维度地学习分析,自主改进模型算法,然后通过历史交易数据对改进更新的模型算法进行效果回测。在测试结果满足性能提升的标准后,进行模型的自主升级部署。7×24小时不间断的机器学习训练使智能化的反欺诈模型可以不断提高动态的欺诈风险识别的准确性。