Chapter 2
第2章 零售潜在高价值客户识别——图神经网络技术

众所周知,中国银行业最大的发展机遇在零售银行业务。零售银行业务因受经济周期波动影响相对较小、经营风险较低、个人贷款不良率较低、经营贡献占比提升等而成为银行经营转型的重要抓手。中国工商银行凭借其庞大的工资代发和网点体系,曾经提出“中国第一零售银行”的战略目标,中国建设银行也曾提出“一流零售银行”战略,招商银行定位“零售之王”等。由于零售银行业务占用资本比例相对较低,在资本监管要求趋紧的形势下,商业银行相继提出零售数字化转型、大零售板块、客户经营下沉等概念。零售银行板块竞争加剧,主要表现在价格竞争、产品竞争、渠道竞争、人才和客户竞争等几个方面。

随着金融市场的开放,以及外资银行和民营银行的进入,国内外银行数量呈现小幅上升态势。中国银保监会公布的数据显示:截至2018年12月末,我国银行业金融机构法人4588家;2019年6月末,这一数字变为4597家;到2021年6月末,数字则变为4608家。银行的数量越多,零售银行的竞争压力越大。在银行业产品同质化和竞争加剧的情况下,精准营销就显得极为重要。银行使用人工智能算法识别出哪些客户的价值回报更大,在同等条件下就能获得更大的市场份额,从而提升竞争力。零售银行的关键是客户经营,而客户经营的关键是了解客户。但是,要做好这项工作并不容易。一方面,零售客户的数量非常庞大,如果按照传统方法将客户绑定到银行员工进行一对一营销,工作量巨大且效率极低,收效甚微;另一方面,很多客户的资产分散在多家银行、证券公司和保险公司,单从一家银行的视角无法窥得全貌,某家银行的“普通客户”可能是其他银行的高价值客户。因此,我们需要一个智能化、全面的数据模型来识别潜在的高价值客户。

有一种社会学理论,将人口分为九个阶层,人的社交圈子往往都是同阶层的人,或者是相邻阶层的人。“物以类聚,人以群分”的规律决定了社交圈子的阶层跨度不会很大,这就意味着高价值客户的交往人群大概率是高价值客群。在高价值客户的社交圈子里寻找目标,应该是不错的选择。从银行的角度看,一个人的社交圈子就是他在银行留下的主动交易线索,包括主动交易的交易对手、已知的社会关系和金融行为线索。如果我们的数据模型在考虑客户自身特征的同时,也考虑他的社交圈子特征,则会大幅度提高模型的识别准确度。

符合上述业务需求的技术就是图神经网络(Graph Neural Network, GNN),这是一种近几年来快速发展的新型数据挖掘技术。事实证明,用零售银行的客户实体特征及其关系数据建立社交知识图谱,同时用深度学习技术来提取图谱的语义信息,在解决零售银行客户价值识别、贷款风险预测、黑灰产可疑账户识别等场景的问题方面,可以获得很好的实践效果。

图神经网络有多种类型,适用于多种任务:图卷积神经网络通过卷积运算聚合邻居节点特征,通常适用于节点分类任务;图自编码器通过编码器机制提取特征并重构图数据,通常适用于链接预测任务;图生成神经网络使用一定的规则对节点和边进行重构,可生成具有特定属性和要求的图数据;图循环神经网络使用循环神经网络机制来处理序列数据;图注意力网络将注意力机制引入图神经网络,更加关注任务学习需要的有效信息,提升模型性能,适用于多种图任务。

本章分享基于客户金融特征及其关系的图卷积神经网络(Graph Convolutional Network, GCN)节点分类任务,介绍GCN精准识别零售潜在高价值客户的实现方法。该模型已在笔者所在的银行投入生产应用。我们在实际工作中发现,GCN对未知样本的泛化能力更强,能胜任更复杂的数据挖掘任务,产生较好的实际应用效果。我们认为图神经网络是零售银行业务场景极具价值的数据挖掘方法。