當前位置 > CPDA數據分析師 > “數”業專攻 > 數據分析篇:基于海量數據的異常交易研究(下篇)

:數據分析篇:基于海量數據的異常交易研究(下篇)

7天彩票会员登录 www.dibyt.icu 來源:數據分析師 CPDA | 時間:2019-05-05 | 作者:admin

接上篇:《数据分析篇:基于海量数据的异常交易研究(上篇)》

 

第3章 可疑交易案例分析

 

可疑交易分为两种情况,其一为一对多的归集行为,其二为多对一的归集行为。如图3.1所示,为多对一归集资金的一个案例。此案例归集的资金量较为庞大,但是归集情况并不复杂。如图所示,以姚某为主等11人,在贷款每月还款日前均得到了姚某的转账用来归还其贷款本息,而且资金量较为庞大,该可疑归集圈共计归集资金约为1513万,若该可疑交易圈的资金归集确认为欺诈或者贷款挪用行为,其资金链一旦断裂,其可能在商业银行产生逾期或者造成不良记录,以至于造成损失。因此,对模型捕捉构建的类似该归集圈的交易行为需要进行重点的排查,对该归集圈涉及的贷款项目做进一步的排查和确认。

 

数据分析篇:基于海量数据的异常交易研究6 - 数据分析篇:基于海量数据的异常交易研究(下篇)

图3.1 一对多归集案例

 

多对一进行资金归集的特征相对较好确认,因为其归集方式较为直接,通过交易直接进行归集,其特点是客户在获得贷款后,对放款金额进行转移,且转移的方式简单直接,可以通过数据直接建模获得。

 

数据分析篇:基于海量数据的异常交易研究7 - 数据分析篇:基于海量数据的异常交易研究(下篇)

图3.2 多对一归集案例图

 

如图3.2所示,为多对一进行转账归集的可疑群体,箭头所指向的节点即为归集方,我们可以看出主要的四个归集节点分别为卞某民、隋某、张某元和王某英,归集金额较为庞大,共计627.1万元。为了更位清晰的对其归集的情况进行掌握,我们可以继续对该网络进行放大,以卞某民为例,如图3.3所示,我们可以获得图3.2网络的第二层网络图。即为卞某民转账的四个人,卞某民接受转账为四张不同的账户卡,这四张卡均为卞某民名下的账户,但最终都归集到卞某民一人名下,总计金额为31.57万元。

 

数据分析篇:基于海量数据的异常交易研究8 - 数据分析篇:基于海量数据的异常交易研究(下篇)

图3.3 多对一归集案例第二层细化图

 

如有需要,模型仍然支持继续对该层网络进行放大,如下图3.4所示,展示出了为卞某民转账的用户的转账明细,四种颜色分别代表四个不同的账户,边上标有转账的金额,叶子节点标有转账人的姓名以及其转账时间,可以清晰的获得客户进行可疑的归集的时间、金额等信息数据。

 

由此,我们可以通过构建自动化模型的方式,以关联交易为线索,自动化的捕捉海量的数据中的线索资源,识别可疑的异常交易,大大降低手工工作量,解放人力、降低成本,而且模型的准确性也大大高于手工筛选,工作效率远高于人工处理。通过将经验模型化落地,也将大大的降低操作风险。

 

数据分析篇:基于海量数据的异常交易研究9 - 数据分析篇:基于海量数据的异常交易研究(下篇)

图3.4 多对一归集案例第三层细化图

 

第4章 结论及展望

 

本文通过对海量交易数据的整理与分析,综合运用大数据工具与算法,结合社交网络、知识图谱等前沿理论,建立了一个具有实际应用价值的欺诈网络分析模型,以捕捉在银行信贷中的异常交易行为,通过构建社交网络的方式,识别欺诈性的资金归集的群体。同时,模型还支持网络的逐层拆解与放大,为商业银行信贷风险管理提供辅助工具,具有一定的实用价值。

 

由于篇幅所限,本文依然存在诸多不足之处,下一步拟对捕捉到的资金归集流水的特征做进一步提取与分析,以便下一步运用机器学习的算法进行优化,通过历史的交易行为捕捉其交易欺诈的行为特征,如交易的时间、地点以及行业特征、交易频率等,从而生成衍生变量,进一步的做欺诈分析。

 

随着欺诈手段的快速演变与提升,识别可疑异常交易的难度也在不断提升,通过构建大数据机器学习模型并快速迭代应用于实际业务,将理论与实践相结合,动态、科学、精准的识别欺诈行为,进一步提升风险管理的有效性,以数据和技术驱动风险管理,助推我国普惠金融的发展。

 

文 / 北京CPDA数据分析师 兰铁

双色球随机一注 湖南十分快乐现场开奖 浙江十二选五分布走势图 深圳风采开奖走势 二十一点高级策略表 南粤风采26选5开奖信息 彩票刮刮乐试刮 上海时时乐靠谱吗 最吉利的手机号码尾号 英雄联盟电子游戏网址是多少 葡超 手机软件赚 9955678第一时间开奖 快乐十分随机选号 重庆市时结果记录 羽毛球加拿大公开赛比分直播