|
亿级订单量下,美团外卖的风控设计是怎样的?时间:2018-12-20 试问:谁不想成为一个做出亿级体量的产品 or 研发呢?有目标才有前进的方向,有方向才有一步一个脚印的实现。亿级体量四个字,不仅意味着成就感与光环,更意味着压力与责任。 今天分享的内容,来自美团外卖的风控负责人蔡敏老师。蔡老师有互联网行业10 余年从业经验,先后任职于 58 到家、58 同城、百度等互联网顶级大厂,在大数据、风控、支付等领域有多年架构和技术管理经验。蔡老师将从自身项目经验出发,为大家解读亿级订单体量下的美团外卖风控架构是如何设计的。 关于美团风控设计,可以分为 3 个版块:
常用的策略。 一、概述风控即风险控制。 一般来讲,风控分为两大方向: 1. 信用风控信用风控广泛适用于日常生活中,例如银行贷款或者 P2P 贷款,机构会对借款人进行偿还能力评估,是否有逾期或者恶意欠款等情况。 2. 反舞弊风控目前有许多黑产活跃在互联网上,我们的目标是魔高一尺道高一丈,与骗子之间不断攻防的过程,就是反舞弊风控。 财务的风险行为定义如图所示:
二、风控的特性风控的特性,或者说是特征,总结了三条: 1. 高对抗性即与上文中提到的黑产进行对抗。任何平台只要有利可图,黑产会不间断 24 小时兜圈子。打游戏的同学更容易理解一些,各种游戏都会出现有组织有规模的工作室去找游戏的 Bug ,刷金、刷装备、盗号来谋取钱财。这就需要我们不断去对抗,一直与黑产处于攻防阶段。 美团和 58 这种平台,黑产去发帖子刷排名,单价很可观的,所以黑产动力很足,需要我们有这个意识,对方是不会休息的。 2. 准确性风控领域有两个要点,一个是准确性,另一个是召回率。准确率之所以在风控领域格外重要,是因为所有的策略、模型都无法保证百分百的成功与正确。策略和模型的准确率低一点,用户及商户的投诉就会随之上升。因此准确率要比召回率更中啊哟,一个策略的准确率应达到 99 % 才允许上线。 3. 灵活性由于黑产打得都是持久战,我们通过人工进行全天对抗是不太可能的,所以策略应当保证能够随时监控、随时修改、及时更新,即灵活性强。 三、风控的整体架构风控的整体架构可以分为三个大的系统:
区分的标准是根据策略的速度:
如图所示第二层是策略系统。策略系统时风控的核心系统,包含着规则、管理以及监控的功能。 策略系统在设计的过程中,最关键的是:
最下面一层是特征库,具备黑白名单、统计数据以及特征数据等功能。特种库对于系统的性能应该是最重要的,因为亿级体量的数据量是十分庞大的,因此在设计时要用到一些大数据框架。 图中左侧的处理系统即统一的处罚系统,无论是对商家还是用户的处罚都会归到这个处罚系统中;右侧主要是一些公共组建,包含过载保护、报表、监控报警等等功能。这就是一个完整的风控架构。 四、风控关键流程风控的流程可以分为六个关键性流程: 业务启动的初期,风控其实就随之开始了,但是没有必要做到上文中我们提到的那些具体动作。
五、实时监控架构随着业务量的增多,监控不能依靠简单的离线报表进行,离线一般来讲是 T+1 ,等发现的时候已经太晚了,因此要进行实时监控。 如图所示,实时监控分为:
六、风控策略的难点如图所示:风控的难点与风控的特性一一对应。
七、风控模型策略上图列出的其实是风控策略和模型中比较基础的:
这部分分为两大块,一种是有监督评分,一种是无监督评分。很多公司在前期没有足够的正负样本,可以采用无监督评分,只要有数据就可以采用这种方式,可解释性也足够强。 1. 异常检测可以简单分为三种:
2. 知识图谱如图所示,知识图谱即多对多的关系,举登录的例子,设备 ID 与 登录 ID 未必是一对一的关系,同一台设备可以有多个人登录,同一个登录 ID 又可以在多个设备上登录,但重要的是一个人无法同时登录 N 个设备,同样 N 个设备也不可能被 N 个人登录,因此很容易捉到异常。 3. 用户画像用户画像就是通过采集到的基础特征,推测一些其他的特征然后给用户贴标签,例如风险评分、信用频评分。具体的方法每个公司略有不同,大家看图了解一下即可。 |