互联网贷款风控体系包括(贷前风控)
互联网金融浩荡不过十年。虽然时间不长,但也不能说其影响规模发生了翻天覆地的变化。这从名字就能看出来。互联网金融广为人知,而不是很多专家学者一度热议的金融互联网。传统金融互联网化不足以形容撼动中国金融体系的巨变。互联网金融,当然不仅限于信贷,还包括银行、证券、基础信息等全新的业态。是名副其实的“金融行业的showstopper”。
但无论如何,互联网金融和金融互联网最初的争论是围绕信用产生的。我们集中讨论信用的话题。信用风险控制体系如何适应时代的变化?今天,我们讨论风险控制有哪些常见的模型策略系统,以及它们的二阶问题:为什么是这样一个系统?
2013年诞生的“宝月”让货币基金这棵老树开花,引爆整个市场。否则互联网金融只会是IT圈里一个不热闹的子话题。这也是业内普遍将2013年定义为互联网金融元年的原因。
2014年,首个互联网消费金融产品“白条”成立,首家互联网银行“微众银行”获监管部门批准开业。
这个时候,互贷业务还在起步阶段。风控能做什么?新模式下,没有用户,传统银行信贷的绩效周期是一年甚至几年,标准的数据产品就更少了,更不用说大数据模型,统计模型也无能为力。这个时候,功劳只能去给优质人群,比如信用卡客户,比如电子商务的一些高级品类的交易客户,等等。
这时候的风控可以说是基于客户的风控,也可以说是基于白名单的风控。这也就产生了基于人群的互联网消费金融,包括大学生分期、蓝领/白领分期、农民分期,然后是场景化的互联网消费金融,比如租房分期、家装分期、旅游分期、教育分期、医美分期等等。
然后随着P2P、网贷等互金业务的快速发展,消费金融市场主体进一步丰富。与此同时,移动互联网的全面发展导致数据和信息的激增。在某种程度上,数据已经成为和石油一样重要的战略资源。在大数据兴起的趋势下,大量的数据公司成立了。计算和大数据的发展引发了机器学习的狂潮,风控水平大幅提升。
在17、18年的野蛮时期,很多人只要有一点钱和勇气,就敢借钱。接入几个三方数据源,定几个通用规则,做一个信用模型,找几个人收,就可以开始流水了。
此时,风控的完整技术已经相当成熟。三方数据覆盖多个维度,征信、银联、运营商、公安、司法、工商、税务、公牛等等。取什么样本,设置什么标签,访问什么数据,用什么算法,做什么通过率,做一个与产品相匹配的模型策略并不难。真正重要的是产品本身,即额度、定价、期数、还款方式等。
后来一系列监管政策陆续出台,行业从高速发展走向规范整顿的新路径。风雨过后,如何在健康的竞争环境和发展空间中保持稳健和深远,成为新的命题,行业已经进入并将继续处于精细化运营时代。
这个时候,如何把风控做细,如何服务于业务形态的需求,是一个新的命题。
以产品变化为特征的互联网时代的变化,似乎更为鲜明。
时代产品经理的工作可能就是画原型,把交互做到极致就很厉害了;然后会有策略优化和功能进化。ToC业务的产品经理,从工作内容上来说,都是战略产品经理,也需要了解数据。现在和未来,已经悄然成为业务形态和组织关系下的计划梳理。
说到这里,我终于有了背景。行业在变,风控体系也在变。
H
在过去的几年里,信贷行业出现了这么多新的从业者,或称showstopper,这么多新的网络信贷产品,以及他们背后的风险控制游戏。
但总结起来,常见的可靠模型策略系统只有三种。
第一种以规则为主,模型为辅。大多出现在会展行业的前期,样本较少,数据较少。风控主要靠专家的经验,无场景的现金贷和有场景的消费贷也是如此。
展业初期,或者说冷启动阶段,需要逐步积累样本,风险需要长时间暴露,必须严格执行信用。在不知道风险结果之前,严格录取或宽松录取的标准都是通过率,所以初始通过率一般较低。
卡的通过率是多少?也许你有一个场景。当然,一张场景数据卡是可以的,但是还不够。风险是滞后的,毕竟要接入一些三方数据。根据这些数据,根据你的场景,根据你的产品定位,制定相应的政策和规则。
然后随着还款日的到来,一批用户开始执行,新户的数据肯定在分数上亏钱,你会想优化。你知道风险与你的产品和你的支持操作密切相关。你会觉得标准产品不够,还得自己建模。
在样本有限的情况下,过多的数据访问是没有意义的。这个时候模型只能是小数据模型而不是大数据模型。如果你的产品没有大的变化,模型开发没有失误,这个模型可能会带来一些收获。随着业务规模的增大,模型频繁刷新优化。
但此时整个风控体系以规则为主,模型为辅。白名单、黑名单、年龄和地域限制、公牛、公安和司法信息、标准产品分数。你的风险控制是基于行业内一般的专家规则,模型只是辅助。说白了,你的安全感来自于各种规则。
这种制度不仅出现在会展行业的早期,很多平台长期处于这个阶段,甚至夭折。其代表场景是发薪日贷款,以及由此衍生的一系列网贷,风险高,通过高定价、短周期来弥补资金损失。
第二个是以模型为主,策略为辅。样本相对丰富后,模型的重要性会逐渐提升,尤其是行业介入、客户质量下沉后,精准识别就变得必要。
在最初的专家中
经验系列规则外,一些可变规则不断地被调整,在这些规则之后,如何依据模型作更精细化决策呢?一种做法是把模型效果做的尽可能好,然后所有人通过这个模型进一步筛选。为了效果足够好,模型复杂度就会变高,缺陷就是你说不出来为什么这个人被通过、那个人被拒绝。不管解释性工具再怎么做事后工作,这个缺陷本质上弥补不了。
另一种法是把模型做的效果足够好且可解释性足够强,为了追求可解释性,可以将数据也就是特征分类,基于每一类特征构建对应的模型,例如逾期模型,例如多头模型,例如交易模型,等等。同一维度的特征组合,保留了一定程度的该维度可解释。串行的过每个模型,得以判定这个用户逾期上表现不行,或者多头很严重,或者银联交易评分有风险。
在这类风控体系中,你的安全感来自模型。只要模型AUC、KS保持高位,不管每天放款流水多少,你都会比较安心。
这类体系中,模型重要性很高,策略依靠模型做差异化。一个模型为主的风控团队往往最终会走向这种做法,很多银行也会走向这种做法。因为真正的策略人才是很稀缺的。
第三种以策略为主、模型为辅。注意和第一种的区别,第一种说的是规则为主,这里说的是策略为主。规则为主的规则,是简单的,是通用的,是经验的,是串行不交叉的。
这个阶段,样本非常丰富,场景内不断挖掘用户数据,接入各种有效的三方数据,大数据模型效果很好,且不断追求更好。模型的重要性很高,就如同“工欲善其事,必先利其器”的器很重要一样。
这时的模型充当策略的工具。模型可以不追求解释性了,策略为主,策略保持决策的可解释。
决策要有可解释性,是因为未来不一定会像现在一样,我们无法承担极端情况的伤害。就像投资,你可以数据化出一套决策避开所有的熊市,找到所有的牛市,但例子才多少呢,你敢用在当下吗?决策一定是尽量简单的,它可以犯错,但犯的错要小,获的利要大。
策略的精髓在于分群,年龄是分群,收入是分群,多头是分群,模型也是分群,是风险的分群。无论是授信,还是贷中管理,无论是你对用户做什么,还是希望用户做什么,你都要区分用户。
这类体系的标志是决策体系中有很多重要的分群,也就是决策分支,模型用作最后的保障。模型作为策略的工具,可以需多少有多少,一个工具可以用的范围很大,也可以用的范围很小。
决策分支的意思是,策略对模型的应用不是一刀切的,不是所有小于600分的用户都要被拒绝的。
你的安全感来自策略,再具体一点,就是策略分群。
在行业强监管下,非持牌机构不断倒下,只有巨头才能勉强活着,越来越多的风控都是这种体系。无他,精细化要求而已。
我们上面的讨论已经涵盖了这些体系发展的背景,不同的阶段、不同的平台、不同的业务场景下,风控体系不一样。
为什么发展出了这样的体系?这个二阶问题,似乎答案就是数据。样本的多少、数据维度的多少、特征数量的多少决定了背后模型和策略的关系。
但,这不是问题的本质。我认为问题的本质在于风险回报比。
如果你是“714”高炮那样的玩法,搭几条规则,让钱出去利滚利就是最赚钱的,周期短流动性强,年化利率好几倍甚至十几倍,风险再高也就是一个本金,不算什么问题。目标客户里就没有优质人群,还做什么模型精准识别。
当这种玩法不再合法,风险回报越来越低,银行的对客定价一般在年化18%以内,消费金融公司基本在20%出头, 若要在这个范围内盈利,就要风险平稳可控,服务目标要锁定优质客群,没有大数据模型是不行的。当然,不缺优质流量的巨头光白名单就够用了。
后来流量越来越贵,客户不断被多平台渗透,做好存量就至关重要。省一份流量算一份流量,涨一点余额算一点余额,开始把每个用户挖掘到极致。客户分群精细化运营成为当下的趋势。
只是,这样的挖掘,这样的运营,是客户需要的吗?
举目向去处,多是坎坷。回首望来路,皆是坦途。
题图来自 Unsplash,基于CC0协议