图中变量数量 , 基本就体现了这些类别的重要程度 。 信用历史往往是最重要的 , 其次是履约能力 。
同样的一万块钱 , 借给一个每次借钱下个月都及时还钱的人 , 比借给一个月入十万的人靠谱的多 。
这 65 个变量进一步拆分为 8 个核心变量和 57 个基础变量 。
这些变量的分段逻辑 , 按文档的说法是 , 综合考虑 DAS 变量在全量芝麻用户上的数值分布对好坏用户的区分度将其进行分段 , 最多分十五段 。 分段序号 01-15 代表变量数值由小到大的排列顺序 。
我们详细看一看这8个核心变量 , 57个基础变量汇总放在后面 。
文章插图
在身份特质项中 , 更核心的变量竟然是稳定性指标 , 而不是行职业信息 。 一方面是因为 , 行职业信息一般很难准确获取;另一方面 , 所在公司、所做职业是需要分类到大类上的 , 这类信息在住房按揭这种长期贷款中很重要 , 对短期借贷没有直接作用关系 。 不管是消费信贷 , 还是信用生活 , 还款能力的刻画完全不需要上升到行职业 , 反而稳定性指标更为重要 。
文章插图
第三方支付的核心在于深度和广度 , 支付业务要看广度 , 对应的当然要看用户使用第三方支付的广度 。 行为特质中 , 支付活跃场景数就很好的体现了这个广度 。 而支付金额和资产等维度在下面的履约能力中体现 。
文章插图
履约能力选取了一个资产一个支出一个消费层次 。 资产和支出不必说 , 消费层次意义在于 , 只消费生活必须品 , 和对精神物品有强烈需求的 , 代表了不同的层级 。
文章插图
信用历史中更为关注信用还款 , 而非逾期 , 我推测原因有二 , 一是还款类的信息丰富度会高很多 , 二是正面信息在面向用户可见的产品上更为友好 , 它既能一定程度上起到和负面信息类似的效果 , 在相对关系上负面降分和正面增分区别不大 , 还能激励用户更高频高额地借还 。
剩余 47 个基础变量 , 我整理如下 。
文章插图
上述变量除了选取的指标值得学习外 , 时间窗口也很值得注意 。 另外 , 显而易见 , 这些变量很多都是相关的 , 它们都会被用在芝麻分里面吗?它们怎么综合得到一个芝麻信用分呢?
当然是通过权重进行组合 。
权重如何得到?
“综合考虑 DAS 变量在全量芝麻用户上的数值分布对好坏用户的区分度将其进行分段” , 既然变量的分组是参考了好坏用户的区分度的 , 专业名词就是WOE , 那变量的组合当然是对好坏用户进行建模得到 。
但是 , 这些变量 , 高度相关的变量 , 是会被评分卡筛选掉的 。 有效的模型不可能用到了其中所有的变量 , 即使有 , 我推测 , 很多变量也是人为地被赋予了无关痛痒的权重 。
请注意 , 这是 DAS 变量数据服务文档 , 并未称作芝麻信用分产品介绍 。 我推测芝麻信用分的关键在那8个核心变量 , 我说的是关键 , 并不是说完全不用那57基础变量 。
另外 , 芝麻分作为面向用户的产品 , 还兼有营销激励的功能 , 最终的芝麻分除模型计算外 , 应该还有其他环节的增减分设置 。
03
花呗将全面接入央行征信系统 , 用户使用花呗需不需要担心哪些问题呢?
征信关乎个人信用 , 花呗是当代人超前消费的好助手 , 当它俩一拍即合 , 消费者应怎么考虑?
我不说责任和义务 , 也觉得有必要说几句 。
现在大概央行收录的自然人11亿 , 其中有信贷数据的应该不到一半 , 我们消金业务发起申请查得率稍高一些 , 60%左右 。 也就是说 , 绝大多数人的征信数据信息是比较少的 , 就是那些简单的身份信息 , 没有金融信用数据 。
传统的信用评估模型是根据一个人的借贷历史和还款表现 , 通过逻辑回归的方式来判断这个人的信用情况 。 现在越来越兴起大数据模型 , 它的数据源就十分广泛 , 包括电商、社交、搜索浏览等行为都产生了大量的数据 。
所以 , 显然 , 花呗接入央行征信 , 对各大平台来说好处很大 , 因为用户的信用更好被评估了 , 那对用户来说呢 , 是不是就不好呢?
推荐阅读
- 五四青年节 微信文案【五四青年节微信祝福语】
- 微信不实名发红包限额多少[推荐]
- 微信运动不小心设置了不与某人排行如何恢复解决您的问题
- 中医秘方 哪些中药可以祛斑
- 介绍淘宝常用的9种推广方式 淘宝常用的推广方式有哪些?
- 风信子的花语和寓意是什么
- 风信子一年开几次花
- 风信子花有毒吗 风信子开花后怎么处理
- 尿液知健康 看尿液颜色辨疾病信号
- 和女生微信聊天怎么聊 让女生爱上和你聊天的技巧