团尚科技:现金贷系统探索大数据反欺诈过程中的遇到的问题
作者:tuanshang发表时间:2017-11-17 14:15来源:未知
讲讲我们在探索大数据反欺诈过程中的遇到的问题
常见的问题
伴随着互联网消费信贷的发展,大数据与反欺诈风险的切实需求相结合,市面上出现了各式各样的反欺诈服务和产品,与我们合作的供应商已经超过50家,在使用中会碰到哪些问题,又该如何利用好这些服务或产品是大家一直很关心的,下面是我们总结的几点。
1、冗余重复
每家服务商擅长的领域是有差别的,有的提供核身验证(人脸识别、实名认证等)服务,有的汇集电信运营商数据(核实手机电话等通讯信息等),有的提供负面信息(犯罪、司法等)核查,有的提供借贷记录(逾期时间、金额、严重程度等),有的提供多头借贷(借款机构平台数等),还有很多其他各式各样的行为数据或评分等。丰富的种类给数据应用打开了很多扇门,但也出现了很多冗余重复的情况,比如几家服务商都有黑名单数据但来源几乎是同一个。
2、质量不一
每家数据服务商所提供数据的质量也是各有各的问题。从风险评估的粒度上看,有的只提供汇总的评分,有的只提供明细,有的既有评分也有明细。从风险拦截的效果上讲,有的服务商数据准确程度高但只能覆盖一小部分有风险的人,有的准确程度低但覆盖的风险 人群范围大。质量不一带来的差异,使得我们在应用接口数据时不能一概而论,要经过谨慎的效果评估,否则会误伤太多,影响产品体验。
3、成本不同
各家数据服务商在收费定价上也是千差万别。有的服务商查询即收费(查一条收一次费),有的查得才收费(查到坏人才收费),有的则有免费条数(在一定数量内免费查,超出才收费)。对某些小额的产品使用高价的接口,会造成入不敷出,产品收益还不足以覆盖接口成本,成本也是接口应用中必须考虑的一个问题。
4、格式各异
每家服务商的在系统对接上各有各式,返回的数据格式各有特色,有的服务商提供的数据一个人一行记录,有的则一个人多行记录,有的一个人一行记录但某个字段会包含多个变量而且存放无序。要将各个接口的数据整合起来,对一个人做统一的多方位评估,数据存储的格式问题是要首先解决的。