公司动态

识别地址欺诈风险的利器---中文地址模糊匹配技术

来源: 人人信 时间: 2017-12-15 14:26 浏览: 1961次

当前,随着互联网金融监管政策愈来愈严厉,各消费金融公司和现金贷平台愈来愈体会到风控的重要性,尤其欺诈风险的识别,其更是整个互联网金融风控中最为关键的一部分。


就目前欺诈风险识别方式而言,最基本的是通过黑名单之类的风险名单进行筛选,并辅以贷款人的采集信息多维度核验。多维度信息核验中涉及的信息以个人身份五项信息(姓名/身份证/手机号/银行卡号/地址)最为常见,也是最易获取的;其中,“三要素“核验,”四要素“核验在市场上比比皆是;而通过对客户地址信息的风险检测,从而识别欺诈风险的相关技术和能力,是反欺诈领域接下来潜在、重要和有突破性的方向。


通常,正常借款用户在贷款申请时填写的地址,一般来说是相对精准的地址;如果某一借款申请人填写的地址不够完整、短时间内频繁变更、或者被故意模糊化,那就可能存在欺诈风险。如果某一借款平台,不同申请进件之间的申请人地址存在一定规律或交叉使用,那么,这类申请用户可能存在被同一中介代办包装的欺诈风险。


如何通过申请人的地址信息识别以上欺诈风险?这就需要依赖强大的中文地址模糊匹配技术和地址欺诈风险识别能力,从而实现多个地址之间的两两匹配、两两比对、地址交叉核验;以及基于地址欺诈规则的风险识别。


基于此,人人信结合自身在金融风控方面积累的丰富经验及在反欺诈方面的技术积累;同时,聚集公司地址数据资源,自研了一套基于地址分词、地址库、基数树、最小正向匹配和匹配模型等算法实现的中文地址模糊匹配工具。在对18643组地址数据进行比对判断是否为同一个地址的结论上,比对准确率可达96%。从而使风控模型能够直接判断地址是否有效、稳定,对大量地址进行分析,则可以判断地址是否存在冒用的风险。


  人人信中文地址模糊匹配能力


  •拥有细到小区、楼号地址粒度的亿级地址库


  •提供地址标准化能力,多地址之间的模糊匹配能力


  •通过地址模糊匹配能力,能够准确判断多个地址是否指向同一个地方,有效辅助中介团伙、代办中介的识别


  能力一: 地址清洗服务能力


  •繁简转换


  例如:北京市通州區梨園鎮梨園東裏三號院四號樓二單元


            北京市通州区梨园镇梨园东里三号院四号楼二单元

  

      •数字转换


  例如:北京市通州区梨园镇梨园东里三号院4号楼二单元


            北京市通州区梨园镇梨园东里3号院4号楼2单元


  •特殊符号处理


  例如:北京市通州区


            北京市通州区梨园镇梨园东里3号院4号楼2单元


  能力二: 地址分词服务能力


  •覆盖全国五级不同行政区划、约70多万量级的地址词库


  •覆盖全国五级不同行政区划、约124万量级的地址同义词库


  •采用结巴分词与地址关键字分段算法分词,切分准确度可达90%以上


  •提供地址批量分词服务能力


  能力三:地址纠错与补齐服务能力


  •可对区县级以上的行政区划地址段进行纠错


  •目前可对区县级以上缺少的行政区划地址段进行补齐


NO.

原始地址

省份

城市

区县

纠错/补齐

1

北京市西直门西环广场

北京市

北京市

西城区

补齐

2

武汉市江汉区1880大武汉写字楼

湖北省

武汉市

江汉区

补齐

3

南京市建邺区新城市广场

江苏省

南京市

鼓楼区

纠错

  表:地址补全纠错样例


  能力四:地址智能比对服务能力


  •可对区县级以上的行政区划地址段进行纠错


  •目前可对区县级以上缺少的行政区划地址段进行补齐


  通过人人信中文地址模糊匹配能力,可为合作客户在放贷过程中带来四大价值


  价值一:通过一址多人分析,有效辅助识别中介团伙、代办中介


  价值二:通过对申请人名下地址的一致性、不一致性、变更频次风险检测, 有效识别借贷用户的稳定性


  价值三:通过对设备定位信息的计算,可交叉验证申请人填写地址信息的真实性


  价值四:通过输出申请人名下的不同地址信息,辅助贷后催收