如今推荐系统广泛应用于电商、新闻、音乐、电影、广告等领域,例如国外的Amazon、YouTube、Netflix以及国内的京东、淘宝、豆瓣等,推荐算法已成为其核心技术能力并带来巨大的业务价值。
适合保险产品的智能推荐方法有哪些?
推荐算法的基本思路
推荐算法有很多种,如基于人口统计学的推荐、基于内容的推荐、关联规则推荐、协同过滤推荐等等。上述推荐算法的基本思路都是根据用户数据、产品数据或二者之间的交互数据来计算用户和用户之间、产品和产品之间的相似度,然后对于目标用户,推荐与其已购买产品相似的产品,或者推荐与其相似的用户所购买的产品。
推荐算法大多是问题导向的,很多推荐算法最初的提出都是根据具体业务问题来设计的。因此,不同的推荐算法适用于不同的业务场景,推荐的效果与具体要解决的业务问题是高度相关的。
例如,基于内容的推荐方法比较适用于新闻的推荐,关联规则、协同过滤则适用于书籍、电影等的推荐。而对于金融服务例如保险、基金等产品,其特点是购买低频、交叉购买更是少之又少,因此用户和产品的交互数据极度稀疏,一般无法根据历史购买数据来准确计算用户之间或产品之间的相似度。
因此,对于这一类型的产品,传统的基于内容、关联规则、协同过滤等推荐算法往往并不能取得较好的效果。
保险产品:基于知识的推荐
对于保险产品的推荐,一种比较适合的方法是基于知识的推荐,也即根据用户的特征和需求,以及相应保险产品的特点等业务知识,构建专家规则来确定什么样的产品适合什么样的用户,据此对用户进行推荐。基于知识的推荐方法核心在于构建合理、完善的知识库,这是决定推荐效果好坏的关键。
基于知识的推荐方法包括如下两类:
1、 基于案例(case-based)的推荐。对于一个新的推荐问题,计算其与历史推荐案例的相似性,找到相似的历史案例,并根据相似历史案例的推荐结果来解决新的推荐问题。案例推荐的原理是“相似问题具有相似解”,因此该方法的核心是计算不同案例之间的相似度。
2、 基于约束(constraint-based)的推荐。利用预先定义的推荐知识库显式地定义客户特征和产品特征之间应当满足的约束条件,把推荐任务看作是解决一个约束满足问题(constraint satisfaction problem,CSP)的过程,然后把满足约束的产品推荐给用户。
以基于约束的推荐方法为例,推荐知识库通常定义为两组变量(VC,VPROD)和三组约束条件(CR,CPROD,CF),具体含义为:
1、VC-用户特征:描述用户属性及用户需求的变量集合,如用户年龄、性别、年收入、保费预算、常住城市、是否有社保,等等;
2、VPROD-产品特征:描述产品属性的变量集合,如产品名称、保险类别、是否返还型、保障期限、保额、保费,等等;
3、CR-用户约束:用户特征VC需满足的约束条件,如限定保费预算必须小于收入的20%,常住城市≠港澳台,等等;
4、CPROD -产品约束:可用于推荐的产品集合,描述产品特征VPROD各变量取值的约束组合,例如:PROD1={产品名称=“XXX重大疾病保险”∩保险类别=“健康险”∩是否返还型=“否”∩保障期限=“30年”∩保额=“20万”∩保费=5000},PROD2=……,等等;
5、CF -过滤条件:用户特征VC与产品特征VPROD之间需满足的约束关系,如用户保费预算=5000→保险产品保费≤5000,用户年龄>50→产品名称≠“XXX重大疾病保险”,等等。
在给定上述知识库的基础上,对于一个目标用户,收集到其具体需求变量
Cc(例如:Cc={年龄=30,性别=男,年收入=15万,保费预算=5000,常住城市=上海,是否有社保=有}),则推荐任务就是解决约束满足问题(VC,VPROD,Cc∪CR∪CPROD∪CF),也即在VPROD中找到满足约束Cc∪CR∪CPROD∪CF的一个或多个子集推荐给用户。对于该CSP问题,当约束条件比较简单时,可直接应用检索技术查询出满足条件的产品集合;当约束条件较为复杂时,可采用CSP问题的一些求解算法来解决,如回溯算法、基于树的搜索算法,等等。
相比于关联规则、协同过滤等技术,基于知识的推荐方法优点是不存在冷启动问题,因此可以对新产品和新用户进行推荐;缺点则是知识获取瓶颈,需要专业的领域知识并将其转化为推荐算法能够处理的规则化格式。
保险产品推荐的几个具体问题
1、保险知识库的构建与维护
前面已经提到,对于基于知识的推荐方法,知识库的质量极大程度上决定了推荐结果的好坏,而知识库的构建则需要业务专家和工程师相配合。
知识库主要包括用户知识、保险产品知识、业务约束规则3部分:用户知识的获取可以通过问卷、多轮会话、用户行为数据分析等;保险产品知识和业务约束规则更多需要业务专家的梳理和定义。
工程师的任务则是搭建知识库管理系统,用于知识库的后续更新和维护,同时提高知识抽取过程的自动化水平,以节省知识库更新过程中的人力成本。
2、推荐系统的不断调整和优化
在产品上线初期或网站流量主要为新用户的阶段,基于知识的推荐方法往往能取得比其他推荐技术更好的效果。但是随着保险产品库越来越丰富、网站存量用户占比越来越高、采集到的用户交互信息越来越多,协同过滤等技术将会越来越适用,而基于知识的推荐方法要想保证推荐效果则需要配备学习组件,以不断调整、完善知识库。
此时可以采用混合推荐系统,集成多种推荐技术的优势来处理不同场景下的推荐问题。同时可建立用户反馈机制,跟踪用户后续行为来评估推荐的效果,以针对性地调整推荐算法和知识库规则。
3、多推荐结果排序与过度约束问题
CSP问题的解可能不是唯一的,也可能没有解,反映到推荐系统,就是要解决如下两个问题:
(1)多推荐结果的排序。当有多个保险产品满足约束条件时,可以通过一定的算法计算产品特征与用户特征和需求的匹配程度(或相似度),然后将相似度高的产品优先推荐给用户。
(2)过度约束问题。当没有一款保险产品满足用户约束条件时,直接告诉用户没有适合其的产品是用户所不希望的,此时可以适当松弛约束条件,找到满足部分约束的产品推荐给用户,并给出解释和说明。