数据挖掘技术在保险公司交叉销售中的实证研究

点击数:554 | 发布时间:2025-01-22 | 来源:www.vodxm.com

    中图分类号:TU247.1文献标识码:A文章编号:1006-4117(2011)04-0160-02

    在CRISP-DM办法论指导下,构建基于聚类的关联规则数据挖掘模型,对保险业务数据进行挖掘剖析。

    1、数据筹备

    结合保险公司个人寿险业务数据库的信息,可以概括为顾客信息表、保单信息表及理赔信息。将三张表中和挖掘主题有关的字段信息抽取,整理为一张宽表。

    研究样本中,年龄和保费都是连续型数据,将它转化为离散化数据,有益于提升数据挖掘的效率。借助SQLServer2005的IntegrationServer工具加载数据表,打造多维数据立方体。

    基于数据挖掘的保险交叉销售模型应用

    (一)构建基于聚类的挖掘模型

    选取412、413(瑞鑫两全保障)等为主细分变量,区域、保费、途径等为辅细分变量。并保证输入变量与输出变量之间有肯定的有关性。打造聚类挖掘模型,得到聚类结构图。

    模型将数据分为10个群体,对每一个群进行钻取,结合剖面图和数据倾向图,辨别其所拥有的特点。10个分类的强弱势特点如下表所示:

    选择保费10000和100000为临界点,可见类1、类2、类3为低端顾客,缴纳保费均在10000元以下,类4-8为中端用户,缴纳保费为10001到100000元之间,类9和类10是高档顾客,缴纳保费均在100000元以上。

    针对低中高档群组,结合年龄、性别、受教育程度等特点对群组的业务特点进行描述,低端群组特点剖析如下表1-4所示:

    低端群组消费特点描述:该群体受教育程度常见不高,在初中以下,年龄偏大,大多在50―65岁之间,缴纳保费的能力较低,都在10000元以下。因为S42(康宁终身健康保险)交费较高,所以需要非常低,除此之外S66(少儿保险)需要极少。同样的办法,统计剖析中端和高档顾客的群体特点。

    聚类只能解决已经发生过的顾客消费行为,并不可以对以后的消费行为和规律进行预测。在聚类的基础上,对所有险类型别进行关联剖析,得出最强的关联规则,从而有针对性的对各顾客群组进行交叉销售。

    (二)构建关联挖掘模型

    针对每一群组,构建关联挖掘模型,关联规则的默认算法是Apriori算法。通过运行关联挖掘结构,得出依靠互联网图。

    对于每一群组来讲,最强的险种关联只不过两个或三个而已。选择关联最强的两个险种:S43→701,险种出现的概率为88.9%,要紧度为1.9,为正关联。说明低端顾客类1,在购买S43(康宁按期保险)的同时购买701(全家福意料之外卡)的几率为88.9%,结合低端顾客群组的消费特点,较适应常理。得出的关联规则是形如A→B,代表假如购买了商品A,则同时也会购买保险商品B。具体状况如表3所示。

    依据每个类别最好的险种关联,像所对应的群组中还没消费这种保险组合的顾客进行营销推广,已经购买了其中一种保险商品的顾客,向其推荐另一款商品;或者在将来向某一类顾客推荐商品时,依据其收入和教育程度等客观原因,判断大致所属的群组,营销推广商品组合,以达到达成交叉销售的目的。

    结束语:论文对基于聚类的关联规则交叉销售模型进行实证研究,先从顾客角度出发,运用EM聚类算法对筹备好的数据进行数据挖掘,得源于然的10个群组分类,然后对每个群组,从商品业务角度出发,用Apriori算法对险种进行关联剖析,得出可以指导交叉销售的规则。在顾客聚类的基础上,找出保险商品潜在的关联规律,拟定有针对性的交叉销售策划方案。

    作者单位:常熟理工学院管理学院

    作者介绍:周梅,女,汉族,江苏徐州人,中国矿业大学习管理学院在读博士生;常熟理工学院管理学院,讲师,研究方向:数据挖掘,金融工程与风险管理。

  • THE END

    声明:本站部分内容均来自互联网,如不慎侵害的您的权益,请告知,我们将尽快删除。

专业院校

返回顶部

Copyright©2018-2024 国家人事考试网(https://www.scxhcf.com/)
All Rights Reserverd ICP备18037099号-1

  • 国家人事考试网微博

  • 国家人事考试网

首页

财经

建筑

医疗