保险行业数据分析.pdf

时间:2022-12-23 22:01:20
【文件属性】:
文件名称:保险行业数据分析.pdf
文件大小:813KB
文件格式:PDF
更新时间:2022-12-23 22:01:20
文档资料 保险⾏业数据分析 数据分析完整流程: ⼀、业务背景 ⼀、业务背景 1.业务环境 业务环境 宏观 中国是世界第⼆⼤保险市场,但在保险密度上与世界平均⽔平仍有明显差距。 业界 保险⾏业2018年保费规模为38万亿,同⽐增长不⾜4%,过去"短平快"的发展模式已经不能适应新 时代的⾏业发展需求,⾏业及⽤ 户长期存在难以解决的痛点,限制了⾏业发展。 社会 互联⽹经济的发展,为保险⾏业带来了增量市场,同时随着⽹民规模的扩⼤,⽤户的⾏为习惯已发⽣转变,这些都需要互联⽹的⽅式进 ⾏触达。 保险科技:当前沿科技不断应⽤于保险⾏业,互联⽹保险的概念将会与保险科技概念⾼度融合。 中国保险市场持续⾼速增长。 根据保监会数据, 2011~2018年,全国保费收⼊从1.4万亿增长⾄3.8万亿,年复合增长率17.2%。 2014年,中国保费收⼊突破2万亿,成为全球仅次于美国、⽇本的第三⼤新兴保险市场市场; 2016年,中国整体保费收⼊突破3万 亿,超过⽇本,成为全球第⼆⼤保险市场; 2019年,中国保费收⼊有望突破4万亿。 2. 发展现状 发展现状 概览 受保险⾏业结构转型时期影响,互联⽹保险整体发展受阻, 2018年⾏业保费收⼊为1889亿元, 较去年基本持平,不同险种发展呈现 分化格局,其中健康险增长迅猛, 2018年同⽐增长108%,主要由短期医疗险驱动。 格局 供给端专业互联⽹保险公司增长迅速,但过⾼的固定成本及渠道费⽤使得其盈利问题凸显,加上发展现状强,经营渠道建设及科技输出 是未来的破局⽅法, 渠道端形成第三⽅平台为主,官⽹为辅的格局,第三⽅平台逐渐发展出B2C、 B2A、B2B2C等多种创新业务模 式。 模式 互联⽹保险不仅仅局限于渠道创新,其核⼼优势同样体现在产品设计的创新和服务体验的提升。 3. 发展趋势 发展趋势 竞合格局 随着⼊局企业增多,流量争夺更加激烈,最终保险公司与第三⽅平台深度合作将成为常态。 保险科技 当前沿科技不断应⽤于保险⾏业,互联⽹保险的概念将会与保险科技概念⾼度融合。 4. 衡量指标 衡量指标 5. 业务⽬标 业务⽬标 针对保险公司的健康险产品的⽤户,制作⽤户画像,然后进⾏精准保险营销。 ⼆、案例数据 ⼆、案例数据 1. 数据来源 数据来源 美国某保险公司,和本公司合作多年。现在该公司有⼀款新的医疗险产品准备上市。 2. 产品介绍 产品介绍 这⼀款新的医疗产品主要是针对65岁以上的⼈群推出的医疗附加险,销售渠道是直邮。 3. 商业⽬的 商业⽬的 为保险公司某种健康险产品做⽤户画像,找出最具有购买倾向的⼈群以进⾏保险营销。 4. 数据介绍 数据介绍 本次案例数据共有76个字段,字段繁多,在处理数据时,需要先将数据按照类别进⾏归类,⽅便理解查看。 4.1 基本信息 基本信息 4.2 基本情况 基本情况 4.3 家庭成员 家庭成员 4.4 家庭成员情况 家庭成员情况 4.5 疾病史 疾病史 4.6 ⾦融信息 ⾦融信息 4.7 个⼈习惯 个⼈习惯 4.8 家庭状况 家庭状况 4.9 居住城市 居住城市 5. 分析思路 分析思路 根据经验,我们可以⼤概判别哪些特征很可能和⽤户是否购买保险会有相关关系。 结合我们的业务经验,以及数据可视化,特征⼯程⽅法,先⾏探索这些特征中哪些特征更重要。 建模之后,再回顾我们这⾥认为⽐较重要或不重要的特征,看⼀下判断是否准确。 三、 三、Python代码实现 代码实现 了解数据样本和特征个数、数据类型、基本信息等 import numpy as np import pandas as pd import warnings warnings.filterwarnings('ignore') df=pd.read_csv(r'D:\liwork\a\data\ma_resp_data_temp.csv') pd.set_option('max_columns',100) #显⽰100列数据 df.head() df.shape df.info() 统计数据基本信息、统计空值数量 #将id转化为object df['KBM_INDV_ID']=df['KBM_INDV_ID'].astype('object') df.dtypes df.describe().T describe = df.describe().T describe.to_excel('output/describe_var.xlsx') #统计空值 len(df.columns) #空值的列 len(df.columns)-df.dropna(axis=1).shape[1] NA=df.isnull().sum() # 统计各个列空值的数量 NA #重置索引 NA=NA.reset_index() NA `#修改列名 NA.col

网友评论