### --- 数据介绍 ~~~ # 数据来源 ~~~ 一家美国保险公司,该公司的准备上市。 ~~~ # 商品介绍 ~~~ 这是65岁人群的医疗附加险,销售渠道是直邮。 ~~~ # 商业目的 ~~~ 为产品制作用户肖像,找到最有购买倾向的人进行营销。 ~~~ 本案例数据有76个字段,字段多样。在处理数据时,需要根据类别对数据进行划分,以便于理解和查看。
变量名称 |
变量含义 |
备注 |
KBM_INDY_ID |
用户ID |
无意义特征 |
resp_flag |
用户是否购买保险 |
响应变量,即我们的目标变量 |
age |
用户年龄 |
本产品针对65岁以上人群保险 |
GEND |
性别 |
|
c210mys |
学历 |
0-unknown;初中-高中不到; 3-高中毕业;4-大学未毕业; 5-大专;6-本科;7-研究生; 8-专业院校毕业;9-博士 |
POC19 |
是否有小孩 |
|
CA[XX] |
小孩年龄 |
|
变量名称 |
变量含义 |
备注 |
NOC19 |
家庭儿童数量 |
|
NAH19 |
成人家庭数量 |
|
NPH19 |
家庭成员人数 |
|
POEP |
家里有没有老人? |
|
变量名称 |
变量含义 |
备注 |
U18 |
家庭成员是否小于18岁 |
|
N1819 |
18-19岁之间是否有家庭成员? |
|
N2029 |
20-29岁之间是否有家庭成员? |
|
N3029 |
39-39岁之间是否有家庭成员? |
|
N4049 |
40-49岁之间是否有家庭成员? |
|
N5059 |
是否有家庭成员在50-59岁之间 |
|
N6064 |
是否有家庭成员在60-64岁之间 |
|
N65P |
是否有家庭成员在65岁以上 |
|
变量名称 |
变量含义 |
备注 |
AART |
是否有关节炎 |
|
ADBT |
是否有糖尿病 |
|
ADEP |
是否有抑郁症 |
|
AHBP |
是否有高血压 |
|
AHCH |
胆固醇含量是否过高 |
|
ARES |
是否有呼吸疾病 |
|
....... |
........ |
......... |
变量名称 |
变量含义 |
备注 |
ABNK |
是否有过破产记录 |
|
FINI |
是否用过保险服务 |
|
INLI |
是否投资过寿险 |
|
INMEDI |
是否购买过医疗险 |
|
INVE |
是否有投资 |
|
...... |
...... |
...... |
变量名称 |
变量含义 |
备注 |
IOLP |
是否网上购买过产品 |
|
MOBPLUS |
是否通过快递买过东西 |
M-通过多种快递渠道购买;
P-或许通过多种快递读到购买;
S-单一快递渠道购买;
U-不知道 |
ONLA |
是否上网 |
|
SGFA |
是否喜欢美术 |
|
SGLL |
是否经常有奢侈消费 |
|
SGOE |
是否经常户外活动 |
|
SGSE |
是否喜欢运动 |
|
...... |
...... |
...... |
变量名称 |
变量含义 |
备注 |
LIVEWELL |
幸福指数 |
值越大,说明月幸福 |
HOMSEAT |
是否有房子 |
Y:有房子;P:可能有房子;R:租房;TU:不确定 |
HINSUB |
是否有医保补贴 |
A-C,补贴依次增加 |
c210cip |
收入所处排名 |
值越大,说明收入越高 |
c210ebi |
普查家庭有效购买收入 |
值越大,说明有效购买收入越高 |
c210hmi |
家庭收入 |
值越大,说明家庭收入越高 |
c210hva |
家庭房屋价值 |
值越大,说明房屋价值越高 |
c210... |
家庭经济类数据 |
值越大,说明经济地位越高 |
变量名称 |
变量含义 |
备注 |
STATE_NAME |
所处的省份 |
|
c210apvt |
贫穷以上人的比例 |
值越大,说明比例越高 |
c210b200 |
所处地区有多少居住小区在2000年后建立的 |
值越大,说明比例越高 |
c210blu |
所处地区蓝领所占百分比 |
值越大,说明比例越高 |
c210bpvt |
贫穷一下人的比例 |
值越大,说明比例越高 |
c210mob |
所处地区mobile home的比例 |
值越大,说明比例越高 |
c210pdv |
离婚或者分居人群所占比例 |
值越大,说明比例越高 |
...... |
居住地统计数据 |
值越大,说明比例越高 |