您好, 访客   登录/注册

基于三步KMEANS模型的卷烟零售门店分类

来源:用户上传      作者:

  摘 要:根据市场资料对零售户经营进行分析和分类,可以为改善卷烟营销提供决策支持的依据。针对当前研究以及零售门店细分方法存在的不足,提出基于三步KMEANS模型的卷烟零售门店分类,借助Kmeans聚类分析算法,分三步对烟草销售门店进行分类。首先以销售价格将烟草分为高低端,再由不同门店对不同分类烟草的销售额比例将门店分为AB类;然后再用活跃度门店的经营稳定度指标将门店分为AB两类;最后将两个分类结果加以整合,得到四类不同的门店。
  关键词:Kmeans;门店分类;卷烟分类
  中图分类号:F713.5 文献标志码:A 文章编号:1673-291X(2016)19-0052-04
  绪论
  在烟草行业,近年来随着卷烟信息化系统的建设,零售行业数据采集与存储技术的进步,烟草公司已经积累了生产和销售数据,这些数据并不是无用的数据,通过对其进行挖掘分析,获得有价值的信息,能够给企业带来巨大的商业价值以及服务创新。
  在卷烟营销方面,烟草公司在以往的经营中产生了海量的柜台扫码的卷烟销售交易数据,使用这些数据进行发掘,发现零售户的销售规律和群组特征,可以优化渠道网络,实现货源合理配置,提高营销产值,逐步实现精准营销。
  近年来,国内学者在聚类分析探索及卷烟营销挖掘等已经开展了一些研究,李纲等研究了国产轿车市场竞争格局的聚类分析法;黄钟颖研究了两步聚类分析法在汽车市场研究中的应用;张红梅等提出了基于两步聚类算法的卷烟零售客户分类研究。尽管如此,尚未见到文献采用更为客观的扫码数据进行零售客户分类研究。
  本文提出了基于三步Kmeans模型的卷烟零售门店分类模型,基于卷烟零售门店较为客观的每日销售扫码数据,通过数据挖掘手段,可以有效地挖掘和区分不同门店的经营特性,为烟草公司的精细营销提供基于数据的决策支持。
  一、Kmeans模型简介
  Kmeans算法首先从n个数据对象中任意选择k个对象作为聚类中心;而对于所剩下其他对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给以其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数。
  在Kmeans的实际应用中,分类数目K的选取对分类效果有较大的影响。本文通过枚举,令K从2―10,在每个K值上重复运行数次Kmeans(避免局部最优解),并计算当前K的平均轮廓系数,最后选取轮廓系数最大的值对应的K作为最终的集群数目。
  二、组合分类模型方法的思路和流程
  (一)研究问题的提出
  在门店的卷烟销售中,每笔交易都会通过扫码做出记录,我们收集的数据来自贵州省?菖?菖烟草销售公司全部零售门店2014年1月1日至2014年9月1日的销售数据,这些原始数据较为客观地反映了各个门店的销售情况,根据烟草公司项目中数据分析的要求,本文基于零售门店的扫码信息,使用组合分类模型对零售门店进行细化分类。
  (二)组合分类模型流程
  基于零售门店的扫码信息,本文提出组合分类模型对零售门店进行细化分类(如下页图1所示),该方法首先按不同类别卷烟销售额占比将门店分为AB两类,再按门店活跃度分类将门店分为AB两类,然后再将两个分类结果组合得到最终的四个分类结果。
  三、分类实验及实验结果分析
  (一)原始数据和实验工具选择
  烟草公司在以往的经营中产生了海量的柜台扫码交易数据,本文数据来自贵阳市红华烟草公司零售门店在2014年1月1日至2015年3月20日之间产生的柜台扫码销售及库存数据,共有2014年1月1日至2015年3月20日的1 797 371条销售数据,有销售码、执照―代号、交易时间、商品代号、交易数量、单价、交易金额、门店名等字段。论文采用选用R工具调用Kmeans方法进行了扫码销售数据组合分类的实验研究。
  (二)卷烟高低档分类
  本文首先根据不同类别卷烟销售额占比将门店分类,首先,为了确定最佳的分类数,通过计算不同分类数目的轮廓系数,得到图2的轮廓系数图,从图中看出在按卷烟价格为卷烟分类时,分为两类获得了最高的轮廓系数。因此,我们将卷烟品牌按价格分为高低两类。高于**称为高端烟,低于*的称为低端烟。
  (三)按不同类别卷烟销售额占比将门店分类
  通过上文的卷烟分类,我们计算不同门店一年销售额中,高低档烟的占比,然后将比例进行kmeans聚类。通过轮廓系数图,发现分为两类获得了最大的轮廓系数。因此,我们按比例的不同将门店初略分为AB两类,A类、B类门店的聚类中心高端烟的销售占比值分别为0.0888和0.0332,A类、B类门店聚类中心低端烟的销售占比值分别为0.911和0.967。
  (四)按门店活跃度分类
  接着,我们根据门店稳定度对门店分类,首先根据每日营业额计算店铺的稳定度,再用Kmeans将其划分为两类,稳定A门店聚类中心的稳定度值为0.2868,稳定B门店聚类中心的稳定度值为1.005。稳定度数值越小,说明其每日经营额越稳定,波动幅度不大。稳定度数值越大,说明其每日经营额越不稳定,波动幅度较大。
  (五)组合两类分类
  在完成了门店的两种不同分类后,对每个门店,按不同指标我们有两种不同的分类。将他们进行组合。则可将所有76个门店分为四类,其中,AA为高端稳定门店共18个(23.6%),AB为高端不稳定门店共1个(1.3%),BA为低端稳定门店共50个(65.8%),BB为低端不稳定门店共7个(9.2%)。
  (六)结果分析
  我们分别统计四类门店的每日卷烟销售均价,及每日销售额,得到图3和图4。从两张图中我们可以明显观察到不同类别间的显著差异,参见图3和图4我们可以得出通过组合分类得到的四类门店其经营结构特征如下:   1.类AA:每日营业额相对稳定,浮动区间为2 000~6 000元之间;其卖出的每包烟平均售价也较为稳定,维持在每包18元上下,此类店铺可预期性强,客单价维持在较高位,属于高端稳定门店,例如月亮岩店、东门店、小石城点等。
  2.类AB:每日营业额不稳定,浮动区间在1 000~12 500元之间,而营业额超出5 000元的天数占绝对少数;同样,其卖出的每包烟平均售价也较不稳定,均价在10~30元之间宽幅波动,但大多数时间能维持在15~20元之间;此类店铺可预期性较差,客单价也不稳定,属于高端不稳定店铺。76个店面中,仅有威清店属于此类。
  3.类BA:每日营业额相对稳定,浮动区间在2 000~6 000元之间;其卖出的每包烟平均售价也相对稳定,均价在14~16元之间;此类店铺可预期性强,客单价有待提高,属于低端稳定店铺,如白云一店、白云二店、家乐店等。
  4.类BB:每日营业额不稳定,浮动区间在1 000~10 000元之间,而营业额超出4 000元的天数占绝对少数;另一方面,其卖出的每包烟平均售价也较不稳定,在14~18元之间波动;此类店铺可预期性差,客(其)单价也不稳定,属于低端不稳定店铺,如云阳店、世纪园店等。
  (七)策略建议
  根据本文的分析结果可知,AA店是最优质的店铺,应该在供货,服务上面优先满足,着重销售高价烟;对于AB类店,其客单价较高,但是每日营业额不稳定,在供货上我们可以对这类店铺弹性供货,对于旺季,增加供货,而在淡季则减少供货;对于BA类店,属于销售主力,单价稳定,每日销量稳定;对于BB类店,我们可以适当裁减。
  总结
  本文提出了基于三步Kmeans模型的卷烟零售门店分类模型,基于卷烟零售门店每日扫码销售数据,基于销售价格和活跃度对门店分类,通过分类实验结果的分析可知,根据高低端卷烟销售占比分类,可以将门店显著区分为高低端;而通过活跃度指标分类,可以将门店显著分为稳定与非稳定;最后的组合模型得出的四类门店,可以综合考虑销售价格和活跃度对门店分类,特点显著,效果明显,经过实际比对可以验证,采用本文方法得到的门店结果比较合理,可以帮助公司制定相应的改进策略,奖优罚劣,优化销售渠道,实现货源合理配置,提高营销综合效益。论文提出的方法,也可以为根据其他指标的实际分类问题的研究提供参考。
  参考文献:
  [1] 张红梅,李以钢.基于两步聚类算法的卷烟零售客户分类研究[J].经济研究导刊,2012,(34).
  [2] 李纲,毕振力.国产轿车市场竞争格局的聚类分析[J].统计与决策,2007,(22):125-127.
  [3] 黄钟颖.两步聚类分析法在汽车市场研究中的应用[J].管理观察,2008,(9):200-201.
  [4] 刘乐山,雷丁.论农村消费需求潜力向现实消费需求的转化[J].新疆财经,2010,(2):22-24.
  [5] 仲秋雁,莫佳卉.基于拓展自组织神经网络方法的客户市场细分[J].中国管理科学,2008,(10):551-555.
  [责任编辑 陈丽敏]
转载注明来源:https://www.xzbu.com/2/view-11138354.htm