Download as pdf or txt
Download as pdf or txt
You are on page 1of 3

消费市场

基于RFM模型的顾客消费行为与顾客价值预测研究
徐文瑞(广东省科技干部学院 广东珠海 519090)
中图分类号:C913 文献标识码:A

内容摘要:在以顾客为中心的营销时代,顾客关系管理成为企业的重要战略性举措。RFM 模型是衡量顾客价值
和顾客创利能力的重要工具和手段。本文以通信行业的流量包订购业务为研究对象,采用 RFM 模型及层次分析法,
根据顾客的历史消费数据,预测出具有较强再次订购倾向的潜在价值顾客,为企业营销策略制定提供可量化的参
考依据。
关键词:RFM 模型 消费行为 预测研究

研究背景 购买的可能性。Jonker(2009)基于 RFM 模型各变量提


在以顾客为中心的营销时代,顾客关系管理成为企业 供了一种决策支持系统,该系统确定邮件发送的频率以
的重要战略性举措。顾客是企业存在和发展的基石,许多 刺激顾客保持活跃并进行购买。季晓芬、贾真(2015)
统计数据表明,获得一个新顾客的成本是维护一个现有顾 基于 RFM 模型分析了服装企业 VIP 顾客的忠诚度、活
客成本的 5-8 倍。与顾客建立持久稳固的关系,挖掘出 跃度,并结合模糊数学方法构建判断矩阵,将三维数据
最大化的顾客价值,是企业从竞争中脱颖而出的有效途 (RFM 得分)变为一维数据进行比较,对企业从多角度
径。要想做到有的放矢的管理顾客,与顾客建立长期稳 进行 VIP 顾客管理与服务提供参考依据。吕斌、张晋东
定的关系,不仅要从顾客已发生的交易支出中进行分析, (2013)在运用 RFM 模型对商业银行顾客进行分类的基
还要以发展的眼光关注顾客一定时期内消费的频度、增 础上,通过数学算法确定了商业银行各类顾客的营销策
量消费额及购买率,提前预测出有再次购买倾向的顾客, 略问题。王渊(2013)利用顾客交易的历史数据算出每
充分挖掘其潜在价值。 位顾客的 R、F、M 值,之后利用 RFM 模型确定顾客的
RFM 模型作为顾客关系管理领域的一种顾客消费行 价值高低,再针对不同价值类别的顾客采用基于顾客偏
为分析模型,在反映顾客价值及顾客购买偏好方面都具有 好的协同过滤技术进行个性化商品推荐,有效提升了顾
良好的表征性,是衡量顾客价值和顾客创利能力的重要 客的重复购买率。
工具和手段。本文以电信行业的流量包订购业务为研究 综上所述,RFM 模式的优点在于资料搜集容易、计
对象,采用 RFM 模型及层次分析法,根据顾客的历史消 算逻辑简单、适用于多个行业,最重要的是,RFM 的三
费数据,预测出具有较强再次订购倾向的潜在价值顾客, 个属性被许多研究证实,对于识别顾客价值有很强的解
为企业营销策略制定提供可量化的参考依据。

RFM 模型及其研究现状
经典的 RFM 模式由美国数据库营销研究所 Arthur
Hughes(1994) 提 出,RFM 模 型 包 括 最 近 购 买 时 间 R
(Recency)、购买频率 F(Frequency)、购买金额 M
(Monetary)三个变量。
图 1  RFM 总分与累计订购率关系
最近购买时间 R 表示顾客最近一次的购买时间和分
析时间点间隔的天数。该值越小,顾客重复购买的可能
性越大,顾客价值越高。购买频率 F 表示计算期内顾客
购买产品或服务的次数。一般来说,顾客购买频率越高,
顾客越忠诚,顾客价值越大。购买金额 M 表示计算期内
顾客的购买总金额。一般来说,顾客购买金额越高,顾
客越忠诚,顾客价值越大。
RFM 模型被广泛的应用于识别顾客和分析顾客再次 图 2  RFM 总分与订购用户、订购率关系趋势

44 商业经济研究 2017 年 19 期
Consumer Market

释能力,对各行业企业实施差异化营销策略,提升顾客 a ij =7,元素 i 比元素 j 重要得多;a ij =9,元素 i 相比元素 j


重复购买率起到了支撑作用,但在模型变量的权重确定 极其重要。然后构建判断矩阵,也就是每两个因素的权重
方面以主观判断为主,难免影响最终分析的客观性。
表 1  频率及金额描述性统计
本文根据电信行业顾客数量多、消费数据维度多、
顾客生命周期长等特点,在传统 RFM 模型的基础上,运
用层次分析法确定模型中各个变量的权重,以期更加客
观的预测顾客未来的购买情况,为企业精准营销策略的
制定提供参考依据。

表 2  判断矩阵
建模背景
本文以某市电信企业的全网语音用户(剔除无效用
户)为研究对象,根据其 2016 年 10 月及 10 月之前的消
费数据,预测其在下一个月是否继续订购通用叠加流量
包,以合理制定顾客接触频率,进而提高现有顾客的订
购率。根据历史数据分析,发现订购通用叠加流量包的
表 3  RI 取值
用户主要跟订购时间、订购金额以及订购次数有关,这
跟 RFM 模型的三要素相吻合,因此本文采用 RFM 模型
对通用叠加流量包的订购情况进行预测分析。
表 4  各用户 RFM 得分结果
如 果 把 流 量 包 也 当 作 一 件 商 品 来 看 待, 那 正 好
跟 传 统 的 RFM 模 型 的 指 标 一 致,R 表 示 用 户 最 近 一
次 订 购 流 量 包 距 离 分 析 点 的 时 间,F 表 示 用 户 一 定
时 间 段 内 订 购 流 量 包 的 次 数,M 表 示 用 户 一 定 时 间
段 内 订 购 流 量 包 的 总 费 用, 最 后 用 计 算 公 式:RFM_
SCORE=R×W R +F×W F +M×W M(W x 表示各参数的权重
值)计算出最终得分。
表 5  各用户得分区间与订购关系

模型构建
(一)样本选择
本研究主要是根据历史消费数据进行预测,因此假设
只要订购过流量包业务的用户都有可能在未来订购通用叠
加流量包,据此选择 2016 年 8-10 月订购过任何流量包业
务的用户作为建模样本。
(二)权重确定
对目标用户计算各属性值,提取出用户的 R(最近的
流量包订购时间)、F(订购次数)、M(累计订购的费用),
表 1 列出了各属性的描述性统计量,其中 R 代表最近订购
日期距离测试日期 2016/11/01 的间隔。
构建判断矩阵,本文采用层次分析法(AHP)确定各
参数权重,它是一种定性和定量相结合的方法,比较第 i
个元素与第 j 个元素相对上一层某个因素的重要性时,使
用数量化的相对权重 aij 来描述。设共有 n 个元素参与比较,
则 A=(a ij)n×n,称为成对比较矩阵,a ij 在 1-9 及其倒数中
取值:aij=1,元素 i 与元素 j 对上一层次因素的重要性相同;
aij=3,元素 i 比元素 j 略重要;aij=5,元素 i 比元素 j 重要;

《中文核心期刊要目总览》贸易经济类核心期刊 45
消费市场

比矩阵(见表 2): 相关关系,其标准化调整公式为:


X`=(XMax-X)/XRa
由公式 RFM_SCORE=R`*0.6+F`*0.3+M`*0.1 计算结果,
如表 4 所示。
对归一化处理后判断矩阵进行特征向量的计算,最后 (四)模型检验
得 出 R、F、M 的 特 征 向 量 为 W=(0.11,0.31,0.58), 计算出用户的 RFM 得分后,需要对结果进行检验,
再通过判断矩阵和特征向量计算最大特征根 λmax: 即分析该批用户在分析时点后一段时期内的订购情况,理
论上 RFM 得分越高,顾客订购概率越大,结果如图 1 所示。
从图 1 可以看出,该方案的结果跟理论相吻合,再将
顾客按 20 等分对其订购率、订购用户数以及累计订购率
从理论分析得到,如果判断矩阵是完全一致的判断矩 进行区间分析,结果如表 5 所示。
阵,应该有: 图 2 表明该权重和计算公式符合预期,0.55-0.6 分区
aijajk=aik,1 ≤ i,j,k ≤ n 间是累计用户占比跟累计订购率的交叉点,取该区间的中
实际上构成判断矩阵完全一致是不可能的,因此退而 值 0.575 为分段点,得分为 0.575 分以上的用户订购标记
求其次,要求判断矩阵有一定的一致性。对完全一致的判 为 1,共标记用户 14999 个。
断矩阵而言,其绝对值最大的特征值等于该矩阵的维数, (五)模型结论
因此可以将一致性判断准则定为:判断矩阵的绝对值最大 该模型以 2016 年 3-5 月订购过流量包的用户为目标
的特征值和该矩阵的维数相差不大。 用户数据,共 38954 户;该批用户在 6 月成功订购的总
一致性检验:计算衡量一个判断矩阵 A 不一致程度的 数为 14092;通过本模型预测会订购的用户有 14999 户,
指标 CI: 。对于固定的 n,构造判断矩 成功预测用户数为 9574 户,查全率为 67.94%,查准率为
阵 A,其中 a ij 是从 1,2,…,9;1/2,1/3,…,1/9 中随 63.83%。
机抽取的,这样的 A 不一致,取充分大的子样得到 A 的 综上,利用该模型可以对已经订购过流量叠加包的用
最大特征值的平均值,得到表 3。 户进行很好的预测,而且形成有效规则,简单易用,利用
计算随机一致性比率 CR: ,当 IQ 集群的存储过程或者大数据平台就可以完成,各地市
CR<0.1 时,认为层次总排序通过一致性检验。最后确定 根据实际情况微调权重就可以完成数据预测。但是对从未
最终权重:(WR,WF,WM)=(0.6,0.3,0.1)。 订购过流量叠加包的用户无法进行预测分析,需要进一步
(三)RFM 值的标准化处理 优化。
由于用户的三个参数 R、F、M 值的度量单位各不相同,
数据的取值也存在很大差异,所以需要对数据进行标准化 参考文献:
1.Hughes,A.Strategic Database Marketing[M].Chica-
处理。由于 F、M 指标对顾客价值存在正相关影响,因此
go:Probus Publishing,1994
对这两个指标的标准化公式为: 2.Jonker JJ,Piersma N,Potharst R.A decision support
X`=(X-XMin)/XRa system for direct mailing decision.Decsi[J].Support System,
其中,X' 表示标准化后的值,X 表示原始值,X Min 表 2009
3. 季晓芬,贾真 . 基于 RFM 行为模型的服装企业
示该指标的极小值,X Max 表示该指标的极大值,X Ra 表示 VIP 顾客数据挖掘 [J]. 浙江理工大学学报,2015(4)
该指标的全距: 4. 吕斌,张晋东 . 基于 RFM 模型的商业银行营销决
XRa=(XMax-XMin) 策分析 [J]. 统计与决策,2013(4)
5. 王渊 . 基于 RFM 模型的协同过滤方法及其在个性
R 对顾客价值存在负相关关系,即值越小,标准化后
化推荐中的应用 [D]. 杭州电子科技大学,2013
的值越高,因此其标准化调整公式为 R 对顾客价值存在负

46 商业经济研究 2017 年 19 期

You might also like