Professional Documents
Culture Documents
第六届"泰迪杯"B题赛前指导 PDF
第六届"泰迪杯"B题赛前指导 PDF
第六届“泰迪杯”B题赛前指导
张敏
18/3/11
目录
1 问题解读
2 数据解读
3 智能推荐介绍
4 你要注意的
大数据挖掘专家 2
问题解读
一、产品的精准营销推荐
根据附件1所给出的用户观看记录信息数据,试分析用户的收视偏好,并给出附件2中产品的营销推荐方案。
1. 个性化的、非广播式的。
2. 用户/产品间的关联。
3. 用户特征/画像。
4. 产品功能匹配。
大数据挖掘专家 3
问题解读
二、相似偏好用户的产品打包推荐
为了更好地为用户服务,扩大营销范围,利用附件1~附件3的数据,试对相似偏好的用户进行分类(用户标签),对
产品进行分类打包(产品标签),并给出营销推荐方案。
1. 对第一问综合深化。
2. 用户分类依据(人口、家庭成员、职业?)。
3. 单个产品功能如何互补/组合打包(产品功能如何标签化)。
大数据挖掘专家 4
目录
1 问题解读
2 数据解读
3 智能推荐介绍
4 你要注意的
大数据挖掘专家 5
数据解读
用户在广电网络上的绝大部分行为
用户收视信息:
1. 用户收视信息:观看的频道,观看的起止时间。
2. 用户回看信息:回看频道,回看起止时间。
3. 用户点播信息:点播节目,点播金额。
我们希望得到类似这样的信息:
1. 张三家喜欢看体育类节目吗?他家有没有老人?小孩儿是男生还是女生?几岁了?
2. A节目和B节目有关系吗?互补还是互斥呢?
大数据挖掘专家 6
数据解读
目前的产品打包
1. 单个产品组合形成套餐,目前有多个套餐,但区别度不高。
2. 各个产品缺少标签自动生成机制。
3. 套餐产品组合缺少数据支撑。
4. 用户的主流需求有哪些。
大数据挖掘专家 7
目录
1 问题解读
2 数据解读
3 智能推荐介绍
4 你要注意的
大数据挖掘专家 8
智能推荐
推荐系统概述
2006年10月2日,Netflix(一家提供在线视频租赁服务的网站)开出100万美元奖金,奖励能把他们网站的产
品推荐精确度提高10%的人[1]。从上世纪90年代中期开始,推荐系统就成为一个独立的研究领域[2]。
大数据挖掘专家 9
智能推荐
从京东商城网站走进智能推荐
大数据挖掘专家 10
智能推荐
从电商网站网站认识智能推荐
!
大数据挖掘专家 11
智能推荐
电商网站用户画像
据VentureBeat统计,全球最大的在线零售商之一Amazon的推荐系统为其提供了35%的商品销售额
常见推荐方式 :
• 热点推荐/爆款/人气单品
• 经常一起购买的产品:打包销售
• 购买此产品的顾客同时也购买了:协同过滤-显式需求
• 看过此商品后顾客购买的其他商品:协同过滤-隐式需求
• 用户评论(打分)列表
大数据挖掘专家 12
智能推荐
用户在电商网站商的绝大部分行为
用户行为 类型 特征 作用
评分 显式 整数量化的偏好,可能的取值是[0,n] 通过用户对物品的评分,可以精确得到用户的偏好
投票 显式 布尔量化的偏好,取值是0或1 通过用户对物品的投票,可以较精确地得到用户地偏好
通过用户对物品的投票,可以精确得到用户的偏好。如果是
转发 显式 布尔量化的偏好,取值是0或1
站内,同时可以推理得到被转发人的偏好(不精确)
保存书签 显式 布尔量化的偏好,取值是0或1 通过用户对物品的投票,可以精确得到用户的偏好
一段文字,需要进行文本分析,得到
评论 显式 通过分析用户的评论,可以得到用户的情感:喜欢还是讨厌
偏好
单击流 一组用户的点击,用户对物品感兴趣,用户的单击一定程度上反映了用户的注意力,所以它也可以
隐式
(查看) 需要进行分析,得到偏好 从一定程度上反应用户的偏好
页面停留 一组时间信息,噪声大,需要去噪, 用户的页面停留时间一定程度上反映了用户的注意力和偏好,
隐式
时间 分析得到偏好 但噪声偏大,不好利用
购买 显式 布尔量化的偏好,取值是0或1 用户的购买行为很明确地说明他对这个项目感兴趣
大数据挖掘专家 13
智能推荐
推荐系统的功能
1. 增加物品销售数量;
2. 出售更多种类物品;
3. 增加用户满意度;
4. 增加用户忠诚度;
5. 更好地了解用户需求;
6. 扩大用户规模;
7. 提升广告位价值。
大数据挖掘专家 14
智能推荐
常用推荐算法[4]
90年代中期推荐系统成为一个学科领域开始,目前经常用到的一些算法有:
1. 关联规则
3. SVD(隐语义分析模型)
4. KNN(K近邻)
6. ……
大数据挖掘专家 15
推荐
Collaborative Filtering(协同过滤)
2种基本方法:
• 基于用户的协同过滤推荐(UBCF)
• 基于物品的协同过滤推荐(IBCF)
需要以下几个步骤:
1. 收集用户偏好;
2. 找到相似的用户或物品;
3. 计算推荐
大数据挖掘专家 16
推荐
基于物品的协同过滤推荐(IBCF)
用户101
物品A
物品B
用户102
物品C
物品D 用户103
大数据挖掘专家 17
推荐
Collaborative Filtering(协同过滤)
A B C D
101 1 1 0 1
102 1 1 1 0
103 1
物品Jaccard相似系数:
| B∩ A | 2 | B ∩C | 1 | B∩D | 1
P= = =1 P= = = 0.5 P= = = 0.5
| B∪ A | 2 | B ∪C | 2 | B∪D | 2
大数据挖掘专家 18
推荐
Collaborative Filtering(协同过滤)
A B C D
A 0 1 0.5 0.5
A B C D
B 1 0 0.5 0.5
101 1 1 0 1
C 0.5 0.5 0 0
102 1 1 1 0
D 0.5 0.5 0 0
用户物品矩阵 物品相似度矩阵
大数据挖掘专家 19
推荐
Collaborative Filtering(协同过滤)
A B C D
A B C D A 0 1 0.5 0.5
用户物品矩阵 物品/用户相似度矩阵
大数据挖掘专家 20
目录
1 问题解读
2 数据解读
3 智能推荐介绍
4 你要注意的
大数据挖掘专家 21
你要注意的
温馨提示
1. 广电用户以家庭为单位,不同于购物网站用户。
2. 电视产品的标签数据来源可不限于电视产品信息表。
3. 你要善用文本挖掘和爬虫技术。
4. 如何证明你的推荐方案是有效的。
大数据挖掘专家 22
大数据成就未来
泰迪科技:www.tipdm.com
热线电话:40068-40020