SEO外包平台,我们为您提供专业的企业网站SEO整站优化外包服务 SEO设置

SEO外包平台

专注于企业网站SEO整站优化外包服务

[seo数据分析书]数据分析项目实战-淘宝用户行为分析

作者:jcmp      发布时间:2021-05-03      浏览量:0
一、项目背景UserBehavior是阿

一、项目背景

UserBehavior是阿里巴巴提供的淘宝用户行为数据集,数据集包括2017年11月25日至2017年12月3日之间,行为约百万随机用户的所有行为(行为包括点击、购买、购买、购买、喜欢)注:隐性反馈推荐问题。

二、项目目标

2.分析构想

本次分析主要基于分析目的,对以下四个维度进行分析和提出改进建议:

以下是本次分析逻辑:

三、数据收集和整理

数据准备:

阿里巴巴巴天池:

User工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员。

2.将数据导入MySQL

工具准备:工具:NavicatforMySQL,mysql为5.7,powerBI(或Excel)。下载的Excel数据很大,不能直接用Excel打开,需要用Navicat导入数据库进行处理。

1)建立数据库

2)根据下图选择导入指南。

3)选择Excel文件数据源

4)选择分隔符

csv文件文本打开是、分割、选择,其他默认。

5)为来源定义追加选项

在此引进10000行数据。

6)选择向哪个表中导入数据

7)定义源表(excel表)和目标表(数据库表)的对应关系

导入文件的字段栏与数据库字段名一致时,会自动设定对应关系。如果栏的字段不对应,可以手动调整。设置后,单击下一步。

本次Excel数据本身可能没有排名,第一行是数据:

导入数据后,在navicat中使用可视界面修改排名。这次分析的数据没有PK,不要设置。

数据类型选择varchar。打印这一列是时间类型,但为了避免导入后数据异常。设置为varchar,导入后用sql转换。

8)选择导入模式

9)点击开始按钮执行导入命令

3.数据理解

本数据集包括2017年11月25日至2017年12月3日之间,有行为的约百万随机用户的所有行为(行为包括点击、购买、购买、喜欢)。数据集的组织形式与MovieLens-20M类似,即数据集的每行都表示用户行为,由用户ID、商品ID、商品类别ID、行为类型和时间戳构成,用逗号分隔。数据集中各列的详细说明如下:

注意到,用户行为类型有4种,分别为

(2)数据清洗

1)选择子集

数据集的字段有用

2)字段名称修正:

3)删除重复值

4)缺失值处理

对所有列进行数量查询,数量结果为9999999,无缺失值。

5)一致化处理Timestamp列不能直接分析,需要将列转换为时间、日期、时间三列。

6)异常值处理

项目背景通过对2017年11月25日至2017年12月3日之间淘宝用户行为数据集进行隐性反馈推荐问题的研究,删除该时间段以外的数据进行处理。

清洗的数据如下:

最后,导入的数据集的大小概要:

4、数据分析

这一环节的所有结果首先使用sql分析数据,得到分析结果,将分析结果导出到excel或powerbi中可视化。

(1)数据整体情况概要

1.整体UV、PV、人均阅览次数、成交量

2.日均UV、PV、人均阅览次数、成交量

①日访客数趋势线

②日均阅览次数趋势线

④日成交量趋势线

3.整个用户行为数据

4.用户的再购买率和跳跃率

统计时间为9天时,用户的再购买率为65.87%进一步培养用户忠诚度,鼓励用户更高频率的消费。

(2)用户行为转换状况分析

1.用户行为转换和流失分析

流量行为转换漏斗分析

用户点击后,收藏和购物车的概率为5.5%左右,最后真正的购买概率为2.3%,即用户行为在浏览商品详细页面后大量流失那么,用户点击后也发生了大量的流失,只有极少的部分发生了购买吗?

用户行为转换漏斗分析

从上图可以看出,用户点击后没有大量流失,而且有68.47%的收费用户,用户的购买转换率很好。由此推测,流量行为转换中用户的点击行为远远大于收藏和购买,最后只有2.3%转换为购买的原因,可能是比较不同店铺的同类产品。

因此,对于大多数用户行为或商品点击详细页面访问,研究如何提高用户点击后转换到其他行为是关键。APP可以优化商品推荐和筛选功能,使用户不必浏览那么多网页,也可以通过更少的选择获得舒适的商品。

那么,回到用户的转换泄漏图,从阅览到购买,各环节的转换率是多少?为什么收藏用户数远小于加购用户数?

加入购物车和收藏商品没有行为的先后性,也就是说,购物路线有

从上图用户的4种购买行为的保留,用户点击后,如果有后续行为,主要行为是加入购物车,收藏和购买可以重点研究各种渠道用户购买的产品是什么和用户的标签,通过优化商品推荐和正确运营加强这一部分的转换。

推测点击后收藏的用户比点击后购买的用户少得多,因为加入购物车后可以直接订购,加入收藏后没有可以订购的页面,所以必须重新点击商品进入详细页面订购

最后,用户从收藏到购买,从购买到购买,从购买到购买的转化分析可以看出,用户收藏后购买的转化率最高,因此可以通过引导用户收藏和购买来提高用户的购买转化率。

2.追加用户和剩馀情况(需要用户的第一次注册时间,在此不进行分析)。

(3)用户行为习惯分析

这里分别以天和时间段为单位,分析用户的购买行为分布,找出用户活跃的时间段分布规则。

1.2017年11月25日至12月3日之间的用户行为习惯分布

从上图可以看出,在研究日期范围内用户的活跃度比较稳定,仅在12月2日和12月3日有比较明显的增长幅度,因为这个日期和11月25日和26日是周末,周末的原因用户的活跃度上升的原因很小,而且12月2日和3日点击收藏和购买有明显的增加,但是购买没有明显的增加幅度,所以推测最有可能是双十二预热活动因此,收藏和购买的行为也同样增加,这也符合通常的期待。

2.一天中的用户行为习惯分布

经过一天中用户行为分布的可视化,每天0点到3点的用户活跃度急速下降,一天中的活跃度最低,4点到10点的用户活跃度急速上升,10点到18点的用户活跃度平稳,但分别在12点和17点稍微下降,18点以后的用户活跃度开始急速上升,20-22点到1天中的用户活跃度最高因此,在20-22点的时间段进行促销活动和商品推荐,可以考虑提高转化率。

另外,晚上7点到凌晨1点的晚上时间段,用户的操作行为偏向于阅览。用户在白天尤其是商家10点和下午1点,购买行为比例最高,可以看出这段时间用户使用淘宝下单购买商品的意向最高。

(4)用户类别偏好分析

统计所有商品的购买次数,同时找到购买次数、阅览次数、收藏次数和购物车购买次数最多的商品。

1.商品销售状况分析

本次分析相关商品共6440种,用户购买的商品共1984种,但购买数量非常集中的商品没有出现的这次统计数据中,只购买一次的商品为1881种,占用户购买的商品数量的94.8%

2.商品类别阅览top20

点击次数最高的商品类别为4756105,4509次,点击次数最高的商品购买次数也最高吗?

3.商品类收藏top20

通过上图可以看到收藏前20名中的16种商品也出现在点击top20中,收藏和点击同步的概率很高。

4.商品种类购买top20

购买top20的商品种类中的15种商品点击top20,14种商品出现在收藏中,这些商品可以很好地吸引用户的注意力

5.商品类购买top20

通过以上4张图的比较,点击top20中前5名的商品在购买top20中分别出现了7、8、3、12、18名,点击、收藏、购买top20的商品类别在购买top20中出现了12、12、14类,点击、收藏、购买环节吸引用户注意力的商品没有变成实际销售量,这是销售量增加的突破点

而且,单纯看商品类购买top20,商品类销售有明显的集中倾向,可以根据畅销商品类优化商品展示,提高销售量。

由于本次分析没有提供金额,本次分析从r、f两个维度分析客户群。

首先,我们将定义此次分析用户群的分类标准:

由于数据集的时间只有9天,所以在设定规则后,发现每个用户最近的购买时间和12月03日之间的时间间间隔设定等级:

用户的购买次数排名后,发现购买次数范围在1~43之间,因此按照以下规则设定等级:

根据以上用户群的等级设定规则,按照四象限制法规定的用户群

五、结论

1.通过对用户行为的转化分析,可以看出用户从点击到购买的转化率仍然相对较高,目前可以通过引导用户收集和购买来提高用户从收集/购买到购买的转化率。流量行为从点击到购买的转化率只有2.3%,因此从点击到购买的行为转化是提高的重点。对这一环节的建议是:

2.通过对用户行为的分析

,另外,对于购买top20的商品,可以优先表现在电器商品的主页上,满足用户的购买需求。

4.通过RFM模型划分客户群,可以对不同的用户群采用不同的管理战略,实现正确营销不同的客户群。