SEO外包平台,我们为您提供专业的企业网站SEO整站优化外包服务 SEO设置

SEO外包平台

专注于企业网站SEO整站优化外包服务

数据分析项目实战——淘宝用户行为分析

作者:jcmp      发布时间:2021-04-24      浏览量:0
一、项目背景UserBehavior是阿

一、项目背景

UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢),用以进行隐式反馈推荐问题的研究。注:隐式反馈推荐问题。

二、项目目标

2.分析思路

本次分析主要是根据分析目的,就以下四个维度进行分析和提出改进建议:

以下为本次分析逻辑:

三、数据收集与整理

(一)数据准备:

阿里巴巴天池:

User Behavior Data from Taobao for Recommendation-数据集-阿里云天池 ​ tianchi.aliyun.com。

2.将数据导入MySQL

工具准备:工具:Navicat for MySQL,mysql 5.7,powerBI(或Excel)。下载的Excel数据很大,无法用Excel直接打开,所以需要用Navicat导入数据库中进行处理。

1)创建数据库

2)按下图选择“导入向导”。

3)选择Excel文件数据源

4)选择分隔符

csv文件文本打开是“,”分割的,选择“,”,其他默认。

5)为源定义一些附加选项

这里我们导入100000行数据。

6)选择往哪个表里导入数据

7)定义源表(excel表)和目标表(数据库表)的对应关系

若导入文件的字段栏位与数据库字段名匹配,会自动设置对应关系。若栏位字段不对应,可手工调整。设置好后,点击“下一步”。

这次的Excel数据本身可能没有列名,第1行就是数据:

导入数据后,再在navicat里使用可视化界面修改列名。本次分析的数据没有主键,所以不要设置。

数据类型都选择varchar。虽然时间戳这一列是时间类型,但是为了避免导入后数据不正常。先设置为varchar,导入后再用sql来转换。

8)选择导入模式

9)点击“开始”按钮执行导入命令

3.数据理解

本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens-20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

注意到,用户行为类型共有四种,它们分别是:

(二)数据清洗

1)选择子集

数据集的字段都有用

2)字段名称修改:

3)删除重复值

ps:全字段去重

4)缺失值处理

对所有列进行计数查询,计数结果都为99999,不存在缺失值。

5)一致化处理Timestamp列无法直接进行分析,需要对其列转化为三列,分别为时间,日期,小时。

6)异常值处理

由于项目背景是要通过对2017年11月25日至2017年12月3日之间的淘宝用户行为数据集进行隐式反馈推荐问题的研究,所以要对这个时间段外的数据进行删除处理。

清洗完的数据如下:

最后,导入的数据集大小概览:

四、数据分析

这一环节的所有结果均为先使用sql分析数据,获得分析结果,然后将分析结果导出到excel或者power BI里进行可视化。

(一)数据总体情况概览

1.总体UV、PV、人均浏览次数、成交量

2.日均UV、PV、人均浏览次数、成交量

①日访客数趋势线

②日人均浏览次数趋势线

④日成交量趋势线

3.用户整体行为数据

4.用户的复购率和跳失率

当统计时间为9天时,用户的复购率为65.87%且跳失率为0,说明淘宝拥有你足够的吸引力让用户停留且用户的忠诚度非常高。可以进一步培养用户的忠诚度,鼓励用户更高频次的消费。

(二)用户行为转化情况分析

1.用户行为转化及流失分析

流量行为转化漏斗分析

用户点击后,收藏或者加购物车的概率在5.5%左右,而最后真正的购买概率在2.3%,也就是说用户的行为在浏览商品详情页后出现了大量的流失。 那么用户是否也是在点击后产生了大量的流失,只有极少部分产生了购买呢?

用户行为转化漏斗分析

由上图可以看出,用户并未在点击后就大量流失,而且有68.47%的付费用户,用户的购买转化率还是很不错的。由此我们推测流量行为转化中用户的点击行为远远大于收藏和加购,最后仅有2.3%转化为购买的原因,可能是要对不同店铺的同种产品进行比较。

所以针对大部分的用户行为还是对商品点击详情页访问的情况,研究如何提高用户点击后到其他行为的转化是一个重点。APP可以优化商品推荐以及筛选功能,使用户不用浏览那么多的网页,用更少的选择获得心怡的商品。

那么,再回到用户转化漏斗图,从浏览到购买,每一个环节的转化率是多少呢?为什么收藏用户数远小于加购的用户数?

因为加入购物车和收藏商品并没有行为的先后性,也就是说,购物路线可以有四条:

从上图的用户四种购买行为的留存,可以看出用户点击之后,若有后续行为则主要行为是加入购物车,然后是收藏并加购,再接下来是收藏,除此之外还有部分用户是点击后直接购买的。可以着重研究各类路径用户购买的产品是什么以及用户的标签,通过对优化商品推荐及精准运营加强这部分的转化。

推测点击后收藏的用户远小于点击后加购的用户,是因为加入购物车后可以直接下单购买,而加入收藏后并没有可以下单的页面,如果需要购买必须重新点击商品进入详情页才能下单,多了一个步骤。

最后,对用户从收藏到购买、加购到购买及收藏和加购到购买的转化分析可以看出,用户收藏并加购后购买转化率是最高的,故可以通过引导用户进行收藏并加购来提高用户的购买转化率。

2.新增用户及留存情况(需要有用户第一次登录时间,此处不做分析)。

(三)用户行为习惯分析

这里分别以天和时段为单位,分析用户的购买行为分布,找出用户活跃时段分布规律。

1.2017年11月25日至12月3日间的用户行为习惯分布

由上图可以看出,在研究日期范围内用户的活跃度都比较平稳,仅在12月2日及12月3日有相对明显的增幅,由于该日期与11月25及26日同为周末,故由于周末的原因导致用户活跃度提升的原因较小,而且12月2日及3日点击、收藏及加购都有较明显增长,但购买并未有明显增幅,故推测最可能原因是由于双十二预热活动导致的流量上升,用户开始大量浏览商品,加入购物车及收藏是双十二批量购买时的前置动作。故收藏和加购的行为同样出现了增长,这也符合常规预期。

2.一天中的用户行为习惯分布

经过对一天中用户行为分布的可视化,可以发现每日0点至3点用户活跃度快速降低,降到一天中活跃度最低值,4点至10点用户活跃度快速上升,10点至18点用户活跃度较平稳,但分别在12点及17点略有下降,18点后用户活跃度开始快速上升,并在20-22时达到一天中用户活跃度的最高值,这也符合大部分人的作息规律。所以,可以考虑在20-22点这个时间段进行一些促销活动和商品推荐以提高转化率。

此外,可以看出晚上7点到凌晨一点的晚间时间段,用户的操作行为偏向于浏览。用户在白天特别是在商务10点和下午1点,购买行为比率达到最高,可见,在这一时间段的用户使用淘宝下单购买商品的意向是最高的。

(四)用户类目偏好分析

统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。

1.商品销售情况分析

本次分析涉及到的商品共有64440,用户购买的商品共有1984种,却没有出现购买数量非常集中的商品;在本次统计数据中,只购买一次的商品有1881种,占用户购买商品数的94.8%,说明商品售卖主要是依靠商品的长尾效应,而非爆款商品的带动。

2.商品品类浏览top20

我们看到点击数最高的商品品类是4756105,为4509次,那么是否点击次数最高的商品购买的次数也是最高呢?

3.商品品类收藏top20

通过上图我们可以看到排在收藏前20名中的16种商品在点击top20中也有出现,说明收藏和点击同步的几率很大。

4.商品品类加购top20

再加购top20的商品品类中的15种商品在点击top20中,14种商品出现在收藏中,说明这些商品都是能够很好地吸引用户注意力的,那么这些商品的销量又如何呢?

5.商品品类购买top20

通过以上四个图对比我们可以发现,点击top20中前5名的商品在购买top20中排名分别为7、8、3、12、18名,点击、收藏、加购top20的商品品类分别在购买top20中出现了12、12、14类,说明在点击、收藏、加购环节吸引用户更多注意力的商品没有很好的转化为实际销量,这是销量增长的一个突破点,此外我们也可以看出相比于收藏,加购与购买的关系更为直接。

而且,单纯的看商品品类购买top20,可以发现商品类目销售有较为明显的集中趋势,所以可以根据畅销商品品类优化商品展示,进而提高销量。

在本次分析中由于没有提供金额,所以这次分析从R、F两个维度对客户群进行分析。

首先,我们来定义一下本次分析用户群的分类标准:

由于数据集的时间仅有9天,所以我们设置一下规则,对每个用户最近一次购买时间和12月03日之间的时间间隔设立等级:

对用户的购买次数进行排名后,发现购买次数范围在1-43之间,故我们按照以下规则设立等级:

根据上面的用户群等级设定规则,用四象限法划分出来的用户群如下:

通过用户群划分可以了解每位顾客的特性,从而实现差异化营销。

五、结论

1.通过对用户行为的转化分析,可以看出用户从点击到购买的转化率还是比较高的,目前来看可以通过引导用户收藏并加购来提高用户从收藏/加购到购买的转化率。而流量行为从点击到购买的转化率仅有2.3%,故从点击到购买的行为转化是一个提高的重点。针对这一环节的建议有:

2.通过对用户行为的分析

此外,对于购买top20的商品,可以在电商首页对这些品类的商品优先进行展现,以满足用户的购买需求。

4.通过RFM模型对客户群进行划分,可以对不同的用户群体采用不同的管理策略,达到对不同的客户群进行精准营销的目的: