引子 小雪求职记
基础篇 数据分析师的锦囊
一、欲善其事先利器:数据分析技能进阶图谱
二、深入业务寻价值:价值源于深度理解场景
三、积跬步以察千里:数据的采集与治理
四、沥尽狂沙方见金:数据的清洗与可视化
五、营运之道无定法:数据分析的核心方法
六、增长践行成于思:数据分析的关键思维
实践篇 数据运营分析十话
卷一 获客
第 一话 横看成岭侧成峰:用户画像揭示秘密
1.1 问题:这款推广海报好不好
1.2 概念:用户画像
1.3 工具: Python 数据分析编程基础
1.3.1 Python 的极简说明
1.3.2 Python 中的序列数据类型
1.3.3 数学计算工具包 NumPy
1.3.4 数据处理工具包 Pandas
1.3.5 数据可视化工具包 Matplotlib和Seaborn
1.4 实战:哪一类人才是真正的买家
1.4.1 数据读入及简单分析
1.4.2 用户整体画像
1.4.3 购买眼影盘用户的画像
1.5 结论
第二话 远近高低各不同:聚类实现RMF细分
2.1 问题:如何通过细分用户指导运营
2.2 概念:用户细分
2.2.1 用户画像是了解用户的第 一步
2.2.2 用用户行为数据指导精细化运营
2.2.3 进行同期群分析揭示获客时的秘密
2.2.4 根据特征和价值进行用户分组
2.3 工具:RFM 分析和聚类算法
2.3.1 RFM 分析
2.3.2 聚类算法
2.4 实战:基于 RFM 模型的用户细分
2.4.1 整体思路
2.4.2 数据读入和可视化
2.4.3 根据 R 值为用户新近度分层
2.4.4 根据 F 值为用户消费频率分层
2.4.5 根据 M 值为用户消费金额分层
2.4.6 汇总 3 个维度,确定用户价值分层
2.5 结论
2.6 彩蛋:看看谁是最有价值的用户
113
第三话 获客成本何其高:回归预测用户 LTV
3.1 问题:我能从用户身上赚多少钱
3.2 概念:用户生命周期价值
3.3 工具:回归分析
3.3.1 机器学习中的回归分析
3.3.2 训练集、验证集和测试集
3.3.3 如何将预测的损失最小化
3.4 实战:预测电商用户的生命周期价值
3.4.1 整体思路
3.4.2 数据读入和数据清洗
3.4.3 构建机器学习数据集
3.4.4 预测未来一年的 LTV
3.5 结论
3.6 彩蛋:还有哪些机器学习算法
卷二 激活
第四话 百川争流终归海:动态归因优化渠道
4.1 问题:哪个渠道最给力
4.2 概念:渠道分析和归因模型
4.2.1 渠道和渠道分析
4.2.2 归因和归因模型
4.3 工具:马尔可夫链归因模型
4.3.1 记录推广路径
4.3.2 显示用户旅程
4.3.3 统计状态间的转换概率
4.3.4 计算整体激活率
4.3.5 计算移除效应系数
4.4 实战:通过马尔可夫链模型来计算渠道价值
4.4.1 整体思路
4.4.2 构建每一个用户的旅程
4.4.3 根据状态构建通道字典
4.4.4 计算状态间的转换概率
4.4.5 计算渠道移除效应系数
4.5 结论
4.6 彩蛋 :夏普利值归因
第五话
营销贵在激活时:漏斗模型聚焦转化
5.1 问题:促销活动中的哪个环节需优化
5.2 概念:漏斗和转化率
5.3 工具:Plotly 包中的漏斗图
5.4 实战:通过漏斗分析看促销效果
5.4.1 整体思路
5.4.2 数据导入
5.4.3 基本漏斗图
5.4.4 细分漏斗图
5.5 结论
第九话 君向潇湘我向秦:用 A/B 测试助力促销
9.1 问题:两个页面,哪个更好
9.2 概念:A/B 测试
9.2.1 确认实验目标
9.2.2 设计实验
9.2.3 实验上线与监控
9.2.4 结果复盘
9.3 工具:统计学知识
9.3.1 对照实验
9.3.2 假设检验
9.3.3 样本的数量
9.4 实战:通过 A/B 测试找到最佳页面
9.4.1 整体思路
9.4.2 数据导入与数据可视化
9.4.3 查看转化率的增量
9.4.4 检验测试结果的统计学意义
9.4.5 细分样本后重新检验
9.5 结论
卷五 自传播循环
第十话 一二三生千万物:裂变驱动增长循环
10.1 问题:哪种裂变方案更有效
10.2 概念:增长黑客和裂变
10.2.1 增长黑客的本质
10.2.2 各种各样的裂变
10.3 工具:增长模型
10.4 实战:用增长实验确定最佳折扣方案
10.4.1 整体思路
10.4.2 数据导入及数据可视化
10.4.3 比较两种裂变方案带来的转化率增量
10.4.4 用 XGBoost 判断特定用户的分类概率
10.4.5 比较两种裂变带来的转化增量
10.5 结论
寄语