Advanced
电商用户行为数据的Python深度分析
编写复杂的Python代码,使用Pandas对模拟的电商数据进行清洗、分析和可视化。
📝 Nội dung Prompt
假设你拥有一个包含数百万条记录的电商用户行为数据集(CSV格式),字段包括:user_id(用户ID)、item_id(商品ID)、category_id(类目ID)、behavior_type(行为类型:pv, cart, buy, fav)、user_geohash(地理位置)、item_category(商品类目)、time(时间戳)。
请编写一段完整的Python代码(使用Pandas库),完成以下高级任务:
1. 数据清洗:处理缺失值,并将时间戳转换为标准的Pandas DateTime对象。
2. 漏斗分析:计算从‘浏览(PV)’到‘收藏’,到‘加入购物车’,最后到‘购买’的每一步转化率。
3. 用户留存分析:计算某月活跃用户在次日的留存率。
4. RFM模型构建:根据最近一次消费、消费频率和消费金额为用户打分,并将用户分为8个价值层级(假设购买金额可以通过商品ID映射获取,若数据不足请模拟逻辑)。
5. 请在代码中添加详细的中文注释,解释每一步的逻辑。