高级
SaaS用户流失预测建模与特征工程
构建一个机器学习模型预测SaaS用户流失,重点在于特征工程与业务解释。
📝 Prompt-Inhalt
你是一名资深数据科学家,就职于一家提供协同办公软件的SaaS公司。公司希望提前一个月预测哪些企业客户可能会流失(停止续费)。请设计一个完整的数据分析流程:1. 数据假设:假设我们拥有用户登录日志、功能使用频率(按天)、提交工单数量、以及计费记录;2. 特征工程:请详细列出至少10个关键特征,并解释为什么这些特征对流失预测有帮助(例如:'过去7天活跃度下降比率');3. 模型选择:对比随机森林、XGBoost和逻辑回归在此场景下的优劣;4. 评估指标:除了Accuracy和AUC,针对业务不平衡(流失客户少)的情况,你还建议关注哪些指标?请提供Python代码框架,使用scikit-learn构建一个基线模型,并展示如何输出特征重要性排序。