作为用户获取的一方,用户的流失会直接影响我们的工作有效性和产品的长线增长,关心客户流失情况是我们不可忽视的一个环节,可以利用业务知识,数据分析和机器学习建立产品的流失预测模型,帮助产品提高客户的长期留存。
一、为什么需要流失预测模型?
会想到这个话题主要是因为突然想到很久之前的一次产品会议片段,:PM不断地强调用户盘子无法扩大是因为新用户留存不行,但实际上我们的新用户次留是提高了的,我们UA表示是因为流失率高了,老板问UA,流失率不就是留存吗?
后面其实想一想,三方的立场上来说,说法都没错,但是问题在于,初期留存和长期留存的区别。
关于产品的用户留存换一个例子讲,就和HR为公司招新的道理差不多,对于员工离职有一个百度可查的【232原则】,也就是经过众多的公司的分析比较,发现员工离职较为集中有三个时间段,即入职的第2周、三个月试用期届满及在公司工作了2年的老员工。在入职后2周就辞职,多半是因为入职后相应的薪资福利等细节与应聘时招聘人员介绍的有差异;3个月的时候通常是工作内容和企业文化的适应程度;2年的老员工通常是更希望在自己目前的工作岗位上能够实现一个突破,能够得到学习新知识新技能的机会,升职或者工作轮换如果达不到可能就走了。
所以其实不同离职周期一定程度上也能看出不同的离职原因。对比到产品上,用户在次日离开不再登陆和用户在7日,30日甚至更长周期离开不再登陆的原因不见得是完全一样的,想要更加细致的分析清楚原因,留下用户,就需要我们考虑建立产品的流失预测模型,机遇模型预测给出的分析帮助改善我们可能没有发现的流失因素,优化用户的体验流程,进一步提高用户长期留存的概率。
二、如何建立流失预测模型?
1、明确流失定义
首先需要根据业务明确定义流失的定义,不同业务对流失用户的定义可能是不同的,最好是从公司业务层面拟定一个标准。对以下问题进行一个系统化的梳理:
A. 确定想留下的用户是哪些,对于应用类产品,最好是可以通过历史行为预估用户的生命周期价值,过滤掉负价值和无盈利的用户,对于有效用户进行分析是基础。
B. 流失事件指的是什么,由于不同产品的特点不同,游戏用户可能是长时间未登陆的,也可能是长期未进行付费的,是需要根据产品中用户的行为特点来进行确定的。
C. 流失之前的用户行为事件可能会有哪些,最好对于用户流失之前的用户行为事件进行分类和细节分析,也是对用户流程的一个框架性分析。
D. 预测窗口周期,根据产品的优化速度和用户的流失速度制定一个合适的周期,如果周期太短,就没有足够的时间对问题数据进行优化,如果周期太长,得到的结果可能会过于模煳,所以根据优化速度和用户流失定义给出一个发现问题并解决问题的反馈周期,帮助我们后期更好的去使用预测模型。
E. 流失原因可能有哪些
需要先根据业务确认流失原因。从长远来看,所有的用户最后都会流失,流失的原因可以是主观的也可以是客观的,先把不同的原因都列出来,只对能进行优化的那部分进行重点优化。
所以最终我们能得到一个流失定义是:某类对象(确定想留下的用户)因为什么原因(流失原因)在多久的周期内(预测窗口)不再做什么行为(流失事件)。
2、确定模型
在明确了流失定义后,结合之前的用户流失行为事件等情况想一想用户为什么会流失,可以尝试创建差异化的用户群体,帮助找到产品内的共性行为。
接下来我们需要知道每个用户特征或者事件行为对具体预测事件的贡献程度和概率,通过机器学习模型来进行预测,目前比较常见的黑盒模型是XGBoost+深度神经网络用于数据模拟,并利用SHAP来实现表达目标。
这部分具体的需要做数据开发或者技术的同学来实现,具体的技术问题有兴趣的小伙伴自行百度或者请教相关专业大神,我只是知道有这种技术和方法可以去实现业务,当然也还有很多其他算法模型,如果有了解的更多细节的小伙伴也欢迎留言交流学习一下。
3、根据结果找到关键流失因素03
根据数据学习结果,找到的可能不是最终的流失原因,而是与最终的流失因素有关的行为。比如数据告诉我们的可能是用户流失的最大因素是在具体是在于进入某一个游戏功能板块频繁交互以后导致流失的。这种时候其实无法判断是这个功能不好玩(数值或者设计不合理),还是这个功能使用上有硬伤(卡顿,闪退,服务中断)等情况导致的,需要了解业务的具体功能设计和运营流程并充分了解客户行为,基于此基础上对流失行为进行因素分析,并制定相应的解决方案,是一个从行为表现结果-问题定性-解决问题的过程。
基于某数据行为推断得到的流失原因,通常不止一个,可以根据特点对不同的客户群体制定留存措施 ,并不断反馈措施的有效性。
4、找到模型的最佳干预水平
通过反馈对不同预测后果(预测留下或者流失)下的不同结果(留下或者流失)进行回报率预估,可以假设在客户的平均成本下,对某类改善行为做出的积极相应的概率,以及在进行后留存多长时间。必要的时候,可以测试不同算法(比如随机森林模型,逻辑回归模型等)下的最大化效果的算法模型,选择当前情况下最有利最准确的模型进行进一步完善。
5、丰富预测流失数据源
在建立模型以后,需要长久进行的一步就是进行数据源的丰富,这一点和广告投放一样,更多的预算更多的数据行为总能帮助Campaign更高效的进行数据学习,更快稳定广告的表现。
比较常见且首先考虑的肯定是公司的内部数据,比如产品打点的交互数据,新用户注册信息,活跃或者充值数据等情况,帮助模型获取更多相关的信号。根据在模型中需要考虑的各种新因素进行反复的测试,并不断更新迭代反馈帮助模型更加完善。
通过机器学习,利用产品数据来帮助客观了解用户会流失原因,帮助我们在获取新用户的基础上去留住老用户,毕竟通常老用户的人均价值都比较高,且获取成本相比新用户通常不会更贵。建立一个成功的模型的基础还是在于对问题有明确的定义和充分了解,如果一开始的的业务定义都不准确,将会直接影响后续的进展。同时,在模型预测时候 ,要不断基于业务实际情况进行考虑,最终落实到用户维护上,才能真正有效帮助业务进行正向增长,所以模型的建立只是预防流失的开始。
本文链接:https://www.sxwpls.com/4967.html ,转载需注明文章链接来源:https://www.sxwpls.com/
-
喜欢(0)
-
不喜欢(0)