「宝盈策略增长」基于时间序列分析的余额宝赎回量如何预测?

股票资讯

原标题:基于时间序列分析如何预测余额宝的赎回量?

编者按:很多人都用过支付宝里的余额宝功能,可以把资金转移到余额宝,产生收入。如果预测余额宝的赎回,可以更准确的了解业务;本文是关于如何基于时间序列分析预测余额宝的赎回量。我们来看看。

"统计模型应用良好,预测精度也很高."

今天给大家分享一个作者在14年下半年独立负责的基于时间序列模型的预测项目:余额宝的赎回预测。

一.项目背景

大家都用过余额宝。

用户向余额宝转账,业内称之为“认购”;将资金转出余额宝或者用余额宝进行转移购买,业内称为“赎回”。

总赎回金额大于购买金额,即为余额宝的净流入;相反是净流出。

亿万余额宝用户每天都有巨额的购买和赎回;在过去的15年里,每天流入流出的规模一直在数百亿;而且随着余额宝用户活动的增加,赎回的规模也在扩大。

这给余额宝的资金管理带来了很大的困难。

第一个问题,余额宝是今天(或近期)净流入还是净流出?如果是资金净流入,基金经理需要尽可能将资金净流入进行投资,避免基金因留在手中而导致收益下降;如果是净流出,基金经理需要预留提前收到的资金,以应对赎回的压力。

第二个问题,净流入或净流出有多大?这是一个典型的预测问题。如果预测准确,基金经理可以少预留基金安全垫,提高收益率。

因此,基于余额宝的历史数据,我建立了一个时间序列模型来预测未来(7天、14天和30天)和当天的赎回量。

随着对业务认识的加深,预测模型的准确性不断提高;最后,当日预测准确率在99%左右,未来7天预测平均准确率在95%以上,未来30天预测准确率在90%以上。

有趣的是,15年5月,阿里的天池大赛也搞了一个比赛,就是预测余额宝的赎回量,如下图:

二、余额宝救赎的一些规律

首先说说数据中的一些业务规律,对于建模过程很重要;每一个因素,每一个业务规则,都是影响预测精度的因素,也是模型的业务解释方向。

1.关于订阅

先看认购,先看一个整体转让金额的走势:

在订阅层面,主要影响因素有周周期、薪资发放、阿里活动、节假日、收益率、支付宝自动转账等。

周循环:这是一个很明显的因素。由于基金的特性影响,每天15点以后的买入会被记录为下一个交易日的买入;所以周五15点以后的订阅会和周一的订阅一样,浪费了周末两天的收入损失,所以周六周日的订阅很少。

月薪发放:这个和工资发放直接相关。很多用户发工资后会直接转余额宝,所以发工资日会带来更多的购买;日期通常是1号、10号、15号和月底。

阿里活动:这和阿里经常做的活动密切相关。

节假日:类似于周因子,大节假日期间订阅会损失收入,所以转入量很小,用户会在节假日前转入。

余额自动转账:很多支付宝用户都启用了余额自动转账到余额宝,系统每天从黎明到九点都会自动转账。

收益率:余额宝的收益率会影响有多少人调入。

为了方便分享,上面主要列出了影响因素的拆解。

2.关于救赎

看赎回,以下是赎回金额的走势:

在赎回层面,影响因素主要包括周因子、信用卡还款、节假日、活跃消费、阿里活动、收益率(及资本市场情况)、卡间转账等。

周因子:类似于订阅,周末赎回延期。所以整个周末的赎回远远少于购买; 信用卡还款:信用卡还款日期往往固定在每月几个相对较大的日期,尤其是下半年; 节假日:在很多节假日之前,用户会有更多的资金需求,倾向于转出; 主动消费:很多用户用余额宝支付。整体消费的积极上升,会带来余额宝赎回的增加; 阿里活动:主要是双十一等大推广,对余额宝的救赎影响很大; 资本市场:当股市暴涨,IPO重启时,新资金和流入股市的资金会对余额宝的赎回产生很大影响。 至于余额宝救赎的影响因素,以上是主要的,这里暂且分享一下。

三,模型的建立

模型的核心逻辑采用时间序列的分解方法,将日赎回结果视为受到长期趋势因素、季节性因素、周因素等四个因素的影响。

最后,乘法模型用于乘以每个因子的参数:

具体建模过程如下:

1.数据预处理

首先对申购赎回数据进行预处理,剔除离群值,主要包括大型机构赎回和双十一推广。

白名单机构的大规模赎回往往达几个亿,对模式有影响,必须先淘汰;另外双十一活动频率太低,情况年年不一样,数据也剔除了。

另外由于余额宝这13年发展很快,在数据使用方面,我是直接用14年的数据开始建模,排除业务爆发的影响,所以有8个月左右的数据作为建模数据。

2.长期趋势因素的确定

其实这里的长期因素主要是上面分析提到的收益率,以及用户主动使用‘余额宝’。

从上面的截图也可以看出,余额宝的赎回金额普遍在上升;这里我们要预测的是这个趋势。

在具体实现中,在数据预处理的基础上建立线性回归模型。

上图其实是示意图,数据已经存在17年了。在当时的建模情况下,我使用的数据是作为长期趋势预测的近半年的数据。

太长的数据做预测会失去意义,不能很好地反映现状,因为历史数据会有很大的干扰。

3.周期性因素的确定

长期趋势因素确定后,用长期因素除日数据,消除长期因素的影响,只留下周期因素和其他因素。

这里的周期因素实际上包括周因素和月因素。

周因素的影响因素有多种确定方式。我算了一下同期历史的动态平均值,也就是最近三个月的平均值。

获得周的参数后,再将排除长期趋势的参数除以周的参数,排除周的影响因素,主要是当月的影响因素。

对月因子做同样的处理,然后得到月因子参数,购买如下:

从这个图可以明显看出,1号、10号、15号确实是购买的小高峰。

购买和赎回基本上是基于类似的逻辑来处理的。

4.其他因素的确定

在这里,我们得到了长期趋势、月度和周的因素。但根据第二章,影响赎回的因素包括节假日和活动;节假日需要采集特殊参数。

基本方法和以前一样。使用排除长期趋势和周期性因素的数据后,节假日前后(国庆、春节等)的数据。)被取出并用作参数;但由于当初是14年,可用数据不多,所以长假的预测效果不是很好,但3天小长假的数据表现还可以。

5.预测过程

这里基本参数计算完毕。在进行预测时,根据上述过程,可以通过乘以各种因素来获得未来一段时间的预测结果。

另外,在实践中,实际上有一个出现频率较高的场景,就是预测当天。比如现在是上午11点,预计今天下午3点赎回结束;针对这种场景,在原有模型的基础上做了一些调整,主要是加入当天的数据走势。

由于可以看到实时数据,只能预测当天的数据,所以输入模型的数据采用昨天的数据和当天的情况,因此预测精度极高,往往达到99.5%以上。

关于余额宝的赎回预测,我先在这里分享一下。一方面我没有原始资料,另一方面我也写不完;所以先写下预测的思维框架,欢迎各位朋友继续关注~

这篇文章最初是@冬至发表的,大家都是产品经理。未经作者许可,禁止转载。

标题图来自Unsplash,基于CC0协议。回搜狐多看

负责编辑:


以上就是宝盈策略增长基于时间序列分析的余额宝赎回量如何预测?的全部内容了,喜欢我们网站的可以继续关注舒天股票网其他的资讯!