【DTALK实践】如何通过数据产品来驱动业务优化

文章开始之前,提2个基本概念:

用户生命周期是指:用户从第一次使用APP,到最后一次打开APP,这段时间,我们把定义为用户生命周期。用户生命周期价值是指在用户生命周期内能通过电商、付费、广告、游戏等模式带来商业价值,同时用户信息和数据也是重要的商业资产。

产品生命周期指产品从投入市场到更新换代和退出市场所经历的全过程,一般分为导入(进入)期、成长期、成熟期、饱和期、衰退(衰落)期五个阶段。

产品处在不同的生命周期阶段,所能带来的商业价值也不一样,在导入期、成长期,为了获取更多的用户和用户体验,一般会采取免费策略,在成熟期,为了商业变现的需要,会引入广告,或通过会员付费、电商交易等方式来带来利润,在饱和期、在衰落期,采取差异化的商业化变现措施。

Ok,下面我们开始谈数据驱动、用户画像和标签规则的价值。

之前我们曾提出过数据驱动道术器三件事,今天就借用一下这个概念来谈谈企业需要如何才能通过数据产品来驱动业务优化。

请特别注意企业自有的数据产品建设上,会有一些工具、方法论指导你能够形成一个流程化的工作。

很多情况下,包括现在鼓吹的大数据、AI、机器学习,它本质上是希望可以把一些人工做的事情能够自动化、智能化更高效化的一个替代的东西。所以首先要对这个工具和方法论有一个良好的认知。

【DTALK实践】如何通过数据产品来驱动业务优化

比如上面图中写了一些东西,因为之前我们讲到了一个概念——道术器。这个”器”就可能就是工具。

这里列举了一些比较常用的,数据仓库、报表平台、DMP系统、标签体系、ABtest工具,下面的专业人才流程配套就是后话了。基于这些工具,那需要用哪些方法去做,比如说日常的一些流程的漏斗分析,无限的细分,ABTest等。是不是可以用一些具体的方法来代替一些决策上的这个方式。

模拟一个例子来讲。比如用一个社交平台来说。Facebook在初期的时候其实很容易发现既有一些活跃的用户,也有一些不活跃的用户。他们也想说我们是不是怎么把这些不活跃用户转变成活跃用户,我们相信这也是很多企业运营或产品在努力的这个日常工作。

他们也会各抒己见头脑风暴。整理一下之后去提取一下数据,然后拆分用户的各种维度的数据,与他最终这个活跃的关系,比如一些相关性的验证、一些权重值的排序等等方法都可以做到找出单维度他与你需要的指标之间的关系。比如是正相关的、负相关的,或者是线性相关的都是很容易得到的。这是他们最终可能发现与用户活跃频次相关的最大的是用户加的好友数和他个人信息的完善程度。

然后他们就定了这两个指标。在产品功能上做了小的变更,多了一块People you may known的逻辑,就是共同的好友。

然后切了其中整个网站百分之五的流量来做一个灰度发布来测试。最后发现这百分之五的流量的用户呢,表现很好,他们变得越来越活跃了,随着增加好友的人数的增加。他们也会变得越来越活跃。最终的将这个功能向全网开放,促使了这样一个结果。这是这种规格行业前辈已经留下良好的方法,我们只要跟着做就行了。

比如电商网站,用户加购物车,这个过程对于特定商品加购物车,转化率这件事情上面。怎么能够让它变得更活跃,对于我推荐的商品、购买频次能够上升?

很多运营可能还是发券、发红包直接刺激用户。但实际上可能用很多情况下他们的判断依据和诉求跟你想象中可能会差距很大。

一个是他们诉求不同,第二个是他们对优惠的敏感度也不同,是需要用数据去验证好好做的。然后基于用户各个纬度对于你的目标值的相关程度你们就很明显能够列举出哪些是你们需要达成的目标用户,需要圈出来单独做运营的,还是说你们在某些方面需要改进的都是可以的。

然后这个过程,可能一开始都是手动的,比如说数据团队运营团队自己手动的在做一些数据的计算、分群、划分用户等级。作为数据产品,其实很多情况下需要为公司就构建一些常用的工具来方便大家。

下图,我们列举已经给一些企业提供的基于规则和算法的标签管理平台GProfile。

【DTALK实践】如何通过数据产品来驱动业务优化
【DTALK实践】如何通过数据产品来驱动业务优化

这个是我们的Gprofile系统接入这个企业后台的一个功能,它是开放给产品和运营可以通过设定目标,通过一些事实标签的排列组合,包括:逻辑关系或者并且以及发生的时间,已经发生的次数,以及他们的关系。

注明:如果对GProfile这个系统有进一步的了解的需求,可以联系我们,微信个人号richarddq。

这个工具用来组合圈选用户,完成之后,命名完,会形成一个新的规则标签给用户去打上,也方便将来继续使用。

其中设定目标我要特别说明。很多企业问说这个标签怎么创建,怎么验证这个标签的准确性、有效性。

所有的标签,可能是分层的。第一层是事实标签,比如用户的一些静态属性身份证、性别、年龄、出生地域这样很少改变或者是长时间不变的静态属性。

另一类是基于规则的,比如运营喜欢把用户划分为活跃用户不活跃用户。可以通过工具给用户去打上来的标签,方便后续的调用。这类标签很好验证,只是符合规则。

但是其实真正有价值的标签,他一定是有个特定目的,这个目标是跟你的某一个用户指标或者是某一个业绩指标相挂钩的。比如定义企业的一个用户是高风险用户,可能会退单;高价值用户,他可能在随后三十天有购物需求或者是会买单的,这样的标签。

它的形成通常有两种,一种基于规则,比如说他前三十天没有买东西,但是他前六十天花费挺高的,预测他可能下一周可能会消费行为出现。还有一部分可能是基于算法的,通过机器学习的方式,一些算法来预测用户。

自动形成的标签给,因为在产生标签的当下,就会有准确度和召回度的,这样的一些相应的指标,可以作为参考。在事实发生之后数据也会进入到模型的训练当中来修正这个原来的标签,通过管理标签,每次训练得出的准确度和召回度,对这个标签就会有一个完整的认识。产品在使用上就会可以根据这个情况来酌情使用。

常见有关用户画像:Persona和Profile的一些回答:

1、Persona有自动化的工具做用户画像吗?学员:格拉斯流浪者

黄一能@Dtalk 回答:自动化很难,就Persona来讲,应该没有自动化,因为通常是靠问卷和访谈的方式来获得。可以设定好问卷自动发送,自动采集、统计。但是汇总成结论,还是要人工来做。

Profile来看,可能在用户的一些行为属性和静态属性方面可以通过一些规则,比如说基于字段的类型,或者是特殊的命名的判断。来形成一些事标签,但其实这样的准确度以及可用性都很差,基本很少有自动化的工具能够形成标签体系或者是一些成型的用画像。

外面有很多自动化营销工具,可能对这个自动化工具有些误解。这些自动化的营销工具,最终是以触达用户为最终目的,比如说发短信、Email、 APPPush, Wechat的模板化消息。前期的筛选用户可能是基于规则的。这基本是基于规则的很少有算法差异的部分,毕竟是第三方的通用工具没有办法更好的去结合业务,因为可能每个企业的业务的差异性特别大。而且自动化工具通常是为传统企业服务的。公司企业的业务模式相对固定才显得有规模效应产生

这个互联网企业的变化可能太快,用户的口味也变得太快。营销端变化的很快,比如今天可能做做百度的SEM,明天DMP广告辅助一下,然后发现微信挺好,发发微信的信息流。然后现在小程序又是一个大的路口,后来又发现抖音又要去做,那可能像这种自动化一些工具无法去适应这么快的渠道的变化

2、产品生命周期和用户全生命周期的价值之间有线性吗?或其他关系?学员文前波@GrowingIO

黄一能@Dtalk 回答:这个问题其实挺好的,我看到很多人都有提到关于这个用户的生命周期和产品周期的关系。以及这个用户群的变化导致的说后续的一些问题。其实我先回答这个用户群变化,对于这个决策上的问题吧,第一个是说可能你们指的是Persona的部分,就是你通过一次上调研获得了这种用户卡片,然后他指导产品和运营做事。但是可能三个月后他就会变,所以需要再做一次或怎么样。

但实际上,可能在初期的时候更加依赖于Persona,但是当产品,上线了进入正轨了,开始采集数据了,你的标签体系的建立之后,这个完全是一个数据仓库的工程问题,就是你的数据每天在更新,就最差的情况也是每天更新的,所以,规则标签是根据每天的用户数据的现状去改变的。预测标签的模型训练,对于企业来讲,一看这个标签的紧急程度基本也是在每周或每个月都会更新训练模型。然后更新他最新的准确度和召回度情况来做判断。

所以其实他是一个动态自动更新的完全是底层数据仓库的工程问题,所以上层使用的人是不需要关心的,因为你每天使用的这个数据其实就是基于当下最新算出来的,所以应该不会有说滞后的问题。

而进入到成长期以及成熟期的时候。Persona这个东西还更多是在做定性的。这个时候,从不同的群中抽取一部分的用户来做Persona,来验证这个事情,并且给出定性的解决方案,那这个时候你就很容易。比如说我根据三个维度把用户切成了八个组,那八个组里面各挑两个用户制作访谈。那如果出现说每个组中的用户,他们的问题相似。以及足以组之间的诉求,其实有很大差异的情况下,其实我们就可以定性的认为这样的切分是有意义的。

并且你会很明确每个组需要对他们做什么,到底是利益刺激呢,还是只是提醒就可以了。这就是常见的去在成长期或者是成熟期的时候。Persona和Profile互相协调工作的一个过程。

这是一个日常工作,反复地在两者之间去交替,一个是通过数据的异常来挑出用户,然后再从用户中去做访谈来定性。确定你所选的维度和你的结果之间到底只是个相关性的呈现呢,还是有一个具体的因果,谁先谁后,这需要Persona来定。

回到说用户生命周期,很多情况下公司对针对这个用户,在自己的产品的这个整个过程中去将用户划分成不同的阶段来定一些里程碑,比如一个用户刚注册。把它定位为新用户,他只要下过单或者是跟你发生过交易行为。或者跟你发生做业务关系,你们就这样他列成一个老用户。然后我们就认为这个用户进入到了一个正常时期,其实不是这样。

这是一个循环,产品的生命周期是依据市场来定义的。市场是由用户需求组成的。你又在服务这群用户,其实他们是互相关联的。这是形成一个循环的过程。对这个用户到底处在你产品的哪一个时期里。其实不是由人为的规则去制定的。

比如,RFM模型,这样的模型可能快销用的比较多一些。基于用户的最近的消费的间隔、消费品次、消费金额(价值)。来把用户分群分成八群,然后来定义用户价值。然后通过用户的不同状态,把它把就直接RFM来划分用户,这个生命周期也是存在的,这样的企业。它就是一种价值划分。那还有些是以任务触发性的,比如说完成了某一个动作就认为他处在某一个时期。

都是有的,但是无论你怎么去划分用户生命周期,最终的目的是每个时期用户的主要的目的应该是发生变更的。如刚刚注册用户称为新用户,主要目的是促进他做出第一笔交易。那一旦第一笔业务行为触发之后,可能需要他活跃。他一直保持活跃,是不是他希望有些高价值的多次交易产生或者是希望他就邀请好友。这个其实是由业务目的来决定用户处于哪个阶段的。而每个阶段的用户量以及产生的价值,最终会反映在你的业绩上,也就决定了你的产品处在市场中的哪一个阶段上。

如果发现你的整个的产品的服务在市场中的这个地位开始发生变化了,比如说从成长向成熟去发展了,这个时候要考虑说,用户的哪个周期上面是主要的问题所在,然后是不是要改变这个划分的东西以及改变每一个周期的这个业务目标。两者其实是在相互映射作用的。

3、Profile可以理解为精细化运营吗?@cathy lee

黄一能@Dtalk 回答:Profile只是一个工具,是一个底层的一个数据。Profile可以算是精细化运营的基础,如果你没有这样的基础,你很难做到概念中所谓的精细化运营。比如说我们通常看到很多网站,千人千面,他其实也是精细化运营的产品化的结果。

他依据的是对于用户各个维度数据的这个全面的采集以及推荐算法的作用。然后将精细化运营这个东西的一部分,比如说可视化交互层面的部分产品推荐的部分将他自动化产品化出来。所以这个是复杂问题简单化简单问题流程化流程问题自动化。这大家工作无非就是往这个方向去发展的。

我今天还想到一个特别好的比喻,比如ABtest,其实是一个很好的工具,他形象地描述可以是比如说你我前面讲的这个交叉楼梯的结构你走在这个楼梯上,然后伸出一只脚去试探一下前面那个楼梯是不是结实以及确定这个楼梯到底是向上还是向下的。他可能就是ABtest一个形象的一个表述。

对你确实用Persona和Profile构建出了这一节台阶。但这些台阶在你没有真正踏上去之前你真的不知道他会走向哪里。

ABtest这样的工具,如果要做到好做的准,也是要依赖你用户画像Profile建立而不是大家概念中的我随机去分个组就能够做测试的。除非你的样本真的很大,要不在样本量不足的情况下你随机去切分流量,然后去做这样的测试很有可能你是没有办法得到一个正确结果的。

4、请教个问题,说到ABtest,产品每天流量大概是百万,目前公司做ABtest的流程基本流程是实验达到最小样本量后,看指标是否有显著变化。请问下何时才能判断实验结果确实有效?因为经常遇到如下情况:今天指标显著了,但是明天又不显著了。是否查看ab结果,需要等到指标变化趋势平稳了才算有效?

黄一能@Dtalk 回答:ABtest这个是有多方验证的,首先ABtest一般不是分两组,而是分三组。你一定是抽取一个小样本量,然后从中切分成AB。然后呢,你会有一个对照组C组。所以在这样的情况下,你达到的最小样本量,当然这可能是你们自己定的,比如说多少是最小样本量。第二个这三组之间的关系是不是可信的。第三个是有一个置信区间的你其实还需要参考的是这个置信区间是否稳定。

相关新闻