【DTALK对话】顾青:数据分析如何伴随创业企业成长?

本文是由汽车充电桩平台电动生活的技术产品负责人王晓强和DTALK创办人顾青之间就创业企业如何逐步走向数据驱动这件事的对话组成。

电动生活是一个覆盖了全国300个城市充电桩,100家充电桩企业的电动车出行服务平台,通过实地勘查的方式提供了中国最准确覆盖最广的新能源出行信息,并支持免扫码无感充电的用户体验。

电动生活可以在APP store里下载,以下是该APP的一些主要特点:

【DTALK对话】顾青:数据分析如何伴随创业企业成长?
【DTALK对话】顾青:数据分析如何伴随创业企业成长?

以下是电动生活王晓强的问题:

我的问题如下:

– 对于初创的企业。功能实现及验证是比较紧急和重要的,那数据驱动帮助企业成长,在什么时间开始比较好,也就是说对于一个初创的企业, 数据驱动需要开始有没有什么明显的表现标志。比如UV,PV到什么程度,用户量,到什么程度之类的,或者是,企业利润或销售额达到什么程度。

– 如何排除干扰数据,比如一些攻击,刷单刷量

– 数据分析如何伴随企业成长,有哪些阶段? 有什么企业表现?不同阶段侧重点如何?

– 许多时候说数据分析是有目标的,有些数据分析公司甚至可以给客户定制他们想要的目标结果,那对于老板来说,如何避免这些数据陷阱?

– 有没有数据分析度的问题?即不要过度,为了分析而分析!过度了之后会怎样?能否给个案例分享一下企业依赖错误的数据分析造成很严重后果的?

以下是顾青老师的回答:

1)数据分析如何伴随创业企业成长?

对于初创的企业。功能实现及验证是比较紧急和重要的,那数据驱动帮助企业成长,在什么时间开始比较好,也就是说对于一个初创的企业, 数据驱动需要开始有没有什么明显的表现标志。比如UV,PV到什么程度,用户量,到什么程度之类的,或者是,企业利润或销售额达到什么程度。另外,数据分析如何伴随企业成长,有哪些阶段? 有什么企业表现?不同阶段侧重点如何?

创业企业的这个定义首先要决定一下。

所有的创业企业可以分为几种:第一种是纯粹没有什么线上的业务的,第二种是需要有线上业务的,无论是2B还是2C,他们都需要用数据去做决策。我们先谈第二种。一个线上的平台用户量达到了每天几百上千的这样时候,就必须要开始做数据分析了,因为这个时候就会面临着几个比较明确的问题。

第一个是如何从现有的数据里面去判断用户的真实需求是什么,一个是看用户的行为数据具体表现,第二个就是根据成交情况去推断业务到底是否符合用户需要?比方说一个网站或者App当有稳定流量进入时,用户的搜索行为和浏览行为就会变得比较多了。那么站内搜索数据本身就是一种非常明确的信号,来告诉你到底用户想找什么内容或者服务,通过细分分析用户搜索流程,就可以判断你的网站或App是否给用户比较精准内容和服务。

当然关注站内的搜索词,以及监测是否匹配到了相应内容,这是一个非常局部的事情,放到整站来看的话,当你的市场投放开始放开(前提是你验证到了一个需求存在),营销的数据会马上变得急剧膨胀,多渠道的数据分析和营销效果的判断,以及归因分配营销预算和团队资源,以及如设计老拉新或者分销体系,你终归需要去计算的每一种渠道和活动的投资回报,这个时侯如果你的数据埋点和数据整合没有做好,数据仓库和维度建模没有做,字段定义不清楚,基本上市场团队和运营团队是无法有任何条件去做靠谱的营销策划。

我不认为要用利润来决定是否要做数据驱动,因为Facebook和Google一开始也没有实现商业变现,但他们最终成为了价值数千亿美元的企业。

数据驱动本身不决定企业能否马上通过数据分析增加利润,因为互联网企业的特点是创造用户有明显需求但没有很好解决方案的产品,首先还是需要有比较有天分的产品经理,懂得用技术的手段发明出有创新价值的东西,让用户喜欢并开始口碑相传,这个阶段我们叫探索期,这个阶段的数据分析有基本能力就可以了,主要是帮助团队判断用户是否接受并会留下来,所以我们有留存率(回访率)这些基本指标,这个阶段用一些第三方的工具,如友盟、诸葛IO、Growing IO、GA、神策等都可以解决日常流量和事件分析的基本需求。

如果用经典的AARRR模型来看,一个产品在探索期向发展期过渡时,一旦找到激发用户自传播的阶段,马上就面临用户量飞速上升,各种数据需求猛增,研发团队疲于给业务拉报表的阶段,这个时候,第三方的SAAS分析软件除了辅助产品的交互优化和渠道效果分析(抽样时不准)方面,对于业务提升的能力有限,也无法定制实时数据应用需求,如用户群体画像、推荐系统等。

发展期的一个明显特点是当你的业务模式得到探索期的验证,进入快速发展阶段的同时,内部和外部的原因会导致影响核心指标和业务增长的因素明显增多。内部的原因有技术架构和性能上的、有业务部门不断提出的新需求、有产品团队自己通过经验、数据分析和用户研究得出的结论,还有公司管理层从行业发展、竞争格局乃至融资计划本身出发所希望达成的阶段目标。

数据驱动在发展期的作用就是通过数据相关性的发掘,提供企业一个观测用户行为和业务增长的数据框架,并可以给出定量的决策。这些决策不一定是只看利润,更多的时候是要看核心指标的数据增长模型是否有助于撬动规模化的下一步发展,要发现核心行为与什么用户特征密切相关,比如10个月就从0做到2-3千万的平台上,重复发生核心价值的用户行为可能是每天收看xxx时长以上的短视频,或者每天在核心任务上至少完成一次等,这样就可以做到用同样的投入获得最有价值的目标客户,并留住他们。比如Facebook通过数据观测发现的共同的好友这个特征可以激发用户上线的频率和活跃的程度,并通过灰度发布验证统计上的有效性,并迅速全流量放开引发用户量大涨,同时保证稳定的用户留存,就是一个很好的案例。

所以企业需要在发展期开始的时候,就要着手完善数据仓库设计,并通过前端和后端数据埋点的方式,通过设计符合企业实际业务的数据建模、指标设计、字段设计和ETL,洗出完整可以用于数据挖掘的高质量数据,保证可以通过数据产品驱动有效的业务决策。

2)如何排除干扰数据,比如一些攻击,刷单刷量?

干扰数据的场景非常多,很难用几句话来描述。

可以把干扰数据的情况总体上分为流量获取本身、产品运营和技术安全等不同领域。

流量获取的阶段要分别从网站、APP的不同特性来说。由于cookie是判断网站流量数据的技术手段,所以攻防双方都会围绕cookie这件事来做处理。比如广告流量产业里比较多的会出现广告主的费用结算(CPC、CPM)与实际获得流量的质量很大程序上取决于双方约定的广告点击有效性,广告平台对于用户识别的定义是基于cookie id,但是这个cookie id本身与广告主的内部系统(比如CRM)识别的唯一用户不一样,所以就必须通过广告主内部系统来做数据整合、去重,并准确计算每个渠道的ROI。

我认识的一家在线旅游企业把对接dsp/媒体投放设计为内部系统和外部系统,内部系统包括产品、运营、维护、报警;外部部系统,包括商务、运营、出价策略、对账结算、产品。内外部系统又分模块和行动路径及重点指标,最核心的问题其实数据驱动产品运营是解决稳定性、时效性和优化效果及减少浪费。

如果是APP的话,问题的技术原因在于APP上没有办法用cookie去追踪数据,而必须用iOS的IDFA和Android的AID来识别唯一性。由于这些ID是可以通过技术重置的,而且可以通过模拟器虚拟出大量的虚拟设备来自动批量完成用户的操作,让运营团队误以为渠道的效果很好。

其他的如或者直接刷单的通过技术手段伪造大量账号,并通过操作这些账号来套平台的补贴(比如淘宝商户)。或者干脆就是人为通过商户和用户的私下约定,共同创造虚拟交易来获得平台的补贴(比如滴滴司机和乘客)。

这些干扰手段由于是系统进行大批量操作,或者人为有规律地操作,在流量特征(比如访问页面类型和深度、时长、地域),或者账号属性(比如有规律的手机号码批量在特定时间集中出现),或者交易特性(比如集中在某个店铺、某些SKU在集中的时间),或者(司机和乘客的行驶里程及交易半径比较固定),都是可以通过数据分析和建模找到规律的,所以都是可以解决的。

问题3)许多时候说数据分析是有目标的,有些数据分析公司甚至可以给客户定制他们想要的目标结果,那对于老板来说,如何避免这些数据陷阱?另外有没有数据分析度的问题?即不要过度,为了分析而分析!过度了之后会怎样?能否给个案例分享一下企业依赖错误的数据分析造成很严重后果的?

数据分析是用来解决业务运营、产品设计和研发资源投入等决策的,所以是手段不是目标。所谓定制目标结果我理解就是定制数据Dashboard,把一些基本经营和业务运营上的指标,通过可视化报表的形式展现出来,这最多也就是数据报告,而不是数据驱动决策。

举个容易理解的例子,如果我们驾驶一辆普通的汽车,数据报告是汽车里的仪表盘,但决定如何开车的还是人,但如果我们驾驶一辆谷歌研制的Waymo自动驾驶汽车,很多时候决定如何行驶的就是计算机系统,人只是在需要的时候介入,这时候Waymo是属于数据驱动决策。

可视化报表的方案有很多,我这里不一一列举了,但是数据驱动决策这件事需要企业自己来动手做,这里面涉及到从数据仓库设计、维度建模、相关性数据挖掘、算法赋能产品运营等不同层面的具体解决方案、流程和工具,对于不熟悉这些领域的企业团队,可以找专家咨询,我自己的企业E-Bizcamp也在这些年帮助不少互联网团队实现了数据驱动决策的落地。

对于过度分析这件事,一般我更多的时候看到因不理解数据来源口径、不熟悉业务导致数据报告不能反映真实业务情况的事情,这些事情其实每天都在发生,但不是过度分析,而是“不靠谱”分析,更多的时候是基础的数据产品和数据基础收集工作出了问题。

另外一个方面,我在培养过200多个不同的互联网项目团队后,发现很多企业的开发周期排得很长,研发资源排的很紧,但是却总是听到业务部门觉得技术部门虽然加班辛苦,但产出却看不到,这种抱怨的另一面是业务部门不断和产品团队提出各种需求,双方却无法有效量化业务需求和实际产出之间的数据关系。

举个比较具有代表性的例子:

“某一个电商企业的主域名要由a变为b,所以主力开发团队把很多页面新建到xyz.a,也就是把xyz.b很多页面都处理跳转到xyz.a, 造成营销时使用多域名,而多套网站分析工具都还没来得及做好多域名配置,广告已经早就都投放出去了,而营销团队是后来才知道,事先没有人通知他们。

更糟糕的是在这个过程中,技术团队又把新域名PC站和移动站大部分页面生成了,导致后面需要修补的工作量巨大。苦逼的营销团队和SEO团队需要查明什么弄错弄丢了,第二件事是想办法提交需求给开发处理,最后还要盯着开发团队把需求排期开发并上线。”

如果出现屡次出现这种情况,按照一个企业每年开发上线的节奏来看,估计过了12个月,数据的错误和渠道的业绩统计估计还是会有很大问题,还谈什么数据驱动?

发现这类数据收集和分析方面的问题,找到数据上的问题并解决,直接的效果是可以帮助企业准确计算各个渠道的业绩贡献,让SEO项目获得的流量和业绩可以得以体现,让开发团队付出的努力可以体现在业务报表里。所以,专注做好数据的基础工作很重要。

相关新闻