Skip to content

《精益数据分析》的结构非常清晰——在空间维度上,商业模式被划分为六类:电子商务、SAAS(软件即服务)、免费移动应用、媒体网站、UGC(用户生成内容)、双边市场;在时间维度上,企业的发展阶段被划分为五段:移情、黏性、病毒性、营收、规模化。接着,作者就在这样一个空间和时间构成的平面上讨论数据分析问题,最后,将数据分析的方法还延伸到企业市场和企业内部创业领域。讨论的过程中,第一关键指标是化繁为简的有效手段、而底线则是创业者衡量自身的准绳……

但是,内容琐碎代表了本书的另一面——似乎这本书就不是让读者一字一句详读的,针对不同模式不同阶段的各种数据指标繁杂,且应用条件各不相同,即使勉强记录下来,使用时也难免教条刻板。幸运的是,第2章包含了本书的书胆——对于好的数据指标的特征阐述。我甚至认为,除了这一章,其他内容都可以放到附录中查询。

我相信即使超越本书,这些衡量好的数据指标的准则也是值得关注的。这些准则就是:

  • 好的数据指标是比较性的。

如果能比较某数据指标在不同的时间段、用户群体、竞争产品之间的表现,你可以更好地洞察产品的实际走向。

  • 好的数据指标是简单易懂的。

如果人们不能很容易地记住或讨论某指标,那么通过改变它来改变公司的作为会十分困难。

  • 好的数据指标是一个比率。

比率是天生的比较性指标,其可操作性强,是行动的向导,比率还适于比较各因素间的相生相克(正相关和负相关)。

  • 好的数据指标会改变行为。

好的指标与商业目标一致,所以其变化会改变创业者的商业行为(如果指标的变化不会引发你的举措,要它何用?)

··················································

附:一些基本的客户开发问题

  • 跟我说说你今天是如何做______的。

  • 你有没有使用什么【工具/产品/应用/手段】来帮助你完成______?

  • 如果你能挥舞魔杖,来帮你完成一件自己目前无法做到的事,这件事会是什么?不用担心这有没有可能,说什么都行。

  • 你上次做______的时候,在开始之前都做了些什么?任务完成之后你又做了些什么?

  • 关于______,还有什么是我应该问的吗?

——《精益客户开发》第4章

事实上,《精益客户开发》是我阅读的精益系列第一本书,当我坚持读完《精益数据分析》之后,已经没有心情继续阅读包括传说中的《精益创业》在内的其他精益了。原因大致是,这两本书除了一些关键的观点和方法,其他部分给人的阅读感受简直和新华字典差不多。

从方法论的角度,《精益客户开发》的客户访谈与大前研一的“假设-验证”是一致的。所以,这本书真正的价值其实在于操作层面:访谈提问的技巧、对环境的观察、记录和分析的方法等。例如:4.3哪些内容要留意、5.3巧做笔记、5.5第一分钟、附录A有用的问题等等。

操作层面的内容本就是琐碎的,并且难以用理性归纳,对于喜欢剥洋葱式阅读的我而言,这种捡豆子式的阅读体验确实不好。但是,我也有另类的收获:销售培训中的“背话术”一直是我所厌恶的,作为成年人,我讨厌按照话术与人交往——一种难以言明的假惺惺;但是,我在《精益客户开发》的访谈中也看到了“话术”——书中称为模板或台词,不知为什么,同样的东西,写在自己喜欢的书中(以及O'REILLY这样的出版社),我竟也能接受。以后如果有机会,我也很想寻找一下自己为什么会如此的原因。

在线旅游开始火了,腾讯百度淘宝纷纷涉水,再加上携程去哪儿,引用人家一句话就是“剑拔弩张”,前几天看到一份国内著名咨询机构发布的有关2011年在线旅游行业的发展报告,洋洋洒洒几大篇,把在线旅游描绘得真是好啊!而我,一直对此持怀疑态度,万一大家又是互相忽悠,制造泡沫呢?

本打算把那份报告的各个条目梳理出来,看看他们的行业模型骨架,可惜人太懒,加上看到许多数据图表中又多这么一句“基于对20万名家庭及办公(不含公共上网地点)样本网络行为的长期监测数据获得”,心一下就凉了,20万···新加坡的人口还有518万(2011年)呢!

简单看了一下,说白了就是长期监测了在家或者公司上网的人群,这个人群的规模就是20万,而事实上,能够在家上网的人群规模,肯定随着城市化进程和经济发展而扩大:城市化率在提高,人口总数在增长,GDP同样在增长,城市人口中拥有至少一台电脑且能上网的人群也在扩大,对区区20万样本的长期监测可信吗?想让人信服,起码也得对监测的数据做出修正。

我这人比较懒,就说吃水果,如果你问我橙子为什么比苹果好吃?我会告诉你因为橙子剥皮就能吃,至于为什么香蕉会比橙子好吃?当然是因为剥过橙子皮还需要洗手……说到博客,也就是,建起来了懒得写,实在要写也尽量放到周末,所以说今天这文章写得意外嘛!主要是早上想起要写三篇文章,晚上下班回来就只记得两篇了……

言归正传,做过一些数据分析的工作,略有心得,短载如下,欢迎指正:

1.一般而言,我的数据分析模型是如下结构:

确定分析目标(分析的目的是?)->设定分析方法->分析验证->输出结论。

其中,分析方法->分析验证是一个迭代的过程,方法不对就换嘛~同样,最后输出的结论不能达成分析的目标时,那也得闭环反馈,得迭代,杯具有时是难免的。

当然,本文的重点不在于上面的分析模型,虽然那也能算重点,毕竟这种抽象的结构下,才会有基于各种工具的分析手段。

2.贯穿这个模型的,是我自己称作的“特征识别”,就如同区分男女一样,从确定分析目标开始,就要去辨别,去寻找目标的特征,完成对目标的识别,基于此,如何确定分析的方法也就有迹可循,后面的工作也是水到渠成的事情。例如:分析某件商品在新老用户人群中的受欢迎程度,问题虽然简单,但是如果新老用户群没有任何可区分的特征,细分就无从谈起,想起线性代数中矩阵的特征向量/值,呵呵~这不就是某个矩阵的特征吗?通过对它的识别,才能将该矩阵与其他的区分开。

3.特征因具体对象而异,但通常至少有三个条件:A.特征应该足够简洁;B.特征应该足够容易获取。C.特征应该紧扣目标。

4.通过以上的抽象模型,在具体的行业中,比如网站的流量分析,结合专用的各种工具,就可以实现很多组合分析。由于水平所限,我所看到的网站分析其实并不高深,即便是Avinash在他的书/博文中提到对于网页交互度的分析方法(将一个网页中的链接赋予不同权重,然后累加各链接×权重的PV值,事实上,权重即概率),也没有达到让人难以想象或理解的程度,一般的分析人员基于自身分析的需要,想出这种方法几乎是意料之中的,当然,Avinash的价值远不止如此,只是想说明,从方法上的学习和掌握,结合不断积累的经验,应付一般的网站分析还是够用的。