数据分析方法论、流程和框架?

论坛 期权论坛 知乎     
知乎用户   2019-8-14 01:09   8879   5
转载声明:本文由互联网用户自发贡献,部分转载来源来自知乎(zhihu.com),强烈建议您访问知乎查看完整内容。本社区不拥有所有权,也不承担任何法律责任。如有侵权,请联系optbbs@163.com。一经查实,即刻删除。
数据分析方法有很多,有没有一些比较成熟的常用的方法论,即数据分析的套路?另外,数据分析的流程和框架又是怎样的?
分享到 :
0 人收藏

5 个回复

倒序浏览
2#
热心回应  16级独孤 | 2019-8-14 01:09:07 发帖IP地址来自
谢邀。
针对题主的问题,接下来我就从两部分来回答:一是数据分析方法论的建立,二是数据分析的流程框架,最后再给题主提供一份详尽的数据分析学习书单,以及社区上建议关注的数据分析领域大神们。


[h1]Part 1 | 数据分析方法论 & 知识体系[/h1][h1]一、 数据分析体系:道、术、器[/h1][h1]「道」是指价值观。[/h1]要想做好数据分析,首先就要认同数据的意义和价值。一个不认同数据分析、对数据分析的意义缺乏理解的人是很难做好这个工作的。
那么如何让数据分析真正发挥价值?
我认为必须在价值认同、工作定位和商业模式三点上取得突破。

(一)数据分析的价值认同
做好数据分析,首先要认同数据的意义和价值。一个不认同数据、对数据分析的意义缺乏理解的人是很难做好这个工作的。
放到一个企业里面,企业的 CEO 及管理层必须高度重视和理解数据分析的价值。你想一下,如果老板都不认可数据分析的价值,那么数据相关的项目在企业里面还能推得动吗?然后,企业内部还需要有数据驱动的公司文化。如果大家宁可拍脑袋做决定也不相信数据分析师的建议,那么数据分析往往是事倍功半、走一下形式而已,反之则是事半功倍。
(二)数据分析的工作定位
做好数据分析,要对数据分析的价值有清楚的定位。既不要神化数据分析,把它当做万能钥匙;也不要轻易否定数据分析的意义,弃之不用。数据分析应该对业务有实际的指导意义,而不应该流于形式,沦为单纯的 “取数”、“做表”、“写报告”。
在 LinkedIn 那么多年的工作时间里面,我们对数据分析的工作早已有了清晰的定位:利用(大)数据分析为所有职场人员作出迅捷、高质、高效的决策,提供具有指导意义的洞察和可规模化的解决方案。

当时我们还采用了一套 EOI 的分析框架,对不同业务的数据分析价值有明确的定位。针对核心任务、战略任务和风险任务,我们认为数据分析应该分别起到助力(Empower)、优化(Optimize)、创新(Innovate)的三大作用。
(三)数据分析的商业模式
做好数据分析,要对企业的商业模式非常了解。数据分析的最终目的还是服务于企业的增长目标,所以务必要对行业背景、业务含义、产品和用户有着深刻的认知。

还是以 LinkedIn 为例,作为企业增长的重要环节,LinkedIn 在产品设计之初就优先考虑到了数据的价值模式。首先是用户的增长、使用和活跃,然后产生大量的数据,最后根据数据进行业务变现(企业广告、企业招聘、高级账号等业务)和用户增长,从而不断良性循环。
只有认可分析价值、明确工作定位、深谙商业模式,数据分析才能走在正确的轨道上。
[h1]「术」是指正确的方法论。[/h1](一)数据分析的两个方法论
数据分析应该帮助我们不断优化营销、运营、产品、工程,驱动企业和用户的增长,而不是为了分析而分析。在这里我给大家介绍两个方法论,一个是业务上的 AARRR 模型,另一个是分析上的学习引擎。

AARRR 是著名的 Growth Hacker (增长黑客)海盗法则,依序分别是 Acquisition(获取用户)、Activation(激发活跃)、Retention(提高留存)、Revenue(增加收入)和 Referral(推荐传播)的首字母简称,覆盖用户整个生命周期。
我们在进行数据分析的时候,应该考虑用户正处于 AARRR 模型的哪个部分、关键数据指标是什么、对应的分析方法又是什么?

“ 学习引擎 ” 是《精益创业》一书中提倡的精益化运营方式,在硅谷被大小企业广泛采纳。
当我们有一个想法的时候,可以采用最简可行化产品(MVP)的方式将其构建(Build)出来。产品上线后,我们需要衡量(Measure)用户和市场的反应。通过分析收集到的数据,我们可以验证或者推翻我们之前的想法,从而不断学习(Learn)和优化。
(二)数据分析的具体方法

数据分析的具体方法有很多,接下来我就选几种典型的讲讲。


(1)流量分析
a. 访问 / 下载来源,搜索词
网站的访问来源,App 的下载渠道,以及各搜索引擎的搜索关键词,通过数据分析平台都可以很方便的进行统计和分析,分析平台通过归因模型判断流量来源,产品经理在分析这些流量时,只需要用自建或者第三方的数据平台追踪流量变化即可,第三方平台如 Google Analytics 、GrowingIO 等;
b. 自主投放追踪
平时我们在微信等外部渠道投放文章、H5 等,许多产品都会很苦恼无法追踪数据。
分析不同获客渠道流量的数量和质量,进而优化投放渠道。常见的办法有 UTM 代码追踪,分析新用户的广告来源、广告内容、广告媒介、广告项目、广告名称和广告关键字。
c. 实时流量分析
实时监测产品的访问走势,尤其要关心流量异常值。举个例子,某互联网金融平台因为一个产品 Bug 导致用户疯狂抢购造成的流量峰值,产品经理发现实时数据异常后迅速下线该产品修复 Bug,避免了损失扩大。



(2)转化分析
无论是做网站还是 App,产品里面有很多地方需要做转化分析:注册转化、购买转化、激活转化等等。一般我们借助漏斗来衡量用户的转化过程。



影响转化率的因素很多,我们总结了三个大的方面:渠道流量、用户营销、网站 / APP 体验。以渠道流量为例,通过优选渠道并且量化分配我们的投放资源,可以有效提升总体的转化率。
更详细的转化分析方法,可以参考我之前的这篇回答 如何提升转化率? - 张溪梦的回答


(3)留存分析
在互联网行业里,通常我们会通过拉新把客户引过来,但是经过一段时间可能就会有一部分客户逐渐流失了。那些留下来的人或者是经常回访我们公司网站 / App 的人就称为留存。
在一段时间内,对某个网站 / App 等有过任意行为的用户,称之为这个网站 / App 这段时间的活跃用户,这个任意行为可以是访问网站、打开 App 等等。
现在大家经常会用到所谓的「日活」 (日活跃用户量,DAU)、「周活」 (周活跃用户量,WAU)来监测我们的网站,有的时候会看到我们的「日活」在一段时期内都是逐渐地增加的,以为是非常好的现象,但是如果没有做留存分析的话,这个结果很可能是一个错误。
留存是产品增长的核心,用户只有留下来,你的产品才能不断增长。一条留存曲线,如果产品经理不做什么的话,那么用户就慢慢流失了。

这是一个常见的留存曲线,我把它分成了三个部分:第一部分是振荡期,第二部分是选择期,第三部分是平稳期。
从产品设计的角度出发,找到触发留存的关键行为,帮助用户尽快找到产品留存的关键节点。之前我们发现我们产品里面,使用过“新建”功能用户的留存度非常高;于是我们做了产品改进,将“新建”按钮置于首页顶部刺激用户使用,效果非常好。
硅谷流行的 Magic Number(魔法数字)也是留存分析的一部分,比如 Facebook 发现「在第一周里加 10 个好友」的新用户留存度非常高。作为产品经理,我们也需要通过数据分析来不断探索我们产品里面的魔法数字,不断提高用户留存度和活跃度。
更详细的留存分析方法,可以参考这篇文章 你能找到的最深入的留存分析文章 - 留存 · 增长 · Magic Number


(4)可视化分析
用户体验,是一个非常抽象的概念,我们可以对其进行形象化。目前一个普遍的方法就是对用户的数据进行可视化,以热图的形式呈现。

借助热图,产品经理可以非常直观了解用户在产品上的点击偏好,检验我们的产品设计或者布局是否合理。
热图的概念、原理、类型和应用,可以参考这个回答 热力图是什么原理? - 张溪梦的回答


(5)群组分析 & 挖掘用户需求、改进及优化产品
千人千面,产品经理对用户精细化的分析必不可少。不同区域、不同来源、不同平台甚至不同手机型号的用户,他们对产品的使用和感知都可能存在巨大的差异。产品经理可以对不同属性的用户进行分群,观察不同群组用户的行为差异,进而优化产品。



之前我们做过一次分析,网站的总体注册转化率是 6%;但是使用 Chrome 浏览器的新用户注册转化率高达 12%,使用 IE 浏览器的新用户注册转化率才 1%。这样一分的话,问题就很明显了,极有可能是浏览器兼容性的问题,产品经理应该关注一下这个问题。
详细的群组分析操作流程,可以参考这个回答 产品经理一般是怎么搜集产品不好用之处的? - 张溪梦的回答


懂得每一种方法的原理是一回事,在业务中灵活应用又是另外一回事。以产品经理为例,可以把“用户行为 - 数据分析 -产品设计&优化 ”三位归于一体,在不断的实践应用中掌握各种分析方法的精髓和要义。
因为数据来源于用户,数据分析的最终目的也是服务于企业和用户。做数据分析之前,一定要清晰业务目的和数据指标,选择科学的分析方法,用数据来指导产品和用户增长。


[h1]「器」则是指数据分析工具。[/h1]“ 大数据、大数据,最重要的就是数据。但数据在哪里呢?现在最缺乏的,是统一的数据采集平台!”这是很久之前我接受采访时的观点,现在仍是如此!
(一)为什么工具那么重要?
在我创立 GrowingIO 的时候被投资人拉进一个交流群,群里面是硅谷各种创业公司的 CEO。我发现群里面讨论的东西很有趣,就两件事情:一个是创业增长的方法论,另外一个就是讨论各种工具。“ 工欲善其事,必先利其器 ” 说的就是这个道理,古今中外概莫如此!





很久之前我就跟人谈起过这个问题,整个数据框架下面的部分可能花费了你 80% 的时间和精力,但是产生了不到 20% 的价值。大家都在搭建数据采集平台、都在写代码埋点、都在做 ETL、都在建 BI 系统,哪里还有更多的时间和人力来做 Analytics 和 Insight 。
以前我在 eBay、LinkedIn 工作的时候,市面上没有好的数据分析工具,我们不得不自己去部署很多的系统、建立很多的机制,甚至雇佣三四个团队去做一件事。今天市面上有很多好的工具来帮助我们进行数据分析,为了节省时间、资源(特别是成长型企业),大家完全没有必要内部建造一套分析系统,应该擅用好的工具来帮助自己做数据分析。
(二)选择合适的分析工具
选择什么样的分析工具,跟你的工作岗位、分析场景息息相关。每种场景都有若干种工具可以选择,有些工具也可以用于多种分析场景,关键在于你对工具的熟悉和理解。





Excel 绝对是最基本、最常见的数据分析工具了,对于数据量较小的情况,无论是数据处理、数据可视化还是一些统计分析都能支持。一旦数据量大了,这个时候就需要大型的数据库来支持。
市场营销人员需要对广告投放进行数据分析,网站流量监测是他们关注的重点。产品和运营重点关注用户行为和产品使用,用户行为数据分析工具是他们的首选。以前大家只关注业务数据,然而这些结果型的数据并不能告诉他们中间发生了什么、为什么发生;现在大家越来越关注精细化运营、对用户行为数据的需求也越来越高,这也是我回国创立 GrowingIO 的原因。
如果你能懂一些 R 和 Python,在数据建模、统计分析、数据科学的方向上有所发展,那么你的数据分析水平就更上一层楼了。


[h1]Part 2 | 数据分析的框架 [/h1]在整个数据分析框架中,用户是数据的来源,也是数据分析最终要服务的对象。整个分析框架可以分为四大层次,依次是:数据规划、数据采集、数据分析和数据决策。从用户、业务系统,到数据采集平台、ETL、数据仓库, 再到分析、BI、DM、AI、洞察,再到决策、行为、价值,最终回到用户。





上面整个分析框架中,越底层的占用的时间和精力越多,而顶层的耗时较少。从产生的价值来看,越底层的产生的价值越低,越顶层的产生的价值越高。大家想一下就会理解,做数据分析的过程大多时间是耗费在数据采集、清理、转换等脏活累活上面,最有价值的分析和决策部分往往耗时很少。
因此,大家做数据分析应该把重心放在最有价值的分析和决策两个层面上,并且尽可能使用工具实现底层的自动化操作。


[h1]Part 3 | 数据分析知识学习[/h1]

从入门到精通:互联网数据分析的书籍清单!
任何一个技能的学习,都有从浅到深的过程,数据分析也不例外。因此我把推荐书籍划分成几个段位,更便于大家挑选。
1. 入门版
适合对数据分析的入门者,对数据分析没有整体概念的人,常见于应届毕业生,经验尚浅的转行者。
深入浅出数据分析 (豆瓣):HeadFirst 类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。
谁说菜鸟不会数据分析 (豆瓣):不仅讲解了一些常见的分析技巧,并附带 Excel 的一些知识以及数据分析在公司中所处的位置,对职场了解亦有一定帮助。
赤裸裸的统计学 (豆瓣):作者年轻时是个追求学习意义的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。
同样类似的书籍还有「统计数字会撒谎 (豆瓣)」,这本书知名度要高点,不过我还没看…


2. 进阶版
具有一定的行业针对性,要求具备一定的分析常识,适合网站分析师,商业分析师以及数据产品经理。
精通 Web Analytics 2.0 (豆瓣):此书虽老,但其中很多思想和流量分析的案例仍然很有借鉴意义,现在纸质书只能上淘宝买旧书了。
与此类似的有「网站分析实战 (豆瓣)」,是国内一本讲网站分析的书,没有上面经典,但胜在新出,很多案例和理念都有及时的更新。
深入浅出统计学 (豆瓣):Headfirst 类书籍,可以帮助你快速了解统计方面的知识。
数据化管理:洞悉零售及电子商务运营 (豆瓣):黄成明著,讲解在企业中应用数据的例子,读完受益匪浅,里面举的很多例子都很接地气。虽说偏向于零售业管理,但大道归一,可适用于很多行业,当时依据里面的理念规划了美团外卖面向 BD 的数据产品。
MySQL 必知必会 (豆瓣):这本也是我当年学习 SQL 的入门书,薄册子一本,看起来很快。SQL 是个性价比很高的技能,简单而强大。任何想进一步提高自己数据分析技能的产品/运营/分析师 同学,都建议点亮 这个技能点。
增长黑客手册 | 如何用数据驱动爆发式增长:我司 GrowingIO 2017 年第 1 期电子书,(封面和目录见下图),我们一直在做互联网行业数据分析知识的普及,目前我们已经做了 4 本电子书,以及 24 期「GrowingIO 数据分析公开课」,面向产品经理、运营等等。这本增长黑客手册是关于增长黑客的普及和养成手册,简单易读,结合多个实战案例,非常适合新手。



[h1]免费下载传送门[/h1]

3. 高阶版
更高阶的数据相对来说专业性较强了,如涉及到企业内部数据治理,数据结合的业务分析,数据可视化等。当然,还有数据挖掘算法之类的更深入的东西,这块没有研究就不瞎推荐了。
决战大数据 (豆瓣):阿里巴巴前数据副总裁车品觉老师所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。
精益数据分析 (豆瓣):此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。
The Wall Street Journal Guide to Information Graphics (豆瓣),华尔街日报负责商业分析的人做的可视化指南,精华且实用,我之前在公众号上写过读书笔记「华尔街日报是这样做数据可视化的(1)」,可供大家参考。
《数据仓库经典教程》:网上有人整理出来的资料,优点是简单明了,不像正常的数据仓库教材厚厚一本。


4. 推荐关注
在社区上有不少数据分析及 Growth 的大牛,在这里推荐几位我熟悉的,经常会写一些相关的文章:
@覃超,前 Facebook 早期工程师,关于增长黑客写了许多优秀的文章;
@邹昕,Facebook 用户增长数据分析,在数据分析方面很有见解;
@范冰XDash,「增长黑客」和「增长黑客实战」作者,人非常有趣,同时也非常推荐「增长黑客」以及「增长黑客实战」两本书;
@空白白白白 ,数据分析界的清新美女,很多高票答案都非常接地气,可读性很强
@路人甲 ,数据分析小王子,擅长用数据分析讲故事
@何明科,专注于数据和互联网产品,许多回答很值得细看。


| 结语
数据分析是一门多学科、多领域的交叉学问,涉及到的东西非常多。要想做好数据分析,应该有一套完整的思维体系,在价值观、方法论和工具三个层面上储备相关知识。同时立足于产品和用户,用数据来打磨产品,用数据来检验迭代,不断提升用户体验。


注:本文中所有数据分析产品功能均来自 GrowingIO 官网 硅谷新一代数据分析产品
我们最近还发布了行业和岗位解决方案,包括互联网金融、在线旅游和企业服务,以及产品、运营市场、管理者三个岗位的定制化用户行为分析解决方案。
欢迎各位有用户行为数据分析需求的朋友免费试用。
[h1]试用传送门[/h1]
3#
热心回应  16级独孤 | 2019-8-14 01:09:08 发帖IP地址来自
@王礼Leon 几百年前的邀请。


首先,这个问题太大了,我没法回答的面面俱到,所以我选其中一个我比较了解的来回答。说说关于数据分析的流程。
正常在工作中,一个数据分析的问题的分析流程我们可以把它拆解为三个步骤,每一个步骤需要我们回答几个问题,总体来说是2W1H:
What:什么正在发生?
Why:事情为什么发生,问题为什么产生?
How:怎么避免这种问题?怎么提高?


步骤一:What
有一句话叫做好的开始是成功的一半,这句话在数据分析的流程里,我们可以把这个开始认为是弄清楚什么正在发生,问题的本质是什么。
分析一个问题,首先要回答什么正在发生。只有弄清楚问题的本质,才能给后面的分析工作做好铺垫。
也许有人认为What是很简单的事情,但是从我做数据分析一年多精力来看,我发现在很多场景下我们并没有弄清楚真正的问题是什么,就开始做分析了。这样到头了,只能是瞎忙活了半天,回头一看原来不是这个问题。
有人会认为我在瞎扯,我给大家举一个真实的例子:



比如说我们在红线的地方发了一个版本,这个版本中全量了好几个功能「A/B/C/D」,看到这张图我们第一反应就是iOS因为发版出了什么问题,android没出问题。所以咱们就去分析了。
但是当我们分析了好几天仍然没有头绪的时候,我们有一位同事就提出来:会不会我们的方向就是错的。也有可能上线的好几个功能中,A功能让android下降,B功能促进了android上涨,最后导致android看起来没大的变化。A功能也导致了iOS下降,但是B功能没让iOS上升。所以出现了上面这种情况。
你看,这就是我们一开始就太疏忽,太理所当然了了。根本就没弄清楚到底在发生什么,方向错了,后续的分析也就是白扯了。所以第一步的拆解问题,找到问题的本质这一步很重要。


步骤二:Why
弄清楚什么在发生,紧接着我们应该解答为什么发生,一般来说这也是业务方最关心的问题。因为这些Why可以解开他们心中的谜底。回答Why的时候我们所熟知的各种分析方法论,什么回归分析、时间序列等等就派上了用场了。
这这一大步里面,我们还可以把这一大步拆分为几个小步骤:
1、拆解问题
2、探索解法
3、输出结论


详细来说:
1、拆解问题
拆解问题跟上面的第一步What有点类似,对可能对目前现状造成影响的因素做拆解,进一步明确问题的根源。
比如说下面这个图,对淘宝店销售量下降这个一问题进行拆解,进一步发现最根本的问题是什么,到底是长袖的下降还是所有品类都下降。



2、探索解法
解法这一块没必要细说了,不同的问题有不同的解法。通常来说在刚做数据分析的时候,大家都是一头雾水,一些典型的问题多问问同事和Google,通用的分析思路和模型很多。大家照葫芦画瓢就行了。
随着经验的累计,业务大家也熟悉了,很多分析问题大家解决起来也游刃有余了。但是这时候99%的人都会陷入业务的误区,形成固化的思维。这时候需要大家跳出来,多跟不属于这块业务的朋友多聊聊,会发现更广阔的视野。


3、输出结论
输出结论就是我们所熟知的数据报告了。在工作中一个分析项目的结论可以大可以小。有时候一张折线图就可以直接说明问题,但有时候需要一个非常详细的报告来解释你的分析逻辑和结论。
输出的结论是展示你成果的时候,整个分析项目业务并不知道你是怎么做的。所以这些如果可能尽量写成人话放在数据报告里。告诉别人你是怎么做的。
一个好的报告通常有这么几个部分:
1、交代背景
2、交代分析的目的、交代分析方法
3、写明分析结论
4、下一步应该做什么


步骤三:How
我认为总结教训是一个每一个项目最重要也最有价值的地方,而遗憾的是很多分析师在解答了Why之后,就认为项目已经结束了。往往解答了一个问题之后,通常来说会有两点比较有价值的事情值得去做的。


1、总结套路与经验
本质上在一个公司里,在整个工作生涯中,很多项目都是大致雷同的。比如说产品经常发版,经常会查DAU为什么下降,经常会查留存为什么下降。很可能,你上周刚做了一次留存下降原因排查,第二周留存又下降了。
这些问题的分析思路都是差不多的,所以如果你在上一周的分析之后,总结了经验和分析思路。那么这一周就可以快速的把这些方法论又作用到这一次的分析中。
2、探索其他新方向
要学会举一反三,通过分析问题你可能发现某个增长点,那么对着这个增长点,你是否能举一反三。
在分析某个项目的时候,发现30岁以上的用户因为使用了某个功能之后留存会上升。那么,同一个功能能不能也试试拓展给30岁以下的用户;发现对海外的版本改了分发的算法,海外的用户停留时间变长了,那么能不能也用到国内的版本。
我觉得这两点,对于数据分析师来说,是整个分析项目中最重要的环节。
。。。
作为数据分析可能平常不少人需要学习一下Python,我之前自己做了一本学习Python的电子书,现在有六十多万人在学习,关注微信公众号「路人甲TM」后台回复关键词「1」可以免费获得整理的这本Python电子书,看完这个数基本上Python基础和Python爬虫都没啥问题。
另外,我之前写了一本关于从零开始学习数据分析的电子书,关注微信公众号「路人甲TM」后台回复关键词「2」可以免费获得这本电子书,看完这本书基本上数据分析差不多能入个门。
4#
热心回应  16级独孤 | 2019-8-14 01:09:09 发帖IP地址来自
    针对这个问题,我从一个十年大数据人的日常工作实践、可落地可实施的角度总结归纳分享给大家。(节选自小讲“数据分析师-从零入门到精通”)
第一部分:数据分析框架。
为了分析问题的聚焦,我们具体拿互联网电商来举例子说明,至于其他的比如互联网金融、教育、社交等等,可以依此借鉴。
(1)从互联网实体角度分析。我们可以从以下7个角度构建互联网数据分析体系。
    买家:基本特征分析、交易行为分析、流量行为分析、售后满意分析等
    卖家:基本特征分析、经营效果分析、流量曝光分析、售后满意分析、产品分析等
    产品:基本特征分析、交易行为分析、流量曝光分析、售后满意分析等
    行业:基本特征分析、经营分析、曝光分析、售后分析、产品分析、买卖家分析等
    设备:移动端分析、PC端分析、访问对象分析、cookie分析、session分析等
    日志:访问对象URL分析、cookie分析、session分析等
    事件:登录、流量、点击、曝光、下单、交易、支付、物流、评价、纠纷、仲裁等分析
这个实体分析方法,可以称得上是万能的数据分析框架,适用于所有的互联网企业。我曾工作过的阿里巴巴、腾讯、随手记等企业,我个人都是按照这个套路去构建互联网的分析体系。
(2)从用户的关键路径进行分析。
    关键路径分析方法是一个行之有效的常用分析方法,也是做数据化运营的常用工具。关键路径分析让我们聚焦于核心环节,排除杂音,定位出业务的核心问题,快速的加以解决。在应用关键路径分析时候,我们往往先把可能的结果、以及最关心的结果梳理出来,以结果为导向追溯行为的根本,当然,也可以从行为的初始出发,梳理出所有可能的行为路径,找出关键行为,导向我们最终设计好的结果中去。下面我们举例子说明下:
在电商网站中,我们假设我们运营目标是让用户购买网站上的商品(在这里,我要插说几句,我们的目标有时候不只是购买,在精细化运营中,往往会根据用户的生命周期,确定关键路径的目标,比如对于一个进入期的新买家,我们通常会发一些购物攻略加以指导,针对流失期的买家,关键路径的结果我们可能导向申领我们的优惠劵之类,等等。关于这一部分数据化精细化运营方面,在大数据应用系列的数据化运营小讲,我们会详细加以分享,敬请关注)。刚才谈到,我们假设我们运营目标是让用户购买网站上的商品,那么我们可以把关键路径,也即,用户的购买路径梳理出来:
a.用户登录/注册》搜索关键词》查看商品详情》加入购物车》点击下单》确认付款》确认收货
b.用户搜索关键词》类目和店铺》卖家交流》点击下单》确认付款》确认收货





通过这种关键路径,我们还常常进行漏斗分析,从而进行流量的转化分析,找出影响到达最终结果的关键环节。
(3)从KPI拆解角度分析。
KPI拆解分析方法也是比较常见的互联网分析方法。核心思想是先定一个总体目标,比如今年营收12亿,那么可以把这个指标拆解到各个业务线去,业务线再进行拆分,比如分解为12个月,每个月需要达成营收额,接着,就是达成该营收额,根据流量的转化情况,估算出需要多少的流量,目前平台已有多少流量,需要外拓引流多少流量才能达成目标,这就可以层层的拆解指标,最终或落地到产品团队或部分到运营团队去承担KPI任务。


第二部分:数据分析常用分析方法
常用的数据分析方法有:PEST分析方法、5W2H分析法、4P营销分析法、逻辑树分析法、指标拆分法、对比分析法、漏斗分析法、用户行为分析法、用户生命周期分析法、金字塔分析法等等,下面我们逐个的简单说明下
(1)PEST分析方法
这个方法主要应用于行业研究中。从政治(Political)、经济(Economic)、社会(Social)、技术(Technical),简称PEST角度对一个行业进行比较分析。下面我们举一个例子:我们小讲开始就谈到数据分析行业前景,那么我们在此利用PEST分析下大数据行业前景如何?



(2)5W2H分析法
这个方法主要应用于用户行为研究和专项问题分析,从时间、地点、人物、事情、原因、方式、价格等7个方面对一个问题进行刻画研究。请看如下案例二:





(3)4P营销理论
这个方法主要应用于公司整体经营状况分析,是比较经典的营销分析方法。该方法从产品、价格、渠道、促销等四方面对企业经营状况进行全面分析。请看如下案例三:





(4)逻辑树分析法
这个方法也称作问题树分析方法,主要应用于针对业务存在的问题进行专题分析,是数据分析方法中非常常见的一种分析方法。请看案例四:





(5)指标拆分法
这个方法也是经常适用的方法,特别是为了达成业务目标,我们往往都会先定一个总的目标,然后再初步的拆解指标。下面我们讲讲案例五:



(6)对比分析法
对比分析法是非常常用的基础分析方法,虽然方法特别简单,但几乎所有的分析报告中,都会采取对比分析方法。比如去年同期相比、上个月环比、目标和实际达成相比、各个部门和业务线相比、行业内竞品比较、营销效果对比,等等。这里需要注意的是我们不管是横向比较还是纵向比较,比较的双方一定要有可比性,并且在同一个维度、粒度上去比较,要不是毫无意义的。
(7)漏斗分析法
漏斗分析方法经常应用于产品的转化分析。举个电商的例子:用户登录网站1千万,浏览商品详情页200万,加入购物车80万,下单支付50万,支付成功40万。每一步都是转化率的问题。针对关键路径进行漏斗分析能够帮助我们快速的定位到问题所在。从而能够及时做出决策。
(8)用户行为理论
也称用户的活动周期理论。该分析方法,往往用于对用户的基础研究中。用户行为过程分为认知、熟悉、试用、使用和忠诚5个步骤。
(9)用户生命周期理论
该分析方法,也往往用于用户基础研究中,在互联网领域应用广泛。用户的生命周期分为进入期、成长期、成熟期、衰退期、流失期。每一个阶段用户的行为特征是不一样的,其价值是不一样的,需要精细化的运营。不可急功近利。
(10)金字塔理论
金字塔这个分析方法正好和漏斗分析方法相反,它是基数大,上层小。最初是英国历史学家、政治学家诺斯科特·帕金森(C.Northcote Parkinson)在《帕金森定律》(Parkinson's Law)一书中,论述在行政管理中,行政机构会像金字塔一样不断增多,行政人员不断膨胀,每个人都很忙,但组织效率越来越低下。这条定律又被称为“金字塔上升”现象。后来,人们将这一理论延伸应用,不再只限于本意。大凡是基数大,上层小,符合金字塔特征的研究分析都可以套用到该理论中。所以,金字塔这幅图也常常见于各分析报告中。比如,分析用户群体特征(马斯洛需求层次模型、用户价值模型等等)
综上所述种种数据分析方法,如果在一份分析报告中,能够把这些分析方法都灵活反复体现和应用,那么,这个分析报告一定会比较丰满的。


第三部分:数据分析的流程。
数据分析的流程主要分为六步骤,遵循这种方法,一个完整的数据分析项目就出来了。
(1)明确分析目的:我们接到一个分析任务,首先要弄清楚我们分析的对象是什么,要达成怎样的目的,不能陷于为了分析而分析。然后,要熟悉行业和业务,透彻的理解分析的目的,构建起分析的角度和体系。
(2)进行数据准备:我们有哪些数据,通过什么途径可以获取到需要的数据,往往涉及到内部数据和外部数据,内部数据常常是我们的业务库或者基础数据团队建立起来的数据仓库系统,外部数据方面,现在各行各业都有大数据交易源,还有大量的公开市场数据。
(3)进行数据加工处理:主要通过数据清洗工作,对重复值进行去重处理、对异常值错误值进行修正或剔除、对缺失值进行填充修正或删除。如果软件环境为支持大数据量情况下,还需要对数据进行抽样处理。经过这些预处理后,最重要的就是进行数据的计算统计、合并转换,让数据符合目标分析过程。
(4)进行数据分析挖掘:绝大部分的分析目标达成都可以刚才介绍的分析方法外加常见统计分析等达到。主要的分析:整体和组成分析、走势趋势分析、均值方差分析、排序TOP分析、同比环比纵横比较分析、频度频率分析、相关关系分析、数量和比例的双坐标分析、逻辑结构分析、金字塔分析、漏斗图分析、矩阵图分析、指标拆解分析、PEST分析、5W2H分析法、4P营销分析等等。还有一部分分析需要到更高级的数据分析方法才能得到结论,这一部分在第3章会详细介绍。
(5)进行数据结果图表展现:数据分析的目的就是要解决问题的,往往数据分析师不是需求的发起人,那么这就需要数据分析师把分析的数据和结论展现给需求方。最佳的方式就是通过图表,有理有据形象的重点突出且专业的表达出来。根据第(4)步骤的分析,我们可以选取恰当的图标。比如常用的有:折线图、柱形图、条形图、饼图、冒泡图、散点图、矩阵图、雷达图、双坐标图、瀑布图、帕累托图、金字塔图、漏斗图等等。
(6)写出分析报告:数据分析最终的结论全部体现在分析报告中,一个分析师水平如何,只要看他写过的一份分析报告就可以完全清楚了。综合灵活应用这么多的分析方法和各种各样的展示图表,分析报告一定会显得非常丰满。下面一个问题我们再详细和大家讨论数据分析报告的相关事情。


   以上就是我在日常工作当中的实践总结,比较少理论性的东西,更多的是可落地的非常具体的经验总结。本文是节选于小讲“数据分析师-从零入门到精通”的 “第二章 数据分析师的基本能力素质模型”的第2小节“2.数据分析方法论,流程和框架?(基础篇),经过整理后的文章。
  结尾附上完整的live( “数据分析师-从零入门到精通”)分享章节,整个分享的整体思路和框架如下:
在第一部分,谈谈数据分析的行业前景、数据分析的价值所在,以及数据分析师的日常岗位内容,目的其实就是传达一个信息给大家,数据分析这个职业前景非常的好,个人职业发展通道畅通,大量的就业岗位,工作内容想多浅就有多浅,想多深就有多深,正好适合于我们新入行者,从浅入手找到工作,在工作中进行深挖,逐步提升自己的数据分析技能。
在第二部分,我跟大家分享了数据分析师需要掌握哪些傍身技能,有技术上的,更有业务上的要求。目的就是让大家清楚,分析师要学习什么,要培养什么,行业中有哪些分析套路。帮助大家快速学习数据分析基本技能,培养数据分析思维,掌握数据分析的方法论和框架。
在第三部分,我跟大家分享了厉害的数据分析师的职业门槛在哪里,希望大家在日常的学习工作中,不断学习和追求,努力把自己提升到一个高度,建立起自己的职业壁垒和护城河。同时,我试图让大家了解到,真正厉害的数据分析师,一定是一个技术专家,更是一个业务专家,还同时也是一个战略家、谋略家。他是一个公司的神经中枢--大脑,是老板身边的参谋、智囊团。
在第四部分,主要跟大家分享数据分析师的个人成长、个人的职业规划,以及在选择公司和行业时候我们应该最关心哪些,而不仅仅是看薪资、看大机构,另外,也分享了一些应聘面试的技巧,让大家能够在招聘面试中,应付自如,战无不胜。同时,找到让自己薪资增长和职位晋升最快的方法途径,更重要的是让大家明白自己未来会成为怎样一个人,提前做好自己的职业生涯规划。


第一章 数据分析行业概况
1.什么是数据分析,其行业前景如何?转行做数据分析师值得吗?
2.数据分析岗位日常工作内容有哪些?为啥数据分析最适合女生、新入行者、初学者?
3.数据分析的价值在哪里?
第二章 数据分析师的基本能力素质模型
1.数据分析师需要具备哪些能力和基本素质?
2.数据分析方法论,流程和框架?(基础篇)
3.如何写出一份优秀的分析报告?如何解读分析报告中的数据?
4.案例应用:如何构建互联网数据分析体系?
第三章 数据分析师的进阶之道:走向巅峰
1.牛X的分析师和普通的分析师差别在哪里?如何让自己成为一个得到老板赏识的牛X的分析师?
2.数据分析方法论,流程和框架?(高阶篇)
3.牛X的分析师需要精通哪些模型和算法?精通掌握哪些常用领域?
4.牛X的分析师除了掌握技术和业务外,还需要具备哪些嗅觉?
5.成为大数据科学家?
第四章 数据分析师的职业生涯规划
1.数据分析师的职业发展通道是怎样的,如何做好自己的职业生涯规划?
2.如何有节奏的实现薪资的培增?
3.选择一个好的公司和行业,成为时代的弄潮儿?
4.做好简历,成为一个Offer收割机?
结语:赠送自学指南
在校生、初学者如何自学数据分析?


欢迎大家拍砖指正,欢迎大家关注我的社区专栏“大数据实践与职业生涯”并留言,专栏会陆续的推出过往十多年的大数据工作经验总结和我的一些研究实践成果。如果你是大数据新人,或者想转行进入大数据领域,或者职业生涯上存在一些疑惑,都欢迎关注我的社区live分享“大数据人的职业生涯规划” 和 “数据分析师-从零入门到精通”。
5#
热心回应  16级独孤 | 2019-8-14 01:09:10 发帖IP地址来自
经常有人说,我不是专业的数据分析师,但工作中常常需要分析数据才能推进业务,有没有一种简单粗暴的方式可以让我快速上手数据分析呢?

【有啊老铁!】


一、 数据分析目标:以量化方式来分析业务问题


现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。所以,我们做数据分析是为了能以量化的方式来分析业务问题,并得出结论。其中有两个重点词语:量化业务


1、量化


量化是为了统一认知,并且确保路径可回溯、可复制。 统一认知后,才能保证不同层级、不同部门的人在平等话语权和同一个方向上进行讨论和协作,才能避免公司内的人以“我感觉”、“我猜测”来判断当前业务的情况。


例如,这个产品功能上线后效果怎么样?A方案和B方案哪个更好些呢?诸如此类的问题,都牵涉到一个“标准”的问题,如果标准是这个功能必须有200人以上使用,那只有100人使用都不叫效果好。只有给出真实、可靠、客观的事实数据,才能对具体的活动作出最真实的评判。


2、业务


只有解决业务问题分析才能创造价值。价值包括个人价值和公司价值。对于公司来讲,解决业务问题可以提高收益或者降低成本;对于个人来讲,知道怎么利用数据解决业务问题,对个人的能力成长和职业生涯都有非常大的帮助。


二、一切数据分析的核心是:分析方法


在之前发布的《科普 | 说说商业数据分析师的7类岗位及基本技能》一文中提到,数据分析是基于商业目的,收集、整理、加工和分析数据,提炼有价值信息,并指导实践的过程。


在实际应用中,数据分析可帮助人们作出判断,以便采取适当行动。但数据本身其实并没有任何价值,是分析方法的存在使得原本毫无价值的数据大放异彩。数据分析的三大作用,主要是现状分析、原因分析和预测分析。


三、数据分析的重要基础:指标体系


1、数据分析的第一步就是建立指标体系


那什么是指标呢?假设隔壁老王开了一家水果铺子,你问他每天生意怎么样,他可以回答卖的“不错,很好”、“最近不景气”。这些都是很虚的词,因为他认为卖的不错也许是卖了50个,而你认为的卖的不错,是卖了100。老王想要描述生意,他应该使用销量,这就是他的指标。


互联网想要描述产品,也应该使用活跃率、使用率、转化率等指标。


在建立指标体系的过程中,我们知道孤立的指标发挥不出数据的价值,和分析思维的金字塔结构一样,指标也有固有结构,呈现树状。


我们在考虑问题的时候都会遵循一个思路,例如从宏观到微观,从全局到局部,数据分析也不例外。例如产品运营中的数据分析指标体系:









需要注意的是,指标体系没有放之四海而皆准的模板,不同业务形态有不同的指标体系。移动APP和网站不一样,SaaS和电子商务不一样,低频消费和高频消费不一样。好比一款婚庆相关的APP,不需要考虑复购率指标;互联网金融,必须要风控指标;昨日突破了2135亿成交额的天猫双十一,它属于电子商务,所以卖家和买家的指标也各不一样。这些需要不同行业经验和业务知识去学习掌握。


2、不是所有的指标都是好的。


美国硅谷增长黑客专家曲卉提出了产品的“北极星”指标。定义北极星指标有6个标准:


①这个指标可以让你知道你的用户体验到了产品的核心价值吗?
②这个指标能够反映用户的活跃程度吗?
③如果这个指标变好了,是不是说明整个公司是在向好的方向发展?
④这个指标是不是很容易被整个团队理解和交流呢?
⑤这个指标是一个先导指标,还是一个滞后指标?
⑥这个指标是不是一个可操作的指标?


北极星指标和公司发展相关联,是公司在一个阶段内的重点方向。记住是一个阶段,不同时期的北极星指标不一样不同业务的北极星指标也不一样


互联网公司在产品1.0期间,我们应把注意力放到打磨产品上,在推广前提高产品质量,这时留存率是一个北极星指标;在发展阶段,北极星指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度;而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。


四、如何保证数据分析全面性:维度分析法


确定了数据分析的核心目标,就可以着手进行分析了。数据分析大体可以分三类:


①利用维度分析数据;
②使用统计学知识如数据分布假设检验;
③使用机器学习。
(今天主要展开讲述第一类。)


1、第一类:利用维度分析数据。


利用维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性。具体的思路为:





维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。


当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个数据立方体。


例如,在做产品运营的数据分析时,我们可以按照以下思路来进行:
我们以天猫店铺利润情况进行分析,店铺运营最关注的就是营业额,但最本质的还是盈利情况,按照上面提到的思路进行分析:



①数据分析目标:店铺的利润情况分析


②确定数据目标的关键影响维度拆解:









③找出不同维度之间的关联关系从而建立起数据分析模型:
利润=销售额-成本=流量*转化率*客单价-(店铺固定成本+运营成本+货品成本+人员成本)


④根据数据模型发现问题数据:
要想实现店铺利润(L)额最大化:
L(max)=R(max)-C(min)
如果店铺出现亏损,那么一定是R<C,也就是成本大于收入,我们假设出现以下情况:









根据上述的假设思路,我们可以得出,在成本合理的情况下,店铺出现了亏损,那么可以得出是销售额太低,销售额不高额影响原因是流量转化率低。因此针对这种情况我们要做的就是提高店铺的转化率。


⑤针对问题数据影响维度做相应的优化:提升转化率
我们可以通过以下几个方面来提高转化率:
  • 提升产品包装
  • 优化详情页图片和介绍文案
  • 优化消费者下单支付路径和体验
  • 提升客服服务水平和促单技巧
  • 做好用户评价管理优化
  • 实行相应的促销策略,如满减、满赠、折扣等
  • ……
说到维度法,我们知道单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。在此,我想强调的一个分析的核心思维:对比


做不同维度的对比大概是新人快速提高分析能力的捷径之一。比如,过去和现在的时间趋势对比、不同地区维度的对比、产品类型的区别对比、不同用户的群体对比等。


因此,做数据分析,要更多地关注多个数据维度之间的相关关系,而不是单个数据产生的因果关系!通过影响关键指标的数据维度间的关联关系,建立数据分析模型。


我们以公众号运营为例,公众号运营的关键指标是粉丝数和文章阅读量,而粉丝数和文章阅读量的影响维度有很多个。这些维度之间也存在相应的影响关系,具体如下:







在做公众号运营的时候,可以尝试着把你影响文章阅读量的所有数据全部梳理出来,然后去筛选出相对有用的一些数据维度,然后建立起他们的相关关系。



在实际运营过程中,很多运营的小伙伴每周只关注推送了多少篇文章,增长了多少个粉丝,其实还应该关注一些细节数据,比如文章标题、内容长度、内容类型跟阅读量、转发量的关系,推送时间和频次对阅读量和粉丝增减的影响,另外就是有图文、纯文字、文章图片数量、公众号单图文推送、多图文推送、头条推送和非头条推送对阅读量的影响等,这些都是需要在运营过程中需要考虑的,并且要养成对这些数据进行记录的习惯。


在社区运营过程中最基本的模型就是用户的金字塔模型了,这个金字塔模型的建立是依据用户的活跃度和贡献值来建立的,金字塔模型会将用户分成几个层级,层级越往上用户的价值越大,贡献值越高。当然这个用户金字塔模型的建立一定不是固定的,而是根据具体的社区数据情况会在层级划分和每个层级占比上都会有所不同,并且每个层级的具体需求和运营方式都是不同的。比如以某K12教育社区的运营为例:







社区发帖量这一核心数据指标提升,是与整个社区的用户量,用户层级比例,用户层级转化,每个层级用户行为,用户粘性,社区内容质量, 内容展示与推送情况等都存在一定的相关关系。所以在社区的运营过程中就要不断的促进各个影响维度与社区发帖量的正向关系,那么社区发帖量与其他数据维度的关联关系如何建立呢?我们尝试着做了一个简单的梳理,相应的数据维度并未全部包含,此关系图仍需完善,此处只是给出一种梳理思路,具体如下:







2、第二类:使用统计学知识如数据分布假设检验。


使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现,具体思路:







3、第三类:使用机器学习。


五、日常数据分析中需要避开的坑


1、控制变量
在做 A/B 测试时没有控制好变量,导致测试结果不能反映实验结果。或者在进行数据对比时,两个指标没有可比性。


2、样本
在做抽样分析时,选取的样本不够随机或不够有代表性。举例来讲,互联网圈的人会发现身边的人几乎不用「今日头条」,为什么这 APP 还能有这么大浏览量?有个类似的概念,叫幸存者偏差。


3、定义
在看某些报告或者公开数据时,经常会有人鱼目混珠。「网站访问量过亿」,是指的访问用户数还是访问页面数?


4、比率
比率型或比例型的指标出现的谬误以至于可以单独拎出来将。一个是每次谈论此类型指标时,都需要明确分子和分母是什么。另一方面,在讨论变化的百分比时,需要注意到基数是多少。有些人即使工资只涨10% ,那也可能是150万…


5、因果相关
会误把相关当因果,忽略中介变量。比如,有人发现雪糕的销量和河溪溺死的儿童数量呈明显相关,就下令削减雪糕销量。其实可能只是因为这两者都是发生在天气炎热的夏天。天气炎热,购买雪糕的人就越多,而去河里游泳的人也显著增多。


6.辛普森悖论
简单来说,就是在两个相差较多的分组数据相加时,在分组比较中都占优势的一方,会在总评中反而是失势的一方。


六、要点复习


1.还记得“如果你不能衡量它,那么你就不能有效增长它”这句话吗?我们做数据分析是为了能以量化的方式来分析业务问题。其中有两个重点词语:量化和业务;


2.数据本身并没有任何价值,而一切数据分析的核心是分析方法。数据分析的三大作用,主要是现状分析、原因分析和预测分析;


3.数据分析的第一步就是建立指标体系,但是不是所有的指标都是好的,我们需要找到产品的“北极星”指标。除此之外,不同时期的北极星指标不一样,不同业务的北极星指标也不一样;


4.数据分析大体可以分三类:利用维度分析数据、使用统计学知识如数据分布假设检验、使用机器学习;


5.维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性;使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现。





6#
热心回应  16级独孤 | 2019-8-14 01:09:11 发帖IP地址来自
讲数据分析的书很多,但是如果你想实战的话会觉得大部分书的内容都是隔靴搔痒,学不到具体怎么做
这是为什么呢?因为他们根本不会分析数据,只会讲课而已。当然不排除有些人会做,写书只是为了捞钱做广告,并不打算给干货。
数据分析怎么做?我给一个万能的套路
梳理业务--建立业务模型--匹配数据--建立数学模型(如果需要的话)-各种方法论和手段--得出结果。
发现没有,各种教你做数据分析的书都在讲后面两步,前面的根本不给你讲
要分析数据,先分析业务。若是做宏观分析,就要知道一个事情在宏观上是怎么运行的,要是做具体的案例分析,就得知道这个案例的环境和自身情况。这些事情应该在看数据之前就一清二楚,而不是通过数据来反推实际情况。
在分析师当中有一句经典的忽悠叫“数据会骗人”,什么意思呢,就是说你看到的数据跟实际情况是不一样的,根据数据来判断实际情况可能是不对的。但是这句话其实只是推脱责任,这帮人不接地气不实际深入业务,拿着数据凭空想象一些场景,当然会错漏百出啦。最后还要把问题推到数据上,好像是数据骗了他们而不是他们又懒又蠢。


具体应该怎么来做一个全套数据分析呢?举个例子
我们招分析师面试有一个经典的题目:如果我们是12306,怎么通过数据分析识别黄牛?
有很多分析师一上来就pv,uv,购票频次balabala一顿分析,有的人还有各种高大上的方法论,这种人直接就淘汰了,没有下一轮面试了。实际上他们也是(将)会被数据骗的人。
正确的套路应该是分析正常购票乘车的流程,黄牛购票卖票的流程,买黄牛票购票乘车的流程,然后建立一个正常购票和黄牛购票的业务差异的模型,然后把数据放上去,然后根据实际情况选取分析角度和手段(在此背后体现你的方法论),最后得出结论。
下面我们来做一个示范
首先正常的购票乘车流程,查票--买票(下订单)--付款--取票--进站(首次验票,验身份证)--乘车(可能有二次验票,验身份证)--出站(可能有三次验票)
黄牛的购票卖票流程,查票--买票--对接买票人--卖票(关键点)
买黄牛票乘车的流程,对接黄牛--买黄牛票--取票--后续进站乘车跟正常购票一样
那么问题来了,由于现在火车票跟身份证是绑定的,黄牛怎么卖票给别人呢?据我所知一般来说有两种手段,一种是把身份证和票给买票人,让他混进站,然后把身份证找人带出来,但是这样有可能造成二次验票的时候无法通过;还有一种是黄牛当场退票,让买票人当场上12306抢票。
以上述业务模型为基础,把虚拟的12306的各项数据附上去,就会发现应该选取购票频次和退票频次为突破口。
以此为基础,如果有必要的话建个数学模型,剩下的事情各种书上就都有讲了。
由于我不是很熟悉铁路情况,所以上述场景只是模拟一下,真实情况未必如此。在实际业务中,为了确认具体业务情况,各种调研访谈问卷和直接参与业务等等手段都是有用到的。
整个数据分析,最基础的是建模型,模型建起来以后,该用什么手段就很清晰了。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:182358
帖子:1746
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP