什么样的思维才是数据分析工作者应该具备的入门思维?文章为你解析。
随着企业中的大数据采集技术、存储技术的日益增强,沉淀下来的大数据急需唤醒潜在的价值,从传统BI(Business Intelligence)到现在的大数据分析,企业对数据分析人才的需求也从单纯的数据交叉多维度分析,配置可视化报表提升到了另外一个阶段。
那么,数据分析工作者在人工智能时代该具备怎样的思维才算真正的入门了呢?本文会带给大家一个全新的角度阐释什么样的思维才是数据分析工作者应该具备的入门思维。无论你的职责是分析企业内部数据的分析师,还是设计大数据分析产品的产品经理希望本文对你有所启发。
数据分析的四种模式
首先我们回顾一下被普遍接受的数据分析的四个模式:
第一个方式:描述性分析(Descriptive Analytics),即将已经发生事实用数据表述出来。
第二个方式:诊断性分析(Diagnostic Analytics),即回答为什么会发生,通常使用数据钻取的手段就可实现。
第三个方式: 预测性分析(Predictive Analytics),即通过历史数据对未来的趋势进行预测。这个阶段会引入一些高级算法。
第四个方式:决策建议性分析(Prescriptive Analytics),即通过分析可能影响行为结果的动态指标(或行为)并将指标和结果的关联关系进行量化,从而给出对结果产生最重要影响的指标,以及对应每个指标对结果产生不同影响程度的描述。有了以上这些分析,决策者可以将数据驱动决策真正落地。
尽管很多文章将这四个模式分为四个阶段逐层深入,笔者认为在很多场景中的数据分析并不应该将这四种方式按分析的深入程度区分,或者说它们不应该被赋予不同的价值标签。
例如在很多场景中,描述性分析就完全可以以最低的成本快速解决用户的需求,并不需要引入复杂的算法,用户就可以得出结论或指导他的决策了。
相反,如果引入了高级算法,进行了预测性分析或决策建议性分析往往在投入和汇报比方面对于终端用户来讲会很低,毕竟,任何一种数据分析绝不是分析而已,不要忽略了从数据采集、清洗、存储,必要时候还要进入高级算法建立模型这些不同阶段消耗的是企业的人力和财力。因此我们要放平心态,用效率最高的方式解决问题即可,切不可盲目追求低投入产出比的方案。
什么是“Back & Forth”思维模式
之所以称为思维模式,是相比于分析模式更抽象一层的思考逻辑。“Back & Forth”正是基于四种分析模式的一种大数据产品设计、规划以及分析的思维方式,如果将四种分析模式比喻成工具,那么“Back & Forth””就是一种可以将工具发挥到极致的思维逻辑。毕竟,有了工具还不够,还要学会怎么使用,在什么情况下使用才能将数据分析方法论应用到各种不同场景中。
其实这种思维模式在很早以前就存在,只不过被广泛引用在书面报告、年终总结中,被视为一种“讨人喜欢”的语言和信息的组织和表达方式,“Back & Forth”思维模式通常具有两大特征:
一、Back,即倒退一步总结,不要停留在事情的表面,从感性认知上升到规律性的总结,总结经验和方法论。
二、Forth往前多迈一步,给出行动指南或具体方案。
这种语言和信息的组织表达方式即使不应用在数据分析方面,用在和领导的汇报和年终总结上,也一样会让你脱颖而出,让领导印象深刻。因为Back意味着补充新的知识、总结新的经验、提供新的视角、揭示新的问题,往往这样的信息带给人的是一种礼物,甚至是惊喜,是一种信息加工后的结果。而Forth就更容易理解了,领导希望看到的是你给出行动建议,而不是提出问题,给别人挑毛病不难,但是给出行动建议才是对方真正需要的。
举个使用到“Back”的例子,在写年终总结的时候:
未使用“Back & Forth”思维
使用了“Back & Forth”思维
显然如果你是领导,你更喜欢听到的是后者的汇报,前面的汇报更像是讲述一个流水账而已。
再举一个使用到“Forth”的例子,同样是年终总结:
未使用“Back & Forth”思维
使用了“Back & Forth”思维
“Back & Forth”思维模式如何应用在大数据分析中
说到这,你应该对这种思维模式有了基本的了解,接下来就分享下怎么在大数据分析或数据分析类产品设计中使用这种思维了,应用在教育行业中举例:
分析某学校的学术能力时,传统的BI思维会这样设计分析主题:
用户看到这些BI图表的分析后应该是懵逼的状态。
原因很显然,传统BI思维,显然没有为用户说明。
发生了什么,是否有规律可循,这些数据如果都是重点,我到底关注哪些数据?
给我看这些的目的是什么?我需要怎么改变现状来提高我学校的学术能力?
而通过应用”Back & Forth”思维,可以为用户这样设计大数据产品:
Back,即倒退一步总结,不要停留在事情的表面,从感性认知上升到规律性的总结,总结经验和方法论。我们可以这样设计:
1、提供科研经费使用和论文和专著成果物数量的双折线图:
价值凸显:那些科研经费花费高,但是科学成果却很少的学科团队。也可以帮助用户找到每年不同学科科研经费的投入产出效率。指导来年的不同学科科研经费投入分配比例。
2、通过分析近三年学校论文发表数量趋势并和同类院校进行比对
价值凸显:学校的学术能力跟竞争院校比是有缩窄差距的趋势还是拉大差距的趋势,通过该图凸显最近几年的学术活跃度规律和竞争走势。
Forth, 往前多迈一步,给出行动指南或具体方案。
1、一针见血的告知用户:通过近些年的历史数据分析,预测明年的学术地位可能上升或者可能下降,预测明年的论文发表趋势。
2、通过多维数据的引入(内部数据、外部数据),分析近三年学校在业界的学术及影响力排名走势,总结出影响排名走势的最重要因素(提供下面答案中的某一个):资金投入,外部知名教授引入,国家重点实验室的建设,教育科研人员的增多,并将不同的因素可能带来的影响力进行排序,即告知用户在不同因素上的投入可能会带来效果程度上的不同。
价值凸显:帮助学校找到影响学校学术地位的最重要因素。进而进行重点关注和资源投入。
这里给出的例子只是设计方案中的一种,只要沿着这种思路继续剖析不同场景下的客户需求,你总会找出用户最关注的点,从而给出产品设计上或者分析方向上的解决方案。
在数据分析中常见的一些业务模型:
由于“Back & Forth” 思维模式是注定要为客户解决复杂问题而产生的,景下是需要搭配业务分析模型使用的,因此我在这里举了四种常用的业务模型供大家参考:
最后,无论你是产品经理,咨询顾问,数据分析师还是任何一个跟产品设计和数据分析有关的职业,在应用“Back & Forth”思维之前要首先梳理用户的关键业务,了解用户的关键业务痛点,关键业务对用户的影响以及关键业务的行业及历史背景,因为这些是一切数据分析和产品设计的前提,脱离了行业背景和用户需求,凭空捏造出的任何假设都是不成立的。
其实数据分析和写年终总结给领导汇报是一个道理,没有领导希望听到的是“假大空”、流水账、心灵鸡汤,只有经过了充分的需求分析,了解用户想要什么样的分析结果,才能做出好的产品。