新闻中心
入门学习—数据分析(基础)(数据分析快速入门)
很久前,读过小蚊子的《谁说菜鸟不会数据分析》,后来就爱不释手反复翻看,鉴于总容易忘记里面的一些关键点,后来就自己将主体内容整理成了思维导图。最近想要把这个主体内容,结合自己的一些实际经验,整合一下发出来,来记录自己的学习,同时供大家指正参考。
CH1-入门基础
这里没有前言,所以数据分析的种种历史不谈,有兴趣去看看任意一本数据分析书籍,都有介绍。
一、数据分析的作用
也可以说是数据分析的分类,数据分析师的日常工作,都是围绕这3类展开的。
1、 现状分析
(1) 说明:通过各个经营指标的完成情况来衡量企业的运营状况,了解企业各项业务的发展即变动情况,对企业运营状况有更深入的了解。
(2) 展现方式:日常报告(日报、周报、月报等)
2、 原因分析
(1) 说明:了解运营情况具体好在哪里,坏在哪里,是什么原因导致的
(2) 展现方式:专题分析(针对某一现状展开)
3、 预测分析
(1) 说明:了解现状和原因后,需要对企业未来发展趋势作出预测,为制定运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展
(2) 展现方式:专题分析(制定企业季度、年度等计划时)
二、数据分析步骤
(同理,绝大部分的数据分析书籍的chapter1也都有介绍过数据分析的步骤)

1、 明确需求
(1) 确定分析目的
有句千古名言:
不要为了分析而分析!
不要为了分析而分析!!
不要为了分析而分析!!!
明确本次分析工作的目的,比如单量下降,那你首先应该去了解单量下降的原因,则找到单量下降的原因应该是你的主目的,解决了主目的,你才能进一步去分析如何提高单量。若一提到单量下降,你就首先想到要将提高单量作为主目的,那你的工作一开始可能就会遇到问题。其次,无目的或者目的模糊不清,那你接下来做的一系列工作都是没有意义的。
很多时候,目的并不能那么容易明确,在这里,分享一些经验给你大家:
懵逼1:问题描述的模糊不清
实际工作中经常会遇到这种情况,你压根不知道如何下手,或者迷迷糊糊地做完了分析,最后被骂:“要你有何用?”这些都是因为你自己没有get到问题重心。
这时候,你要在心里要按照“起因→现状→需求”来快速梳理出问题,循循善诱的了解业务的前因后果,最后你还必须总结性地问对方:“你们本来是这样的……(描述起因),但现在变成这样了……(描述现状),所以你们想要这样……(描述需求),对吗?”。这样,在不断的需求交流中,你帮对方清楚描述了问题,同时自己也能快速get到目的。
这种情况,不仅仅可以用在同对方面对面、聊天软件交流,同样在收到领导的需求邮件时也适用,只不过需要注意措辞。这种做法一箭双雕,即可以向领导表现出你认真负责的工作态度,同时也有助于你get到分析目的。
懵逼2:压根不告诉你出了什么问题
你认为你做的日常报表,分析目的是什么?还是你认为它们就仅仅是每天跑跑数,跑完发邮件就结束了?那些时常找你要各种数据的部门,你知道他们要这个数据来干嘛吗?
日常报表是为了满足某些需求目的而搭建的。了解每一份报表的目的,可以剔除掉不必要的报表,可以帮助你在需要的时候调整报表,可以及时监控到异常指标。所以,不要只是每天跑跑数就结束了,你不要只做个表哥表姐。
另外,某些部门经常会找你要数据,可能是一份数据文件,只需要你下载帮忙整理好就行,也可能只是是一个数据结果。不管他们要什么,你都得询问清楚发生了什么,他们为什么需要,你可以做什么。比如,他们只是做PPT需要某个数据,那你了解清楚后给他们就是,但有时候他们可能是业务出了某些问题,你了解后,可以帮他们梳理一下问题,在你不忙的时候是可以顺带帮他们解决问题的,这是我理解的“数据驱动”和“个人驱动”。如果你只是想做个表哥表姐,那他们要什么你就给什么吧。
(2) 确定分析思路
确定分析思路,是为了梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,最后还要确保分析框架的体系化。即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
分析思路,也叫分析方法论,即你要进行思考的方式,比如:5W2H、PEST、SWOT原则、逻辑树等。运用一种或几种思维方式,可以帮助你清晰的搭建思维导图。
2、 数据收集
确定好分析框架后,就需要根据你的框架,收集相关数据。数据通常分为两种:一手数据(主要指可直接获取的数据)和二手数据(主要指经过加工整理后得到的数据)。一般的数据来源主要有:数据库、公开出版物、互联网、市调。
大部分的数据需求,都可以通过企业自己的数据库获取,这是对大部分数据分析师而言最常见的来源。其次,我们可以通过国家统计局等来获取外围的数据,还有互联网上的数据(但可信度不高)。最后就是市场调查,因为市调耗时费用较高,一般而言,普通企业很少会采用,但专业性的咨询公司做的比较多,他们得到的数据,也有助于我们对整体的外围情况进行分析了解。
3、 数据处理
数据处理主要包括:数据清洗、转化、提取、计算等。通常,我们获取数据后,会先检查数据的时效性和完整性,其次才是进一步的处理。数据处理没有明确的步骤,但整个分析工作70%以上的时间都应该花费在此处。So,不进行检查处理的数据,对后续分析是没有意义的。
在做数据处理时,通常主要检查数据范围、格式、缺失值、异常值等,根据分析目的来判断如何处理。
4、 数据分析
这个过程,就是在用适当的分析方法和工具,对处理后的数据进行分析,提取有价值信息,形成有效结论的过程。
5、 数据展现
在展现结果时,一定要保证绝大部分人的理解是一致的(比如某个指标的定义)。通常,数据是通过表格和图形的方式来呈现。
大多情况下,人们更愿意接受图形这种数据展现方式,因为它能更加有效、直观地传递分析师要表达的观点。一般,能用图说明的问题就不要用表格,能用表格说明的就不要用文字。
6、 报告撰写
分析报告是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果完整地呈现出来,供决策者参考。
一份好的数据分析报告,需要有一个好的分析框架,并且图文并茂层次明晰;需要有明确的结论;一定要有建议或解决方案。
三、误区预警
数据分析有三大误区:
1、 分析目的不明确,为分析而分析
2、 缺乏业务知识,分析结果偏离实际
一切不以业务知识为基础的分析,都是“耍流氓”。
3、 一味追求实用高级分析方法,热衷研究模型
如果用Excel就能高效率解决的问题,为什么非要用其他软件或者其它高级的分析方法呢?比如,你要做1月的单量预测,新手童鞋会想到统计学里面的时间序列、线性回归等,这些虽然能预测,但其实有很多其它更有业务意义的计算方法。不要把数据分析想的太复杂,它其实很有趣,也不要一上来就想搞一个聚类分析,先把基础的工作做好,再加固深入自己的知识层次。
四、基本个人素质
数据分析师应该有基本的个人素质:
1、 态度严谨负责
有人会在做次月单量预测时随意估一个数据填上去,会偷懒不按指标定义的正确计算方式去计算数据,而只是用一些简单没有意义的方法是计算,想着反正他们也注意不到……
上述行为,都是不严谨负责的表现。别人不仔细计算也许发现不了,但作为一个数据分析师,丢失了起码的可信度,别人还会相信你的分析结果吗?So,我一直认为,作为一个数据从业者,你必须要严谨负责,要让别人觉得你很可靠可信,别人才能承认你的工作价值。
2、 好奇心强烈
好奇心虽然会害死猫,但工作上的好奇心害死不了你。实际工作中,每一项任务,都多问自己几个为什么:为什么我要用这个分析方法,为什么数据要这样处理,为什么他们要让我做这项任务……每一项工作都有它的起因,它落到你手中,你就需要尽自己的全力去了解,打破砂锅问到底,不仅利于你解决问题,也利于你的个人能力成长。
3、 逻辑思维清晰(字面意思)
4、 擅长模仿学习
模仿,不是抄作业,不是ctrl+c再ctrl+v,是要你去参考模仿别人的分析思路、方法、展现方式等等。没有绝对相同的分析,所以各自的分析框架、内容、结论等都不是完全相同的。
5、 善于创新
每次模仿别人的思路和方法后,要进行总结创新,最终目的是形成自己的风格。不要千篇一律,这个总论套话跟上一次又一样。看的人,已经看吐了。
五、常用指标术语
1、 平均数
平均数,一般指算术平均数,即一组数据全部累加后除以数据个数。
平均数代表总体的一般水平,但它很容易受到极值的影响。比如平均工资水平,常常听到大家吐槽被平均化了。你们小组的同事工资普遍在2w以内,而唯独你们小组组长薪资是10w,那么你们的平均工资算下来可能在2w+以上,但事实并不是这样。所以,为了避免受到极值的影响,在统计学中,我们时常用中位数来代替平均值。
2、 绝对数与相对数
(1) 绝对数
反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。如:5000万人、1亿元、100米。
(2) 相对数
由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。一般以倍数、成数、百分数等表示,反映了客观现象之间数量联系的程度。比如:20%、6倍、7成。
3、 百分比与百分点
(1) 百分比
相对数的一种,表示一个数是另一个数的百分之几,也称百分率或百分数。
(2) 百分点
不同时期以百分数的形式表示的相对指标的变动幅度,1百分点=1%。比如,公司今年的利润是45%,比去年的28%提高了17个百分点。
4、 频数与频率
(1) 频数
一组数据中个别数据重复出现的次数。
(2) 频率
每组类别次数与总次数的比值,代表某类别在总体中出现的频繁程度。
5、 比例与比率
(1) 比例
在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
(2) 比率
不同类别数值的对比,反映一个整体中各部分之间的关系。如男:女=2:1
6、 倍数与番数
(1) 倍数
一个数除以另一个数所得的商。倍数一般表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
(2) 番数
指原来数量的2的N次方倍。比如,翻一番为原来的2倍(2^1),翻两番为原来的4倍(2^2)
7、 同比与环比
(1) 同比
与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。比如,2010年12月与2009年12月相比
(2) 环比
指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。如,2010年12月与2010年11月相比
CH2-确定分析思路
(内容请详见往期内容:数据分析方法论与分析方法的论述)
CH3-理解数据
一、 字段与记录
1、 字段
事物或现象的某种特征,在统计学中称为变量。比如,数据中,第一行列名通常就叫做字段(变量)
2、 记录
事物或现象某种特征的具体表现,也称数据或变量值。比如,数据中,从第二行起往下,都叫做变量值
二、 数据类型
1、 日期型:用来表示日期时间的数据
2、 字符型:不具有计算能力的文字数据
3、 数值型:直接使用自然数或度量单位进行计量的数值数据
三、 数据表
1、 由标题行和数据组成
2、 第一行是表的列标题,即字段名,列标题不能重复
3、 第二行起是数据,数据的每一行称为一个记录,并且不允许出现空白行和空白列
4、 不能有合并单元格存在
5、 与其他数据之间应该留出至少一个空白行和一个空白列
6、 数据需要以一维形式存储
CH4-数据处理
一、 数据清洗
Step1:处理重复数据
1、 找出重复数据(Excel方法)
(1) 函数:countif(要计数的单元格范围,计算条件)
(2) 高级筛选:在Excel中“排序”和“筛选”组别中,点击“高级”
(3) 条件格式
(4) 数据透视表
2、 删除重复数据(Excel方法)
(1) 菜单操作:在“数据”选项卡中的“数据工具”组中,点击“删除重复项”
(2) 排序:利用函数countif(),计算出重复个数再排序删除
(3) 筛选:利用函数countif(),筛选计算出的个数,即数值>1的为重复值
Step2:处理缺失数据
若缺失值过多,说明数据收集过程存在着严重问题。可以接受的标准是:缺失值在10%以下。最常见的形式是空值或者错误标识符(如NA值)。
1、 产生原因
(1) 系统原因:由于数据收集或保存失败造成的数据缺失
(2) 人为原因:由于人的主观失误、历史局限或有意隐瞒造成的数据缺失
2、 找出缺失值(Excel方法)
(1) 定位:Ctrl+G或F5
(2) 查找替换
3、 处理缺失值
(1) 最典型做法:用该列变量的样本均值代替缺失值
(2) 替代法:用统计模型计算处理的值去代替缺失值。常用的模型有:回归模型、判别模型等,但需要借用专业数据分析软件
(3) 删除记录:将有缺失值的记录删除,但会导致样本量的减少,需要慎重
(4) 保留记录:将有缺失值的记录保留,仅在相应的分析中做必要的排除。当样本量较大,缺失值的数量不多,切变量间不存在高度相关,采用该法比较可行。
Step3:检查数据逻辑错误(Excel方法)
(1) 利用IF条件语句检查错误
(2) 利用条件格式标记错误
二、 数据加工
1、 数据抽取(Excel方法)
指保留源数据表中某些字段的部分信息,组合成一个新字段。
(1) 字段分列
函数法:left()、right()、mid()等
直接分列:在“数据”选项卡的“数据工具”组中,点击“分列”。
(在此介绍一种情况,有些时候日期型数据转变格式后仍计算有误,那么你可以尝试对日期列进行“分列”,分列后的日期可正常使用了)
(2) 字段合并:利用concatenate函数和“&”符号。其中合并某些数据需要用text()转变成文本
(3) 字段匹配:利用vlookup查找函数,也可以借助match+index等
2、 数据计算:(利用函数进行各种需求的计算)
3、 数据分组:利用vlookup()模糊查找
三、 数据抽样
1、 普查:指对总体中的对象一一进行观察、访问与记录,确定资料
2、 抽样调查:指从调查对象总体中按随机原则选取一部分对象作为样本进行调查分析
CH5-数据分析
一、 数据分析方法
1、 现状分析
(1) 对比分析
定义:指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。
分类:
a) 静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较,也称横向比较;
b) 动态比较:在同一总体条件下对不同时期指标数值的比较,也称为纵向比较.
实践运用:
a) 与目标对比:实际完成值与目标进行对比,属于横比
b) 不同时期对比:选择不同时期的指标数值作为对比标准,属于纵比
c) 同级部门、单位、地区对比:可了解自身某一方面或各方面的发展水平在公司、集团内部或各地区处于什么样的位置
d) 行业内对比:与行业中的标杆企业、竞争对手或行业的平均水平进行对比。可以了解自身某一方面的发展水平在行业内处于什么样的位置
e) 活动效果对比:对某项营销活动开展前后进行对比。可以分析营销活动开展得是否有效果,效果是否明显,还可以对企业投放广告的前后业务状况进行对比分析,了解投放的广告是否有效果,如品牌知名度是否提升,产品销量是否有大幅增长等
注意事项:
a) 指标的口径范围、计算方法、计算单位必须一致;
b) 对比的对象要有可比性。对比对象之间相似之处越多,越具有可比性;
c) 对比的指标类型必须一致.
(2) 平均分析
定义:运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。
主要作用:
a) 对比同类对象在不同地区、行业、类型单位等之间的差异程度,比用总量指标对比更具有说服力;
b) 对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律
常用指标:
算数平均数、调和平均数、几何平均数、众数和中位数等,最常用的是算数平均值。
总结:
平均分析法要结合各种分组和指标对比来进行。总之,对于所有数量指标都可以依据不同的分组用单位数来平均,进行对比与分析。
(3) 综合平均分析
定义:运用多个指标对多个参评单位进行评价的方法。基本思想是将多个指标转化成一个能够反映综合情况的指标来进行分析评价。
步骤:
Step1:确定综合评价指标体系,即包含哪些指标,是综合评价的基础和依据;
Step2:收集数据,并对不同计量单位的指标数据进行标准化处理;
Step3:确定指标体系中各指标的权重,以保证评价的科学性;
Step4:对经处理后的指标再进行汇总,计算出综合评价指数或综合评价分值;
Step5:根据评价指数或分值对参评单位进行排序,并由此得出结论.
注意:
a) 数据的标准化是将数据按比例缩放,使落入一个小的特定区间。最典型的就是0-1标准化和Z标准化;
b) 0-1标准化也叫离差标准化,是对原始数据作线性变换,使结果落到[0,1]区间,第N各经标准化处理的值=(第N各原始值-最小值)/(最大值-最小值);
c) 0-1标准化缺点:当有新数据加入时,可能导致最大值和最小值发生变换,需要重新计算.
特点:
a) 评价过程不是逐个指标顺次完成的,而是通过一些特殊方法将多个指标的平均同时完成;
b) 在综合评价过程中,一般要根据指标的重要性进行加权处理;
c) 评价结果不再是具有含义的统计指标,而是以指数或分值表示表示参评单位综合状况的排序.
权重确定方法:
a) 方法:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法等。这些方法都较为复杂,操作也相对困难。可采用目标优化矩阵,不仅量化准确,而且简单、方便、快捷;
b) 目标优化矩阵的原理:把人脑的模糊思维,简化为计算机的1/0式逻辑思维,最后得出量化的结果。它不仅可用于目标的优化,还可用于任何项目的排序;
c) 目标优化矩阵表的用法:将纵轴上的项目一次与横轴上的项目对比,由专家进行投票表决,如果纵轴上的项目比横轴上的项目重要,那么在两个项目相交的格子里填“1”,否则填“0”,最后将每行数字相加,根据合计的数值进行排序。
2、 原因分析
(1) 分组分析
定义:根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型,以揭示内在的联系和规律性。
目的:
便于对比。把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性。因此,分组法必须与对比法结合使用。
步骤:
Step1:确定组数。根据数据本身的大小来判断确定;
Step2:确定各组的组距。可根据公式来确定:组距=(最大值-最小值)/组数。也可进行不等距分组,取决于所分析对象的性质特点;
Step3:对数据分组整理。
(2) 结构分析
定义:指被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。结构相对指标(比例)=(总体某部分的数值/总体总量)*100%
经典应用:市场占有率。评价一个企业运营状况是否良好,不仅要了解客户数、收入等绝对值指标是否增长,还要了解其在行业中的比重是否维持稳定或者也在增长。
(3) 交叉分析
定义:通常用于分析两个变量之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值称为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系。
(4) 杜邦分析
定义:利用各主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。
特点:
a) 将若干个用以评价企业经营效率和财务状况的比率,按其内在联系结合起来,形成一个完整的指标体系,并最终通过权益收益率来综合反映;
b) 采用金字塔结构,使财务比率分析的层次更清晰、条理更突出,简明地表达了各财务指标之间的关系。
(5) 漏斗图分析
适合业务流程较规范、周期较长、各流程环节涉及复杂业务过程交多。漏斗图是对业务流程最直观的一种表现形式,并且也最能说明问题的存在。
漏斗图不仅能告诉我们用户在业务中的转化率和流失率,还可以告诉我们各种业务在网站中的受欢迎程度或重要程度。
(6) 矩阵关联分析
定义:根据事物的两个重要指标作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。
用法:
以属性A为横轴,属性B为纵轴,组成一个坐标系,在两坐标轴上分别按某一标准(可取平均值、经验值、行业水平等)进行刻度划分,构成四个象限,将要分析的每个事物对于投射到这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而分析每一个事物在这两个属性上的表现。
改进难易矩阵:
可以采用气泡图来绘制改良后的矩阵,如气泡面积的大小代表着改进程度的难易,为决策者提供决策依据与改进的顺序。
(7) 聚类分析
聚类分析是一种数据挖掘算法,大意是根据某些指标将数据对象分类,而我们能根据分类归纳出特点,再针对各个分类制定不同的运营策略。
比如游戏中,可以取相关指标数据,将玩家分大R、中R、小R、无付费等,但通常界定每个等级之前的界限是很难说的清楚的,常常是运营人员根据经验或者分布来确定,但如果采用聚类分析,就可以很快将玩家分类了,如果有新玩家,也可以采用判别分析,判断这个玩家可能是哪个级别的玩家。
3、 预测分析
(1) 回归分析
(2) 时间序列
(3) 决策树
(4) 神经网络
(*上述请参考统计学、数据挖掘等书籍,但刚入门的小白了解一下即可,后续再深入*)
二、 高级数据分析方法
1、 产品研究:相关分析、对比分析、判别分析、结合分析、多维度分析等
2、 品牌研究:相关分析、聚类分析、判别分析、因子分析、对应分析、多维度分析等
3、 价格研究:相关分析、PSM价格分析等
4、 市场细分:聚类分析、判别分析、因子分析、对应分析、多维尺度分析、Logistic回归、决策树等
5、 满意度研究:相关分析、回归分析、主成分分析、因为分析、结构方程等
6、 用户研究:相关分析、聚类分析、判别分析、因为分析、对应分析、Logistic回归、决策树、关联规则等
7、 预测决策:回归分析、决策树、神经网络、时间序列、Logistic回归等
CH6-数据可视化
一、 图表介绍
1、 图表的作用
(1) 表达形象化
(2) 突出重点
(3) 体现专业化
(*“电梯法则”:要让决策者在30秒内读懂你的数据)
2、 图表的选择
常见图表:表格、饼图、条形图、柱形图、折线图、散点图
3、 图表的制作
Step1:确定所要表达的主题或目的;
Step2:确定哪种图表最适合你的目的;
Step3:选择数据制作图表;
Step4:检查是否真实有效地展示数据;
Step5:检查是否能表达了你的观点.
二、 图表规范
1、 完整的图表
(1) 图表标题:介绍图表的主题及副标题
(2) 图例:不同项目的标识
(3) 单位:数据单位的说明
(4) 脚注:为图表中的某一元素进行说明
(5) 资料来源:赋予数据可信度
2、 基本规则
(1) 避免生出无意义的图表:图表贵精不贵多,决定作不作图的唯一标准是——能否帮助你有效表达信息;
(2) 不要把图表撑破:最好一个图表阐明一个主题;
(3) 只选对的,不选复杂的:图表简约;
(4) 一句话标题:切中图表的大意,让标题更有吸引力
3、 不真实的图表
(1) 虚张声势的增长:修改了纵坐标轴的刻度;
(2) 3D效果的伪装:3D角度可能会让读者无法看清相关坐标轴上的数据。若要使用,尽量薄一些;
(3) 逆序排列的误导;
(4) 一维图形的障眼法:如表达扩大2倍时,将图形拉大了,但宽和高都扩大了2倍,造成误解
三、 图表美化
1、 图表美化原则
(1) 简约:清晰明了,让人一看就明白
(2) 整洁:排版整齐,整洁自然
(3) 对比:指突出某些重要元素,帮助读者迅速抓住信息。对比原则在图表设计中,主要体现在字体(大小、粗细)、颜色(明暗、深浅)或者构图(分散、前后)等方面。
2、 图表美术技巧
(1) 最大化数据墨水比
图表中的每一滴墨水都要有存在的理由。尽量减少和弱化非数据元素,增强和突出数据元素。(数据元素:曲线、条形、扇形等代表的数据信息;非数据元素:网格线、坐标轴、填充色等跟原始数据无关的)
步骤:
Step1:去掉不必要的背景填充色
Step2:去掉无意义的颜色分类
Step3:去掉装饰性的渐变色
Step4:去掉网格线、边框
Step5:删掉不要的图例
Step6:去掉不要的坐标轴
Step7:去掉装饰性图片
Step8:以上不能去掉的元素尽量淡化
Step9:对需强调的数据元素进行突出标识
(2) 找出隐形的线
让图表中的每一个元素像被无形的线条贯穿在一起一样。最好的方法是找一条明确的线,并让它来对齐,使元素与元素之间存在着某种视觉纽带。
描绘图表的每一个元素时,都要特别注意它的位置,应该找出能够与之对齐的元素。切记不要一会居中一会右对齐,在图表上逮着空就添东西。
(3) 图表喜欢的数字格式
当添加的数据标签多,或坐标轴刻度很密集时,图表上会显示很多数字,排版时很容易就会显得非常拥挤和凌乱。此时,可以将数字格式调整成Arial字体,有英文也建议调整成Arial字体。
(4) 如何突出对比
最快捷的方式,就是改变颜色,利用对比色更能增强突出效果。还可以使用直线、箭头或者阴影等手法。
3、 图表的颜色
(1) 主色与配色
a) 红色:白色、黑色、蓝灰色、米色、灰色
b) 咖啡色:米色、鹅黄、砖红、蓝绿色、黑色
c) 黄色:紫色、蓝色、白色、咖啡色、黑色
d) 绿色:白色、米色、黑色、暗紫色、灰棕色
e) 蓝色:白色、粉蓝色、酱红色、金色、银色、橄榄绿、橙色、黄色
(2) 色彩
a) 色环:只有最基本的三种颜色:红、黄、绿。三原色两两混合,组合成了二次色,二次色再两两搭配,组成了三次色。
b) 相似色:是由一种色调及其相应地多种亮色和暗色组成,可用于表现类似、过滤的事物。给人感觉素雅、正式,但可能会导致:画面较平淡、对象间区分度不够。
c) 邻近色:指色环上相邻的颜色,可用于表现类似、过滤的事物。邻近色的色调同一和谐,能带给观众一种明显情感特征。
d) 对比色:指色环上相对的颜色。可用于突出主题、内容或表现不同类别等。最常用的对比色:深色与浅色(经典用色:黑白色)、亮色与暗色、冷色与暖色。
e) 冷暖色:冷色调,给人感觉是安静、冷酷、稳重;暖色调,给人感觉是热情、奔放、温暖。
(3) 慎用的颜色
a) 红色:代表禁止或危险,显示指标存在重大问题
b) 黄色:代表警告和提醒,显示指标存在潜在问题
c) 绿色:代表安全、正常,显示指标发育良好
CH7-数据报告
一、 认识报告
1、 含义
根据数据分析原理和方法,运用数据来反映、研究和分析某项树屋的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体
2、 写作原则
(1) 规范性:使用的名词术语一定要规范,标准统一,前后一致,要与业内公认的术语一致
(2) 重要性:要体现数据分析的重点,在各项数据分析中,应重点选取关键指标,科学专业地进行分析。针对统一类问题,其分析结果也应当按照问题重要性的高低来分级阐述。
(3) 谨慎性:编制过程要谨慎,基础数据必须真实、完整,分析过程必须科学、合理、全面,分析结果要可靠,内容实事求是。
(4) 创新性:报告需要适时引入新的研究模型或分析方法
3、 作用
(1) 展示分析结果
使决策者能迅速理解、分析、研究问题的基本情况、结论与建议等内容。
(2) 验证分析质量
通过对数据分析方法的描述对数据结果的处理与分析等几个方面来检验数据分析的质量,并让决策者感受到整个数据分析过程是科学且严谨的。
(3) 提供决策参考
4、 报告种类
(1) 专题分析报告
对社会经济现象的某一方面或某一问题进行专门研究的一种数据分析报告。它的作用是为决策者指定某项政策、解决某个问题提供决策参考和依据。
特点:
a) 单一性:不要求反映事物的全貌,主要针对某一方面或某一问题进行分析
b) 深入性:由于专题分析报告内容单一,重点突出,因此便于集中精力抓住主要问题进行深入分析
(2) 综合分析报告
全面评价一个地区、单位、部门业务或其他方面发展情况的一种数据分析报告。
特点:
a) 全面性:站在全局的高度,反映总体特征,做出总体评价,得出总体认识
b) 联系性:要把互相关联的一些现象、问题综合起来进行全面系统的分析
(3) 日常数据报告
以定期数据分析报表为依据,反映计划执行情况,并分析其影响和形成原因的一种数据分析报告。
特点:
a) 进度性:必须把计划执行的进度与时间的进展结合起来分析,观察比较两者是否一致,从而判断计划完成的好坏;
b) 规范性:反映计划执行的基本情况;分析完成或未完成的原因;总结计划执行中的成绩和经验,找出存在的问题;提出措施和建议
c) 时效性:时效性最强的一种分析报告。只有及时提供业务发展过程中的各种信息,才能帮助决策者掌握企业经营的主动权
5、报告常用软件
(1) Word
优点:(1)易于排版;(2)易打印装订成册
劣势:(1)缺乏交互性;(2)不适合演示汇报
适用范围:(1)综合分析报告;(2)专题分析报告;(3)日常数据通报
(2) Excel
优点:(1)可含有动态图表;(2)结果可实时更新;(3)交互性更强
劣势:不适合演示汇报
适用范围:日常数据通报
(3) PPT
优点:(1)可加入丰富的元素;(2)适合演示汇报;(3)增强展示效果
劣势: 不适合大篇文字
适用范围:(1)综合分析报告;(2)专题分析报告
二、 报告结构
1、 标题页
(1) 标题常用类型
a) 解释基本观点
常用观点句来表示,点明报告的基本观点,如《不可忽视高价值客户的保有》;
b) 概括主要内容
重在叙述数据反映的基本事实,概括分析报告的主要内容,让读者能抓住全文的中心,如《我司销售额比去年增长30%》
c) 交代分析主题
反映分析的对象、范围、时间、内容等情况,并不点明分析师的看法和主张,如《发展公司业务的途径》
d) 提出问题
以设问的方式提出报告所要分析的问题,引起读者的注意和思考,如《客户流失到哪里去了》
(2) 标题制作要求
a) 直接:必须用毫不含糊地表达观点,让读者一眼就能明白报告的基本精神
b) 确切:要准确地表现分析报告的内容和对象的特定
c) 简洁:用较少文字集中、准确、简洁地进行表达
(3) 标题的艺术性
力求新鲜活泼、独具特色,要抓住对象的特征展开联想,适当运用修辞手法给予突出和强调。另外,标题下方要注明报告的作者或所在部门名称,报告的日期。
2、 目录
在目录中列出报告主要章节名称。它相当于数据分析大纲,可以体现分析思路。但目录也不要太详细,会造成阅读困难。
3、 前言
a) 分析背景:主要是为了让读者对整个分析研究的背景有所了解。主要阐述此项分析的主要原因、分析的意义,以及其他相关信息,如行业发展现状等内容;
b) 分析目的:主要为了让读者了解开展此次分析能带来何种效果,可以解决什么问题;
c) 分析思路:用来指导如何进行一个完整的数据分析
4、 正文
(1) 报告最长的主体部分;
(2) 包含所有数据分析事实和观点;
(3) 通过数据图表和相关的文字结合分析;
(4) 正文各部分具有逻辑关系.
5、 结论与建议
(1) 结论:以数据分析结果为依据得出的分析结果,通常以综述性文字来说明,应措词严谨、准确、鲜明。
(2) 建议:根据数据分析结论对企业或业务等所面临的问题而提出的改进方法,主要关注在保持优势及改进劣势等方面。
6、 附录
(1) 提供正文中涉及而未于阐述的相关资料,有时也含有正文中提及的资料;
(2) 主要包括报告中涉及的专业名词解释、计算方法、重要原始数据、地图等。每个内容都需要编号,以备查询;
(3) 不要求每篇报告都有附录,根据情况决定是否添加附录
三、 注意事项
1、 结构合理,逻辑清晰
2、 实事求是,反映真相
3、 用词准确,避免含糊
4、 篇幅适宜,简洁有效
5、 结合业务,分析合理