新闻中心

超级菜鸟如何学数据分析?看大牛如何用最接地气的语言为你指路?(菜鸟数据分析师)

2023-04-26
浏览次数:
返回列表

数据本身是冰冷没有温度的,但是如果我们利用好它,通可视化图表将数据直观的表现出来,然后对其进行分析,就可以发现背后蕴藏的规律,并将付诸于后续的事情中去,从而对我们的行为有一定的指导意义。

但对于平常人来说,对于数据分析的概念似乎不太明晰,首先我们来看一下数据链图,他用比较接地气的语言来给我们解释了数据分析是怎么做的:

这里我们选取其中的选菜、做菜、摆盘来详细展开。

一、如何让选菜更加高效?(数据源获取)

关于数据源的获取,是一个互相促进的过程,有时候可以是人们主观的想要去搜集一些数据通过分析进而得出结论,另外一种方式可能是去浏览一些数据源的网站,这样反向给自己一些灵感,这个方法在自己“想法枯竭”时还是很好用的。

推荐题主可以去一下这个问题里去找找数据源,也许会给你一些启发和选题方向:

大家都是在哪些网站找数据?​

1、常用数据公开网站

UCI:该网站目前维护了436个经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集。

国家数据:数据来源中华人民共和国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面。

CEIC:涵盖超过195个国家400多万个时间序列的数据源,最完整的一套超过128个国家的经济数据,能够精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。

万得:被誉为中国的Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新非常快,据说很受国内的商业分析者和投资人的亲睐。

搜数网:已加载到搜数网站的统计资料达到7,874本,涵盖1,761,009张统计表格和364,580,479个统计数据,汇集了中国资讯行自92年以来收集的44个行业所有统计和调查数据。

中国统计信息网:国家统计局的官方网站,汇集了全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。

亚马逊:来自亚马逊的跨科学云数据平台,拥有免费且开源的数据库,包含化学、生物、经济等多个领域的数据集。

figshare:研究成果共享平台,这里向全世界开放免费的研究成果及科学数据。

github:一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全面,适合做研究和数据分析的人员。

这样一来,我们没有用到什么编程和复杂的操作也能高效的得到数据源。

二、研究菜谱让做菜更加轻松(研究模型为自己所用)

分析模型类似于菜谱的功能,初学者可以跟进菜谱的指引也能做出一道大菜来。这里介绍10个大数据分析模型,供大家思考和使用。

1、战略分析模型:ROS\RMS矩阵

ROS/RMS(Return Of Sales/Relative MarketShare)矩阵也称做销售回报和相对市场份额矩阵,主要是用来分析企业的不同业务单元或产品的发展战略。该分析模型定义,企业某个业务单元或产品在市场上的销售额应该与其在市场中的相对份额成正比,并且该业务单元或产品的销售额越高,该业务单元或产品为企业所提供的销售回报就应该越高。

数据分析人员根据上图,可了解企业的某种业务单元或产品的销售额在由低向高不断增加,其相对市场份额和销售回报也在一个“通道”内由低向高不断增加。如果该业务单元或产品的销售额增加,而其对企业的销售回报或相对市场份额降低,那么企业就不应该在这个时候进入其他领域,应该着重改善这个业务单元或产品的经营状况。

2、战略价值分析模型:价值链模型

为了提升企业战略,美国战略管理学家Porter第一次提出价值链分析的方法。企业的竞争优势来源于企业在设计、生产、营销、交货等过程及辅助过程中所进行的许多相互分离的活动,这些活动中的每一种都对企业的相对成本地位有所贡献,并奠定了企业竞争优势的基础。价值链模型将一个企业的行为分解为战略性相关的许多活动,企业正是通过比其竞争对手更廉价或更出色地开展这些重要的战略活动来赢得竞争优势的。

在数据分析中,价值链模型目的在于帮助企业分析公司运行的哪个环节可以提高客户价值或降低生产成本。

3、地位分析:三四矩阵

三四矩阵是由波士顿咨询集团提出的。这个模型用于分析一个成熟市场中企业的竞争地位。在一个稳定的竞争市场中,参与市场竞争的参与者一般分为三类,领先者、参与者、生存者。

打开凤凰新闻,查看更多高清图片

领先者一般是指市场占有率在15%以上,可以对市场变化产生重大影响的企业,如在价格、产量等方面;

参与者一般是指市场占有率介于5%~15%之间的企业,这些企业虽然不能对市场产生重大的影响,但是它们是市场竞争的有效参与者;

生存者一般是局部细分市场填补者,这些企业的市场份额都非常低,通常小于5%。

这个模型印证了中国彩电业几次降价后,各个企业的竞争态势的变化。在长虹第一次降价后,企业的成本和产量都得到收益,使它迅速成为市场占有率最大的企业,康佳和TCL则紧随其后。经过几次的降价后,企业已经不能再靠价格因素来扩大市场份额了,企业必须创造新的竞争优势。

4、战略规划模型:GE矩阵

GE矩阵法又称通用电器公司法、麦肯锡矩阵、九盒矩阵法、行业吸引力矩阵是美国通用电气公司(GE)于70年代开发了新的投资组合分析方法。对企业进行业务选择和定位具有重要的价值和意义。

数据分析师可通过该分析模型保证企业资源的合理配置,企业也可以尝试按照发展中业务和已发展业务的混合,与现金产生和现金使用的内在一致性来平衡业务。

5、业务或投资组合:波士顿分析矩阵

波士顿矩阵又称市场增长率-相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。在矩阵中,坐标轴的两个变量分别是业务单元所在市场的增长程度和所占据的市场份额。每个象限中的企业处于根本不同的现金流位置,并且应用不同的方式加以管理,这样就引申出公司如何寻求其总体业务组合。

通过波士顿矩阵进行数据分析,有助于对各公司的业务组合投资组合提供一些解释并能查企业各个业务单元的经营情况,如果同其他分析方法一起使用会产生非常有益的效果。

6、竞争战略选择:战略钟

“战略钟”是分析企业竞争战略选择的一种工具,这种模型为企业的管理人员和咨询顾问提供了思考竞争战略和取得竞争优势的方法。

7、受冲击战略调整:SCP分析模型

SCP(structure、conduct、performance)模型,分析在行业或者企业受到表面冲击时,可能的战略调整及行为变化。

SCP模型从对特定行业结构、企业行为和经营结果三个角度来分析外部冲击的影响。

外部冲击:主要指企业外部经济环境、政治、技术、文化变迁、消费习惯等因素的变化。

行业结构:主要是指外部各种环境的变化对企业所在行业可能的影响,包括行业竞争的变化、产品需求的变化、细分市场的的变化、营销模型的变化

企业行为:主要是指企业针对外部冲击和行业结构的变化所采取的措施,包括企业方面对相关业务单元的整合、业务的扩张与收缩、运营方式的转变、管理的变革等以一系列行动。

经营结果:主要是指在外部环境方面发生变化的情况下企业在经营利润、产品成本、市场份额等方面的变化趋势。

8、解析基本维度:ECIRM战略模型

ECIRM模型的构成包括了五个核心要素:一是E,代表企业家要素;二是C,代表资本要素;三是I,代表产业要素;四是R,代表资源要素;五是M,代表管理要素。五项要素共同耦合成为一个以企业家精神和企业家能力为核心的公司战略模型,构成从战略上系统解析一家企业的五个基本维度。

产业型公司和资本型公司呈现“顺时针”方向的成长路径,而资源型公司和管理型公司则呈现“逆时针”方向的成长路径。

9、外部环境采用战略:SPACE矩阵

SPACE矩阵有四个象限分别表示企业采取的进取、保守、防御和竞争四种战略模式。这个矩阵的两个数轴分别代表了企业的两个内部因素——财务优势(FS)和竞争优势(CA);两个外部因素——环境稳定性(ES)和产业优势(IS)。这四个因素对于企业的总体战略地位是最为重要的。

10、机会、优劣、挑战:SWOT模型

“SWOT”是Strength、Weakness、Opportunity、Threat四个英文单词的缩写,这个模型主要是通过分析企业内部和外部存在的优势和劣势、机会和挑战来概括企业内外部研究结果的一种方法。

S-优势:比较分析企业在外部市场环境、内部经营方面相对于其他竞争对手的优势;

W-劣势:比较分析企业在外部市场环境、内部经营方面相对于其他竞争对手的劣势;

O-机会:分析在目前的市场竞争态势下企业存在的发展机会;

T-挑战:分析在目前的市场竞争态势下企业存在的威胁和挑战。

优劣势分析主要是着眼于企业自身的实力及其与竞争对手的比较,而机会和威胁分析将注意力放在外部环境的变化及对企业的可能影响上。在分析时,应把所有的优势集中在一起,然后用外部的力量来对这些因素进行评估。

三、如何让摆盘更加高级?(可视化工具助力)

这一步是比较重要的一步,前面我说了对于题主而言前期不要太在意编程能力,因为市面上这种做数据可视化的工具有很多,只要可以利用好他们,同样可以做出好看的可视化图表,而且时间成本付出的相对较少。

1、亿信华辰豌豆BI

个人版完全免费,可以终生使用,非常适合不懂技术的人员,但是别小瞧他是免费版,功能可是一定都没有打折扣的。

支持基于列存储的MPP架构的分布式数据库进行敏捷分析,百亿数据可达到秒级响应,可解决TB甚至PB级超大数据量敏捷分析的难题。

智能化建模,一键导入数据,自动识别维度和指标,构建数仓模型;根据拖拽的指标和维度,识别最优的展现形式,所有图表无需任何设置即可联动,也可自定义选择部分图表参与联动和下钻。

除了Excel、TXT之类的文件,还可接入各类数据库,强大到跌破眼镜

2、一站式数据分析平台亿信ABI

面向技术人员,有大数据量的处理分析,大屏需求等,产品融合了ETL数据处理、数据建模、数据可视化、数据分析、数据填报、移动应用,功能全面且实用,灵活组合满足数据分析所有需求。

1、覆盖基础报表应用

复杂报表:支持各类报表应用,包含交叉报表、多级表头的中国式复杂报表、简历表等,可满足用户各式各样报表展现诉求。

图表分析:系统内置数百种图表组件,任意组合即可制作灵动直观的数据看板,辅助领导决策。

数据钻取:系统内置十余种的钻取方式,支持文本、报表、统计图、地图等各种数据元素上进行钻取和切片,通过数据指标的层层下钻,可帮助用户快速定位问题。

2、多元的数据可视化

领导驾驶舱:系统内置数百种图表组件,可直观展示和监测企业运营情况,为企业高层提供一站式决策支持。

大屏可视化:ABI提供多个大屏模板,内置300+酷炫可视化组件,拖拽即可应用,同时具备较高的开放性,允许用户自定义个性化业务大屏,创建你专属的大屏可视化效果。

3D可视化:结合全景3D建模和数据分析引擎,可建设智慧城市,3D设备管理等,实现端到端的数据可视化。

GIS地图应用:无缝对接多个GIS地图平台,可实现地理相关信息的综合数据分析和展现。

说了这么多还是需要勇敢的迈开第一步,数据分析没有你想象的那么高不可攀,千万不要被自己臆想出来的东西吓着了,多多看书,多多借助工具去动手实践才是最重要的,

搜索