新闻中心

数据分析|什么是数据分析?

2023-05-10
浏览次数:
返回列表

前言

突然觉得寒假摸鱼太久了,得写一点东西了,但是又不知道写什么了?(笑哭.jpg),想着寒假又从一个dalao那里听了几节关于数据分析的东西,有了一点新的体会,之前在朋友之间做了一次简单地分析,就把当时讲的东西整理一下发出来。

什么是数据分析?

为了方便大家的理解,我们从时间轴上对数据分析进行一个自己的理解说明。分别是

过去性分析,通常指过去发生了什么?比如,在过去十年的房价涨幅。

现在性分析,这里也能说成在预测性分析。之前上概率论时候,老师提到这里可以是对现在的事物进行预测,也可以是对将来的事物进行预测。对现在的进行预测也就是我们通常所说的实时预测。比如,我们要预测现在的股市。

将来,规范性分析,这里讲得是,如何对之后的事物进行调整,朝着对我们更有利的方向发展,如何去做,也是现在数据分析行的主要目的之一。比如,我们采取什么的措施能够让我们货物卖得更好。

数据分析包括什么?

个人认为主要包括六个方面,分别是数据收集、数据清洗、数据预处理、模型建立、数据可视化、描述性分析。

数据收集:这一步就是做数据的收集。一般数据收集主要包括以下几个方面:统计调查、实地研究、做实验、大数据。

数据清洗:一般如果是我们自己统计/现实数据,得到的数据会很脏(存在缺失值/异常值之类)。所以我们需要对数据进行清洗,对缺失的数据进行填补、对异常值进行合理化修正。

数据预处理:举个栗子,我们对数据要进行建模、但是我们模型可能只能处理数值型,但是我们的数据是字符串,我们就要对数据进行预处理,处理成我们模型可以处理的数据。

模型的建立,这一步可以说是数据分析的关键一步,模型的建立。我们要对未来的数据进行预测,如何将我们影响因子加入到模型,权重如何设置、函数的阶数如何设置都是我们要解决的问题。

数据可视化:哪怕我们对我们已经有的数据进行了模型的建立,但是到目前为止我们所做的工作都是只有我们自己能看懂或者相关人员能看懂。所以我们需要进行数据的可视化,来更直观更方便的对数据进行解读。

描述性报告/报表:我们做数据分析就是帮助上层决策人员进行一个更好的决策,所以我们需要对我们的工作进行一个报告。来报告给决策人员。

以上就是数据分析的流程

一些常见的问题

Q:关于数据分析、机器学习、统计建模关系

A:我用这个图对这个问题进行解答,

1、什么是简单问题?

比如公司领导想知道每周的销售情况,这种就是简单问题。简单问题可以用数据分析来处理,通过分析数据来分析出有用的信息。

2、什么是复杂问题?

比如我们天天使用的淘宝,它会根据你的历史购物习惯(数据),来给推荐你可能感兴趣的商品。淘宝是如何做到的呢?对于这种复杂问题,淘宝背后使用的就是机器学习。

关于如何界定简单问题和复杂问题?

我个人认为是在这个工作中,所设计到变量的大小、计算的整体步骤、模型的大小。

以上仅个人理解,如有错误欢迎指出。

写在后面的话

我会把我理解的数据分析专题的内容写完,挖个坑,之后从概率论的方向对数据分析进行一个总结(好像挖的坑太多了,慢慢补齐吧。

搜索