新闻中心

使用Excel对数据进行分析(excel怎样对数据进行排序)

2023-09-20
浏览次数:
返回列表

一、提出问题

1) 2012年-2015年每年母婴产品的总销量及其变化走势。

2) 销量最高的商品?

3) 不同性别对商品需求和销售情况。

4) 不用年龄对商品的需求和销售情况。

二、数据分析的步骤

数据清洗步骤:选择子集-列名重命名-删除重复值-缺失值处理-一致化处理-数据排序-异常值处理

1) 选择子集

列名是英文,为了方便收集信息及便于理解,改成中文。

因商品属性对于本次信息收集无太大作用,隐藏此列。

2) 删除重复值

通过对于购买行为编号筛选,进行了重复值的删除。

3) 缺失值处理

用户ID为唯一值,首先观察每列都是29927项,故理解本行没有确实值。如何定位缺失值?点击列号-定位条件(ctrl+G)-空值-人工补全;c如何进行自动化补全?如果要补同一数字,可以直接输入定位空值后输入第一个数字之后按住ctrl+enter来自动填充),另外还有“删除空值(定位后右键直接删除整行或整列)/平均值填充/统计模型填充”等方法。

4) 一致化处理

表2 婴儿性别一栏为方便理解,将1,0改为男,女。首先筛选删除性别一栏为2的值,然后运用if函数,公式为if(c2=0,”男”,”女”),并隐藏原有性别栏。

日期格式进行一致化处理,选择需要进行处理的行,点击分列,点击下一步,下一步,选择日期YMD,之后点击完成。

表2添加一列婴儿年龄,公式为=YEAR(NOW())-YEAR(B2)

表1添加一列出生日期,用函数进行关联=VLOOKUP(A2,表2婴儿信息.csv!$A:$B,2,0)。对年龄列进行筛选,删除”#N/A”。

此处不知道为什么年龄和性别怎么直接关联,用VLOOKUP函数无法关联。

一、相对应的问题分析

1) 2012年-2015年每年母婴产品的总销量及其变化走势。

分析:这是所有有效数据的商品的的销量情况,可以看出母婴商品还是有较强的季节性,每年的第四季度销量会达到最高。还可以看出整体销量处于平稳的趋势。

2) 每周哪一天销量最高?

对商品效率进行分析,得出结果如下,商品种类ID为50014530的商品销量最高。

3) 不同性别对商品需求和销售情况。

由下图可见,男生比女生需求量更多。

4) 不用年龄对商品的需求和销售情况。

由下图可以看出,5-8岁的需求量最大

总结

函数还是无法熟练应用,如何函数套函数还需要继续学习。

搜索