1.导入模块
|
1
2 |
import pandas as pdimport matplotlib.pyplot as plt |
2.读取csv文件
|
1
2 |
读取文件csvindata = pd.read_csv('catering_sale.csv') |
结果:

3.计算销量的最大值、最小值和平均值
|
1
2
3
4
5
6
7
8 |
print(data)#1.求销量的最大值、最小值、平均值sales_volume_max=data['销量'].max()print('最大值\n',data[data['销量']==sales_volume_max])sales_volume_min=data['销量'].min()print('最小值\n',data[data['销量']==sales_volume_min])sales_volume_mean=data['销量'].mean()print('平均值\n',sales_volume_mean) |

4.获取缺失的数量以及样本总量
|
1
2
3
4
5 |
#2.求缺失值data['销量'].isnull()n=data['销量'].shape[0] -data['销量'].count()print('样本总数',data['销量'].shape[0])print('缺失值的个数',n) |

5.对销量进行数据分析给出相应的箱式图
|
1
2
3
4
5
6
7
8
9 |
#3.数据分析图#解决中文乱码plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题fig,axes = plt.subplots()data.boxplot(column='销量',ax=axes)# column参数表示要绘制成箱形图的数据,可以是一列或多列axes.set_ylabel('sales_volume of data')fig.savefig(r'输出图片') |
