1.导入模块
1
2 |
import pandas as pd import matplotlib.pyplot as plt |
2.读取csv文件
1
2 |
读取文件csvin data = pd.read_csv( 'catering_sale.csv' ) |
结果:
3.计算销量的最大值、最小值和平均值
1
2
3
4
5
6
7
8 |
print (data) #1.求销量的最大值、最小值、平均值 sales_volume_max = data[ '销量' ]. max () print ( '最大值\n' ,data[data[ '销量' ] = = sales_volume_max]) sales_volume_min = data[ '销量' ]. min () print ( '最小值\n' ,data[data[ '销量' ] = = sales_volume_min]) sales_volume_mean = data[ '销量' ].mean() print ( '平均值\n' ,sales_volume_mean) |
4.获取缺失的数量以及样本总量
1
2
3
4
5 |
#2.求缺失值 data[ '销量' ].isnull() n = data[ '销量' ].shape[ 0 ] - data[ '销量' ].count() print ( '样本总数' ,data[ '销量' ].shape[ 0 ]) print ( '缺失值的个数' ,n) |
5.对销量进行数据分析给出相应的箱式图
1
2
3
4
5
6
7
8
9 |
#3.数据分析图 #解决中文乱码 plt.rcParams[ 'font.sans-serif' ] = [ 'KaiTi' ] # 指定默认字体 plt.rcParams[ 'axes.unicode_minus' ] = False # 解决保存图像是负号'-'显示为方块的问题 fig,axes = plt.subplots() data.boxplot(column = '销量' ,ax = axes) # column参数表示要绘制成箱形图的数据,可以是一列或多列 axes.set_ylabel( 'sales_volume of data' ) fig.savefig(r '输出图片' ) |