您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch |

自学教程:pandas使用fillna函数填充NaN值的代码实例

51自学网 2022-07-22 18:47:51
  python
这篇教程pandas使用fillna函数填充NaN值的代码实例写得很实用,希望能帮到您。

1. 参数解析

1.1 inplace参数

取值:True、False

True:直接修改原对象

False:创建一个副本,修改副本,原对象不变(缺省默认)

1.2 method参数

取值 : {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default None

pad/ffill:用前一个非缺失值去填充该缺失值

backfill/bfill:用下一个非缺失值填充该缺失值

None:指定一个值去替换缺失值(缺省默认这种方式)

1.3 limit参数:

限制填充个数

1.4 axis参数

修改填充方向

补充

isnull 和 notnull 函数用于判断是否有缺失值数据

  • isnull:缺失值为True,非缺失值为False
  • notnull:缺失值为False,非缺失值为True

2. 代码实例

#导包import pandas as pdimport numpy as npfrom numpy import nan as NaNdf1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])df1

代码结果:

     0    1    2
0  1.0  2.0  3.0
1  NaN  NaN  2.0
2  NaN  NaN  NaN
3  8.0  8.0  NaN

2.1 常数填充

2.1.1 用常数填充

#1.用常数填充print (df1.fillna(100))print ("-----------------------")print (df1)

运行结果:

       0      1      2
0    1.0    2.0    3.0
1  100.0  100.0    2.0
2  100.0  100.0  100.0
3    8.0    8.0  100.0
-----------------------
     0    1    2
0  1.0  2.0  3.0
1  NaN  NaN  2.0
2  NaN  NaN  NaN
3  8.0  8.0  NaN

2.1.2 用字典填充

第key列的NaN用key对应的value值填充

df1.fillna({0:10,1:20,2:30})

运行结果:

      0     1     2
0   1.0   2.0   3.0
1  10.0  20.0   2.0
2  10.0  20.0  30.0
3   8.0   8.0  30.0

2.2 使用inplace参数

print (df1.fillna(0,inplace=True))print ("-------------------------")print (df1)

运行结果:

在这里插入代码片

2.3 使用method参数

1.method = 'ffill'/'pad':用前一个非缺失值去填充该缺失值

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))df2.iloc[1:4,3] = Nonedf2.iloc[2:4,4] = Noneprint(df2)print ("-------------------------")print(df2.fillna(method='ffill'))

运行结果:

   0  1  2    3    4
0  8  4  4  5.0  6.0
1  5  2  8  NaN  7.0
2  6  3  1  NaN  NaN
3  5  4  9  NaN  NaN
4  6  5  4  6.0  9.0
-------------------------
   0  1  2    3    4
0  8  4  4  5.0  6.0
1  5  2  8  5.0  7.0
2  6  3  1  5.0  7.0
3  5  4  9  5.0  7.0
4  6  5  4  6.0  9.0

2.method = ‘bflii’/‘backfill’:用下一个非缺失值填充该缺失值

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))df2.iloc[1:4,3] = Nonedf2.iloc[2:4,4] = Noneprint(df2)print ("-------------------------")print(df2.fillna(method='bfill'))

运行结果:

   0  1  2    3    4
0  1  0  4  1.0  3.0
1  4  6  4  NaN  2.0
2  4  9  2  NaN  NaN
3  9  7  3  NaN  NaN
4  6  1  3  5.0  5.0
-------------------------
   0  1  2    3    4
0  1  0  4  1.0  3.0
1  4  6  4  5.0  2.0
2  4  9  2  5.0  5.0
3  9  7  3  5.0  5.0
4  6  1  3  5.0  5.0

2.4 使用limit参数

用下一个非缺失值填充该缺失值且每列只填充2个

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))df2.iloc[1:4,3] = Nonedf2.iloc[2:4,4] = Noneprint(df2)print ("-------------------------")print(df2.fillna(method='bfill', limit=2))

运行结果:

   0  1  2    3    4
0  2  0  4  4.0  0.0
1  7  9  9  NaN  1.0
2  1  7  3  NaN  NaN
3  8  5  8  NaN  NaN
4  8  6  2  4.0  4.0
-------------------------
   0  1  2    3    4
0  2  0  4  4.0  0.0
1  7  9  9  NaN  1.0
2  1  7  3  4.0  4.0
3  8  5  8  4.0  4.0
4  8  6  2  4.0  4.0

2.5 使用axis参数

axis=0 对每列数据进行操作

axis=1 对每行数据进行操作

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))df2.iloc[1:4,3] = Nonedf2.iloc[2:4,4] = Noneprint(df2.fillna(method="ffill", limit=1, axis=1))

运行结果:

    0    1    2    3    4
0  0.0  4.0  9.0  7.0  2.0
1  6.0  5.0  0.0  0.0  3.0
2  8.0  8.0  8.0  8.0  NaN
3  5.0  5.0  6.0  6.0  NaN
4  7.0  5.0  7.0  4.0  1.0

还有一些pandas的基础运算请参考这篇文章->pandas | DataFrame基础运算以及空值填充

总结

到此这篇关于pandas使用fillna函数填充NaN值的文章就介绍到这了,更多相关pandas用fillna填充NaN值内容请搜索wanshiok.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持wanshiok.com!


Python中的简写操作(for、if简写、匿名函数)
Python流程控制if条件选择与for循环
51自学网,即我要自学网,自学EXCEL、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。
京ICP备13026421号-1