nan值
有些数据会有一些缺失,如 泰坦尼克记录中 Age
列,有一些人没有年龄,如下:
在 pandas 中显示为 NaN
例子
import pandas as pd
df=pd.read_csv(r'D:\python\pandas_std\titanic_train.csv')
df
选取 nan 记录
有时,我们要选取出年龄是 nan 的记录,搭配 布尔索引
例子
import pandas as pd
df=pd.read_csv(r'titanic_train.csv')
# 选取 Age 是 NaN的记录
df [ df['Age'].isnull() ]
判断
判断是否空
df.isnull()
返回值: nan
值显示 True
,否则显示 False
例子
import pandas as pd
df=pd.read_csv(r'D:\python\pandas_std\titanic_train.csv')
#%%
print( df['Age'] )
# nan值显示True,否则显示False
print( df['Age'].isnull() )
判断是否 非空
df.notnull()
返回值: nan
值显示 False
,否则显示 True
例子
import pandas as pd
df=pd.read_csv(r'D:\python\pandas_std\titanic_train.csv')
#%%
print( df['Age'] )
# nan值显示False,否则显示True
print( df['Age'].notnull() )
选取 非nan 记录
有时,我们要选取出年龄 不是 nan 的记录,搭配 布尔索引
例子
import pandas as pd
df=pd.read_csv(r'titanic_train.csv')
# 选取 Age 不是 NaN的记录
df [ df['Age'].notnull() ]