pandas-统计函数 作者:马育民 • 2020-10-26 08:43 • 阅读:10098 # 概述 本文介绍常用统计函数,如:查找 **某一列** 的 **最大值**、**最小值** ### 常用函数 |操作 |解释 | | ------------ | ------------ | |count |计算分组中非NA值的数量 | |sum |计算非NA值的和 | |mean |计算非NA值的平均值 | |min|获得非NA值的最小值| |max|获得非NA值的最大值| |median |计算非NA值的算术中位数 | |std|计算非NA值标准差| |var|计算非NA值方差| # count() 统计非NaN值的数量 ### 例子 对所有列统计 ``` import pandas as pd df=pd.read_csv('train.csv') print(df.count()) ``` 对某一列统计 ``` import pandas as pd df=pd.read_csv('train.csv') print(df["price"].count()) ``` 对某几列统计 ``` import pandas as pd df=pd.read_csv('train.csv') print(df["price","m"].count()) ``` ### 获取统计后的数量 ``` import pandas as pd f=open(r'C:\Users\mym\Desktop\数据挖掘\titanic\train.csv','r') df=pd.read_csv(f) res=df_file[["price","m"]].count() print(res["price"]) print(res["m"]) ``` # sum() 求某列的和 求某列(非NA值)的和 需要用到数据集:SELL.csv,文件格式如下: [![](https://www.malaoshi.top/upload/0/0/1EF4RAYaIEu0.png)](https://www.malaoshi.top/upload/0/0/1EF4RAYaIEu0.png) 根据```Sell_No```分组,求```Volume```的和 ``` import pandas as pd df = pd.read_csv("SELL.csv", index_col=[0]) df[["Volume","Price"]].sum() ``` # mean() 求某列平均数 求某列(非NA值)的平均数 需要用到数据集:SELL.csv,文件格式如下: [![](https://www.malaoshi.top/upload/0/0/1EF4RAYaIEu0.png)](https://www.malaoshi.top/upload/0/0/1EF4RAYaIEu0.png) 根据 ```Sell_No``` 分组,求 ```Prices``` 列的平均数 ``` import pandas as pd df = pd.read_csv("SELL.csv", index_col=[0]) df[["Volume","Price"]].mean() ``` 原文出处:http://malaoshi.top/show_1EF6VY4GlGmP.html