pandas对数据进行排序,python dataframe 统计

　　本文主要介绍Pandas实现的数据帧的简单操作、统计和排序。通过示例代码进行了非常详细的介绍，对大家的学习或工作有一定的参考价值。有需要的朋友下面跟边肖学习。

　　一.行动二。统计三。排序上一章我们讨论了数列的计算方法和熊猫的自动对齐功能。不仅是Series，DataFrame也支持运算，也是经常使用的函数之一。

　　由于DataFrame的数据结构包含许多行和列，所以DataFrame的计算和统计可以用行数据或列数据来完成。为了方便我们使用，熊猫为我们提供了常用的计算和统计方法：

　　方法运算方法求和最大值求和最大值求平均值最小值求方差var标准差std中位数众数分位数

一.运算

　　这时，数学老师有了新的需求。他要查看本班学生数学成绩的最高分、最低分、中位数的统计数据，所以他一点也不慌张。熊猫可以帮我们完成这一切：

　　df[math]的最小值。min() #数学列

　　产量：80

　　df[math]的最大值。max() #数学列

　　产量：104

　　DF [数学]的30%、40%、50%。分位数([0.3，0.4，0.5]) #数学列

　　分位数

　　Output：

　　0.3 87.2

　　0.4 89.6

　　0.5 92.0

　　Name: math, dtype: float64

　　df[math].std() # math列的标准差

　　Output：12

　　df[math].var() # math列的方差

　　Output：144

　　df[math].mean() # math列的平均数

　　Output：92

　　df[math].median() # math列的中位数

　　Output：92

　　df[math].mode() # math列的众数，返回一个Series对象（有可能出现并列的情况，例子中众数为1，所以都返回）

　　Output:

　　0 80

　　1 92

　　2 104

　　dtype: int64

　　我们也可以使用DataFrame的describe方法对DataFrame查看基本的统计情况：

df.describe()

三.排序

　　一般来讲我们的成绩表都是按照总分从高到低进行排序：

df = df.sort_values(by=sum, ascending=False)

　　可以看到我们使用了sort_values方法对DataFrame进行排序，同时by参数传入‘sum’指定按照‘sum’字段进行排序，ascending用来设置是降序（False）还是升序（True，默认值）排序。使用sort_values排序后默认会返回一个新的DataFrame对象，也就是说并不会影响原有的DataFrame对象，所以例子中我们才会把排序后的对象赋值给原有的DataFrame对象，如果不想排序后创建新的对象也是可以的，只需要传入inplace=True即可（在原有的DataFrame基础上修改）：

df.sort_values(by=sum, ascending=False, inplace=True)

　　细心的小伙伴可能会发现当我们进行排序后，如果DataFrame中的行数据有调整的话，其行的索引值是不会更改的，上述例子中因为我们用了默认的递增数列索引，所以排序后看起来并不是很友好，不过不用担心，我们还是可以重置索引值的：

df = df.sort_values(by=sum, ascending=False).reset_index()

　　使用reset_index重设索引后我们的DataFrame对象的索引列确实被重置成了递增的序列，同时也多了列名为index的一列数据。当然我们可以传入drop=True将原有的索引列不插入到新的DataFrame中：

df = df.sort_values(by=sum, ascending=False).reset_index(drop=True)

　　为了更直观的展示排名情况，我们可以索引值+1这样就展示出了学生的排名情况：

df.index += 1

　　到此这篇关于Pandas实现DataFrame的简单运算、统计与排序的文章就介绍到这了,更多相关Pandas DataFrame运算统计与排序内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

pandas对数据进行排序,python dataframe 统计

目录

一.运算

三.排序

相关文章阅读