使用Pandas怎么实现一个分组计数功能
更新:HHH   时间:2023-1-7


这篇文章将为大家详细讲解有关使用Pandas怎么实现一个分组计数功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

在对dataframe进行分析的时候会遇到需要分组计数,计数的column中属性有重复,但又需要仅对不重复的项计数(即重复N次出现的项只计1次)。

函数如下:

dataframe.groupby([‘分组的列名']).需要计数的列名.nunique()

举例:

数组“data”如下:

StoreIDSalesSalesDateChannel
A1002018/1/101
A902018/1/102
A1102018/1/201
B82.22018/1/101
B902018/1/202

如果要按StoreID来统计每一家店的营业日期数(可以通过不计重复的count “SalesDate”来完成)

代码如下:

data.groupby(['StoreID']).SalesDate.nunique()

补充:pandas 统计分组内不重复计数

在数据分析中的数据处理过程中,经常需要对数据进行分组计数,看下下面这组数据

数据中name 为C 的有三行,其中有2个code是重复的

目标:

按name 分组,统计每组中code的不重复数量

df.groupby('name')['code'].nunique()
# 以name 分组后,统计code的不重复数目

结果如下:

排序

df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分组后,统计code的不重复数目

关于使用Pandas怎么实现一个分组计数功能就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

返回开发技术教程...