Pandas rank函数使用方法(pct = True)

网上对rank函数资料比较多,其中典型的用例为

obj = pd.Series([7,-5,7,4,2,0,4])
obj.rank()

输出为:

0    6.5
1    1.0
2    6.5
3    4.5
4    3.0
5    2.0
6    4.5
dtype: float64

这是典型的使用方法,如果我在rank里的添加参数pct = True如下代码

obj = pd.Series([7,-5,7,4,2,0,4])
print(obj.rank(pct = True))

其结果为:

0    0.928571
1    0.142857
2    0.928571
3    0.642857
4    0.428571
5    0.285714
6    0.642857
dtype: float64

pct参数的代表的意思为输出结果为百分比形式,可是上例输出的百分比是如何计算出来的呢?

answer:

用 1处以列表中元素个数(本例为7个元素),计算的值为0.142857143,后将排序的序号乘以小数该值即为输出的百分比的值

如序号为4的值 0.428571 = 0.142857143 × 3。

猜你喜欢

转载自blog.csdn.net/qianniu2meiyi/article/details/86656239