python中计算DataFrame,Series的数据频率 - 代码天地

python中计算DataFrame,Series的数据频率

其他 2018-07-15 17:14:20 阅读次数: 0

在pandas里面常用用value_counts确认数据出现的频率。

Series 情况下

import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
ss = Series([ 'Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])
ss.value_counts() #value_counts 直接用来计算series里面相同数据出现的频率

Tokyo 3
Nagoya 2
Osaka 1
dtype: int64

DataFrame 情况下

import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
df=DataFrame({'a':['Tokyo','Osaka','Nagoya','Osaka','Tokyo','Tokyo'],'b':['Osaka','Osaka','Osaka','Tokyo','Tokyo','Tokyo']}) #DataFrame用来输入两列数据，同时value_counts将每列中相同的数据频率计算出来
print(df)

a b
0 Tokyo Osaka
1 Osaka Osaka
2 Nagoya Osaka
3 Osaka Tokyo
4 Tokyo Tokyo
5 Tokyo Tokyo

df.apply(pd.value_counts)
a b
Nagoya 1 NaN #在b列中meiynagoya，因此是用NaN 表示。
Osaka 2 3.0
Tokyo 3 3.0

参考：

http://ailaby.com/dataframe_value_counts/

猜你喜欢

转载自blog.csdn.net/qq_39521554/article/details/81052311

python中计算DataFrame,Series的数据频率

Series.value_counts，pd.value_counts计算Series，DataFrame数据频率

python数据分析六：Series与DataFrame的计算

Python数据分析-Pandas（Series与DataFrame）

【Python】Series 和 Dataframe

python中DataFrame、Series数据类型 sort 排序

python数据分析五:Series和DataFrame的索引的方法

python-pandas-Series和DataFrame数据结构构建

Python数据分析：Numpy、Series、DataFrame的简单理解

【Python数据分析】Pandas模块下的Series与DataFrame

python pandas数据类型Series和DataFrame

Python数据分析——series和DataFrame转化

Python数据分析--Pandas入门--Series与DataFrame属性

Python数据分析--Pandas入门--Series与DataFrame创建

【Python】Pandas入门（Series、DataFrame）

python中计算梯度值

pandas模块--Series数据与DataFrame数据

python数据分析（七） python pandas--series和dataframe的算术运算和数据对齐

python基础-----Pandas的DataFrame和pandas.core.series.Series

python学习笔记—DataFrame和Series的排序

python中DataFrame和Series的排序

Python-pandas-Series/DataFrame入门

python3：pandas（Series+dataFrame)

<Python>判断变量是否是DataFrame 或者 Series

【python】Series和DataFrame的简单介绍

Python之Pandas中Series、DataFrame实践

python的pandas库快速入门(Series、DataFrame)

python DataFrame/Series加减乘除运算

Python pandas基础——创建Series、DataFrame

Pandas基本操作：Series和DataFrame（Python）

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)