数据数值转换factorize和dummy

其他 2019-06-16 10:51:41 阅读次数: 0

数据的数值转换有两种方式：

1. factorize

API：

pandas.factorize(values, sort=False, order=None, na_sentinel=-1, size_hint=None)

将对象编码为枚举类型或分类变量。

输入参数：

values: 一维数据序列

sort: 为数据加标签的时候需不需要保持原有数据的大小关系，默认False

na_sentinel: 对于没有找到数据的赋予的标签，默认-1

返回：

labels和uniques，一般使用的是labels，因此在factorize得到的数据要写上第几维数据。

pd.factorize()[0]

2. dummy

API：

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False,drop_first=False, dtype=None)

Convert categorical variable into dummy/indicator variables

输入参数：

prefix: 转换成dummy类型后新增加特征的名字前缀

具体这两种转换方法对于最后的结果有什么影响还没有试过，等豆桑把titanic程序看完了实验一下。

其实就豆桑自己分析的话，由于factorize后的数据不是归一化的，而get_dummies后的数据都是0和1，不需要再进行归一化，因此豆桑觉得可能更多地应用会是get_dummies。

猜你喜欢

转载自blog.csdn.net/weixin_41524411/article/details/90647205

数据数值转换factorize和dummy

Pandas —— get_dummies( )和 factorize( )的区别

dummy

ov9650的dummy pixel和dummy line

课后习题 3.12（改进）双精度正数进制转换，输入数值和base，输出转换数据

虚拟变量和独热编码的区别（Difference of Dummy Variable & One Hot Encoding）定量变量和定性变量的转换（Transform of Quantitative & Qualitative Variables）虚拟变量陷阱（Dummy Variable Trap）

数据结构栈数值转换

R 大数值型数据转换

关于onehot和哑变量（dummy）

数值转换

Scala数值类型自动转换和强制转换

Java基础知识之了解变量、常量，掌握数据类型，类型转换，数值提升，int和String相互转换

postgreSQL数据类型转换字符串和数值

python中multiprocessing、multiprocessing.dummy和threading用法笔记

Jmeter5.1 Plugins Manager配置和dummy使用

JAVA数值类型之间的合法（自动）和强制转换

C#和Oracle中Guid类型数值互相转换

JS学习--数值转换时，Number()，parseInt()和parseFloat()的区别

2.9数值数据类型和操作

数值数据类型和操作

总结归纳计算机编程中的各种数据类型，其表示形式和计算方法。重点关注类型转换、数值溢出和移位等操作。

Android开发数值转换

javaScript数值转换

数值转换关系

关于数值转换

JavaScript数值转换函数

【编程】【Python】数值转换

3.5.2 数值之间的转换

javscript数值类型转换

js数值转换

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)