深度学习笔记之四——feature_column

1、numeric_column —— 代表连续数值类型的特征列。

2、bucketized_column——将连续数值分箱,如:输入(1,2,3,4,5)按照(0,34,5)两个区间分箱,分箱成为(0,0,0,1,1)的onehot形式,即最终结果为:),(

 [1,0]  #1
 [1,0]  #2
 [1,0]  #3
 [0,1]  #4
 [0,1]  #5

 3、categorical_column_with_identity——将数值型离散值进行onehot编码。注意要求是数值型的离散值。

4、categorical_column_with_hash_bucket——将连续值分箱的hash版本,即对于连续值取余,用余数来确定它被归为哪个区间。不知道该列所有的取值,取值很多,用这个方法合适。

5、crossed_column —— 将两个离散型特征列进行组合,输入多个bucketized_column,输出一个bucketized_column。

6、embedding_column —— 输入categorical_column离散类数值,返回embedding矩阵。

7、categorical_column_with_vocabulary_list——知道该列所有取值,且不多,可以直接写一个包含所有取值的list。

8、以上所有方法最终都会生成categorical Column或是Dense Column,这两个东西我在文档中没有找到,不知道是不是仅仅是个概念。

发布了88 篇原创文章 · 获赞 28 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/qq_35946969/article/details/89434614