用过滤法对以下数据进行特征选择:
[[0,2,0,3],
[0,1,4,3],
[0,1,1,3]]
要求:
1、Variance Threshold(threshold =1.0)
2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的
可以看到指定阈值方差为1时,删除了原始数据的第一列、第二列、第四列。只保留了第三列【0,4,1】
实现代码:
from sklearn.feature_selection import VarianceThreshold#导入特征选择模块
print("原始数据\n",[[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])
var = VarianceThreshold(threshold = 1.0)#初始化,指定阈值方差为1
data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])#转换数据格式
print("特征选择后的数据\n",data)