特征选择(2):mRMR特征选择算法(matlab代码实现)

其他 2018-11-06 05:54:19 阅读次数: 0

mRMR是什么

是基于最大相关最小冗余的特征选择方法。

要点：1.相关是特征列与类标的相关性，也可以值特征之间的相关性，通常来说，特征与类标相关性越高，说明这个特征越重要。则选择这个特征，这就是最大相关。

2.最小冗余：特征选择的目的就是减少分类器的负担，减少不需要的特征。而两个特征之间如果相关性很高，这表示这两个特征对分类有着相同的作业。也可以说是冗余度比较高，这去掉其中一个特征。

相关性度量方法

相关性度量一般有三种：互信息（MI），皮尔森相关系数，最大信息系数

本文算法用的是互信息。

mRMR具体实现

function [fea, score] = mRMR(X_train, Y_train, K)
bdisp=0;
nd = size(X_train,2);
nc = size(X_train,1);
t1=cputime;
for i=1:nd, 
   t(i) = mutualinfo(X_train(:,i), Y_train);
end; 
[tmp, idxs]=sort(-t);
fea_base = idxs(1:K);

fea(1) = idxs(1);

KMAX = min(1000,nd); %500

idxleft = idxs(2:KMAX);

k=1;
% if bdisp==1,
% % fprintf('k=1 cost_time=(N/A) cur_fea=%X_train #left_cand=%X_train\n', ...
% %       fea(k), length(idxleft));
% end;

for k=2:K,
   t1=cputime;
   ncand = length(idxleft);
   curlastfea = length(fea);
   for i=1:ncand,
      t_mi(i) = mutualinfo(X_train(:,idxleft(i)), Y_train); 
      mi_array(idxleft(i),curlastfea) = getmultimi(X_train(:,fea(curlastfea)), X_train(:,idxleft(i)));
      c_mi(i) = mean(mi_array(idxleft(i), :)); 
   end;

   [score(k), fea(k)] = max(t_mi(1:ncand) - c_mi(1:ncand));

   tmpidx = fea(k); fea(k) = idxleft(tmpidx); idxleft(tmpidx) = [];
   
%    if bdisp==1,
% %    fprintf('k=%X_train cost_time=%5.4f cur_fea=%X_train #left_cand=%X_train\n', ...
%       k, cputime-t1, fea(k), length(idxleft));
%    end;
end;

return;

%===================================== 
function c = getmultimi(da, dt) 
for i=1:size(da,2), 
   c(i) = mutualinfo(da(:,i), dt);;
end;

代码中互信息的测量函数为文中的mutualinfo

具体代码下载地址：https://github.com/zhan81776075/feature-selection

猜你喜欢

转载自blog.csdn.net/m0_37628529/article/details/83312225

特征选择(2):mRMR特征选择算法(matlab代码实现)

特征选择mRMR算法代码实现及安装下载

mRMR特征选择算法（feature_selection）的使用

最大相关 - 最小冗余（mRMR）特征选择

利用BPSO与KNN进行特征选择及matlab代码实现

基于互信息的特征选择算法MATLAB实现

基于鲸鱼算法的二维特征选择方法及其Matlab代码实现

最小冗余 - 最大相关性（mRMR）特征选择

特征选择（含代码）

特征选择算法-Relief

特征选择常用算法

特征选择思想与算法

特征选择算法学习2

特征选择——Matrix Projection算法研究与实现

特征选择(1):特征相关性度量之互信息量(matlab代码实现)

2. 特征工程之特征选择

【机器学习】特征选择之最小冗余最大相关性(mRMR)与随机森林(RF)

特征选择

特征的选择

特征工程-特征选择

特征工程的特征选择

【特征工程】特征选择

降维和特征选择的关键方法介绍及MATLAB实现

特征选择_过滤特征选择

特征选择 8、特征选择

特征选择常用算法综述

常用的特征选择算法介绍

算法选择--数据与特征工程

特征选择算法--Relief与ReliefK

特征选择 | 递归特征消除算法筛选最优特征

今日推荐

【学术精选】遥感领域高水平期刊：J-STARS 期刊介绍

探索二次元新境界：Han1meViewer——您的专属动漫神器

Java毕业设计：基于Java福建省地方特产销售商城系统毕业设计源代码作品和开题报告

【机器学习】自动驾驶——智能交通与无人驾驶技术的未来

智谱清影的魅力：使用CogVideoX-2b生成6秒视频的真实体验！

苹果可能将于 2025 年推出首款智能显示器和配套操作系统 homeOS

源码解析：从零解读SAM(Segment Anything Model)大模型！

《王者荣耀》鸿蒙原生版开启限量删档测试

fl studio v20.8中文破解版(附Crack文件+图文安装教程)

AI驱动TDSQL-C Serverless 数据库技术实战营-电商可视分析

828华为云征文 | 将Vue项目部署到Flexus云服务器X实例并实现公网访问

Java毕业设计：Java江西南昌城市文化展示网站系统毕业设计源代码作品和开题报告

周排行

单向链表的运用---一元多项式的加减详解

WEEK13 GITHUB

C语言左移和右移

四个概念详细分析servlet、filter、listener、interceptor的区别与联系

C语言如何使用print语句 %d%c%s

11.代码测试、维护

LAMMPS安装-给新手的建议

Android在页面上写字,居中写文字

OracleSID在本机上已经存在,请指定一个不同的SID的解决办法

开复老师的回信

每日归档

更多

2024-10-07(64)

2024-10-06(2)

2024-10-05(62)

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)