典型相关分析
现实生活中两组变量间的相关关系的问题很多,例如家庭的特征(如户主的年龄、家庭的年收入、户主的受教育程度等)与消费模式(如每年去餐馆就餐的频率、每年外出看电影的频率等)等等。为此,1936年由Hulling提出了典型相关分析,揭示了两组多元随机变量之间的关系。
典型相关分析基本思想
例 蔬菜产出水平主要体现在蔬菜总产量(Y1)、人均蔬菜占有量(Y2)、蔬菜总产增长速度(Y3)三个方面,并称作因变量组(简称“产出组”)。问题:因变量组与自变量X1(市场经济综合因素)、X2(劳动力动力因素) 、X3(气候因素)(简称“影响组”)的关系如何?
解答:SAS
data ex;
input y1-y3 x1-x3 @@;
cards;
/*数据省略*/
proc cancorr data=ex all;var y1-y3; with x1-x3;
/*cancorr典型相关分析,同var x1-x3; withy1-y3*/
run;
程序结果:
第一对,第二对显著
整理得到蔬菜产出水平与影响因素的三个自变量的典型相关系数及特征值:
结果表明:前两个典型相关系数较高,表明相应典型变量之间密切相关。
结果表明:只有前两对典型变量通过了统计量检验,表明相应典型变量之间相关关系显著,能够用三个自变量影响变量来解释产出变量。
冗余度分析的结果
典型变量的解释能力
偏最小二乘?
主成分,相关性分析,回归分析的合成。
同时解决变量的相关性。