対象とする変量数が少ない場合には、今までも学んできたように、
単変量ごとに特性を把握することにより
ある程度、データの構造を把握することができた。
また、2変量までなら、平面に図示することもできるので、
視覚的に捉えることも可能であった。
しかし、もう少し大きくなって、3変量以上を同時に把握しようとすると
いささかやっかいである。
多変量解析法(Multivariate Analysis)は、いくつかの項目間の関連性を 統計的に分析し現象を要約して簡潔な表現を与えたり、現象の背後に潜む 構造を浮き彫りにしたり、あるいは特定の項目を他のいろいろの要因から 説明したりする方法である。複雑な現象を解明するための有力な方法論として いろいろな分野で幅広く応用されている。 特に、近年の計算機の発展・普及により、計算量に対しての苦労が 大幅に軽減されたのも広範に利用されだした一つの要因であろう。
代表的な多変量解析として以下のようなものが挙げられる。
いくつか(p個)の変量の値をできるだけ情報の損失なしに、
少数変量(m個)の総合的指標(主成分)で代表させる方法である。
いくつかのテストの成績を総合した総合的成績、
いろいろな症状を総合した総合的な重症度、
種々の財務指標に基づく企業の評価...
を求めたいといった場合に用いられる。
p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、
次元を減少させる方法と言うこともでき、
多変量データを要約する一つの有力な方法である。
/* Lesson 9-1 */ /* File Name = prin01.sas 12/13/96 */ data tyuuni; infile 'seiseki.dat'; input koku sya suu rika eigo; : proc print data=tyuuni; : データの表示 run; : proc princomp cov data=tyuuni out=out_prin; : 主成分分析(分散共分散行列) var suu eigo; : 2変量 run; : proc print data=out_prin; : 結果の出力 run; : proc plot data=out_prin; : 散布図 plot suu*eigo; : 元の変量のプロット plot prin2*prin1/vref=0 href=0; : 主成分得点のプロット run; : : proc sort data=out_prin; : 説明のためにソートする by prin1; : proc print data=out_prin; : 数学が効いていることの確認 run; :
/* Lesson 9-2 */ /* File Name = prin02.sas 12/13/96 */ data tyuuni; infile 'seiseki.dat'; input koku sya suu rika eigo; proc print data=tyuuni; run; proc princomp cov data=tyuuni out=out_prin; var koku sya suu rika eigo; run; proc print data=out_prin; run; proc plot data=out_prin; plot prin2*prin1/vref=0 href=0; plot prin3*prin2/vref=0 href=0; plot prin3*prin1/vref=0 href=0; run;
/* Lesson 9-3 */ /* File Name = prin03.sas 12/13/96 */ data tyuuni; infile 'seiseki.dat'; input koku sya suu rika eigo; proc print data=tyuuni; run; : proc princomp data=tyuuni out=out_prin; : 相関係数を使って var koku sya suu rika eigo; : run; : proc print data=out_prin; run; proc plot data=out_prin; plot prin2*prin1/vref=0 href=0; plot prin3*prin2/vref=0 href=0; plot prin3*prin1/vref=0 href=0; run;
/* Lesson 9-4 */ /* File Name = prin04.sas 12/13/96 */ data tyuuichi; infile 'shintai.dat'; input shintyou taijyuu kyoui zakou; proc print data=tyuuichi; run; proc princomp data=tyuuichi out=out_prin; run; proc print data=out_prin; run; proc plot data=out_prin; plot prin2*prin1/vref=0 href=0; plot prin3*prin2/vref=0 href=0; plot prin3*prin1/vref=0 href=0; run;
/* Lesson 9-5 */ /* File Name = prin05.sas 12/13/96 */ data gakusei; infile 'all.dat'; input seibetsu $ shintyou taijyuu kyoui kozukai jitaku $ daigaku $; proc print data=gakusei(obs=10); run; proc princomp data=gakusei out=out_prin; var shintyou taijyuu kyoui; run; proc print data=out_prin(obs=10); run; proc plot data=out_prin; plot prin2*prin1/vref=0 href=0; plot prin3*prin2/vref=0 href=0; plot prin3*prin1/vref=0 href=0; run;
明確に決まっているわけではないが、以下のような基準が一般的に 用いられている。また、結果の解釈の都合上、多少増減させることもある。