/* Lesson 13-1 */
/* File Name = les1301.sas 01/15/04 */
data gakusei;
infile 'all03b.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run;
proc plot data=gakusei; : 散布図
plot height*weight; : 元の変量のプロット
run; :
proc princomp cov data=gakusei out=outprin; : 主成分分析(分散共分散行列)
var height weight; : 2変量
run; :
proc print data=outprin(obs=15); : 結果の出力
run; :
proc plot data=outprin; : 散布図
plot prin2*prin1/vref=0 href=0; : 主成分得点のプロット
run; :
proc sort data=outprin; : 説明のためにソートしてみる
by prin1; : 第一主成分で
run; :
proc print data=outprin; : 体重がややが効いていることの確認
run; :
SAS システム 2 21:31 Thursday, December 18, 2003 プロット : HEIGHT*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) HEIGHT | 200 + | | B A 180 + A ADCDDCBCA A B A A | AACDJHRMGFCDDCB BA | ADAGHEEDCBBDAA A A 160 + ADBDBHCCAABB | A D DCCA A A | A AAA 140 + ---+-----------+-----------+-----------+-----------+-- 20 40 60 80 100 WEIGHT SAS システム 3 21:31 Thursday, December 18, 2003 Principal Component Analysis 229 Observations 2 Variables Simple Statistics HEIGHT WEIGHT Mean 168.8410480 58.78515284 StD 7.9565305 9.08518881 SAS システム 4 21:31 Thursday, December 18, 2003 Principal Component Analysis Covariance Matrix HEIGHT WEIGHT HEIGHT 63.30637784 51.16008580 WEIGHT 51.16008580 82.54065579 Total Variance = 145.84703363 Eigenvalues of the Covariance Matrix Eigenvalue Difference Proportion Cumulative PRIN1 124.980 104.112 0.856923 0.85692 PRIN2 20.867 . 0.143077 1.00000 SAS システム 5 21:31 Thursday, December 18, 2003 Principal Component Analysis Eigenvectors PRIN1 PRIN2 HEIGHT 0.638457 0.769658 WEIGHT 0.769658 -.638457 SAS システム 6 21:31 Thursday, December 18, 2003 K C H W J O A T E E C I D R S P P I I H T U R U R R O S G G E A K I U I I B E H H S K A E W N N S X T T T U I R A 1 2 1 F 145.0 38.0 . J 10000 . -31.2189 -5.07902 2 F 148.0 42.0 . J 50000 . -26.2249 -5.32387 3 F 148.0 43.0 80 J 50000 DoCoMo 4000 -25.4553 -5.96233 4 F 148.9 . . J 60000 . . . 5 F 149.0 45.0 . G 60000 . -23.2775 -6.46959 6 F 150.0 46.0 86 40000 . -21.8694 -6.33839 7 F 151.0 50.0 . G 60000 J-PHONE . -18.1523 -8.12256 8 F 151.7 41.5 80 J 35000 . -24.2475 -2.15691 9 F 152.0 35.0 77 J 60000 DoCoMo 2000 -29.0587 2.22396 SAS システム 8 21:31 Thursday, December 18, 2003 プロット : PRIN2*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) PRIN2 | | 10 + A A BA | AA BB |ABBAAACA B | A B C CAAFBBEGCFGECAAD A 0 +-------------ABA-A-BBAI-BEAFEDEECABDB-C--A-----A--------- | A C BBB AC A AAB DDBADA A | A B AA AAA A A A BBAAB A BA AAC -10 + A A | AA A | | | | -20 + | A A ---+------------+------------+------------+------------+-- -40 -20 0 20 40 PRIN1 SAS システム 9 21:31 Thursday, December 18, 2003 OBS SEX HEIGHT WEIGHT CHEST JITAKU KODUKAI CARRIER TSUUWA PRIN1 PRIN2 1 F 148.9 . . J 60000 . . . 2 F 153.0 . . G 120000 DoCoMo 200 . . 3 F 155.0 . . J 20000 . . . 4 F 156.0 . . J 30000 . . . 5 F 156.0 . . J 50000 . . . <略> SAS システム 35 21:31 Thursday, December 18, 2003 K C H W J O A T E E C I D R S P P I I H T U R U R R O S G G E A K I U I I B E H H S K A E W N N S X T T T U I R A 1 2 247 M 170.0 74.0 90 J 0 . 12.4502 -8.82203 248 M 178.0 68.0 . J 100000 DoCoMo 4000 12.9399 1.16597 249 M 175.0 74.0 . J 0 . 15.6424 -4.97374 250 M 180.0 70.0 . J 40000 au 4000 15.7561 1.42837 251 M 180.0 70.0 . . . 15.7561 1.42837 252 M 178.7 71.2 95 0 . 15.8497 -0.33833 253 M 173.5 76.5 . G 100000 . 16.6089 -7.72437 254 M 184.0 68.0 85 30000 . 16.7706 5.78392 255 M 182.0 70.0 90 G 100000 . 17.0330 2.96769 256 M 185.0 68.0 93 J 0 . 17.4091 6.5536 257 M 175.0 77.0 95 G 130000 . 17.9514 -6.8891 258 M 176.5 78.0 96 J 10000 . 19.6788 -6.3731 259 M 177.0 78.0 . J 40000 . 19.9980 -5.9883 260 M 181.5 74.5 . G 120000 au 3000 20.1772 -0.2902 261 M 178.0 78.0 110 G 50000 . 20.6364 -5.2186 262 M 169.3 88.5 94 J 0 . 23.1633 -18.6184 263 M 186.0 82.0 . J 0 . 28.8227 -1.6152 264 M 182.0 90.0 100 J 40000 . 32.4262 -9.8014 265 M 178.0 100.0 112 G 60000 . 37.5689 -19.2646
/* Lesson 13-2 */ /* File Name = les1302.sas 01/15/04 */ data gakusei; infile 'all03b.prn' firstobs=2; input sex $ height weight chest jitaku $ kodukai carrier $ tsuuwa; proc print data=gakusei(obs=10); run; proc princomp cov data=gakusei out=outprin; : 主成分分析(分散共分散行列) var height weight chest; : 3変量 run; : proc print data=outprin(obs=15); : 結果の出力 run; : proc plot data=outprin; : 散布図 plot prin2*prin1/vref=0 href=0; : 主成分得点のプロット plot prin3*prin2/vref=0 href=0; : plot prin3*prin1/vref=0 href=0; : run; :
SAS システム 3
21:31 Thursday, December 18, 2003
Principal Component Analysis
87 Observations
3 Variables
Simple Statistics
HEIGHT WEIGHT CHEST
Mean 167.8827586 59.43908046 86.90804598
StD 8.5952286 11.02480666 7.98637238
SAS システム 4
21:31 Thursday, December 18, 2003
Principal Component Analysis
Covariance Matrix
HEIGHT WEIGHT CHEST
HEIGHT 73.8779551 66.1455654 25.0774659
WEIGHT 66.1455654 121.5463619 58.2222400
CHEST 25.0774659 58.2222400 63.7821438
SAS システム 5
21:31 Thursday, December 18, 2003
Principal Component Analysis
Total Variance = 259.20646084
Eigenvalues of the Covariance Matrix
Eigenvalue Difference Proportion Cumulative
PRIN1 197.118 153.734 0.760467 0.76047
PRIN2 43.384 24.679 0.167371 0.92784
PRIN3 18.705 . 0.072162 1.00000
SAS システム 6
21:31 Thursday, December 18, 2003
Principal Component Analysis
Eigenvectors
PRIN1 PRIN2 PRIN3
HEIGHT 0.493745 -.687917 0.531963
WEIGHT 0.759061 0.042449 -.649634
CHEST 0.424313 0.724547 0.543131
SAS システム 7
21:31 Thursday, December 18, 2003
K C
H W J O A T
E E C I D R S P P P
I I H T U R U R R R
O S G G E A K I U I I I
B E H H S K A E W N N N
S X T T T U I R A 1 2 3
1 F 145.0 38.0 . J 10000 . . . .
2 F 148.0 42.0 . J 50000 . . . .
3 F 148.0 43.0 80 J 50000 DoCoMo 4000 -25.2265 7.9747 -3.64949
4 F 148.9 . . J 60000 . . . .
5 F 149.0 45.0 . G 60000 . . . .
6 F 150.0 46.0 86 40000 . -19.4159 11.0735 -1.27568
7 F 151.0 50.0 . G 60000 J-PHONE . . . .
8 F 151.7 41.5 80 J 35000 . -24.5382 5.3657 -0.70677
9 F 152.0 35.0 77 J 60000 DoCoMo 2000 -30.5969 2.7098 2.04604
SAS システム 9
21:31 Thursday, December 18, 2003
プロット : PRIN2*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 178 オブザベーションが欠損値です.)
PRIN2 | |
20 + |
| A A | A A A A
| B A BCABA AA | A AB A A
0 +--------A-------ABBCABBB--D-BFABACA--AAA-------A-----------------
| A A A AAAABAAC AA
| A A A A
-20 + A |
| |
| |
-40 + |
---+-----------+-----------+-----------+-----------+-----------+--
-40 -20 0 20 40 60
PRIN1
SAS システム 10
21:31 Thursday, December 18, 2003
プロット : PRIN3*PRIN2. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 178 オブザベーションが欠損値です.)
PRIN3 | |
10 + |
| A A AB A| A A
| A A A AA ADAEACAAA BBC A
0 +--------------------------A--A-A--A--CAB-BAABAAA--AA-------------
| AA AAABB C AAA A
| A AAA |AA A A
-10 + | A
| A | A
| |
-20 + |
---+-----------+-----------+-----------+-----------+-----------+--
-30 -20 -10 0 10 20
PRIN2
SAS システム 11
21:31 Thursday, December 18, 2003
プロット : PRIN3*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 178 オブザベーションが欠損値です.)
PRIN3 | |
10 + |
| B A BA A A
| A A BACAABA A DEABA A BA
0 +-----------A--A-BBBAAA-A--CA-CAA---------------------------------
| A AA A A A | AA BAC AA
| A A AAA| A A A
-10 + A |
| A | A
| |
-20 + |
---+-----------+-----------+-----------+-----------+-----------+--
-40 -20 0 20 40 60
PRIN1
/* Lesson 13-3 */
/* File Name = les1303.sas 01/15/04 */
data gakusei;
infile 'all03b.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run; :
proc princomp data=gakusei out=outprin; : 相関係数を使って
var height weight chest; :
run; :
proc print data=outprin(obs=15);
run;
proc plot data=outprin;
plot prin2*prin1/vref=0 href=0;
plot prin3*prin2/vref=0 href=0;
plot prin3*prin1/vref=0 href=0;
run;
SAS システム 3
21:31 Thursday, December 18, 2003
Principal Component Analysis
87 Observations
3 Variables
Simple Statistics
HEIGHT WEIGHT CHEST
Mean 167.8827586 59.43908046 86.90804598
StD 8.5952286 11.02480666 7.98637238
SAS システム 4
21:31 Thursday, December 18, 2003
Principal Component Analysis
Correlation Matrix
HEIGHT WEIGHT CHEST
HEIGHT 1.0000 0.6980 0.3653
WEIGHT 0.6980 1.0000 0.6613
CHEST 0.3653 0.6613 1.0000
SAS システム 5
21:31 Thursday, December 18, 2003
Principal Component Analysis
Eigenvalues of the Correlation Matrix
Eigenvalue Difference Proportion Cumulative
PRIN1 2.16120 1.52577 0.720400 0.72040
PRIN2 0.63543 0.43206 0.211809 0.93221
PRIN3 0.20337 . 0.067790 1.00000
SAS システム 6
21:31 Thursday, December 18, 2003
Principal Component Analysis
Eigenvectors
PRIN1 PRIN2 PRIN3
HEIGHT 0.552278 -.679465 0.483028
WEIGHT 0.637739 -.028823 -.769713
CHEST 0.536916 0.733142 0.417403
[注意] データによっては解釈が困難なことも有り得る。
[参考] 「J:\コンピュータによる統計解析03(林 篤裕)\」に以下のデータを置いておく。
なお、今まで紹介していた私のメールアドレスは実は講義用のものであった。 今後、もし統計に関して何か疑問に遭遇し、私に連絡・相談してみたいと思った時は、 以下のアドレスを使ってください。
皆さんの期待に応えられたか心許無い部分もありますが、半年間ご苦労様でした。