/* Lesson 12-1 */
/* File Name = les1201.sas 01/13/05 */
data gakusei;
infile 'all04b.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
proc print data=gakusei(obs=10);
run;
proc plot data=gakusei; : 散布図
plot shintyou*taijyuu; : 元の変量のプロット
run; :
proc princomp cov data=gakusei out=outprin; : 主成分分析(分散共分散行列)
var shintyou taijyuu; : 2変量
run; :
proc print data=outprin(obs=15); : 結果の出力
run; :
proc plot data=outprin; : 散布図
plot prin2*prin1/vref=0 href=0; : 主成分得点のプロット
run; :
proc sort data=outprin; : 説明のためにソートしてみる
by prin1; : 第一主成分で
run; :
proc print data=outprin; : 体重がややが効いていることの確認
run; :
SAS システム 2 18:09 Tuesday, January 11, 2005 プロット : SHINTYOU*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 45 オブザベーションが欠損値です.) SHINTYOU | 200 + | | B A 180 + A BDCEDDBEA B B A A A | BAFDKHTNHGCFECB BA | AEAGIFFECBCEAA AA A A 160 + ADCEDHDDBABB | A EC ECDA A A | A BAA 140 + ---+-----------+-----------+-----------+-----------+-- 20 40 60 80 100 TAIJYUU SAS システム 3 18:09 Tuesday, January 11, 2005 Principal Component Analysis 272 Observations 2 Variables Simple Statistics SHINTYOU TAIJYUU Mean 168.5496324 58.70845588 StD 8.1312163 9.42776980 SAS システム 4 18:09 Tuesday, January 11, 2005 Principal Component Analysis Covariance Matrix SHINTYOU TAIJYUU SHINTYOU 66.11667883 54.16924666 TAIJYUU 54.16924666 88.88284336 Total Variance = 154.99952219 Eigenvalues of the Covariance Matrix Eigenvalue Difference Proportion Cumulative PRIN1 132.852 110.705 0.857113 0.85711 PRIN2 22.147 . 0.142887 1.00000 SAS システム 5 18:09 Tuesday, January 11, 2005 Principal Component Analysis Eigenvectors PRIN1 PRIN2 SHINTYOU 0.630219 0.776417 TAIJYUU 0.776417 -.630219 SAS システム 6 18:09 Tuesday, January 11, 2005 S H T K C I A J O A T N I K I D R S P P T J Y T U R U R R O S Y Y O A K Y U I I B E O U U K A E W N N S X U U I U I R A 1 2 1 F 145.0 38.0 . J 10000 . -30.9198 -5.23348 2 F 146.7 41.0 85 J 10000 Vodafone 6000 -27.5192 -5.80423 3 F 148.0 42.0 . J 50000 . -25.9235 -5.42510 <中略> SAS システム 8 18:09 Tuesday, January 11, 2005 プロット : PRIN2*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 45 オブザベーションが欠損値です.) 20 + | | | PRIN2 | A | A | A BCABABBCBA B | A BC BDAGCAGGCGGFCADD A 0 +-------------BBBAAACCAI-CEDFEEDICACFBAE-AA-----A--------- | A AAAAABABCDAABCA C CB EDB FD A BA | AAA AA A A A B|BA A A AA A | A | AA | | A A -20 + | A A ---+------------+------------+------------+------------+-- -40 -20 0 20 40 PRIN1 SAS システム 9 18:09 Tuesday, January 11, 2005 S H T K C I A J O A T N I K I D R S P P T J Y T U R U R R O S Y Y O A K Y U I I B E O U U K A E W N N S X U U I U I R A 1 2 1 F 148.9 . . J 60000 . . . 2 F 153.0 . . G 120000 DoCoMo 200 . . 3 F 155.0 . . J 20000 . . . <中略> SAS システム 46 18:09 Tuesday, January 11, 2005 S H T K C I A J O A T N I K I D R S P P T J Y T U R U R R O S Y Y O A K Y U I I B E O U U K A E W N N S X U U I U I R A 1 2 297 M 175.0 74.0 . J 0 . 15.9378 -4.62885 298 M 180.0 70.0 94 G 70000 au 5000 15.9832 1.77412 299 M 180.0 70.0 . J 40000 au 4000 15.9832 1.77412 300 M 180.0 70.0 . . . 15.9832 1.77412 301 M 180.0 70.0 . J 40000 DoCoMo 6500 15.9832 1.77412 302 M 178.7 71.2 95 0 . 16.0956 0.00851 303 M 173.5 76.5 . G 100000 . 16.9335 -7.36902 304 M 184.0 68.0 85 30000 . 16.9512 6.14022 305 M 182.0 70.0 90 G 100000 . 17.2436 3.3270 306 M 185.0 68.0 93 J 0 . 17.5815 6.9166 307 M 175.0 77.0 95 G 130000 . 18.2670 -6.5195 308 M 179.1 74.2 . 0 au 4000 18.6769 -1.5716 309 M 176.5 78.0 96 J 10000 . 19.9888 -5.9851 310 M 177.0 78.0 . J 40000 . 20.3039 -5.5969 311 M 181.5 74.5 . G 120000 au 3000 20.4224 0.1028 312 M 178.0 78.0 110 G 50000 . 20.9341 -4.8205 313 M 169.3 88.5 94 J 0 . 23.6036 -18.1926 314 M 186.0 82.0 . J 0 . 29.0815 -1.1300 315 M 182.0 90.0 100 J 40000 . 32.7720 -9.2774 316 M 178.0 95.0 . 1000 No . 34.1332 -15.5342 317 M 178.0 100.0 112 G 60000 . 38.0153 -18.6853
/* Lesson 12-2 */ /* File Name = les1202.sas 01/13/05 */ data gakusei; infile 'all04b.prn' firstobs=2; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; proc print data=gakusei(obs=10); run; proc princomp cov data=gakusei out=outprin; : 主成分分析(分散共分散行列) var shintyou taijyuu kyoui; : 3変量 run; : proc print data=outprin(obs=15); : 結果の出力 run; : proc plot data=outprin; : 散布図 plot prin2*prin1/vref=0 href=0; : 主成分得点のプロット plot prin3*prin2/vref=0 href=0; : plot prin3*prin1/vref=0 href=0; : run; :
SAS システム 3
18:09 Tuesday, January 11, 2005
Principal Component Analysis
102 Observations
3 Variables
Simple Statistics
SHINTYOU TAIJYUU KYOUI
Mean 167.4078431 58.86666667 86.51960784
StD 8.8461401 10.86787740 7.68273156
SAS システム 4
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Covariance Matrix
SHINTYOU TAIJYUU KYOUI
SHINTYOU 78.2541953 70.2814521 25.2028150
TAIJYUU 70.2814521 118.1107591 54.8382838
KYOUI 25.2028150 54.8382838 59.0243642
SAS システム 5
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Total Variance = 255.38931858
Eigenvalues of the Covariance Matrix
Eigenvalue Difference Proportion Cumulative
PRIN1 196.659 154.604 0.770037 0.77004
PRIN2 42.055 25.380 0.164670 0.93471
PRIN3 16.675 . 0.065292 1.00000
SAS システム 6
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Eigenvectors
PRIN1 PRIN2 PRIN3
SHINTYOU 0.529571 -.661425 0.531104
TAIJYUU 0.750220 0.072997 -.657146
KYOUI 0.395884 0.746450 0.534872
SAS システム 7
18:09 Tuesday, January 11, 2005
S
H T K C
I A J O A T
N I K I D R S P P P
T J Y T U R U R R R
O S Y Y O A K Y U I I I
B E O U U K A E W N N N
S X U U I U I R A 1 2 3
1 F 145.0 38.0 . J 10000 . . . .
2 F 146.7 41.0 85 J 10000 Vodafone 6000 -24.9718 11.2582 -0.06979
3 F 148.0 42.0 . J 50000 . . . .
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 -24.7623 6.8120 -3.36800
5 F 148.9 . . J 60000 . . . .
6 F 149.0 45.0 . G 60000 . . . .
7 F 150.0 46.0 86 40000 . -19.0772 10.1869 -1.06801
8 F 151.0 50.0 . G 60000 J-PHONE . . . .
9 F 151.7 41.5 80 J 35000 . -23.9283 4.2553 -0.41720
10 F 152.0 35.0 77 J 60000 DoCoMo 2000 -29.8335 1.3430 2.40897
11 F 152.0 43.0 . J 20000 au 3500 . . .
12 F 152.0 44.0 . 45000 DoCoMo 4000 . . .
13 F 153.0 41.0 . J 125000 No . . . .
14 F 153.0 42.0 . G 0 Vodafone 1000 . . .
15 F 153.0 46.5 87 G 10000 . -16.7175 8.9856 0.73160
SAS システム 9
18:09 Tuesday, January 11, 2005
プロット : PRIN2*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 215 オブザベーションが欠損値です.)
PRIN2 | |
20 + |
| A A A | A A A A
| AA A BABCA AB | A AC A A
0 +--------A---A---ABCBDCACA-CABFA-BBCA-B-AA-------A----------------
| A AA AA AB AABBC AA
| A |B A A
-20 + |
| A |
| |
-40 + |
---+-----------+-----------+-----------+-----------+-----------+--
-40 -20 0 20 40 60
PRIN1
SAS システム 10
18:09 Tuesday, January 11, 2005
プロット : PRIN3*PRIN2. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 215 オブザベーションが欠損値です.)
PRIN3 | |
10 + |
| A A AB A| A A A
| A A A AA CAEBCDA A BD A A
0 +----------------------A---A-A--B--A--EAAADBCBA-A-AA-A------------
| A A A AA CC CBA AA
| A AA A | AA A A
-10 + | A
| A | A
| |
-20 + |
---+-----------+-----------+-----------+-----------+-----------+--
-30 -20 -10 0 10 20
PRIN2
SAS システム 11
18:09 Tuesday, January 11, 2005
プロット : PRIN3*PRIN1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 215 オブザベーションが欠損値です.)
PRIN3 | |
10 + |
| A AA A C A A
| A A AAACA BA AACFABAA ABB
0 +-----------AA--ACBBCBBAAA-AC-ABAA--A-----------------------------
| AA AA A AAAA | B BBB AA
| A AA A A A A A
-10 + A |
| A | A
| |
-20 + |
---+-----------+-----------+-----------+-----------+-----------+--
-40 -20 0 20 40 60
PRIN1
/* Lesson 12-3 */
/* File Name = les1203.sas 01/13/05 */
data gakusei;
infile 'all04b.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
proc print data=gakusei(obs=10);
run; :
proc princomp data=gakusei out=outprin; : 相関係数を使って
var shintyou taijyuu kyoui; :
run; :
proc print data=outprin(obs=15);
run;
proc plot data=outprin;
plot prin2*prin1/vref=0 href=0;
plot prin3*prin2/vref=0 href=0;
plot prin3*prin1/vref=0 href=0;
run;
SAS システム 3
18:09 Tuesday, January 11, 2005
Principal Component Analysis
102 Observations
3 Variables
Simple Statistics
SHINTYOU TAIJYUU KYOUI
Mean 167.4078431 58.86666667 86.51960784
StD 8.8461401 10.86787740 7.68273156
SAS システム 4
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Correlation Matrix
SHINTYOU TAIJYUU KYOUI
SHINTYOU 1.0000 0.7310 0.3708
TAIJYUU 0.7310 1.0000 0.6568
KYOUI 0.3708 0.6568 1.0000
SAS システム 5
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Eigenvalues of the Correlation Matrix
Eigenvalue Difference Proportion Cumulative
PRIN1 2.18484 1.55273 0.728281 0.72828
PRIN2 0.63211 0.44907 0.210704 0.93899
PRIN3 0.18304 . 0.061015 1.00000
SAS システム 6
18:09 Tuesday, January 11, 2005
Principal Component Analysis
Eigenvectors
PRIN1 PRIN2 PRIN3
SHINTYOU 0.559350 -.651569 0.512431
TAIJYUU 0.638287 -.055869 -.767768
KYOUI 0.528883 0.756530 0.384637
[注意] データによっては解釈が困難なことも有り得る。
[参考] 「J:\コンピュータによる統計解析02(林 篤裕)\」に以下のデータを置いておく。
定式化 : 配布資料 195ページ〜
[注意] データによっては解釈が困難なことも有り得る。
また、自分の思い付かない結果を含んでいることもある。
なお、今まで紹介していた私のメールアドレスは実は講義用のものであった。 今後、もし統計に関して何か疑問に出会い、私に連絡・相談してみたいと思った時は、 以下のアドレスを使ってください。
皆さんの期待に応えられたか心許無い部分もありますが、半年間お疲れ様でした。