/* Lesson 09-1 */
/* File Name = les0901.sas 06/12/03 */
data gakusei;
infile 'all03a.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run;
:
proc plot data=gakusei; : 散布図を描く
plot height*weight; : 散布図の変量を指定(縦軸、横軸の順)
plot weight*height; :
run; :
:
proc corr data=gakusei; : 相関係数(相関行列)を計算
run; :
SAS システム 2
17:20 Monday, June 9, 2003
プロット : HEIGHT*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
HEIGHT |
200 +
|
| B A
180 + A ADCDDCACA A B A A
| AABDJHQMGFCCDCB BA
| AD GHEDDCBBDAA A A
160 + ADBCBGCCAABB
| A D DCAA A A
| A AAA
140 +
---+-----------+-----------+-----------+-----------+--
20 40 60 80 100
WEIGHT
SAS システム 3
17:20 Monday, June 9, 2003
プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
100 + A
| A A
WEIGHT | A A B A A
| B CBDDC CBDAC BBD B AA
| A AA C B CABBF GBMHKBHFFCC BADBB A
50 + AA CABBA BBF E EBBEF DAAAA A
| A B B A BA
|
|
|
0 +
--+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 4
17:20 Monday, June 9, 2003
Correlation Analysis
5 'VAR' Variables: HEIGHT WEIGHT CHEST KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
HEIGHT 243 168.2 8.0126 40874.9 145.0 186.0
WEIGHT 219 58.9306 9.1418 12905.8 35.0000 100.0
CHEST 86 86.9651 8.0153 7479.0 56.0000 112.0
KODUKAI 230 51380.4 52427.6 11817500 0 300000
TSUUWA 39 8173.1 4820.9 318750 2000.0 30000.0
SAS システム 5
17:20 Monday, June 9, 2003
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
HEIGHT WEIGHT CHEST KODUKAI TSUUWA
HEIGHT 1.00000 0.70307 0.36019 0.03638 0.00375
0.0 0.0001 0.0007 0.5881 0.9819
243 219 86 224 39
WEIGHT 0.70307 1.00000 0.65937 -0.03117 0.10584
0.0001 0.0 0.0001 0.6588 0.5330
219 219 86 203 37
CHEST 0.36019 0.65937 1.00000 -0.11379 0.53589
0.0007 0.0001 0.0 0.3087 0.1103
86 86 86 82 10
KODUKAI 0.03638 -0.03117 -0.11379 1.00000 0.02468
0.5881 0.6588 0.3087 0.0 0.8847
224 203 82 230 37
TSUUWA 0.00375 0.10584 0.53589 0.02468 1.00000
0.9819 0.5330 0.1103 0.8847 0.0
39 37 10 37 39
[注意] 相関行列は細切れに表示されるので、 不要部分を削除することによって整形しレポート等に使うこと。
/* Lesson 09-2 */
/* File Name = les0902.sas 06/12/03 */
data gakusei;
infile 'all03a.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run;
:
proc reg data=gakusei; : 回帰分析
model weight=height; : 変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
:
proc print data=outreg1(obs=15); : まずは表示
run; :
:
proc plot data=outreg1; : 散布図を描く
plot weight*height/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
plot pred1*weight; : 予測値と観測値
plot resid1*pred1/vref=0; : 残差と予測値(残差解析)(水平軸指定)
plot resid1*height/vref=0; : 残差と説明変数(残差解析)
plot resid1*weight/vref=0; : 残差と目的変数(残差解析)
run;
[補足] proc plot の下に以下の行を追加した方がより正確ではある。
欠損値を含むデータを解析対象から除外する事を指示する命令文である。
「欠損値です」の表示が無くなるだけで、得られる図は同じ(欠損値は描画できないから)。
試しに追加する/しないの両方で実行してみよ。
where weight^=. and height^=.;
SAS システム 2
10:59 Thursday, June 12, 2003
Model: MODEL1
Dependent Variable: WEIGHT
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 9005.73624 9005.73624 212.117 0.0001
Error 217 9213.04878 42.45645
C Total 218 18218.78502
Root MSE 6.51586 R-square 0.4943
Dep Mean 58.93059 Adj R-sq 0.4920
C.V. 11.05684
SAS システム 3
10:59 Thursday, June 12, 2003
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -78.449102 9.44294320 -8.308 0.0001
HEIGHT 1 0.813016 0.05582278 14.564 0.0001
SAS システム 4
10:59 Thursday, June 12, 2003
K C
H W J O A T R
E E C I D R S P E
I I H T U R U R S
O S G G E A K I U E I
B E H H S K A E W D D
S X T T T U I R A 1 1
1 F 145.0 38.0 . J 10000 . 39.4383 -1.4383
2 F 148.0 42.0 . J 50000 . 41.8773 0.1227
3 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.8773 1.1227
4 F 148.9 . . J 60000 . 42.6090 .
5 F 149.0 45.0 . G 60000 . 42.6903 2.3097
6 F 150.0 46.0 86 40000 . 43.5033 2.4967
7 F 151.7 41.5 80 J 35000 . 44.8855 -3.3855
8 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1294 -10.1294
9 F 153.0 41.0 . J 125000 No . 45.9424 -4.9424
10 F 153.0 46.5 87 G 10000 . 45.9424 0.5576
11 F 153.0 50.0 . G 70000 DoCoMo 10000 45.9424 4.0576
12 F 153.0 55.0 78 J 30000 . 45.9424 9.0576
13 F 153.5 46.0 . J 30000 J-PHONE 8000 46.3489 -0.3489
14 F 154.0 46.0 . . . 46.7554 -0.7554
15 F 155.0 48.0 83 G 180000 . 47.5684 0.4316
SAS システム 6
10:59 Thursday, June 12, 2003
プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
WEIGHT |
100 + A
| A A
80 + A A B A A
| B CBDDC CBDAC BBD B AA
60 + A AA C B CABBF GBMHKBHFFCC BADBB A
| AA CABBA BBF E EBBEF DAAAA A
40 + A B B A BA
|
20 +
|
--+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 7
10:59 Thursday, June 12, 2003
プロット : PRED1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
80 +
|
PRED1 | A B A
| A ADAAFAA D A A A A
| A BBBJFDD FAA A BB
60 + BDBHGGGJBGBAADAB A
| AE DHBF BCAAC
| BBBBBDAB AAA
| BA BBAAA A A
| A B AB A A
40 + A AA
---+------------+------------+------------+------------+--
20 40 60 80 100
WEIGHT
SAS システム 8
10:59 Thursday, June 12, 2003
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A A A A AAA A
u | A A A BBAA BBBCDCCAA B A A
a 0 +-------------A--BAA-ABBBBAABF-CEBBCGHBKHHGFGBDCF-A-AA------------
l | AA BAA B BA AEDCACCDB CD CABBA
| A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
30 40 50 60 70 80
Predicted Value of WEIGHT
SAS システム 9
10:59 Thursday, June 12, 2003
プロット : RESID1*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A A A A A B A
u | A A A B BAA B BBCDC BBA B A A
a 0 +--------A---BAA-A-CABBA-ABF-C-EBBCG-HBKFIAGFGBD-ABF-A--AA--------
l | A A BA A B B A ADE CACCCAB CBB BABAB A
| A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 10
10:59 Thursday, June 12, 2003
プロット : RESID1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 33 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A B BB A
u | AAABBAHBCBFAB A A
a 0 +--------------A-BAADCCHHDJFIROFKAG-C---------------------
l | A CABCF BJAHCCECAA
| A
-25 +
---+------------+------------+------------+------------+--
20 40 60 80 100
WEIGHT
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[式(a)]
1次元正規分布 N(0,1)
[式(b)]
2次元正規分布 N({0,0},{1,1}, ρ=0.0)
[式(c)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)
[式(d)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)、y=1 で切り出し
[式(e)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)、x+y=2 で切り出し