/* Lesson 09-1 */
/* File Name = les0901.sas 12/04/03 */
data gakusei;
infile 'all03b.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run;
:
proc plot data=gakusei; : 散布図を描く
plot height*weight; : 散布図の変量を指定(縦軸、横軸の順)
plot weight*height; :
run; :
:
proc corr data=gakusei; : 相関係数(相関行列)を計算
run; :
SAS システム 2
11:25 Thursday, November 20, 2003
プロット : HEIGHT*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
HEIGHT |
200 +
|
| B A
180 + A ADCDDCBCA A B A A
| AACDJHRMGFCDDCB BA
| ADAGHEEDCBBDAA A A
160 + ADBDBHCCAABB
| A D DCCA A A
| A AAA
140 +
---+-----------+-----------+-----------+-----------+--
20 40 60 80 100
WEIGHT
SAS システム 3
11:25 Thursday, November 20, 2003
プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
100 + A
| A A
WEIGHT | A A B A A
| B CBDDC CBEAC CBD B AA
| A AA C B CABBF HBMHKBIFFCC BADBB A
50 + AAA CABCA CBF F EBBFF DAAAB A
| A B B A BA
|
|
|
0 +
--+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 4
11:25 Thursday, November 20, 2003
Correlation Analysis
5 'VAR' Variables: HEIGHT WEIGHT CHEST KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
HEIGHT 255 168.0 8.0840 42846.9 145.0 186.0
WEIGHT 229 58.7852 9.0852 13461.8 35.0000 100.0
CHEST 87 86.9080 7.9864 7561.0 56.0000 112.0
KODUKAI 241 51566.4 52037.2 12427500 0 300000
TSUUWA 48 7961.5 5011.7 382150 200.0 30000.0
SAS システム 5
11:25 Thursday, November 20, 2003
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
HEIGHT WEIGHT CHEST KODUKAI TSUUWA
HEIGHT 1.00000 0.70774 0.36532 0.02347 0.05957
0.0 0.0001 0.0005 0.7204 0.6875
255 229 87 235 48
WEIGHT 0.70774 1.00000 0.66125 -0.03849 0.11510
0.0001 0.0 0.0001 0.5773 0.4515
229 229 87 212 45
CHEST 0.36532 0.66125 1.00000 -0.11120 0.53420
0.0005 0.0001 0.0 0.3169 0.0905
87 87 87 83 11
KODUKAI 0.02347 -0.03849 -0.11120 1.00000 -0.11297
0.7204 0.5773 0.3169 0.0 0.4600
235 212 83 241 45
TSUUWA 0.05957 0.11510 0.53420 -0.11297 1.00000
0.6875 0.4515 0.0905 0.4600 0.0
48 45 11 45 48
[注意] 相関行列は細切れに表示されるので、 不要部分を削除することによって整形しレポート等に使うこと。
/* Lesson 09-2 */
/* File Name = les0902.sas 12/04/03 */
data gakusei;
infile 'all03b.prn' firstobs=2;
input sex $ height weight chest
jitaku $ kodukai carrier $ tsuuwa;
proc print data=gakusei(obs=10);
run;
:
proc reg data=gakusei; : 回帰分析
model weight=height; : 変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
:
proc print data=outreg1(obs=15); : まずは表示
run; :
:
proc plot data=outreg1; : 散布図を描く
plot weight*height/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
plot pred1*weight; : 予測値と観測値
plot resid1*pred1/vref=0; : 残差と予測値(残差解析)(水平軸指定)
plot resid1*height/vref=0; : 残差と説明変数(残差解析)
plot resid1*weight/vref=0; : 残差と目的変数(残差解析)
run;
[補足] proc plot
の下に以下の行を追加した方がより正確ではある。
欠損値を含むデータを解析対象から除外する事を指示する命令文である。
「欠損値です」の表示が無くなるだけで、得られる図は同じ(欠損値は描画できないから)。
試しに追加する/しないの両方で実行してみよ。
where weight^=. and height^=.;
SAS システム 2
11:25 Thursday, November 20, 2003
Model: MODEL1
Dependent Variable: WEIGHT
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 9426.48780 9426.48780 227.815 0.0001
Error 227 9392.78172 41.37789
C Total 228 18819.26952
Root MSE 6.43257 R-square 0.5009
Dep Mean 58.78515 Adj R-sq 0.4987
C.V. 10.94250
SAS システム 3
11:25 Thursday, November 20, 2003
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -77.661171 9.05004324 -8.581 0.0001
HEIGHT 1 0.808135 0.05354181 15.094 0.0001
SAS システム 4
11:25 Thursday, November 20, 2003
K C
H W J O A T R
E E C I D R S P E
I I H T U R U R S
O S G G E A K I U E I
B E H H S K A E W D D
S X T T T U I R A 1 1
1 F 145.0 38.0 . J 10000 . 39.5184 -1.5184
2 F 148.0 42.0 . J 50000 . 41.9428 0.0572
3 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.9428 1.0572
4 F 148.9 . . J 60000 . 42.6701 .
5 F 149.0 45.0 . G 60000 . 42.7509 2.2491
6 F 150.0 46.0 86 40000 . 43.5590 2.4410
7 F 151.0 50.0 . G 60000 J-PHONE . 44.3672 5.6328
8 F 151.7 41.5 80 J 35000 . 44.9329 -3.4329
9 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1753 -10.1753
10 F 153.0 41.0 . J 125000 No . 45.9835 -4.9835
11 F 153.0 46.5 87 G 10000 . 45.9835 0.5165
12 F 153.0 50.0 . G 70000 DoCoMo 10000 45.9835 4.0165
13 F 153.0 55.0 78 J 30000 . 45.9835 9.0165
14 F 153.0 . . G 120000 DoCoMo 200 45.9835 .
15 F 153.5 46.0 . J 30000 J-PHONE 8000 46.3875 -0.3875
SAS システム 6
11:25 Thursday, November 20, 2003
プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
WEIGHT |
100 + A
| A A
80 + A A B A A
| B CBDDC CBEAC CBD B AA
60 + A AA C B CABBF HBMHKBIFFCC BADBB A
| AAA CABCA CBF F EBBFF DAAAB A
40 + A B B A BA
|
20 +
|
--+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 7
11:25 Thursday, November 20, 2003
プロット : PRED1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
80 +
|
PRED1 | A B A
| A ADAAFAB D A A A A
| A BBBKFDD GAA A BB
60 + BEBHHGGJBGBAADAB A
| AE EHBF BCAAC
| BBBCCDAB AAA
| BA BBABA A A
| A B AB B A
40 + A AA
---+------------+------------+------------+------------+--
20 40 60 80 100
WEIGHT
SAS システム 8
11:25 Thursday, November 20, 2003
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A A A A AB A
u | A A A A BBAA BBBCDCCAB AA A A
a 0 +-------------A--BAA-ABBBCABBF-DEBBCGIBKHHHFIDBBF-A-AA------------
l | AA BAA B BA AFDCACCEB EBBAABBA
| A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
30 40 50 60 70 80
Predicted Value of WEIGHT
SAS システム 9
11:25 Thursday, November 20, 2003
プロット : RESID1*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A A A A A B A
u | A A A A B BAA B BBCDC BBB B A A
a 0 +--------A---BAA-A-CABCA-BBF-D-EBBCG-IBKFIAHFGBD-BBF-A--AA--------
l | A A BA A B B A AEE CACCDAB CBB BABAB A
| A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
HEIGHT
SAS システム 10
11:25 Thursday, November 20, 2003
プロット : RESID1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 36 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 +
d | A B BB A
u | A AAABBAHBDBFAB A A
a 0 +--------------A-BAADCDJHDJGISOFKAH-C---------------------
l | A CABCF CKAHCCECAA
| A
-25 +
---+------------+------------+------------+------------+--
20 40 60 80 100
WEIGHT
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[式(a)]
1次元正規分布 N(0,1)
[式(b)]
2次元正規分布 N({0,0},{1,1}, ρ=0.0)
[式(c)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)
[式(d)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)、y=1 で切り出し
[式(e)]
2次元正規分布 N({0,0},{1,1}, ρ=0.7)、x+y=2 で切り出し