/* Lesson 10-1 */
/* File Name = les1001.sas 06/22/06 */
data gakusei;
infile 'all06ae.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
proc print data=gakusei(obs=10);
run;
proc plot data=gakusei; : 散布図を描く
plot shintyou*taijyuu; : 散布図の変量を指定(縦軸、横軸の順)
plot taijyuu*shintyou; :
run: :
proc corr data=gakusei; : 相関係数(相関行列)を計算
run: :
SAS システム 2
20:07 Wednesday, June 21, 2006
プロット : SHINTYOU*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
SHINTYOU |
200 +
|
| A B A
180 + A BFCFDDBGA B B A A A
| CAGELITQKHCGECB BC
| AFAGIIFEBCDEAA AA A A
160 + ADDGDIFDBABB
| A ECAEDDA A A
| A BAA
140 +
---+-----------+-----------+-----------+-----------+--
20 40 60 80 100
TAIJYUU
SAS システム 3
20:07 Wednesday, June 21, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
100 + B
| A A
TAIJYUU | A A A A B B A A
| A B CBDDC ECGAD CCH B BA
| A AA E B CBDBG KCRILBMGFFE CBDCB A
50 + AAA CACEC EDIBG EBDGF DAABC BC
| A A B D BA BA
|
|
|
0 +
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 4
20:07 Wednesday, June 21, 2006
Correlation Analysis
5 'VAR' Variables: SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
SHINTYOU 338 167.9 8.1732 56766.6 145.0 186.0
TAIJYUU 306 58.7118 9.3201 17965.8 35.0000 100.0
KYOUI 111 86.4685 7.5074 9598.0 56.0000 112.0
KODUKAI 325 47667.7 48012.3 15492000 0 300000
TSUUWA 128 6568.0 4510.3 840702 0 30000.0
SAS システム 5
20:07 Wednesday, June 21, 2006
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
SHINTYOU 1.00000 0.70416 0.38960 0.04626 -0.00902
0.0 0.0001 0.0001 0.4117 0.9205
338 306 111 317 125
TAIJYUU 0.70416 1.00000 0.66557 -0.02434 -0.03684
0.0001 0.0 0.0001 0.6808 0.6946
306 306 111 288 116
KYOUI 0.38960 0.66557 1.00000 -0.08600 -0.13416
0.0001 0.0001 0.0 0.3785 0.4423
111 111 111 107 35
KODUKAI 0.04626 -0.02434 -0.08600 1.00000 0.21340
0.4117 0.6808 0.3785 0.0 0.0173
317 288 107 325 124
TSUUWA -0.00902 -0.03684 -0.13416 0.21340 1.00000
0.9205 0.6946 0.4423 0.0173 0.0
125 116 35 124 128
[注意] 相関行列は細切れに表示されるので、 不要部分を削除することによって整形しレポート等に使うこと。
/* Lesson 10-2 */
/* File Name = les1002.sas 06/22/06 */
data gakusei;
infile 'all06ae.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
proc print data=gakusei(obs=10);
run;
proc reg data=gakusei; : 回帰分析
model taijyuu=shintyou; : 変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
:
proc print data=outreg1(obs=15); : 表示してみる
run; :
:
proc plot data=outreg1; : 散布図を描く
plot taijyuu*shintyou/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
plot pred1*taijyuu; : 予測値と観測値
plot resid1*pred1 /vref=0; : 残差と予測値(残差解析)(水平軸指定)
plot resid1*shintyou/vref=0; : 残差と説明変数(残差解析)
plot resid1*taijyuu /vref=0; : 残差と目的変数(残差解析)
run; :
:
proc univariate data=outreg1 plot normal; : 残差を正規プロットして確かめる
var resid1; :
run; :
[補足] proc plot
の下に以下の行を追加した方がより正確ではある。
欠損値を含むデータを解析対象から除外する事を指示する命令文である。
「欠損値です」の表示が無くなるだけで、得られる図は同じ(欠損値は描画できないから)。
試しに追加する/しないの両方で実行してみよ。
where shintyou^=. and taijyuu^=.;
SAS システム 2
20:07 Wednesday, June 21, 2006
Model: MODEL1
Dependent Variable: TAIJYUU
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 13136.48932 13136.48932 298.982 0.0001
Error 304 13356.98832 43.93746
C Total 305 26493.47765
Root MSE 6.62853 R-square 0.4958
Dep Mean 58.71176 Adj R-sq 0.4942
C.V. 11.28996
SAS システム 3
20:07 Wednesday, June 21, 2006
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -78.346595 7.93558665 -9.873 0.0001
SHINTYOU 1 0.812421 0.04698498 17.291 0.0001
SAS システム 4
20:07 Wednesday, June 21, 2006
S
H T K C
I A J O A T R
N I K I D R S P E
T J Y T U R U R S
O S Y Y O A K Y U E I
B E O U U K A E W D D
S X U U I U I R A 1 1
1 F 145.0 38.0 . J 10000 . 39.4545 -1.4545
2 F 146.7 41.0 85 J 10000 Vodafone 6000 40.8356 0.1644
3 F 148.0 42.0 . J 50000 . 41.8917 0.1083
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.8917 1.1083
5 F 148.9 . . J 60000 . 42.6229 .
6 F 149.0 45.0 . G 60000 . 42.7041 2.2959
7 F 150.0 46.0 86 40000 . 43.5166 2.4834
8 F 151.0 50.0 . G 60000 J-PHONE . 44.3290 5.6710
9 F 151.7 41.5 80 J 35000 . 44.8977 -3.3977
10 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1414 -10.1414
11 F 152.0 43.0 . J 20000 au 3500 45.1414 -2.1414
12 F 152.0 44.0 . 45000 DoCoMo 4000 45.1414 -1.1414
13 F 153.0 41.0 . J 125000 No . 45.9538 -4.9538
14 F 153.0 42.0 . G 0 Vodafone 1000 45.9538 -3.9538
15 F 153.0 46.5 87 G 10000 . 45.9538 0.5462
SAS システム 6
20:07 Wednesday, June 21, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
TAIJYUU |
100 + B
| A A
80 + A A A A B B A A
| A B CBDDC ECGAD CCH B BA
60 + A AA E B CBDBG KCRILBMGFFE CBDCB A
| AAA CACEC EDIBG EBDGF DAABC BC
40 + A A B D BA BA
|
20 +
|
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 7
20:07 Wednesday, June 21, 2006
プロット : PRED1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
80 +
|
PRED1 | A A B A
| A BDACFAB H B A A A A
| ABBCCCNHEEBIBB A BC
60 + CECLHGGMDIBAADABA A A
| AG EHCH CCAAE A
| BCDDEHACAAAA
| BABCDACA A A
| A CABB B A
40 + A BA
---+------------+------------+------------+------------+--
20 40 60 80 100
TAIJYUU
SAS システム 8
20:07 Wednesday, June 21, 2006
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A B B A BAA A
u | A A A B BBBB BCBEDCEAD BA A A
a 0 +-------------A-ABAA-CCBDECDCJBEEBECHKCNIIJHGCEEJ-A-AA------------
l | AA BAAAB BA BGDCACDFDBDFBDACBAA
| A A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
30 40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 9
20:07 Wednesday, June 21, 2006
プロット : RESID1*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A B B A B B A
u | A A A B B BBB B CBEDC DBD BA A A
a 0 +--------A-A-BAA-C-DBCEC-DCJBE-EBECH-KCNGJAJHGCE-BCJ-A--AA--------
l | A A BA AAB B A BFE CACDEADBDDD CABBB AA
| A A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
SHINTYOU
SAS システム 10
20:07 Wednesday, June 21, 2006
プロット : RESID1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 43 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A BABD A
u | A ABABBBLBFCGAC A A
a 0 +--------------A-DBDFFEMLEQGJSTILCH-G---------------------
l | A CABCI DLDIDEHCBB
| A A
-25 +
---+------------+------------+------------+------------+--
20 40 60 80 100
TAIJYUU
SAS システム 11
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Moments
N 306 Sum Wgts 306
Mean 0 Sum 0
Std Dev 6.617659 Variance 43.7934
Skewness 1.435334 Kurtosis 4.167262
USS 13356.99 CSS 13356.99
CV . Std Mean 0.378306
T:Mean=0 0 Pr>|T| 1.0000
Num ^= 0 306 Num > 0 132
M(Sign) -21 Pr>=|M| 0.0189
Sgn Rank -2843.5 Pr>=|S| 0.0663
W:Normal 0.917161 Pr<W 0.0001
SAS システム 15
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Histogram # Boxplot
35+* 1 *
.* 4 0
.**** 15 0
.**************************** 112 +--+--+
.****************************************** 167 *-----*
-15+** 7 |
----+----+----+----+----+----+----+----+--
* may represent up to 4 counts
SAS システム 16
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Normal Probability Plot
35+ *
| ****
| *******++++
| ++**************
| ***********************
-15+***+**++++
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。
/* Lesson 10-3 */
/* File Name = les1003.sas 06/22/06 */
data gakusei;
infile 'all06ae.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
if shintyou=. | taijyuu=. then delete; : 欠損値データを除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei;
where taijyuu<85; : 対象データを絞る
run;
proc reg data=gakusei;
model taijyuu=shintyou;
where taijyuu<85; : 対象データを絞る
output out=outreg1 predicted=pred1 residual=resid1;
run;
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
where taijyuu<85; : 対象データを絞る
plot taijyuu*shintyou;
plot taijyuu*pred1;
plot resid1*(pred1 shintyou taijyuu)/vref=0; : まとめて指定することも可
run;
proc univariate data=outreg1 plot normal;
var resid1;
run;
SAS システム 2
20:07 Wednesday, June 21, 2006
Correlation Analysis
5 'VAR' Variables: SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
SHINTYOU 302 168.6 8.0591 50916.0 145.0 186.0
TAIJYUU 302 58.2526 8.4598 17592.3 35.0000 82.0000
KYOUI 108 86.0370 7.0299 9292.0 56.0000 110.0
KODUKAI 284 48308.1 49603.6 13719500 0 300000
TSUUWA 116 6728.5 4525.0 780502 0 30000.0
SAS システム 3
20:07 Wednesday, June 21, 2006
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
SHINTYOU 1.00000 0.73092 0.35407 0.05257 -0.05074
0.0 0.0001 0.0002 0.3774 0.5886
302 302 108 284 116
TAIJYUU 0.73092 1.00000 0.60190 -0.00278 -0.03684
0.0001 0.0 0.0001 0.9628 0.6946
302 302 108 284 116
KYOUI 0.35407 0.60190 1.00000 -0.08164 -0.13416
0.0002 0.0001 0.0 0.4100 0.4423
108 108 108 104 35
KODUKAI 0.05257 -0.00278 -0.08164 1.00000 0.25480
0.3774 0.9628 0.4100 0.0 0.0067
284 284 104 284 112
TSUUWA -0.05074 -0.03684 -0.13416 0.25480 1.00000
0.5886 0.6946 0.4423 0.0067 0.0
116 116 35 112 116
SAS システム 6
20:07 Wednesday, June 21, 2006
Model: MODEL1
Dependent Variable: TAIJYUU
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 11508.78237 11508.78237 344.121 0.0001
Error 300 10033.19051 33.44397
C Total 301 21541.97288
Root MSE 5.78308 R-square 0.5342
Dep Mean 58.25265 Adj R-sq 0.5327
C.V. 9.92758
SAS システム 7
20:07 Wednesday, June 21, 2006
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -71.105835 6.98124839 -10.185 0.0001
SHINTYOU 1 0.767269 0.04136107 18.551 0.0001
SAS システム 10
20:07 Wednesday, June 21, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
TAIJYUU |
100 +
|
| A
75 + A B BAA B C B BA A
| BB B CBHCCAEDGCD BCKAB BA
| A AA E B C CBG JCMIKALFEDE CAABA A
50 + AA CACEB DDGBF EBDGF DAABC BC
| A A BA C BA BB A B A
| A
25 +
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 11
20:07 Wednesday, June 21, 2006
プロット : TAIJYUU*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
TAIJYUU |
100 +
|
| A
75 + A B BAAB CAABA A
| BBBCBGDDEDGCDEKAB BA
| A AA E BC CIHEMJKKGEFCD CAA
50 + AA DCEBDCHBFEBDMCBABC BC
| A ABA ABBABBA B A
| A
25 +
---+-----------+-----------+-----------+-----------+--
40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 12
20:07 Wednesday, June 21, 2006
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A A A
d | A AAAAA AC BA A
u | A B B E BBBBABEBGDBEBD B A
a 0 +--A-ABAA-BABCEACCDCEE-EBHFDKFJJHFCEBCJ-A-AA--------------
l | AB ABBB E BABBFECBCDDDCBDDCABBBAA
| A AA C A
-20 +
---+------------+------------+------------+------------+--
40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 13
20:07 Wednesday, June 21, 2006
プロット : RESID1*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A A A
d | A AAAAA A C B A A
u | A B B E B BBBAB EBHCB EBD AA A
a 0 +--------A-A-BAA-B-BACEA-CCEBE-E-EBH-HBKFJAIHFCE-BCJ-A--AA--------
l | A BA BB BAD B ABBFE DACDDADBBDD CABBB AA
| A AA C A
-20 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
SHINTYOU
SAS システム 14
20:07 Wednesday, June 21, 2006
プロット : RESID1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A B
d | A A AA C BCA A
u | B A D B AC EEDIBAFAEB AA
a 0 +----------A--AABAADADEFDFEDIFDIBRFLEEFCCD-G----------------------
l | ADAACDCH ABFEEEEDDAHC BAA
| A C B A
-20 +
---+---------+---------+---------+---------+---------+---------+--
30 40 50 60 70 80 90
TAIJYUU
SAS システム 15
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Moments
N 302 Sum Wgts 302
Mean 0 Sum 0
Std Dev 5.773462 Variance 33.33286
Skewness 0.754069 Kurtosis 0.895746
USS 10033.19 CSS 10033.19
CV . Std Mean 0.332225
T:Mean=0 0 Pr>|T| 1.0000
Num ^= 0 302 Num > 0 132
M(Sign) -19 Pr>=|M| 0.0331
Sgn Rank -1892.5 Pr>=|S| 0.2133
W:Normal 0.96039 Pr<W 0.0001
SAS システム 18
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Histogram # Boxplot
22.5+* 1 0
.** 4 0
.**** 12 0
.************ 36 |
.*************************** 79 +--+--+
.***************************************** 121 *-----*
.************** 42 |
-12.5+*** 7 |
----+----+----+----+----+----+----+----+-
* may represent up to 3 counts
SAS システム 19
20:07 Wednesday, June 21, 2006
Univariate Procedure
Variable=RESID1 Residual
Normal Probability Plot
22.5+ *
| ****
| ******++++
| ********+
| ++********
| *************
| ***********+
-12.5+****+*++
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
options linesize=72 pagesize=20;
sas les9999.sas