/* Lesson 10-1 */
/* File Name = les1001.sas 12/06/06 */
data gakusei;
infile 'all06be.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
proc print data=gakusei(obs=10);
run;
proc plot data=gakusei; : 散布図を描く
plot shintyou*taijyuu; : 散布図の変量を指定(縦軸、横軸の順)
plot taijyuu*shintyou; :
run: :
proc corr data=gakusei; : 相関係数(相関行列)を計算
run: :
SAS システム 2
13:01 Thursday, November 30, 2006
プロット : SHINTYOU*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
SHINTYOU |
200 +
|
| A B A
180 + A BFCFDEBGA B B A A A
| CAHELIVQLHDHEDB BC
| AGAGJJFEBCDEAA AA A A
160 + ADDGDIFDBACB
| A ECBEDDA A A
| A BAA
140 +
---+-----------+-----------+-----------+-----------+--
20 40 60 80 100
TAIJYUU
SAS システム 3
13:01 Thursday, November 30, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
100 + B
| A A
TAIJYUU | A A A A B B A A
| A B CBDDE ECGBD DCH B BA
| A AA AE B CBEBG KCSJMBMGFFE CBDCB A
50 + AAB CACEC EDIBG EBEGG DAACC BC
| A A B D BA BA
|
|
|
0 +
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 4
13:01 Thursday, November 30, 2006
Correlation Analysis
5 'VAR' Variables: SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
SHINTYOU 352 167.9 8.1272 59116.6 145.0 186.0
TAIJYUU 319 58.7329 9.2582 18735.8 35.0000 100.0
KYOUI 112 86.5446 7.5168 9693.0 56.0000 112.0
KODUKAI 339 47941.0 47506.2 16252000 0 300000
TSUUWA 140 6501.4 4359.2 910202 0 30000.0
SAS システム 5
13:01 Thursday, November 30, 2006
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
SHINTYOU 1.00000 0.70420 0.39716 0.04799 -0.01338
0.0 0.0001 0.0001 0.3841 0.8767
352 319 112 331 137
TAIJYUU 0.70420 1.00000 0.66735 -0.01784 -0.03891
0.0001 0.0 0.0001 0.7579 0.6641
319 319 112 301 127
KYOUI 0.39716 0.66735 1.00000 -0.08998 -0.17920
0.0001 0.0001 0.0 0.3544 0.2957
112 112 112 108 36
KODUKAI 0.04799 -0.01784 -0.08998 1.00000 0.20547
0.3841 0.7579 0.3544 0.0 0.0164
331 301 108 339 136
TSUUWA -0.01338 -0.03891 -0.17920 0.20547 1.00000
0.8767 0.6641 0.2957 0.0164 0.0
137 127 36 136 140
[注意] 相関行列は細切れに表示されるので、 不要部分を削除することによって整形しレポート等に使うこと。
/* Lesson 10-2 */
/* File Name = les1002.sas 12/06/06 */
data gakusei;
infile 'all06be.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
proc print data=gakusei(obs=10);
run;
proc reg data=gakusei; : 回帰分析
model taijyuu=shintyou; : 変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
:
proc print data=outreg1(obs=15); : 表示してみる
run; :
:
proc plot data=outreg1; : 散布図を描く
plot taijyuu*shintyou/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
plot pred1*taijyuu; : 予測値と観測値
plot resid1*pred1 /vref=0; : 残差と予測値(残差解析)(水平軸指定)
plot resid1*shintyou/vref=0; : 残差と説明変数(残差解析)
plot resid1*taijyuu /vref=0; : 残差と目的変数(残差解析)
run; :
:
proc univariate data=outreg1 plot normal; : 残差を正規プロットして確かめる
var resid1; :
run; :
[補足] proc plot
の下に以下の行を追加した方がより正確ではある。
欠損値を含むデータを解析対象から除外する事を指示する命令文である。
「欠損値です」の表示が無くなるだけで、得られる図は同じ(欠損値は描画できないから)。
試しに追加する/しないの両方で実行してみよ。
where shintyou^=. and taijyuu^=.;
SAS システム 2
13:01 Thursday, November 30, 2006
Model: MODEL1
Dependent Variable: TAIJYUU
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 13516.68437 13516.68437 311.837 0.0001
Error 317 13740.46002 43.34530
C Total 318 27257.14439
Root MSE 6.58371 R-square 0.4959
Dep Mean 58.73292 Adj R-sq 0.4943
C.V. 11.20958
SAS システム 3
13:01 Thursday, November 30, 2006
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -78.160166 7.76082431 -10.071 0.0001
SHINTYOU 1 0.811504 0.04595434 17.659 0.0001
SAS システム 4
13:01 Thursday, November 30, 2006
S
H T K C
I A J O A T R
N I K I D R S P E
T J Y T U R U R S
O S Y Y O A K Y U E I
B E O U U K A E W D D
S X U U I U I R A 1 1
1 F 145.0 38.0 . J 10000 . 39.5079 -1.5079
2 F 146.7 41.0 85 J 10000 Vodafone 6000 40.8875 0.1125
3 F 148.0 42.0 . J 50000 . 41.9424 0.0576
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.9424 1.0576
5 F 148.9 . . J 60000 . 42.6728 .
6 F 149.0 45.0 . G 60000 . 42.7539 2.2461
7 F 150.0 46.0 86 40000 . 43.5654 2.4346
8 F 151.0 45.0 . J 20000 docomo 5000 44.3769 0.6231
9 F 151.0 50.0 . G 60000 J-PHONE . 44.3769 5.6231
10 F 151.7 41.5 80 J 35000 . 44.9450 -3.4450
11 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1884 -10.1884
12 F 152.0 43.0 . J 20000 au 3500 45.1884 -2.1884
13 F 152.0 44.0 . 45000 DoCoMo 4000 45.1884 -1.1884
14 F 153.0 41.0 . J 125000 No . 45.9999 -4.9999
15 F 153.0 42.0 . G 0 Vodafone 1000 45.9999 -3.9999
SAS システム 6
13:01 Thursday, November 30, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
TAIJYUU |
100 + B
| A A
80 + A A A A B B A A
| A B CBDDE ECGBD DCH B BA
60 + A AA AE B CBEBG KCSJMBMGFFE CBDCB A
| AAB CACEC EDIBG EBEGG DAACC BC
40 + A A B D BA BA
|
20 +
|
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 7
13:01 Thursday, November 30, 2006
プロット : PRED1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
80 +
|
PRED1 | A A B A
| A BDACFBB H B A A A A
| ABBCCCNHEECIBB A BC
60 + CFCLHGIMEIBBADBBA A A
| AH EHDI CCAAE A
| BCDDEHACAABA
| BABCDACA A A
| A CACB B A
40 + A BA
---+------------+------------+------------+------------+--
20 40 60 80 100
TAIJYUU
SAS システム 8
13:01 Thursday, November 30, 2006
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A B B A BAA A
u | A A A AB BBBB BCBEDEEAB BA A A
a 0 +-------------A-ABAAACCBDECDCJBEEBFCIJCOJJJHIDECM-A-AA------------
l | AA BAA C BA CGDDACEFDBDFBCBCBAA
| A A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
30 40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 9
13:01 Thursday, November 30, 2006
プロット : RESID1*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A B B A B B A
u | A A A AB B BBB B CBEDE DBB BA A A
a 0 +--------A-A-BAAAC-DBCEC-DCJBE-EBFCI-JCOHKAJHIDE-CCJ-A--AA--------
l | A A BA AAB B A CFE DACEEADBDDD CABBB AA
| A A
-25 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
SHINTYOU
SAS システム 10
13:01 Thursday, November 30, 2006
プロット : RESID1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
(NOTE: 44 オブザベーションが欠損値です.)
|
R 50 +
e |
s | A A
i 25 + A A
d | A BABD A
u | A ABACBBLBECGBC A A
a 0 +--------------A-DBEFFEMLERGJUTJLEJ-G---------------------
l | A CABCJ DMEIDEHCBB
| A A
-25 +
---+------------+------------+------------+------------+--
20 40 60 80 100
TAIJYUU
SAS システム 11
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Moments
N 319 Sum Wgts 319
Mean 0 Sum 0
Std Dev 6.573355 Variance 43.20899
Skewness 1.406071 Kurtosis 4.082218
USS 13740.46 CSS 13740.46
CV . Std Mean 0.368037
T:Mean=0 0 Pr>|T| 1.0000
Num ^= 0 319 Num > 0 138
M(Sign) -21.5 Pr>=|M| 0.0186
Sgn Rank -3002 Pr>=|S| 0.0685
W:Normal 0.920047 Pr
SAS システム 15
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Histogram # Boxplot
35+* 1 *
.* 4 0
.**** 16 0
.****************************** 117 +--+--+
.******************************************** 174 *-----*
-15+** 7 |
----+----+----+----+----+----+----+----+----
* may represent up to 4 counts
SAS システム 16
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Normal Probability Plot
35+ *
| ****
| *******++++
| ++**************
| ***********************
-15+***+**++++
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。
/* Lesson 10-3 */
/* File Name = les1003.sas 12/06/06 */
data gakusei;
infile 'all06be.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
if shintyou=. | taijyuu=. then delete; : 欠損値データを除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei;
where taijyuu<85; : 対象データを絞る
run;
proc reg data=gakusei;
model taijyuu=shintyou;
where taijyuu<85; : 対象データを絞る
output out=outreg1 predicted=pred1 residual=resid1;
run;
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
where taijyuu<85; : 対象データを絞る
plot taijyuu*shintyou;
plot taijyuu*pred1;
plot resid1*(pred1 shintyou taijyuu)/vref=0; : まとめて指定することも可
run;
proc univariate data=outreg1 plot normal;
var resid1;
run;
SAS システム 2
13:01 Thursday, November 30, 2006
Correlation Analysis
5 'VAR' Variables: SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
SHINTYOU 315 168.6 8.0149 53105.0 145.0 186.0
TAIJYUU 315 58.2930 8.4300 18362.3 35.0000 82.0000
KYOUI 109 86.1193 7.0497 9387.0 56.0000 110.0
KODUKAI 297 48415.8 48958.6 14379500 0 300000
TSUUWA 127 6629.9 4376.7 842002 0 30000.0
SAS システム 3
13:01 Thursday, November 30, 2006
Correlation Analysis
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ Number of Observations
SHINTYOU TAIJYUU KYOUI KODUKAI TSUUWA
SHINTYOU 1.00000 0.72993 0.36359 0.05739 -0.05044
0.0 0.0001 0.0001 0.3243 0.5733
315 315 109 297 127
TAIJYUU 0.72993 1.00000 0.60582 0.00400 -0.03891
0.0001 0.0 0.0001 0.9453 0.6641
315 315 109 297 127
KYOUI 0.36359 0.60582 1.00000 -0.08629 -0.17920
0.0001 0.0001 0.0 0.3814 0.2957
109 109 109 105 36
KODUKAI 0.05739 0.00400 -0.08629 1.00000 0.24072
0.3243 0.9453 0.3814 0.0 0.0073
297 297 105 297 123
TSUUWA -0.05044 -0.03891 -0.17920 0.24072 1.00000
0.5733 0.6641 0.2957 0.0073 0.0
127 127 36 123 127
SAS システム 6
13:01 Thursday, November 30, 2006
Model: MODEL1
Dependent Variable: TAIJYUU
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 11889.02775 11889.02775 356.950 0.0001
Error 313 10425.17688 33.30727
C Total 314 22314.20463
Root MSE 5.77125 R-square 0.5328
Dep Mean 58.29302 Adj R-sq 0.5313
C.V. 9.90041
SAS システム 7
13:01 Thursday, November 30, 2006
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -71.136573 6.85833410 -10.372 0.0001
SHINTYOU 1 0.767730 0.04063545 18.893 0.0001
SAS システム 10
13:01 Thursday, November 30, 2006
プロット : TAIJYUU*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
TAIJYUU |
100 +
|
| A
75 + A B BAB B C B BA A
| BB B CBICDAEDGDD CCKAB BA
| A AA AE B C DBG JCMJLALFEDE CAABA A
50 + AA CACEB DDGBF EBEGG DAACC BC
| A A BA AC BA BB A B A
| A
25 +
--+-----------+-----------+-----------+-----------+-----------+-
140 150 160 170 180 190
SHINTYOU
SAS システム 11
13:01 Thursday, November 30, 2006
プロット : TAIJYUU*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
TAIJYUU |
100 +
|
| A
75 + A B BABB CAABA A
| BBBCBHDDFDGDDCNAB BA
| A AA AE BC DIHEMJMKGEFCCACAA
50 + AA CDEBDCHBFEBENCBACC BC
| A ABA BBBABBA B A
| A
25 +
---+-----------+-----------+-----------+-----------+--
40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 12
13:01 Thursday, November 30, 2006
プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A A A
d | A AAAAB AC BA A
u | A B B AB BBBBABEBHDCDBD B A
a 0 +--A-ABAAABABCEACCGCEE-FBIFDJGKKHFDECCJ-A-AA--------------
l | AB ABBB E BABCFECBDEDDCBDDCABBBAA
| A AA C A
-20 +
---+------------+------------+------------+------------+--
40 50 60 70 80
Predicted Value of TAIJYUU
SAS システム 13
13:01 Thursday, November 30, 2006
プロット : RESID1*SHINTYOU. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A A A
d | A AAAAB A C B A A
u | A B B AB B BBBAB EBICC DBD AA A
a 0 +--------A-A-BAAAB-BACEA-CCHBE-E-FBI-HBJGKAJHFDE-CCJ-A--AA--------
l | A BA BB BAD B ABCFE DADEDADBBDD CABBB AA
| A AA C A
-20 +
---+-----------+-----------+-----------+-----------+-----------+--
140 150 160 170 180 190
SHINTYOU
SAS システム 14
13:01 Thursday, November 30, 2006
プロット : RESID1*TAIJYUU. 凡例: A = 1 OBS, B = 2 OBS, ...
|
R 40 +
e |
s |
i 20 + A B
d | A A AB C BCA A
u | B A A B AD EFDHBAGAEB AA
a 0 +----------A--AABABDADEFDFEEMEDIBTFLEEGECD-G----------------------
l | ADAACDCI ABFFEEFDDAHC BAA
| A C B A
-20 +
---+---------+---------+---------+---------+---------+---------+--
30 40 50 60 70 80 90
TAIJYUU
SAS システム 15
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Moments
N 315 Sum Wgts 315
Mean 0 Sum 0
Std Dev 5.762048 Variance 33.2012
Skewness 0.731318 Kurtosis 0.827352
USS 10425.18 CSS 10425.18
CV . Std Mean 0.324655
T:Mean=0 0 Pr>|T| 1.0000
Num ^= 0 315 Num > 0 139
M(Sign) -18.5 Pr>=|M| 0.0424
Sgn Rank -2031 Pr>=|S| 0.2098
W:Normal 0.961662 Pr
SAS システム 18
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Histogram # Boxplot
22.5+* 1 0
.** 4 0
.***** 13 0
.************* 38 |
.**************************** 83 +--+--+
.****************************************** 125 *-----*
.*************** 44 |
-12.5+*** 7 |
----+----+----+----+----+----+----+----+--
* may represent up to 3 counts
SAS システム 19
13:01 Thursday, November 30, 2006
Univariate Procedure
Variable=RESID1 Residual
Normal Probability Plot
22.5+ *
| ****
| ******++++
| ********+
| ++********
| ************
| ***********+
-12.5+****+*++
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
options linesize=72 pagesize=20;
sas les9999.sas