/* Lesson 09-1 */ /* File Name = les0901.sas 12/04/03 */ data gakusei; infile 'all03b.prn' firstobs=2; input sex $ height weight chest jitaku $ kodukai carrier $ tsuuwa; proc print data=gakusei(obs=10); run; : proc plot data=gakusei; : 散布図を描く plot height*weight; : 散布図の変量を指定(縦軸、横軸の順) plot weight*height; : run; : : proc corr data=gakusei; : 相関係数(相関行列)を計算 run; :
SAS システム 2 11:25 Thursday, November 20, 2003 プロット : HEIGHT*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) HEIGHT | 200 + | | B A 180 + A ADCDDCBCA A B A A | AACDJHRMGFCDDCB BA | ADAGHEEDCBBDAA A A 160 + ADBDBHCCAABB | A D DCCA A A | A AAA 140 + ---+-----------+-----------+-----------+-----------+-- 20 40 60 80 100 WEIGHT SAS システム 3 11:25 Thursday, November 20, 2003 プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) 100 + A | A A WEIGHT | A A B A A | B CBDDC CBEAC CBD B AA | A AA C B CABBF HBMHKBIFFCC BADBB A 50 + AAA CABCA CBF F EBBFF DAAAB A | A B B A BA | | | 0 + --+-----------+-----------+-----------+-----------+-----------+-- 140 150 160 170 180 190 HEIGHT SAS システム 4 11:25 Thursday, November 20, 2003 Correlation Analysis 5 'VAR' Variables: HEIGHT WEIGHT CHEST KODUKAI TSUUWA Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum HEIGHT 255 168.0 8.0840 42846.9 145.0 186.0 WEIGHT 229 58.7852 9.0852 13461.8 35.0000 100.0 CHEST 87 86.9080 7.9864 7561.0 56.0000 112.0 KODUKAI 241 51566.4 52037.2 12427500 0 300000 TSUUWA 48 7961.5 5011.7 382150 200.0 30000.0 SAS システム 5 11:25 Thursday, November 20, 2003 Correlation Analysis Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / Number of Observations HEIGHT WEIGHT CHEST KODUKAI TSUUWA HEIGHT 1.00000 0.70774 0.36532 0.02347 0.05957 0.0 0.0001 0.0005 0.7204 0.6875 255 229 87 235 48 WEIGHT 0.70774 1.00000 0.66125 -0.03849 0.11510 0.0001 0.0 0.0001 0.5773 0.4515 229 229 87 212 45 CHEST 0.36532 0.66125 1.00000 -0.11120 0.53420 0.0005 0.0001 0.0 0.3169 0.0905 87 87 87 83 11 KODUKAI 0.02347 -0.03849 -0.11120 1.00000 -0.11297 0.7204 0.5773 0.3169 0.0 0.4600 235 212 83 241 45 TSUUWA 0.05957 0.11510 0.53420 -0.11297 1.00000 0.6875 0.4515 0.0905 0.4600 0.0 48 45 11 45 48
[注意] 相関行列は細切れに表示されるので、 不要部分を削除することによって整形しレポート等に使うこと。
/* Lesson 09-2 */ /* File Name = les0902.sas 12/04/03 */ data gakusei; infile 'all03b.prn' firstobs=2; input sex $ height weight chest jitaku $ kodukai carrier $ tsuuwa; proc print data=gakusei(obs=10); run; : proc reg data=gakusei; : 回帰分析 model weight=height; : 変量を指定 output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存 run; : : proc print data=outreg1(obs=15); : まずは表示 run; : : proc plot data=outreg1; : 散布図を描く plot weight*height/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定) plot pred1*weight; : 予測値と観測値 plot resid1*pred1/vref=0; : 残差と予測値(残差解析)(水平軸指定) plot resid1*height/vref=0; : 残差と説明変数(残差解析) plot resid1*weight/vref=0; : 残差と目的変数(残差解析) run;[補足] proc plot の下に以下の行を追加した方がより正確ではある。 欠損値を含むデータを解析対象から除外する事を指示する命令文である。 「欠損値です」の表示が無くなるだけで、得られる図は同じ(欠損値は描画できないから)。 試しに追加する/しないの両方で実行してみよ。
where weight^=. and height^=.;
SAS システム 2 11:25 Thursday, November 20, 2003 Model: MODEL1 Dependent Variable: WEIGHT Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 1 9426.48780 9426.48780 227.815 0.0001 Error 227 9392.78172 41.37789 C Total 228 18819.26952 Root MSE 6.43257 R-square 0.5009 Dep Mean 58.78515 Adj R-sq 0.4987 C.V. 10.94250 SAS システム 3 11:25 Thursday, November 20, 2003 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 -77.661171 9.05004324 -8.581 0.0001 HEIGHT 1 0.808135 0.05354181 15.094 0.0001 SAS システム 4 11:25 Thursday, November 20, 2003 K C H W J O A T R E E C I D R S P E I I H T U R U R S O S G G E A K I U E I B E H H S K A E W D D S X T T T U I R A 1 1 1 F 145.0 38.0 . J 10000 . 39.5184 -1.5184 2 F 148.0 42.0 . J 50000 . 41.9428 0.0572 3 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.9428 1.0572 4 F 148.9 . . J 60000 . 42.6701 . 5 F 149.0 45.0 . G 60000 . 42.7509 2.2491 6 F 150.0 46.0 86 40000 . 43.5590 2.4410 7 F 151.0 50.0 . G 60000 J-PHONE . 44.3672 5.6328 8 F 151.7 41.5 80 J 35000 . 44.9329 -3.4329 9 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1753 -10.1753 10 F 153.0 41.0 . J 125000 No . 45.9835 -4.9835 11 F 153.0 46.5 87 G 10000 . 45.9835 0.5165 12 F 153.0 50.0 . G 70000 DoCoMo 10000 45.9835 4.0165 13 F 153.0 55.0 78 J 30000 . 45.9835 9.0165 14 F 153.0 . . G 120000 DoCoMo 200 45.9835 . 15 F 153.5 46.0 . J 30000 J-PHONE 8000 46.3875 -0.3875 SAS システム 6 11:25 Thursday, November 20, 2003 プロット : WEIGHT*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) WEIGHT | 100 + A | A A 80 + A A B A A | B CBDDC CBEAC CBD B AA 60 + A AA C B CABBF HBMHKBIFFCC BADBB A | AAA CABCA CBF F EBBFF DAAAB A 40 + A B B A BA | 20 + | --+-----------+-----------+-----------+-----------+-----------+-- 140 150 160 170 180 190 HEIGHT SAS システム 7 11:25 Thursday, November 20, 2003 プロット : PRED1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) 80 + | PRED1 | A B A | A ADAAFAB D A A A A | A BBBKFDD GAA A BB 60 + BEBHHGGJBGBAADAB A | AE EHBF BCAAC | BBBCCDAB AAA | BA BBABA A A | A B AB B A 40 + A AA ---+------------+------------+------------+------------+-- 20 40 60 80 100 WEIGHT SAS システム 8 11:25 Thursday, November 20, 2003 プロット : RESID1*PRED1. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) | R 50 + e | s | A A i 25 + d | A A A A AB A u | A A A A BBAA BBBCDCCAB AA A A a 0 +-------------A--BAA-ABBBCABBF-DEBBCGIBKHHHFIDBBF-A-AA------------ l | AA BAA B BA AFDCACCEB EBBAABBA | A -25 + ---+-----------+-----------+-----------+-----------+-----------+-- 30 40 50 60 70 80 Predicted Value of WEIGHT SAS システム 9 11:25 Thursday, November 20, 2003 プロット : RESID1*HEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) | R 50 + e | s | A A i 25 + d | A A A A A B A u | A A A A B BAA B BBCDC BBB B A A a 0 +--------A---BAA-A-CABCA-BBF-D-EBBCG-IBKFIAHFGBD-BBF-A--AA-------- l | A A BA A B B A AEE CACCDAB CBB BABAB A | A -25 + ---+-----------+-----------+-----------+-----------+-----------+-- 140 150 160 170 180 190 HEIGHT SAS システム 10 11:25 Thursday, November 20, 2003 プロット : RESID1*WEIGHT. 凡例: A = 1 OBS, B = 2 OBS, ... (NOTE: 36 オブザベーションが欠損値です.) | R 50 + e | s | A A i 25 + d | A B BB A u | A AAABBAHBDBFAB A A a 0 +--------------A-BAADCDJHDJGISOFKAH-C--------------------- l | A CABCF CKAHCCECAA | A -25 + ---+------------+------------+------------+------------+-- 20 40 60 80 100 WEIGHT
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。