/* Lesson 12-01 */ /* File Name = les1201.sas 01/15/19 */ options nocenter linesize=78 pagesize=30; proc printto print = 'Kougi/les1201_results.txt' new; data gakusei; infile 'Kougi/all08c_sjis.csv' firstobs=2 dlm=',' dsd missover encoding=sjis termstr=crlf; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; proc print data=gakusei(obs=5); run; title '*** データ全体を対象に ***'; : 出力に説明を追記できる proc freq data=gakusei; table sex; run; proc means data=gakusei; var shintyou taijyuu; run; proc univariate data=gakusei plot; var shintyou taijyuu; run; /* 性別ごとに(方法1) */ title '*** 性別ごとに平均値(方法1) ***'; : 出力に説明を追記できる proc means data=gakusei; : 平均を算出 where sex="M"; : 男について計算 var shintyou taijyuu; run; proc means data=gakusei; : 平均を算出 where sex="F"; : 女について計算 var shintyou taijyuu; run; /* 性別ごとに(方法2) */ title '*** 性別ごとに平均値(方法2) ***'; : 出力に説明を追記できる proc sort data=gakusei; : 並べ替え(ソート) by sex; : 性別ごとに run; proc means data=gakusei; : 平均の計算 var shintyou taijyuu; : 身長と体重について by sex; : 性別ごとに run; proc univariate data=gakusei plot; : 基礎統計量の計算 var shintyou taijyuu; : 身長と体重について by sex; : 性別ごとに run; /* 性別ごとにヒストグラム(方法1) */ title ' *** 性別ごとにヒストグラム(方法1) ***'; proc chart data=gakusei; : ヒストグラム hbar shintyou taijyuu; : 指定した変量の水平棒グラフを表示 by sex; run; /* 性別ごとにヒストグラム(方法2) */ title '*** 性別ごとにヒストグラム(方法2) ***'; proc chart data=gakusei; : ヒストグラム hbar shintyou taijyuu/group=sex; : 性別ごとに併置して run;
*** データ全体を対象に *** 237 2019年 1月15日 火曜日 11時51分39秒 FREQ プロシジャ 累積 累積 sex 度数 パーセント 度数 パーセント ----------------------------------------------------------------- F 134 33.58 134 33.58 M 265 66.42 399 100.00 Frequency Missing = 5 *** データ全体を対象に *** 238 2019年 1月15日 火曜日 11時51分39秒 MEANS プロシジャ 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 389 167.9092545 8.2673882 145.0000000 188.0000000 taijyuu 350 58.9542857 9.3840395 35.0000000 100.0000000 -------------------------------------------------------------------------- <<< 中略 >>> *** 性別ごとに平均値(方法1) *** 245 2019年 1月15日 火曜日 11時51分40秒 MEANS プロシジャ 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 261 172.2528736 5.5465132 156.0000000 188.0000000 taijyuu 261 62.3601533 8.0245310 46.0000000 100.0000000 -------------------------------------------------------------------------- *** 性別ごとに平均値(方法1) *** 246 2019年 1月15日 火曜日 11時51分40秒 MEANS プロシジャ 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 127 158.9818898 5.2517332 145.0000000 171.0000000 taijyuu 88 48.8409091 4.7482032 35.0000000 60.0000000 -------------------------------------------------------------------------- *** 性別ごとに平均値(方法2) *** 247 2019年 1月15日 火曜日 11時51分40秒 sex=' ' MEANS プロシジャ 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 1 168.0000000 . 168.0000000 168.0000000 taijyuu 1 60.0000000 . 60.0000000 60.0000000 -------------------------------------------------------------------------- sex=F 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 127 158.9818898 5.2517332 145.0000000 171.0000000 taijyuu 88 48.8409091 4.7482032 35.0000000 60.0000000 -------------------------------------------------------------------------- *** 性別ごとに平均値(方法2) *** 248 2019年 1月15日 火曜日 11時51分40秒 sex=M MEANS プロシジャ 変数 N 平均 標準偏差 最小値 最大値 -------------------------------------------------------------------------- shintyou 261 172.2528736 5.5465132 156.0000000 188.0000000 taijyuu 261 62.3601533 8.0245310 46.0000000 100.0000000 -------------------------------------------------------------------------- <<< 中略 >>> *** 性別ごとにヒストグラム(方法1) *** 273 2019年 1月15日 火曜日 11時51分41秒 sex=' ' shintyou 累積 累積 中間点 度数 度数 パーセント パーセント | 168 |********** 1 1 100.00 100.00 | ----------+ 1 度数 *** 性別ごとにヒストグラム(方法1) *** 274 2019年 1月15日 火曜日 11時51分41秒 sex=' ' taijyuu 累積 累積 中間点 度数 度数 パーセント パーセント | 60 |********** 1 1 100.00 100.00 | ----------+ 1 度数 *** 性別ごとにヒストグラム(方法1) *** 275 2019年 1月15日 火曜日 11時51分41秒 sex=F shintyou 累積 累積 中間点 度数 度数 パーセント パーセント | 144 |* 1 1 0.79 0.79 147 |** 3 4 2.36 3.15 150 |*** 6 10 4.72 7.87 153 |******* 14 24 11.02 18.90 156 |************* 25 49 19.69 38.58 159 |*************** 29 78 22.83 61.42 162 |************ 23 101 18.11 79.53 165 |********* 18 119 14.17 93.70 168 |*** 5 124 3.94 97.64 171 |** 3 127 2.36 100.00 | -----+----+----+ 10 20 30 度数 *** 性別ごとにヒストグラム(方法1) *** 276 2019年 1月15日 火曜日 11時51分41秒 sex=F taijyuu 累積 累積 中間点 度数 度数 パーセント パーセント | 36 |* 1 1 1.14 1.14 | 40 |** 4 5 4.55 5.68 | 44 |******** 16 21 18.18 23.86 | 48 |************** 27 48 30.68 54.55 | 52 |************** 28 76 31.82 86.36 | 56 |**** 8 84 9.09 95.45 | 60 |** 4 88 4.55 100.00 | -----+----+---- 10 20 度数 *** 性別ごとにヒストグラム(方法1) *** 277 2019年 1月15日 火曜日 11時51分41秒 sex=M shintyou 累積 累積 中間点 度数 度数 パーセント パーセント | 157.5 | 2 2 0.77 0.77 160.5 |* 7 9 2.68 3.45 163.5 |** 10 19 3.83 7.28 166.5 |***** 25 44 9.58 16.86 169.5 |*********** 56 100 21.46 38.31 172.5 |************* 65 165 24.90 63.22 175.5 |******** 41 206 15.71 78.93 178.5 |***** 27 233 10.34 89.27 181.5 |**** 20 253 7.66 96.93 184.5 |* 5 258 1.92 98.85 187.5 |* 3 261 1.15 100.00 | ----+---+---+- 20 40 60 度数 *** 性別ごとにヒストグラム(方法1) *** 278 2019年 1月15日 火曜日 11時51分41秒 sex=M taijyuu 累積 累積 中間点 度数 度数 パーセント パーセント | 45 | 1 1 0.38 0.38 51 |*** 24 25 9.20 9.58 57 |********* 64 89 24.52 34.10 63 |************** 105 194 40.23 74.33 69 |***** 40 234 15.33 89.66 75 |** 14 248 5.36 95.02 81 |* 7 255 2.68 97.70 87 | 3 258 1.15 98.85 93 | 2 260 0.77 99.62 99 | 1 261 0.38 100.00 | ----+---+---+-- 30 60 90 度数 *** 性別ごとにヒストグラム(方法2) *** 279 2019年 1月15日 火曜日 11時51分41秒 sex shintyou 累積 累積 中間点 度数 度数 パーセント パーセント | 144 | 0 0 0.00 0.00 148 | 0 0 0.00 0.00 152 | 0 0 0.00 0.00 156 | 0 0 0.00 0.00 160 | 0 0 0.00 0.00 164 | 0 0 0.00 0.00 168 | 1 1 0.26 0.26 172 | 0 1 0.00 0.26 176 | 0 1 0.00 0.26 180 | 0 1 0.00 0.26 184 | 0 1 0.00 0.26 188 | 0 1 0.00 0.26 | F 144 | 1 2 0.26 0.51 148 |* 5 7 1.29 1.80 152 |** 16 23 4.11 5.91 156 |*** 27 50 6.94 12.85 160 |**** 36 86 9.25 22.11 164 |*** 27 113 6.94 29.05 168 |* 13 126 3.34 32.39 172 | 2 128 0.51 32.90 176 | 0 128 0.00 32.90 180 | 0 128 0.00 32.90 184 | 0 128 0.00 32.90 188 | 0 128 0.00 32.90 | M 144 | 0 128 0.00 32.90 148 | 0 128 0.00 32.90 152 | 0 128 0.00 32.90 156 | 2 130 0.51 33.42 160 |* 7 137 1.80 35.22 164 |** 18 155 4.63 39.85 168 |***** 45 200 11.57 51.41 172 |********* 93 293 23.91 75.32 176 |***** 49 342 12.60 87.92 180 |**** 35 377 9.00 96.92 184 |* 9 386 2.31 99.23 188 | 3 389 0.77 100.00 | -----+---- 50 度数 <<< 中略 >>>
if sex=" " or shintyou="." or taijyuu="." then delete; : 欠損値を含んだデータは除外
data gakusei; infile 'Kougi/daigaku08.csv' firstobs=2 dlm=',' dsd missover encoding=sjis termstr=crlf; input id $ sex $ kesseki $ univ $ koku $ suu1 $ suu2 $ tireki $ koumin $ rika $; if sex^='M' then delete; /* 男(male)のみを対象とする */ if kesseki^='0' then delete; /* 出席者のみを対象とする */ area="不明"; if univ="早稲田大学" then area="東日本"; if univ="慶応大学" then area="東日本"; if univ="関西大学" then area="西日本"; if univ="同志社大学" then area="西日本"; if tireki="世界史-0" then tireki="世界史"; if tireki="世界史-2" then tireki="世界史"; if tireki="日本史-2" then tireki="日本史"; if tireki="日本史-3" then tireki="日本史"; ...
[例4] 複数の処理をさせたい場合 : do 〜 end で囲む
if tireki="世界史-0" then do; tireki="世界史"; koumin=.; /* ドットは欠損値を示す */ end; ...
/* Lesson 12-04 */ /* File Name = les1204.sas 01/25/18 */ options nocenter linesize=78 pagesize=30; proc printto print = 'Kougi/les1204_Results.txt' new; data gakusei; infile 'Kougi/all08c_sjis.csv' firstobs=2 dlm=','; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; if sex=" " or shintyou="." or taijyuu="." then delete; proc print data=gakusei(obs=5); run; proc sort data=gakusei; by sex; run; proc univariate data=gakusei plot; var shintyou taijyuu kyoui kodukai; by sex; run; proc ttest data=gakusei; class sex; var shintyou taijyuu kyoui kodukai; run;
2019年 1月15日 火曜日 00時19分56秒 114 TTEST プロシジャ 変数 : shintyou sex 手法 N 平均 標準偏差 標準誤差 F 88 158.6 5.3057 0.5656 M 261 172.3 5.5465 0.3433 Diff (1-2) Pooled -13.6801 5.4871 0.6764 Diff (1-2) Satterthwaite -13.6801 0.6616 sex 手法 最小値 最大値 F 145.0 168.0 M 156.0 188.0 Diff (1-2) Pooled Diff (1-2) Satterthwaite 2019年 1月15日 火曜日 00時19分56秒 115 TTEST プロシジャ 変数 : shintyou 平均の sex 手法 平均 95% 信頼限界 標準偏差 F 158.6 157.4 159.7 5.3057 M 172.3 171.6 172.9 5.5465 Diff (1-2) Pooled -13.6801 -15.0105 -12.3498 5.4871 Diff (1-2) Satterthwaite -13.6801 -14.9871 -12.3732 標準偏差の sex 手法 95% 信頼限界 F 4.6210 6.2305 M 5.1080 6.0680 Diff (1-2) Pooled 5.1075 5.9282 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 347 -20.23 <.0001 Satterthwaite Unequal 155.85 -20.68 <.0001 2019年 1月15日 火曜日 00時19分56秒 116 TTEST プロシジャ 変数 : shintyou 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 260 87 1.09 0.6361 変数 : taijyuu sex 手法 N 平均 標準偏差 標準誤差 F 88 48.8409 4.7482 0.5062 M 261 62.3602 8.0245 0.4967 Diff (1-2) Pooled -13.5192 7.3417 0.9050 Diff (1-2) Satterthwaite -13.5192 0.7092 sex 手法 最小値 最大値 F 35.0000 60.0000 M 46.0000 100.0 Diff (1-2) Pooled Diff (1-2) Satterthwaite 2019年 1月15日 火曜日 00時19分57秒 117 TTEST プロシジャ 変数 : taijyuu 平均の sex 手法 平均 95% 信頼限界 標準偏差 F 48.8409 47.8349 49.8470 4.7482 M 62.3602 61.3821 63.3382 8.0245 Diff (1-2) Pooled -13.5192 -15.2992 -11.7393 7.3417 Diff (1-2) Satterthwaite -13.5192 -14.9158 -12.1227 標準偏差の sex 手法 95% 信頼限界 F 4.1354 5.5758 M 7.3901 8.7790 Diff (1-2) Pooled 6.8338 7.9319 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 347 -14.94 <.0001 Satterthwaite Unequal 255.85 -19.06 <.0001 2019年 1月15日 火曜日 00時19分57秒 118 TTEST プロシジャ 変数 : taijyuu 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 260 87 2.86 <.0001 <<< 中略 >>> 変数 : kodukai sex 手法 N 平均 標準偏差 標準誤差 F 82 50567.1 48126.7 5314.7 M 247 49530.4 58902.5 3747.9 Diff (1-2) Pooled 1036.7 56425.4 7191.5 Diff (1-2) Satterthwaite 1036.7 6503.3 sex 手法 最小値 最大値 F 0 300000 M 0 500000 Diff (1-2) Pooled Diff (1-2) Satterthwaite 2019年 1月15日 火曜日 00時19分58秒 121 TTEST プロシジャ 変数 : kodukai 平均の sex 手法 平均 95% 信頼限界 標準偏差 F 50567.1 39992.5 61141.7 48126.7 M 49530.4 42148.3 56912.4 58902.5 Diff (1-2) Pooled 1036.7 -13110.7 15184.1 56425.4 Diff (1-2) Satterthwaite 1036.7 -11802.0 13875.4 標準偏差の sex 手法 95% 信頼限界 F 41720.8 56874.9 M 54125.8 64611.2 Diff (1-2) Pooled 52412.5 61108.8 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 327 0.14 0.8855 Satterthwaite Unequal 167.92 0.16 0.8735 2019年 1月15日 火曜日 00時19分58秒 122 TTEST プロシジャ 変数 : kodukai 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 246 81 1.50 0.0342
/* Lesson 12-05 */ /* File Name = les1205.sas 01/25/18 */ options nocenter linesize=78 pagesize=30; proc printto print = 'Kougi/les1205_Results.txt' new; data gakusei; infile 'Kougi/all08c_sjis.csv' firstobs=2 dlm=','; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; if sex=" " or shintyou="." or taijyuu="." then delete; proc print data=gakusei(obs=5); run; proc npar1way data=gakusei wilcoxon; : wilcoxon 検定 class sex; : 分類したい特性変数の指定 var shintyou taijyuu kyoui kodukai; : 比較したい変量名 run; :
2019年 1月15日 火曜日 11時58分24秒 287 NPAR1WAY プロシジャ 変数 shintyou に対する Wilcoxon スコア (順位和) 分類変数 : sex スコアの H0 のもとでの H0 のもとでの 平均 sex N 合計 期待値 標準偏差 スコア F 88 4654.0 15400.0 817.853055 52.886364 M 261 56421.0 45675.0 817.853055 216.172414 同順位には平均スコアを使用しました。 Wilcoxon の順位和検定 (2 標本) 統計量 4654.0000 正規近似 Z -13.1387 片側 Pr < Z <.0001 両側 Pr > |Z| <.0001 t 分布で近似 片側 Pr < Z <.0001 Z には 0.5 の連続性の補正が含まれています。 2019年 1月15日 火曜日 11時58分24秒 288 NPAR1WAY プロシジャ Wilcoxon の順位和検定 (2 標本) 両側 Pr > |Z| <.0001 Z には 0.5 の連続性の補正が含まれています。 Kruskal-Wallis 検定 カイ 2 乗 172.6407 自由度 1 Pr > Chi-Square <.0001 2019年 1月15日 火曜日 11時58分24秒 289 NPAR1WAY プロシジャ 変数 taijyuu に対する Wilcoxon スコア (順位和) 分類変数 : sex スコアの H0 のもとでの H0 のもとでの 平均 sex N 合計 期待値 標準偏差 スコア F 88 5044.0 15400.0 817.684297 57.318182 M 261 56031.0 45675.0 817.684297 214.678161 同順位には平均スコアを使用しました。 Wilcoxon の順位和検定 (2 標本) 統計量 5044.0000 正規近似 Z -12.6644 片側 Pr < Z <.0001 両側 Pr > |Z| <.0001 t 分布で近似 片側 Pr < Z <.0001 Z には 0.5 の連続性の補正が含まれています。 2019年 1月15日 火曜日 11時58分24秒 290 NPAR1WAY プロシジャ Wilcoxon の順位和検定 (2 標本) 両側 Pr > |Z| <.0001 Z には 0.5 の連続性の補正が含まれています。 Kruskal-Wallis 検定 カイ 2 乗 160.4031 自由度 1 Pr > Chi-Square <.0001 <<< 中略 >>> 2019年 1月15日 火曜日 11時58分24秒 293 NPAR1WAY プロシジャ 変数 kodukai に対する Wilcoxon スコア (順位和) 分類変数 : sex スコアの H0 のもとでの H0 のもとでの 平均 sex N 合計 期待値 標準偏差 スコア F 82 14523.50 13530.0 742.640535 177.115854 M 247 39761.50 40755.0 742.640535 160.977733 同順位には平均スコアを使用しました。 Wilcoxon の順位和検定 (2 標本) 統計量 14523.5000 正規近似 Z 1.3371 片側 Pr > Z 0.0906 両側 Pr > |Z| 0.1812 t 分布で近似 片側 Pr > Z 0.0911 Z には 0.5 の連続性の補正が含まれています。 2019年 1月15日 火曜日 11時58分24秒 294 NPAR1WAY プロシジャ Wilcoxon の順位和検定 (2 標本) 両側 Pr > |Z| 0.1821 Z には 0.5 の連続性の補正が含まれています。 Kruskal-Wallis 検定 カイ 2 乗 1.7897 自由度 1 Pr > Chi-Square 0.1810