/* Lesson 12-01 */
/* File Name = les1201.sas 01/15/19 */
options nocenter linesize=78 pagesize=30;
proc printto print = 'Kougi/les1201_results.txt' new;
data gakusei;
infile 'Kougi/all08c_sjis.csv'
firstobs=2 dlm=',' dsd missover
encoding=sjis termstr=crlf;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
proc print data=gakusei(obs=5);
run;
title '*** データ全体を対象に ***'; : 出力に説明を追記できる
proc freq data=gakusei;
table sex;
run;
proc means data=gakusei;
var shintyou taijyuu;
run;
proc univariate data=gakusei plot;
var shintyou taijyuu;
run;
/* 性別ごとに(方法1) */
title '*** 性別ごとに平均値(方法1) ***'; : 出力に説明を追記できる
proc means data=gakusei; : 平均を算出
where sex="M"; : 男について計算
var shintyou taijyuu;
run;
proc means data=gakusei; : 平均を算出
where sex="F"; : 女について計算
var shintyou taijyuu;
run;
/* 性別ごとに(方法2) */
title '*** 性別ごとに平均値(方法2) ***'; : 出力に説明を追記できる
proc sort data=gakusei; : 並べ替え(ソート)
by sex; : 性別ごとに
run;
proc means data=gakusei; : 平均の計算
var shintyou taijyuu; : 身長と体重について
by sex; : 性別ごとに
run;
proc univariate data=gakusei plot; : 基礎統計量の計算
var shintyou taijyuu; : 身長と体重について
by sex; : 性別ごとに
run;
/* 性別ごとにヒストグラム(方法1) */
title ' *** 性別ごとにヒストグラム(方法1) ***';
proc chart data=gakusei; : ヒストグラム
hbar shintyou taijyuu; : 指定した変量の水平棒グラフを表示
by sex;
run;
/* 性別ごとにヒストグラム(方法2) */
title '*** 性別ごとにヒストグラム(方法2) ***';
proc chart data=gakusei; : ヒストグラム
hbar shintyou taijyuu/group=sex; : 性別ごとに併置して
run;
*** データ全体を対象に *** 237
2019年 1月15日 火曜日 11時51分39秒
FREQ プロシジャ
累積 累積
sex 度数 パーセント 度数 パーセント
-----------------------------------------------------------------
F 134 33.58 134 33.58
M 265 66.42 399 100.00
Frequency Missing = 5
*** データ全体を対象に *** 238
2019年 1月15日 火曜日 11時51分39秒
MEANS プロシジャ
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 389 167.9092545 8.2673882 145.0000000 188.0000000
taijyuu 350 58.9542857 9.3840395 35.0000000 100.0000000
--------------------------------------------------------------------------
<<< 中略 >>>
*** 性別ごとに平均値(方法1) *** 245
2019年 1月15日 火曜日 11時51分40秒
MEANS プロシジャ
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 261 172.2528736 5.5465132 156.0000000 188.0000000
taijyuu 261 62.3601533 8.0245310 46.0000000 100.0000000
--------------------------------------------------------------------------
*** 性別ごとに平均値(方法1) *** 246
2019年 1月15日 火曜日 11時51分40秒
MEANS プロシジャ
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 127 158.9818898 5.2517332 145.0000000 171.0000000
taijyuu 88 48.8409091 4.7482032 35.0000000 60.0000000
--------------------------------------------------------------------------
*** 性別ごとに平均値(方法2) *** 247
2019年 1月15日 火曜日 11時51分40秒
sex=' '
MEANS プロシジャ
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 1 168.0000000 . 168.0000000 168.0000000
taijyuu 1 60.0000000 . 60.0000000 60.0000000
--------------------------------------------------------------------------
sex=F
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 127 158.9818898 5.2517332 145.0000000 171.0000000
taijyuu 88 48.8409091 4.7482032 35.0000000 60.0000000
--------------------------------------------------------------------------
*** 性別ごとに平均値(方法2) *** 248
2019年 1月15日 火曜日 11時51分40秒
sex=M
MEANS プロシジャ
変数 N 平均 標準偏差 最小値 最大値
--------------------------------------------------------------------------
shintyou 261 172.2528736 5.5465132 156.0000000 188.0000000
taijyuu 261 62.3601533 8.0245310 46.0000000 100.0000000
--------------------------------------------------------------------------
<<< 中略 >>>
*** 性別ごとにヒストグラム(方法1) *** 273
2019年 1月15日 火曜日 11時51分41秒
sex=' '
shintyou 累積 累積
中間点 度数 度数 パーセント パーセント
|
168 |********** 1 1 100.00 100.00
|
----------+
1
度数
*** 性別ごとにヒストグラム(方法1) *** 274
2019年 1月15日 火曜日 11時51分41秒
sex=' '
taijyuu 累積 累積
中間点 度数 度数 パーセント パーセント
|
60 |********** 1 1 100.00 100.00
|
----------+
1
度数
*** 性別ごとにヒストグラム(方法1) *** 275
2019年 1月15日 火曜日 11時51分41秒
sex=F
shintyou 累積 累積
中間点 度数 度数 パーセント パーセント
|
144 |* 1 1 0.79 0.79
147 |** 3 4 2.36 3.15
150 |*** 6 10 4.72 7.87
153 |******* 14 24 11.02 18.90
156 |************* 25 49 19.69 38.58
159 |*************** 29 78 22.83 61.42
162 |************ 23 101 18.11 79.53
165 |********* 18 119 14.17 93.70
168 |*** 5 124 3.94 97.64
171 |** 3 127 2.36 100.00
|
-----+----+----+
10 20 30
度数
*** 性別ごとにヒストグラム(方法1) *** 276
2019年 1月15日 火曜日 11時51分41秒
sex=F
taijyuu 累積 累積
中間点 度数 度数 パーセント パーセント
|
36 |* 1 1 1.14 1.14
|
40 |** 4 5 4.55 5.68
|
44 |******** 16 21 18.18 23.86
|
48 |************** 27 48 30.68 54.55
|
52 |************** 28 76 31.82 86.36
|
56 |**** 8 84 9.09 95.45
|
60 |** 4 88 4.55 100.00
|
-----+----+----
10 20
度数
*** 性別ごとにヒストグラム(方法1) *** 277
2019年 1月15日 火曜日 11時51分41秒
sex=M
shintyou 累積 累積
中間点 度数 度数 パーセント パーセント
|
157.5 | 2 2 0.77 0.77
160.5 |* 7 9 2.68 3.45
163.5 |** 10 19 3.83 7.28
166.5 |***** 25 44 9.58 16.86
169.5 |*********** 56 100 21.46 38.31
172.5 |************* 65 165 24.90 63.22
175.5 |******** 41 206 15.71 78.93
178.5 |***** 27 233 10.34 89.27
181.5 |**** 20 253 7.66 96.93
184.5 |* 5 258 1.92 98.85
187.5 |* 3 261 1.15 100.00
|
----+---+---+-
20 40 60
度数
*** 性別ごとにヒストグラム(方法1) *** 278
2019年 1月15日 火曜日 11時51分41秒
sex=M
taijyuu 累積 累積
中間点 度数 度数 パーセント パーセント
|
45 | 1 1 0.38 0.38
51 |*** 24 25 9.20 9.58
57 |********* 64 89 24.52 34.10
63 |************** 105 194 40.23 74.33
69 |***** 40 234 15.33 89.66
75 |** 14 248 5.36 95.02
81 |* 7 255 2.68 97.70
87 | 3 258 1.15 98.85
93 | 2 260 0.77 99.62
99 | 1 261 0.38 100.00
|
----+---+---+--
30 60 90
度数
*** 性別ごとにヒストグラム(方法2) *** 279
2019年 1月15日 火曜日 11時51分41秒
sex shintyou 累積 累積
中間点 度数 度数 パーセント パーセント
|
144 | 0 0 0.00 0.00
148 | 0 0 0.00 0.00
152 | 0 0 0.00 0.00
156 | 0 0 0.00 0.00
160 | 0 0 0.00 0.00
164 | 0 0 0.00 0.00
168 | 1 1 0.26 0.26
172 | 0 1 0.00 0.26
176 | 0 1 0.00 0.26
180 | 0 1 0.00 0.26
184 | 0 1 0.00 0.26
188 | 0 1 0.00 0.26
|
F 144 | 1 2 0.26 0.51
148 |* 5 7 1.29 1.80
152 |** 16 23 4.11 5.91
156 |*** 27 50 6.94 12.85
160 |**** 36 86 9.25 22.11
164 |*** 27 113 6.94 29.05
168 |* 13 126 3.34 32.39
172 | 2 128 0.51 32.90
176 | 0 128 0.00 32.90
180 | 0 128 0.00 32.90
184 | 0 128 0.00 32.90
188 | 0 128 0.00 32.90
|
M 144 | 0 128 0.00 32.90
148 | 0 128 0.00 32.90
152 | 0 128 0.00 32.90
156 | 2 130 0.51 33.42
160 |* 7 137 1.80 35.22
164 |** 18 155 4.63 39.85
168 |***** 45 200 11.57 51.41
172 |********* 93 293 23.91 75.32
176 |***** 49 342 12.60 87.92
180 |**** 35 377 9.00 96.92
184 |* 9 386 2.31 99.23
188 | 3 389 0.77 100.00
|
-----+----
50
度数
<<< 中略 >>>
if sex=" " or shintyou="." or taijyuu="." then delete; : 欠損値を含んだデータは除外
data gakusei;
infile 'Kougi/daigaku08.csv'
firstobs=2 dlm=',' dsd missover
encoding=sjis termstr=crlf;
input id $ sex $ kesseki $ univ $
koku $ suu1 $ suu2 $ tireki $ koumin $ rika $;
if sex^='M' then delete; /* 男(male)のみを対象とする */
if kesseki^='0' then delete; /* 出席者のみを対象とする */
area="不明";
if univ="早稲田大学" then area="東日本";
if univ="慶応大学" then area="東日本";
if univ="関西大学" then area="西日本";
if univ="同志社大学" then area="西日本";
if tireki="世界史-0" then tireki="世界史";
if tireki="世界史-2" then tireki="世界史";
if tireki="日本史-2" then tireki="日本史";
if tireki="日本史-3" then tireki="日本史";
...
[例4] 複数の処理をさせたい場合 : do 〜 end で囲む
if tireki="世界史-0" then do;
tireki="世界史";
koumin=.; /* ドットは欠損値を示す */
end;
...
/* Lesson 12-04 */
/* File Name = les1204.sas 01/25/18 */
options nocenter linesize=78 pagesize=30;
proc printto print = 'Kougi/les1204_Results.txt' new;
data gakusei;
infile 'Kougi/all08c_sjis.csv'
firstobs=2 dlm=',';
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex=" " or shintyou="." or taijyuu="." then delete;
proc print data=gakusei(obs=5);
run;
proc sort data=gakusei;
by sex;
run;
proc univariate data=gakusei plot;
var shintyou taijyuu kyoui kodukai;
by sex;
run;
proc ttest data=gakusei;
class sex;
var shintyou taijyuu kyoui kodukai;
run;
2019年 1月15日 火曜日 00時19分56秒 114
TTEST プロシジャ
変数 : shintyou
sex 手法 N 平均 標準偏差 標準誤差
F 88 158.6 5.3057 0.5656
M 261 172.3 5.5465 0.3433
Diff (1-2) Pooled -13.6801 5.4871 0.6764
Diff (1-2) Satterthwaite -13.6801 0.6616
sex 手法 最小値 最大値
F 145.0 168.0
M 156.0 188.0
Diff (1-2) Pooled
Diff (1-2) Satterthwaite
2019年 1月15日 火曜日 00時19分56秒 115
TTEST プロシジャ
変数 : shintyou
平均の
sex 手法 平均 95% 信頼限界 標準偏差
F 158.6 157.4 159.7 5.3057
M 172.3 171.6 172.9 5.5465
Diff (1-2) Pooled -13.6801 -15.0105 -12.3498 5.4871
Diff (1-2) Satterthwaite -13.6801 -14.9871 -12.3732
標準偏差の
sex 手法 95% 信頼限界
F 4.6210 6.2305
M 5.1080 6.0680
Diff (1-2) Pooled 5.1075 5.9282
Diff (1-2) Satterthwaite
手法 分散 自由度 t 値 Pr > |t|
Pooled Equal 347 -20.23 <.0001
Satterthwaite Unequal 155.85 -20.68 <.0001
2019年 1月15日 火曜日 00時19分56秒 116
TTEST プロシジャ
変数 : shintyou
等分散性
手法 分子の自由度 分母の自由度 F 値 Pr > F
Folded F 260 87 1.09 0.6361
変数 : taijyuu
sex 手法 N 平均 標準偏差 標準誤差
F 88 48.8409 4.7482 0.5062
M 261 62.3602 8.0245 0.4967
Diff (1-2) Pooled -13.5192 7.3417 0.9050
Diff (1-2) Satterthwaite -13.5192 0.7092
sex 手法 最小値 最大値
F 35.0000 60.0000
M 46.0000 100.0
Diff (1-2) Pooled
Diff (1-2) Satterthwaite
2019年 1月15日 火曜日 00時19分57秒 117
TTEST プロシジャ
変数 : taijyuu
平均の
sex 手法 平均 95% 信頼限界 標準偏差
F 48.8409 47.8349 49.8470 4.7482
M 62.3602 61.3821 63.3382 8.0245
Diff (1-2) Pooled -13.5192 -15.2992 -11.7393 7.3417
Diff (1-2) Satterthwaite -13.5192 -14.9158 -12.1227
標準偏差の
sex 手法 95% 信頼限界
F 4.1354 5.5758
M 7.3901 8.7790
Diff (1-2) Pooled 6.8338 7.9319
Diff (1-2) Satterthwaite
手法 分散 自由度 t 値 Pr > |t|
Pooled Equal 347 -14.94 <.0001
Satterthwaite Unequal 255.85 -19.06 <.0001
2019年 1月15日 火曜日 00時19分57秒 118
TTEST プロシジャ
変数 : taijyuu
等分散性
手法 分子の自由度 分母の自由度 F 値 Pr > F
Folded F 260 87 2.86 <.0001
<<< 中略 >>>
変数 : kodukai
sex 手法 N 平均 標準偏差 標準誤差
F 82 50567.1 48126.7 5314.7
M 247 49530.4 58902.5 3747.9
Diff (1-2) Pooled 1036.7 56425.4 7191.5
Diff (1-2) Satterthwaite 1036.7 6503.3
sex 手法 最小値 最大値
F 0 300000
M 0 500000
Diff (1-2) Pooled
Diff (1-2) Satterthwaite
2019年 1月15日 火曜日 00時19分58秒 121
TTEST プロシジャ
変数 : kodukai
平均の
sex 手法 平均 95% 信頼限界 標準偏差
F 50567.1 39992.5 61141.7 48126.7
M 49530.4 42148.3 56912.4 58902.5
Diff (1-2) Pooled 1036.7 -13110.7 15184.1 56425.4
Diff (1-2) Satterthwaite 1036.7 -11802.0 13875.4
標準偏差の
sex 手法 95% 信頼限界
F 41720.8 56874.9
M 54125.8 64611.2
Diff (1-2) Pooled 52412.5 61108.8
Diff (1-2) Satterthwaite
手法 分散 自由度 t 値 Pr > |t|
Pooled Equal 327 0.14 0.8855
Satterthwaite Unequal 167.92 0.16 0.8735
2019年 1月15日 火曜日 00時19分58秒 122
TTEST プロシジャ
変数 : kodukai
等分散性
手法 分子の自由度 分母の自由度 F 値 Pr > F
Folded F 246 81 1.50 0.0342
/* Lesson 12-05 */
/* File Name = les1205.sas 01/25/18 */
options nocenter linesize=78 pagesize=30;
proc printto print = 'Kougi/les1205_Results.txt' new;
data gakusei;
infile 'Kougi/all08c_sjis.csv'
firstobs=2 dlm=',';
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex=" " or shintyou="." or taijyuu="." then delete;
proc print data=gakusei(obs=5);
run;
proc npar1way data=gakusei wilcoxon; : wilcoxon 検定
class sex; : 分類したい特性変数の指定
var shintyou taijyuu kyoui kodukai; : 比較したい変量名
run; :
2019年 1月15日 火曜日 11時58分24秒 287
NPAR1WAY プロシジャ
変数 shintyou に対する Wilcoxon スコア (順位和)
分類変数 : sex
スコアの H0 のもとでの H0 のもとでの 平均
sex N 合計 期待値 標準偏差 スコア
F 88 4654.0 15400.0 817.853055 52.886364
M 261 56421.0 45675.0 817.853055 216.172414
同順位には平均スコアを使用しました。
Wilcoxon の順位和検定 (2 標本)
統計量 4654.0000
正規近似
Z -13.1387
片側 Pr < Z <.0001
両側 Pr > |Z| <.0001
t 分布で近似
片側 Pr < Z <.0001
Z には 0.5 の連続性の補正が含まれています。
2019年 1月15日 火曜日 11時58分24秒 288
NPAR1WAY プロシジャ
Wilcoxon の順位和検定 (2 標本)
両側 Pr > |Z| <.0001
Z には 0.5 の連続性の補正が含まれています。
Kruskal-Wallis 検定
カイ 2 乗 172.6407
自由度 1
Pr > Chi-Square <.0001
2019年 1月15日 火曜日 11時58分24秒 289
NPAR1WAY プロシジャ
変数 taijyuu に対する Wilcoxon スコア (順位和)
分類変数 : sex
スコアの H0 のもとでの H0 のもとでの 平均
sex N 合計 期待値 標準偏差 スコア
F 88 5044.0 15400.0 817.684297 57.318182
M 261 56031.0 45675.0 817.684297 214.678161
同順位には平均スコアを使用しました。
Wilcoxon の順位和検定 (2 標本)
統計量 5044.0000
正規近似
Z -12.6644
片側 Pr < Z <.0001
両側 Pr > |Z| <.0001
t 分布で近似
片側 Pr < Z <.0001
Z には 0.5 の連続性の補正が含まれています。
2019年 1月15日 火曜日 11時58分24秒 290
NPAR1WAY プロシジャ
Wilcoxon の順位和検定 (2 標本)
両側 Pr > |Z| <.0001
Z には 0.5 の連続性の補正が含まれています。
Kruskal-Wallis 検定
カイ 2 乗 160.4031
自由度 1
Pr > Chi-Square <.0001
<<< 中略 >>>
2019年 1月15日 火曜日 11時58分24秒 293
NPAR1WAY プロシジャ
変数 kodukai に対する Wilcoxon スコア (順位和)
分類変数 : sex
スコアの H0 のもとでの H0 のもとでの 平均
sex N 合計 期待値 標準偏差 スコア
F 82 14523.50 13530.0 742.640535 177.115854
M 247 39761.50 40755.0 742.640535 160.977733
同順位には平均スコアを使用しました。
Wilcoxon の順位和検定 (2 標本)
統計量 14523.5000
正規近似
Z 1.3371
片側 Pr > Z 0.0906
両側 Pr > |Z| 0.1812
t 分布で近似
片側 Pr > Z 0.0911
Z には 0.5 の連続性の補正が含まれています。
2019年 1月15日 火曜日 11時58分24秒 294
NPAR1WAY プロシジャ
Wilcoxon の順位和検定 (2 標本)
両側 Pr > |Z| 0.1821
Z には 0.5 の連続性の補正が含まれています。
Kruskal-Wallis 検定
カイ 2 乗 1.7897
自由度 1
Pr > Chi-Square 0.1810