/* Lesson 11-01 */
/* File Name = les1101.sas 12/21/21 */
options nocenter linesize=78 pagesize=30; : 画面出力サイズ指定
options locale='en_US'; : 出力を英字表記にする
proc printto print = 'StatM21/les1101-Results.txt' new; : 計算結果を直接ファイル出力
data dragons; : ドラゴンズデータ
infile 'StatM21/Dragons21.csv' : ファイルの保存場所
firstobs=8 dlm=',' dsd missover : ファイル特性
encoding=sjis termstr=crlf;
input No $ Name : $24. Pos $ DoBY DoBM DoBD : 読み込む変数(項目)のリスト
shintyou taijyuu tou $ da $ bikou $; : 複数行にわたって
proc print data=dragons(obs=20); : 先頭20ケースを表示
run;
proc means data=dragons; : 平均値等を算出
run;
proc univariate data=dragons plot; : 基礎統計量の算出。plot オプションを指定。
var shintyou DoBY; : 指定した変量について
run;
ods listing; : グラフをキャラクタープロットで出力する場合
ods graphics off; :
proc univariate data=dragons plot;
var shintyou DoBY;
run;
Monday, December 20, 2021 09:26:05 PM 19
s
h t
i a
n i b
N D D D t j i
O a P o o o y y t k
b N m o B B B o u o d o
s o e s Y M D u u u a u
1 11 小笠原 慎之介 投手 1997 10 8 180 95 左 左
2 12 田島 慎二 投手 1989 12 21 181 84 右 右
3 13 橋本 侑樹 投手 1998 1 8 180 71 左 左
4 14 谷元 圭介 投手 1985 1 28 167 72 右 右
5 16 又吉 克樹 投手 1990 11 4 181 74 右 右
6 17 柳 裕也 投手 1994 4 22 180 85 右 右
7 18 梅津 晃大 投手 1996 10 24 187 90 右 右
8 19 髙橋 宏斗 投手 2002 8 9 185 85 右 右
9 21 岡田 俊哉 投手 1991 12 5 178 67 左 左
10 22 大野 雄大 投手 1988 9 26 183 83 左 左
Monday, December 20, 2021 09:26:05 PM 20
The MEANS Procedure
Variable N Mean Std Dev Minimum Maximum
------------------------------------------------------------------------------
DoBY 78 1994.04 5.5066484 1977.00 2003.00
DoBM 78 6.6794872 3.5253943 1.0000000 12.0000000
DoBD 78 15.9615385 8.1375230 2.0000000 31.0000000
shintyou 78 180.5641026 4.5998016 167.0000000 193.0000000
taijyuu 78 84.2820513 7.7189217 65.0000000 108.0000000
------------------------------------------------------------------------------
Monday, December 20, 2021 09:26:05 PM 21
The UNIVARIATE Procedure
Variable: shintyou
Moments
N 78 Sum Weights 78
Mean 180.564103 Sum Observations 14084
Std Deviation 4.59980164 Variance 21.1581752
Skewness -0.2699454 Kurtosis 1.05481804
Uncorrected SS 2544694 Corrected SS 1629.17949
Coeff Variation 2.54746186 Std Error Mean 0.52082498
Basic Statistical Measures
Location Variability
Mean 180.5641 Std Deviation 4.59980
Median 180.0000 Variance 21.15818
Mode 183.0000 Range 26.00000
Interquartile Range 7.00000
Monday, December 20, 2021 09:26:05 PM 22
The UNIVARIATE Procedure
Variable: shintyou
Tests for Location: Mu0=0
Test -Statistic- -----p Value------
Student's t t 346.6886 Pr > |t| <.0001
Sign M 39 Pr >= |M| <.0001
Signed Rank S 1540.5 Pr >= |S| <.0001
Quantiles (Definition 5)
Level Quantile
100% Max 193
99% 193
95% 187
90% 185
75% Q3 184
50% Median 180
25% Q1 177
10% 175
5% 174
1% 167
0% Min 167
Monday, December 20, 2021 09:26:05 PM 23
The UNIVARIATE Procedure
Variable: shintyou
Extreme Observations
----Lowest---- ----Highest---
Value Obs Value Obs
167 28 187 12
167 4 187 44
172 65 190 41
174 66 190 78
174 63 193 34
<<< 中略 >>>
Monday, December 20, 2021 09:26:05 PM 30
The UNIVARIATE Procedure
Variable: shintyou
Stem Leaf # Boxplot
192 0 1 |
190 00 2 |
188 |
186 0000 4 |
184 0000000000000 13 +-----+
182 0000000000000 13 | |
180 00000000000000 14 *--+--*
178 00000000000 11 | |
176 000000000000 12 +-----+
174 00000 5 |
172 0 1 |
170 |
168 |
166 00 2 |
----+----+----+----+
Monday, December 20, 2021 09:26:05 PM 31
The UNIVARIATE Procedure
Variable: shintyou
Normal Probability Plot
193+ *+
| * *++++
| ++++
| ++****
| *******
| *****+
| *****+
| ****+
| ******+
| *****+++
| *+++
| ++++
|+++
167+ * *
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
<<< 以下略 >>>
分布形状と統計量
/* Lesson 11-02 */
/* File Name = les1102.sas 12/21/21 */
options nocenter linesize=78 pagesize=30; : 画面出力サイズ指定
options locale='en_US'; : 出力を英字表記にする
proc printto print = 'StatM21/les1102-Results.txt' new; : 計算結果を直接ファイル出力
data dragons; : ドラゴンズデータ
infile 'StatM21/Dragons21.csv' : ファイルの保存場所
firstobs=8 dlm=',' dsd missover : ファイル特性
encoding=sjis termstr=crlf;
input No $ Name : $24. Pos $ DoBY DoBM DoBD : 読み込む変数(項目)のリスト
shintyou taijyuu tou $ da $ bikou $; : 複数行にわたって
proc print data=dragons(obs=10); : 先頭10ケースを表示
run;
proc chart data=dragons; : ヒストグラムを描く
hbar shintyou; : 水平棒グラフ。変量を指定(複数指定も可)。
vbar shintyou; : 垂直棒グラフ。変量を指定(複数指定も可)。
hbar DoBY;
vbar DoBY;
run;
proc freq data=dragons; : 頻度を算出。個々&クロス集計
table tou da tou*da;
run;
Monday, December 20, 2021 07:14:36 PM 14
s
h t
i a
n i b
N D D D t j i
O a P o o o y y t k
b N m o B B B o u o d o
s o e s Y M D u u u a u
1 11 小笠原 慎之介 投手 1997 10 8 180 95 左 左
2 12 田島 慎二 投手 1989 12 21 181 84 右 右
3 13 橋本 侑樹 投手 1998 1 8 180 71 左 左
4 14 谷元 圭介 投手 1985 1 28 167 72 右 右
5 16 又吉 克樹 投手 1990 11 4 181 74 右 右
6 17 柳 裕也 投手 1994 4 22 180 85 右 右
7 18 梅津 晃大 投手 1996 10 24 187 90 右 右
8 19 髙橋 宏斗 投手 2002 8 9 185 85 右 右
9 21 岡田 俊哉 投手 1991 12 5 178 67 左 左
10 22 大野 雄大 投手 1988 9 26 183 83 左 左
Monday, December 20, 2021 07:14:36 PM 15
shintyou Cum. Cum.
Midpoint Freq Freq Percent Percent
|
168 |** 2 2 2.56 2.56
|
172 |* 1 3 1.28 3.85
|
176 |***************** 17 20 21.79 25.64
|
180 |************************* 25 45 32.05 57.69
|
184 |************************** 26 71 33.33 91.03
|
188 |**** 4 75 5.13 96.15
|
192 |*** 3 78 3.85 100.00
|
-----+----+----+----+----+-
5 10 15 20 25
Frequency
Monday, December 20, 2021 07:14:36 PM 16
Frequency
| ***** *****
| ***** *****
| ***** *****
20 + ***** *****
| ***** ***** *****
| ***** ***** *****
| ***** ***** *****
| ***** ***** *****
10 + ***** ***** *****
| ***** ***** *****
| ***** ***** *****
| ***** ***** ***** ***** *****
| ***** ***** ***** ***** ***** ***** *****
--------------------------------------------------------------------
168 172 176 180 184 188 192
shintyou Midpoint
Monday, December 20, 2021 07:14:36 PM 17
DoBY Cum. Cum.
Midpoint Freq Freq Percent Percent
|
1978 |** 2 2 2.56 2.56
|
1982 |* 1 3 1.28 3.85
|
1986 |**** 4 7 5.13 8.97
|
1990 |**************** 16 23 20.51 29.49
|
1994 |********************* 21 44 26.92 56.41
|
1998 |******************** 20 64 25.64 82.05
|
2002 |************** 14 78 17.95 100.00
|
-----+----+----+----+-
5 10 15 20
Frequency
Monday, December 20, 2021 07:14:36 PM 18
Frequency
| *****
20 + ***** *****
| ***** *****
| ***** *****
| ***** *****
| ***** ***** *****
15 + ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
10 + ***** ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
| ***** ***** ***** *****
5 + ***** ***** ***** *****
| ***** ***** ***** ***** *****
| ***** ***** ***** ***** *****
| ***** ***** ***** ***** ***** *****
| ***** ***** ***** ***** ***** ***** *****
--------------------------------------------------------------------
1978 1982 1986 1990 1994 1998 2002
DoBY Midpoint
Monday, December 20, 2021 07:14:36 PM 19
The FREQ Procedure
Cumulative Cumulative
DoBM Frequency Percent Frequency Percent
---------------------------------------------------------
1 6 7.69 6 7.69
2 4 5.13 10 12.82
3 7 8.97 17 21.79
4 8 10.26 25 32.05
5 10 12.82 35 44.87
6 4 5.13 39 50.00
7 7 8.97 46 58.97
8 4 5.13 50 64.10
9 6 7.69 56 71.79
10 7 8.97 63 80.77
11 5 6.41 68 87.18
12 10 12.82 78 100.00
Cumulative Cumulative
tou Frequency Percent Frequency Percent
--------------------------------------------------------
右 61 78.21 61 78.21
左 17 21.79 78 100.00
Monday, December 20, 2021 07:14:36 PM 20
The FREQ Procedure
Cumulative Cumulative
da Frequency Percent Frequency Percent
-----------------------------------------------------------
右 40 51.28 40 51.28
左 35 44.87 75 96.15
左右 3 3.85 78 100.00
Monday, December 20, 2021 07:14:36 PM 21
The FREQ Procedure
Table of tou by da
tou da
Frequency|
Percent |
Row Pct |
Col Pct |右 |左 |左右 | Total
---------+--------+--------+--------+
右 | 40 | 18 | 3 | 61
| 51.28 | 23.08 | 3.85 | 78.21
| 65.57 | 29.51 | 4.92 |
| 100.00 | 51.43 | 100.00 |
---------+--------+--------+--------+
左 | 0 | 17 | 0 | 17
| 0.00 | 21.79 | 0.00 | 21.79
| 0.00 | 100.00 | 0.00 |
| 0.00 | 48.57 | 0.00 |
---------+--------+--------+--------+
Total 40 35 3 78
51.28 44.87 3.85 100.00
/* Lesson 11-04 */
/* File Name = les1104.sas 12/21/21 */
options nocenter linesize=78 pagesize=30;
options locale='en_US';
/* options locale='ja_JP'; */
proc printto print = 'StatM21/les1104-Results.txt' new;
data dragons;
infile 'StatM21/Dragons21.csv'
firstobs=8 dlm=',' dsd missover
encoding=sjis termstr=crlf;
input No $ Name : $24. Pos $ DoBY DoBM DoBD
shintyou taijyuu tou $ da $ bikou $;
proc format; : 階級を作る。class shintyou の意
value cl_shin low-<170=' -170' : 階級の定義 1
170-<175='170-175' : 2
175-<180='175-180' : 3
180-<185='180-185' : 4
185-<190='185-190' : 5
190-<195='190-195' : 6
195-<200='195-200' : 7
200-high='200- ' : 8
other ='missing'; : 9
run; :
proc freq data=dragons; :
table shintyou; : 変量の指定(1変量の場合)
table shintyou*tou; : 変量の指定(2変量組み合わせの場合)
format shintyou cl_shin.; : 連続変量をグループ化することの指定
run; :
<<< 前略 >>>
Monday, December 20, 2021 07:15:51 PM 28
The FREQ Procedure
Cumulative Cumulative
shintyou Frequency Percent Frequency Percent
-------------------------------------------------------------
-170 2 2.56 2 2.56
170-175 3 3.85 5 6.41
175-180 26 33.33 31 39.74
180-185 32 41.03 63 80.77
185-190 12 15.38 75 96.15
190-195 3 3.85 78 100.00
Monday, December 20, 2021 07:15:51 PM 29
The FREQ Procedure
Table of shintyou by tou
shintyou tou
Frequency|
Percent |
Row Pct |
Col Pct |右 |左 | Total
---------+--------+--------+
-170 | 2 | 0 | 2
| 2.56 | 0.00 | 2.56
| 100.00 | 0.00 |
| 3.28 | 0.00 |
---------+--------+--------+
170-175 | 3 | 0 | 3
| 3.85 | 0.00 | 3.85
| 100.00 | 0.00 |
| 4.92 | 0.00 |
---------+--------+--------+
Total 61 17 78
78.21 21.79 100.00
(Continued)
Monday, December 20, 2021 07:15:51 PM 30
The FREQ Procedure
Table of shintyou by tou
shintyou tou
Frequency|
Percent |
Row Pct |
Col Pct |右 |左 | Total
---------+--------+--------+
175-180 | 19 | 7 | 26
| 24.36 | 8.97 | 33.33
| 73.08 | 26.92 |
| 31.15 | 41.18 |
---------+--------+--------+
180-185 | 25 | 7 | 32
| 32.05 | 8.97 | 41.03
| 78.13 | 21.88 |
| 40.98 | 41.18 |
---------+--------+--------+
Total 61 17 78
78.21 21.79 100.00
(Continued)
Monday, December 20, 2021 07:15:51 PM 31
The FREQ Procedure
Table of shintyou by tou
shintyou tou
Frequency|
Percent |
Row Pct |
Col Pct |右 |左 | Total
---------+--------+--------+
185-190 | 9 | 3 | 12
| 11.54 | 3.85 | 15.38
| 75.00 | 25.00 |
| 14.75 | 17.65 |
---------+--------+--------+
190-195 | 3 | 0 | 3
| 3.85 | 0.00 | 3.85
| 100.00 | 0.00 |
| 4.92 | 0.00 |
---------+--------+--------+
Total 61 17 78
78.21 21.79 100.00
【発展】 上記のプログラムでは都道府県名が綺麗に読み込めていないようだ(先頭2文字のみ)。さて、どうする?