/* Lesson 11-01 */ /* File Name = les1101.sas 12/21/21 */ options nocenter linesize=78 pagesize=30; : 画面出力サイズ指定 options locale='en_US'; : 出力を英字表記にする proc printto print = 'StatM21/les1101-Results.txt' new; : 計算結果を直接ファイル出力 data dragons; : ドラゴンズデータ infile 'StatM21/Dragons21.csv' : ファイルの保存場所 firstobs=8 dlm=',' dsd missover : ファイル特性 encoding=sjis termstr=crlf; input No $ Name : $24. Pos $ DoBY DoBM DoBD : 読み込む変数(項目)のリスト shintyou taijyuu tou $ da $ bikou $; : 複数行にわたって proc print data=dragons(obs=20); : 先頭20ケースを表示 run; proc means data=dragons; : 平均値等を算出 run; proc univariate data=dragons plot; : 基礎統計量の算出。plot オプションを指定。 var shintyou DoBY; : 指定した変量について run; ods listing; : グラフをキャラクタープロットで出力する場合 ods graphics off; : proc univariate data=dragons plot; var shintyou DoBY; run;
Monday, December 20, 2021 09:26:05 PM 19 s h t i a n i b N D D D t j i O a P o o o y y t k b N m o B B B o u o d o s o e s Y M D u u u a u 1 11 小笠原 慎之介 投手 1997 10 8 180 95 左 左 2 12 田島 慎二 投手 1989 12 21 181 84 右 右 3 13 橋本 侑樹 投手 1998 1 8 180 71 左 左 4 14 谷元 圭介 投手 1985 1 28 167 72 右 右 5 16 又吉 克樹 投手 1990 11 4 181 74 右 右 6 17 柳 裕也 投手 1994 4 22 180 85 右 右 7 18 梅津 晃大 投手 1996 10 24 187 90 右 右 8 19 髙橋 宏斗 投手 2002 8 9 185 85 右 右 9 21 岡田 俊哉 投手 1991 12 5 178 67 左 左 10 22 大野 雄大 投手 1988 9 26 183 83 左 左 Monday, December 20, 2021 09:26:05 PM 20 The MEANS Procedure Variable N Mean Std Dev Minimum Maximum ------------------------------------------------------------------------------ DoBY 78 1994.04 5.5066484 1977.00 2003.00 DoBM 78 6.6794872 3.5253943 1.0000000 12.0000000 DoBD 78 15.9615385 8.1375230 2.0000000 31.0000000 shintyou 78 180.5641026 4.5998016 167.0000000 193.0000000 taijyuu 78 84.2820513 7.7189217 65.0000000 108.0000000 ------------------------------------------------------------------------------ Monday, December 20, 2021 09:26:05 PM 21 The UNIVARIATE Procedure Variable: shintyou Moments N 78 Sum Weights 78 Mean 180.564103 Sum Observations 14084 Std Deviation 4.59980164 Variance 21.1581752 Skewness -0.2699454 Kurtosis 1.05481804 Uncorrected SS 2544694 Corrected SS 1629.17949 Coeff Variation 2.54746186 Std Error Mean 0.52082498 Basic Statistical Measures Location Variability Mean 180.5641 Std Deviation 4.59980 Median 180.0000 Variance 21.15818 Mode 183.0000 Range 26.00000 Interquartile Range 7.00000 Monday, December 20, 2021 09:26:05 PM 22 The UNIVARIATE Procedure Variable: shintyou Tests for Location: Mu0=0 Test -Statistic- -----p Value------ Student's t t 346.6886 Pr > |t| <.0001 Sign M 39 Pr >= |M| <.0001 Signed Rank S 1540.5 Pr >= |S| <.0001 Quantiles (Definition 5) Level Quantile 100% Max 193 99% 193 95% 187 90% 185 75% Q3 184 50% Median 180 25% Q1 177 10% 175 5% 174 1% 167 0% Min 167 Monday, December 20, 2021 09:26:05 PM 23 The UNIVARIATE Procedure Variable: shintyou Extreme Observations ----Lowest---- ----Highest--- Value Obs Value Obs 167 28 187 12 167 4 187 44 172 65 190 41 174 66 190 78 174 63 193 34 <<< 中略 >>> Monday, December 20, 2021 09:26:05 PM 30 The UNIVARIATE Procedure Variable: shintyou Stem Leaf # Boxplot 192 0 1 | 190 00 2 | 188 | 186 0000 4 | 184 0000000000000 13 +-----+ 182 0000000000000 13 | | 180 00000000000000 14 *--+--* 178 00000000000 11 | | 176 000000000000 12 +-----+ 174 00000 5 | 172 0 1 | 170 | 168 | 166 00 2 | ----+----+----+----+ Monday, December 20, 2021 09:26:05 PM 31 The UNIVARIATE Procedure Variable: shintyou Normal Probability Plot 193+ *+ | * *++++ | ++++ | ++**** | ******* | *****+ | *****+ | ****+ | ******+ | *****+++ | *+++ | ++++ |+++ 167+ * * +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 <<< 以下略 >>>
分布形状と統計量
/* Lesson 11-02 */ /* File Name = les1102.sas 12/21/21 */ options nocenter linesize=78 pagesize=30; : 画面出力サイズ指定 options locale='en_US'; : 出力を英字表記にする proc printto print = 'StatM21/les1102-Results.txt' new; : 計算結果を直接ファイル出力 data dragons; : ドラゴンズデータ infile 'StatM21/Dragons21.csv' : ファイルの保存場所 firstobs=8 dlm=',' dsd missover : ファイル特性 encoding=sjis termstr=crlf; input No $ Name : $24. Pos $ DoBY DoBM DoBD : 読み込む変数(項目)のリスト shintyou taijyuu tou $ da $ bikou $; : 複数行にわたって proc print data=dragons(obs=10); : 先頭10ケースを表示 run; proc chart data=dragons; : ヒストグラムを描く hbar shintyou; : 水平棒グラフ。変量を指定(複数指定も可)。 vbar shintyou; : 垂直棒グラフ。変量を指定(複数指定も可)。 hbar DoBY; vbar DoBY; run; proc freq data=dragons; : 頻度を算出。個々&クロス集計 table tou da tou*da; run;
Monday, December 20, 2021 07:14:36 PM 14 s h t i a n i b N D D D t j i O a P o o o y y t k b N m o B B B o u o d o s o e s Y M D u u u a u 1 11 小笠原 慎之介 投手 1997 10 8 180 95 左 左 2 12 田島 慎二 投手 1989 12 21 181 84 右 右 3 13 橋本 侑樹 投手 1998 1 8 180 71 左 左 4 14 谷元 圭介 投手 1985 1 28 167 72 右 右 5 16 又吉 克樹 投手 1990 11 4 181 74 右 右 6 17 柳 裕也 投手 1994 4 22 180 85 右 右 7 18 梅津 晃大 投手 1996 10 24 187 90 右 右 8 19 髙橋 宏斗 投手 2002 8 9 185 85 右 右 9 21 岡田 俊哉 投手 1991 12 5 178 67 左 左 10 22 大野 雄大 投手 1988 9 26 183 83 左 左 Monday, December 20, 2021 07:14:36 PM 15 shintyou Cum. Cum. Midpoint Freq Freq Percent Percent | 168 |** 2 2 2.56 2.56 | 172 |* 1 3 1.28 3.85 | 176 |***************** 17 20 21.79 25.64 | 180 |************************* 25 45 32.05 57.69 | 184 |************************** 26 71 33.33 91.03 | 188 |**** 4 75 5.13 96.15 | 192 |*** 3 78 3.85 100.00 | -----+----+----+----+----+- 5 10 15 20 25 Frequency Monday, December 20, 2021 07:14:36 PM 16 Frequency | ***** ***** | ***** ***** | ***** ***** 20 + ***** ***** | ***** ***** ***** | ***** ***** ***** | ***** ***** ***** | ***** ***** ***** 10 + ***** ***** ***** | ***** ***** ***** | ***** ***** ***** | ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** ***** ***** -------------------------------------------------------------------- 168 172 176 180 184 188 192 shintyou Midpoint Monday, December 20, 2021 07:14:36 PM 17 DoBY Cum. Cum. Midpoint Freq Freq Percent Percent | 1978 |** 2 2 2.56 2.56 | 1982 |* 1 3 1.28 3.85 | 1986 |**** 4 7 5.13 8.97 | 1990 |**************** 16 23 20.51 29.49 | 1994 |********************* 21 44 26.92 56.41 | 1998 |******************** 20 64 25.64 82.05 | 2002 |************** 14 78 17.95 100.00 | -----+----+----+----+- 5 10 15 20 Frequency Monday, December 20, 2021 07:14:36 PM 18 Frequency | ***** 20 + ***** ***** | ***** ***** | ***** ***** | ***** ***** | ***** ***** ***** 15 + ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** 10 + ***** ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** | ***** ***** ***** ***** 5 + ***** ***** ***** ***** | ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** ***** ***** -------------------------------------------------------------------- 1978 1982 1986 1990 1994 1998 2002 DoBY Midpoint Monday, December 20, 2021 07:14:36 PM 19 The FREQ Procedure Cumulative Cumulative DoBM Frequency Percent Frequency Percent --------------------------------------------------------- 1 6 7.69 6 7.69 2 4 5.13 10 12.82 3 7 8.97 17 21.79 4 8 10.26 25 32.05 5 10 12.82 35 44.87 6 4 5.13 39 50.00 7 7 8.97 46 58.97 8 4 5.13 50 64.10 9 6 7.69 56 71.79 10 7 8.97 63 80.77 11 5 6.41 68 87.18 12 10 12.82 78 100.00 Cumulative Cumulative tou Frequency Percent Frequency Percent -------------------------------------------------------- 右 61 78.21 61 78.21 左 17 21.79 78 100.00 Monday, December 20, 2021 07:14:36 PM 20 The FREQ Procedure Cumulative Cumulative da Frequency Percent Frequency Percent ----------------------------------------------------------- 右 40 51.28 40 51.28 左 35 44.87 75 96.15 左右 3 3.85 78 100.00 Monday, December 20, 2021 07:14:36 PM 21 The FREQ Procedure Table of tou by da tou da Frequency| Percent | Row Pct | Col Pct |右 |左 |左右 | Total ---------+--------+--------+--------+ 右 | 40 | 18 | 3 | 61 | 51.28 | 23.08 | 3.85 | 78.21 | 65.57 | 29.51 | 4.92 | | 100.00 | 51.43 | 100.00 | ---------+--------+--------+--------+ 左 | 0 | 17 | 0 | 17 | 0.00 | 21.79 | 0.00 | 21.79 | 0.00 | 100.00 | 0.00 | | 0.00 | 48.57 | 0.00 | ---------+--------+--------+--------+ Total 40 35 3 78 51.28 44.87 3.85 100.00
/* Lesson 11-04 */ /* File Name = les1104.sas 12/21/21 */ options nocenter linesize=78 pagesize=30; options locale='en_US'; /* options locale='ja_JP'; */ proc printto print = 'StatM21/les1104-Results.txt' new; data dragons; infile 'StatM21/Dragons21.csv' firstobs=8 dlm=',' dsd missover encoding=sjis termstr=crlf; input No $ Name : $24. Pos $ DoBY DoBM DoBD shintyou taijyuu tou $ da $ bikou $; proc format; : 階級を作る。class shintyou の意 value cl_shin low-<170=' -170' : 階級の定義 1 170-<175='170-175' : 2 175-<180='175-180' : 3 180-<185='180-185' : 4 185-<190='185-190' : 5 190-<195='190-195' : 6 195-<200='195-200' : 7 200-high='200- ' : 8 other ='missing'; : 9 run; : proc freq data=dragons; : table shintyou; : 変量の指定(1変量の場合) table shintyou*tou; : 変量の指定(2変量組み合わせの場合) format shintyou cl_shin.; : 連続変量をグループ化することの指定 run; :
<<< 前略 >>> Monday, December 20, 2021 07:15:51 PM 28 The FREQ Procedure Cumulative Cumulative shintyou Frequency Percent Frequency Percent ------------------------------------------------------------- -170 2 2.56 2 2.56 170-175 3 3.85 5 6.41 175-180 26 33.33 31 39.74 180-185 32 41.03 63 80.77 185-190 12 15.38 75 96.15 190-195 3 3.85 78 100.00 Monday, December 20, 2021 07:15:51 PM 29 The FREQ Procedure Table of shintyou by tou shintyou tou Frequency| Percent | Row Pct | Col Pct |右 |左 | Total ---------+--------+--------+ -170 | 2 | 0 | 2 | 2.56 | 0.00 | 2.56 | 100.00 | 0.00 | | 3.28 | 0.00 | ---------+--------+--------+ 170-175 | 3 | 0 | 3 | 3.85 | 0.00 | 3.85 | 100.00 | 0.00 | | 4.92 | 0.00 | ---------+--------+--------+ Total 61 17 78 78.21 21.79 100.00 (Continued) Monday, December 20, 2021 07:15:51 PM 30 The FREQ Procedure Table of shintyou by tou shintyou tou Frequency| Percent | Row Pct | Col Pct |右 |左 | Total ---------+--------+--------+ 175-180 | 19 | 7 | 26 | 24.36 | 8.97 | 33.33 | 73.08 | 26.92 | | 31.15 | 41.18 | ---------+--------+--------+ 180-185 | 25 | 7 | 32 | 32.05 | 8.97 | 41.03 | 78.13 | 21.88 | | 40.98 | 41.18 | ---------+--------+--------+ Total 61 17 78 78.21 21.79 100.00 (Continued) Monday, December 20, 2021 07:15:51 PM 31 The FREQ Procedure Table of shintyou by tou shintyou tou Frequency| Percent | Row Pct | Col Pct |右 |左 | Total ---------+--------+--------+ 185-190 | 9 | 3 | 12 | 11.54 | 3.85 | 15.38 | 75.00 | 25.00 | | 14.75 | 17.65 | ---------+--------+--------+ 190-195 | 3 | 0 | 3 | 3.85 | 0.00 | 3.85 | 100.00 | 0.00 | | 4.92 | 0.00 | ---------+--------+--------+ Total 61 17 78 78.21 21.79 100.00
【発展】 上記のプログラムでは都道府県名が綺麗に読み込めていないようだ(先頭2文字のみ)。さて、どうする?