Lesson 8-1: 皆さんの小遣いに関するデータ (kodukai.dat) をファイルから読み込んで小遣い額の平均と基礎統計量を求めてみよう。 なお、ファイル名は各自で命名したものを指定せよ。 ここでは「kodukai.dat」という名前で説明する。
/* Lesson 8-1 */ /* File Name = univ01.sas 06/12/97 */ data kodukai; : データ名の定義 infile 'kodukai.dat'; : ファイル名の指定 input seibetsu $ jitaku $ kodukai; : 変量名、型 : proc print data=kodukai(obs=10); : データの表示 run; : proc means data=kodukai; : 平均、標準偏差、最大最小値の算出 run; : proc univariate data=kodukai plot; : 基礎統計量の算出、plot オプション run; :
SAS システム 86 21:46 Wednesday, June 11, 1997 OBS SEIBETSU JITAKU KODUKAI 1 M . 2 M . 3 M 30000 4 M G 0 5 M G 100000 6 M G 120000 7 M G . 8 M G 150000 9 M G 163000 10 M G 50000 SAS システム 87 21:46 Wednesday, June 11, 1997 Analysis Variable : KODUKAI N Mean Std Dev Minimum Maximum ---------------------------------------------------------- 35 56757.14 53071.31 0 163000.00 ---------------------------------------------------------- SAS システム 88 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Moments N 35 Sum Wgts 35 Mean 56757.14 Sum 1986500 Std Dev 53071.31 Variance 2.8166E9 Skewness 0.819528 Kurtosis -0.80521 USS 2.085E11 CSS 9.576E10 CV 93.50596 Std Mean 8970.689 T:Mean=0 6.326955 Pr>|T| 0.0001 Num ^= 0 30 Num > 0 30 M(Sign) 15 Pr>=|M| 0.0001 Sgn Rank 232.5 Pr>=|S| 0.0001 SAS システム 89 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Quantiles(Def=5) 100% Max 163000 99% 163000 75% Q3 100000 95% 150000 50% Med 30000 90% 150000 25% Q1 20000 10% 0 0% Min 0 5% 0 1% 0 Range 163000 Q3-Q1 80000 Mode 20000 SAS システム 90 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Extremes Lowest Obs Highest Obs 0( 39) 150000( 8) 0( 38) 150000( 11) 0( 35) 150000( 13) 0( 24) 150000( 18) 0( 4) 163000( 9) SAS システム 91 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Missing Value . Count 6 % Count/Nobs 14.63 SAS システム 92 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Stem Leaf # Boxplot 16 3 1 | 14 0000 4 | 12 00 2 | 10 0000 4 +-----+ 8 | | 6 00 2 | | 4 40 2 | + | 2 00000005000000 14 *-----* 0 000005 6 | ----+----+----+----+ Multiply Stem.Leaf by 10**+4 SAS システム 93 21:46 Wednesday, June 11, 1997 Univariate Procedure Variable=KODUKAI Normal Probability Plot 170000+ +*++ | * ** +*++ | ** ++++ | ****+++ 90000+ ++++ | +++* | ++++ ** | ********* * 10000+ * * ** **+++ +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2
/* Lesson 8-2 */ /* File Name = chart01.sas 06/12/97 */ data kodukai; infile 'kodukai.dat'; input seibetsu $ jitaku $ kodukai; proc print data=kodukai(obs=10); run; : proc chart data=kodukai; : 図示 hbar kodukai; : 水平棒グラフで run; : proc chart data=kodukai; : 図示 vbar kodukai; : 垂直棒グラフで run; :
SAS システム 94 21:46 Wednesday, June 11, 1997 KODUKAI Cum. Cum. Midpoint Freq Freq Percent Percent | 0 |********** 5 5 14.29 14.29 30000 |******************************** 16 21 45.71 60.00 60000 |****** 3 24 8.57 68.57 90000 |******** 4 28 11.43 80.00 120000 |**** 2 30 5.71 85.71 150000 |********** 5 35 14.29 100.00 | ----+---+---+---+---+---+---+---+ 2 4 6 8 10 12 14 16 Frequency SAS システム 95 21:46 Wednesday, June 11, 1997 Frequency 16 + ***** | ***** 12 + ***** | ***** 8 + ***** | ***** ***** ***** 4 + ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** ***** ----------------------------------------------------------------------- 0 30000 60000 90000 120000 150000 KODUKAI Midpoint
グループを属性に沿ったサブグループに分解して個々について調べてみる。
[テクニック] 層を分けて分析する場合は、事前に並べ替えが必要
以前、電子化してもらったデータを今回の演習例を参考に解析してみよ。