/* Lesson 5-01 */ /* File Name = les0501.sas 05/08/08 */ data naikaku; infile 'naikaku0710.prn' firstobs=2; input name $13. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; proc print data=naikaku(obs=5); run; proc means data=naikaku; var tochi yotyokin total; run; proc univariate data=naikaku plot; : 基礎統計量の算出、plot オプション var tochi yotyokin total; : 指定した変量について計算 run; :
SAS システム 1 09:27 Thursday, May 8, 2008 OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE 1 Fukuda Kakuryou M 6731 480 7211 7031 0 3800 2 Masuda Kakuryou M 1416 5380 6796 6047 0 0 3 Hatoyama Kakuryou M 52728 20308 73036 72481 0 40000 4 Komoto Kakuryou M 6163 1861 8024 6713 0 0 5 Nukaga Kakuryou M 4695 200 4895 3682 0 7500 SAS システム 2 09:27 Thursday, May 8, 2008 Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------- TOCHI 69 6451.67 11945.19 0 60729.00 YOTYOKIN 69 3277.99 6557.29 0 36149.00 TOTAL 69 9729.64 16334.46 0 84817.00 -------------------------------------------------------------------- SAS システム 8 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=YOTYOKIN Moments N 69 Sum Wgts 69 Mean 3277.986 Sum 226181 Std Dev 6557.285 Variance 42997992 Skewness 3.521234 Kurtosis 13.37013 USS 3.6653E9 CSS 2.9239E9 CV 200.0401 Std Mean 789.4044 T:Mean=0 4.152479 Pr>|T| 0.0001 Num ^= 0 56 Num > 0 56 M(Sign) 28 Pr>=|M| 0.0001 Sgn Rank 798 Pr>=|S| 0.0001 SAS システム 9 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=YOTYOKIN Quantiles(Def=5) 100% Max 36149 99% 36149 75% Q3 2900 95% 17286 50% Med 1242 90% 7245 25% Q1 115 10% 0 0% Min 0 5% 0 1% 0 Range 36149 Q3-Q1 2785 Mode 0 SAS システム 10 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=YOTYOKIN Extremes Lowest Obs Highest Obs 0( 63) 14651( 38) 0( 60) 17286( 23) 0( 59) 20308( 3) 0( 58) 30925( 32) 0( 47) 36149( 7) SAS システム 11 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=YOTYOKIN Histogram # Boxplot 37500+* 1 * .* 1 * . .* 1 * .* 1 * .* 2 * .** 4 0 2500+****************************** 59 +--+--+ ----+----+----+----+----+----+ * may represent up to 2 counts SAS システム 12 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=YOTYOKIN Normal Probability Plot 37500+ * | * | | * | * ++++++++ | +++**++ | ++++++++*** 2500+ * * * *************************** +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 SAS システム 13 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=TOTAL Moments N 69 Sum Wgts 69 Mean 9729.638 Sum 671345 Std Dev 16334.46 Variance 2.6681E8 Skewness 3.190038 Kurtosis 10.5297 USS 2.468E10 CSS 1.814E10 CV 167.8835 Std Mean 1966.438 T:Mean=0 4.94785 Pr>|T| 0.0001 Num ^= 0 67 Num > 0 67 M(Sign) 33.5 Pr>=|M| 0.0001 Sgn Rank 1139 Pr>=|S| 0.0001 SAS システム 14 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=TOTAL Quantiles(Def=5) 100% Max 84817 99% 84817 75% Q3 8024 95% 39829 50% Med 4223 90% 23800 25% Q1 2435 10% 668 0% Min 0 5% 303 1% 0 Range 84817 Q3-Q1 5589 Mode 0 SAS システム 15 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=TOTAL Extremes Lowest Obs Highest Obs 0( 63) 37336( 23) 0( 59) 39829( 38) 115( 69) 66804( 19) 303( 50) 73036( 3) 403( 16) 84817( 32) SAS システム 16 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=TOTAL Stem Leaf # Boxplot 8 5 1 * 8 7 7 3 1 * 6 7 1 * 6 5 5 4 4 0 1 * 3 67 2 * 3 2 2 114 3 0 1 7 1 0 1 01122 5 + 0 55555566677788899 17 +-----+ 0 0000011111111222223333333333444444444 37 *-----* ----+----+----+----+----+----+----+-- Multiply Stem.Leaf by 10**+4 SAS システム 17 09:27 Thursday, May 8, 2008 Univariate Procedure Variable=TOTAL Normal Probability Plot 85000+ * | * | * | + 45000+ ++++++ | +***++ | +++++** | ++++++ *** 5000+ * * * ************************* +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2
[参考1] 上記の箱髭図は潰れていて理解し難い部分もあるので、別の例として、皆さんの身長のデータを図に表わしたものを以下に示す。
Univariate Procedure
Variable=SHINTYOU
Histogram # Boxplot
187.5+** 4 |
.******** 22 |
.******************* 55 |
.*********************************** 104 +-----+
167.5+************************ 71 *--+--*
.******************** 58 +-----+
.************** 42 |
.****** 18 |
147.5+** 6 0
----+----+----+----+----+----+----+
* may represent up to 3 counts
[参考2] 例えば 1000万円の単位に四捨五入して最頻値を調べる方法もある。
そのためには「round」と言う関数を用いればよい。
このようにして求めた最頻値は 1000万円であった。
data naikaku; infile 'naikaku0710.prn' firstobs=2; input name $10. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; tot1000=round(total,1000);
分布形状と統計量
/* Lesson 5-88 */ /* File Name = les0588.sas 05/08/08 */ data gakusei; infile 'all08ae.prn' firstobs=2; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; proc print data=gakusei(obs=5); run;
注意1: 電子メールでの場合は、添付ファイルは使わないこと。
提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。
また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
注意3: 連絡ページ
に受領した者の学籍番号を掲載するので、確認に使ってほしい。