/* Lesson 5-01 */ /* File Name = les0501.sas 05/18/06 */ data naikaku; infile 'naikaku0512.prn' firstobs=2; input name $10. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; proc print data=naikaku(obs=5); run; proc means data=naikaku; var tochi yotyokin total; run; proc univariate data=naikaku plot; : 基礎統計量の算出、plot オプション var tochi yotyokin total; : 指定した変量について計算 run; :
SAS システム 1 19:50 Wednesday, May 17, 2006 OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE 1 Koizumi Kakuryou M 10743 2360 13103 13103 0 0 2 Takenaka Kakuryou M 3002 1071 4073 1213 6065 1681 3 Sugiura Kakuryou M 1755 796 2551 2071 0 0 4 Aso Kakuryou M 37779 7850 45629 40379 20100 2000 5 Kosaka Kakuryou M 5596 1300 6896 5224 0 0 SAS システム 2 19:50 Wednesday, May 17, 2006 Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------- TOCHI 60 4053.98 5987.72 0 37779.00 YOTYOKIN 60 2483.67 3671.17 0 22298.00 TOTAL 60 6537.67 7631.23 0 45629.00 -------------------------------------------------------------------- SAS システム 8 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=YOTYOKIN Moments N 60 Sum Wgts 60 Mean 2483.667 Sum 149020 Std Dev 3671.173 Variance 13477511 Skewness 3.124504 Kurtosis 13.74865 USS 1.1653E9 CSS 7.9517E8 CV 147.8126 Std Mean 473.9464 T:Mean=0 5.240396 Pr>|T| 0.0001 Num ^= 0 50 Num > 0 50 M(Sign) 25 Pr>=|M| 0.0001 Sgn Rank 637.5 Pr>=|S| 0.0001 SAS システム 9 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=YOTYOKIN Quantiles(Def=5) 100% Max 22298 99% 22298 75% Q3 3550 95% 9137 50% Med 1058.5 90% 7111.5 25% Q1 100 10% 0 0% Min 0 5% 0 1% 0 Range 22298 Q3-Q1 3450 Mode 0 SAS システム 10 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=YOTYOKIN Extremes Lowest Obs Highest Obs 0( 51) 7850( 4) 0( 47) 8983( 23) 0( 45) 9291( 37) 0( 35) 9803( 15) 0( 34) 22298( 57) SAS システム 11 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=YOTYOKIN Histogram # Boxplot 22500+* 1 * . 12500+ .**** 8 0 2500+************************** 51 +--+--+ ----+----+----+----+----+- * may represent up to 2 counts SAS システム 12 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=YOTYOKIN Normal Probability Plot 22500+ * | 12500+ +++++ | ++++****+**+*+ 2500+ * * ** ******* ***************** +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 SAS システム 13 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=TOTAL Moments N 60 Sum Wgts 60 Mean 6537.667 Sum 392260 Std Dev 7631.234 Variance 58235739 Skewness 3.039733 Kurtosis 12.09356 USS 6.0004E9 CSS 3.4359E9 CV 116.7272 Std Mean 985.1881 T:Mean=0 6.635958 Pr>|T| 0.0001 Num ^= 0 59 Num > 0 59 M(Sign) 29.5 Pr>=|M| 0.0001 Sgn Rank 885 Pr>=|S| 0.0001 SAS システム 14 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=TOTAL Quantiles(Def=5) 100% Max 45629 99% 45629 75% Q3 7797 95% 20505.5 50% Med 4705.5 90% 13395 25% Q1 1849 10% 582 0% Min 0 5% 101 1% 0 Range 45629 Q3-Q1 5948 Mode 0 SAS システム 15 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=TOTAL Extremes Lowest Obs Highest Obs 0( 30) 14826( 12) 40( 49) 16631( 15) 50( 53) 24380( 57) 152( 34) 29513( 36) 260( 58) 45629( 4) SAS システム 16 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=TOTAL Stem Leaf # Boxplot 4 6 1 * 3 0 1 * 2 4 1 0 1 011223457 9 | 0 000000111111112233333444444444555555555667777899 48 +--+--+ ----+----+----+----+----+----+----+----+----+--- Multiply Stem.Leaf by 10**+4 SAS システム 17 19:50 Wednesday, May 17, 2006 Univariate Procedure Variable=TOTAL Normal Probability Plot 45000+ * | 25000+ *+*++++++ | ++++******+*+ 5000+ * * ** *********************** +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2
[参考] 例えば 1000万円の単位に四捨五入して最頻値を調べる方法もある。 そのためには「round」と言う関数を用いればよい。 このようにして求めた最頻値は 4000万円であった。
data naikaku; infile 'naikaku0512.prn' firstobs=2; input name $10. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; tot1000=round(total,1000);
分布形状と統計量
/* Lesson 5-88 */ /* File Name = les0588.sas 05/18/06 */ data gakusei; infile 'all06ae.prn' firstobs=2; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; proc print data=gakusei(obs=5); run;
[Lesson 5-3] : 各自で学生データの基礎統計量を求めよ。
注意1: 電子メールでの場合は、添付ファイルは使わないこと。
提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。
また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
注意3: 連絡ページ
に受領した者の学籍番号を掲載するので、確認に使ってほしい。
注意4: 職場の給電機器の点検のため、
6月2日(金)夕方から5日(月)朝までは、電子メールの受信ができない。
data mon2006; infile 'd:\home\mon05d.csv' dlm=',' firstobs=2 truncover;
data mon2006; infile 'd:\home\mon05e.txt' dlm='09'x firstobs=2 truncover;