/* Lesson 5-01 */ /* File Name = les0501.sas 05/17/07 */ data naikaku; infile 'naikaku0611.prn' firstobs=2; input name $11. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; proc print data=naikaku(obs=5); run; proc means data=naikaku; var tochi yotyokin total; run; proc univariate data=naikaku plot; : 基礎統計量の算出、plot オプション var tochi yotyokin total; : 指定した変量について計算 run; :
SAS システム 1 17:25 Wednesday, May 16, 2007 OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE 1 Abe Kakuryou M 9760 5030 14790 13990 0 0 2 Kan Kakuryou M 4767 0 4767 4767 0 2556 3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950 4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100 5 Omi Kakuryou M 2788 0 2788 2144 500 0 SAS システム 2 17:25 Wednesday, May 16, 2007 Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------- TOCHI 69 4751.35 9352.40 0 61046.00 YOTYOKIN 69 2541.28 5094.07 0 35400.00 TOTAL 69 7292.65 12135.92 0 67121.00 -------------------------------------------------------------------- SAS システム 8 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=YOTYOKIN Moments N 69 Sum Wgts 69 Mean 2541.275 Sum 175348 Std Dev 5094.068 Variance 25949534 Skewness 4.807677 Kurtosis 27.60495 USS 2.2102E9 CSS 1.7646E9 CV 200.4532 Std Mean 613.2538 T:Mean=0 4.143921 Pr>|T| 0.0001 Num ^= 0 55 Num > 0 55 M(Sign) 27.5 Pr>=|M| 0.0001 Sgn Rank 770 Pr>=|S| 0.0001 SAS システム 9 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=YOTYOKIN Quantiles(Def=5) 100% Max 35400 99% 35400 75% Q3 3065 95% 7100 50% Med 996 90% 6075 25% Q1 94 10% 0 0% Min 0 5% 0 1% 0 Range 35400 Q3-Q1 2971 Mode 0 SAS システム 10 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=YOTYOKIN Extremes Lowest Obs Highest Obs 0( 69) 6750( 3) 0( 65) 7100( 52) 0( 63) 7850( 4) 0( 62) 21144( 21) 0( 59) 35400( 33) SAS システム 11 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=YOTYOKIN Histogram # Boxplot 37500+* 1 * . . .* 1 * . . .**** 7 0 2500+****************************** 60 +--+--+ ----+----+----+----+----+----+ * may represent up to 2 counts SAS システム 12 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=YOTYOKIN Normal Probability Plot 37500+ * | | | * | + | ++++++++++ | +++++++***** * 2500+ * * * **************************** +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 SAS システム 13 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=TOTAL Moments N 69 Sum Wgts 69 Mean 7292.652 Sum 503193 Std Dev 12135.92 Variance 1.4728E8 Skewness 3.552726 Kurtosis 13.43033 USS 1.368E10 CSS 1.002E10 CV 166.413 Std Mean 1460.993 T:Mean=0 4.991571 Pr>|T| 0.0001 Num ^= 0 68 Num > 0 68 M(Sign) 34 Pr>=|M| 0.0001 Sgn Rank 1173 Pr>=|S| 0.0001 SAS システム 14 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=TOTAL Quantiles(Def=5) 100% Max 67121 99% 67121 75% Q3 5950 95% 27659 50% Med 3249 90% 15540 25% Q1 1734 10% 803 0% Min 0 5% 200 1% 0 Range 67121 Q3-Q1 4216 Mode 10 SAS システム 15 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=TOTAL Extremes Lowest Obs Highest Obs 0( 49) 22110( 40) 10( 64) 27659( 21) 10( 35) 49055( 4) 200( 23) 57260( 33) 714( 58) 67121( 26) SAS システム 16 22:04 Wednesday, May 16, 2007 Univariate Procedure Variable=TOTAL Stem Leaf # Boxplot 6 7 1 * 6 5 7 1 * 5 4 9 1 * 4 3 3 2 8 1 * 2 2 1 * 1 568 3 0 1 000114 6 0 0 55555555666789 14 +--+--+ 0 00001111111111122222222223333333333344444 41 *-----* ----+----+----+----+----+----+----+----+- Multiply Stem.Leaf by 10**+4 SAS システム 17 17:25 Wednesday, May 16, 2007 Univariate Procedure Variable=TOTAL Normal Probability Plot 65000+ * | * | * 35000+ +++++++ | ++++**++ | +++++++***** 5000+ * * *************************** +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2
[参考1] 上記の箱髭図は潰れていて理解し難い部分もあるので、別の例として、皆さんの身長のデータを図に表わしたものを以下に示す。
Univariate Procedure
Variable=SHINTYOU
Histogram # Boxplot
187.5+* 3 |
.******* 21 |
.****************** 54 |
.********************************* 99 +-----+
167.5+************************ 70 *--+--*
.****************** 53 +-----+
.************* 37 |
.****** 17 |
147.5+** 6 |
----+----+----+----+----+----+---
* may represent up to 3 counts
[参考2] 例えば 1000万円の単位に四捨五入して最頻値を調べる方法もある。
そのためには「round」と言う関数を用いればよい。
このようにして求めた最頻値は 1000万円であった。
data naikaku; infile 'naikaku0512.prn' firstobs=2; input name $10. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; tot1000=round(total,1000);
分布形状と統計量
/* Lesson 5-88 */ /* File Name = les0588.sas 05/17/07 */ data gakusei; infile 'all07ae.prn' firstobs=2; input sex $ shintyou taijyuu kyoui jitaku $ kodukai carryer $ tsuuwa; proc print data=gakusei(obs=5); run;
注意1: 電子メールでの場合は、添付ファイルは使わないこと。
提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。
また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
注意3: 連絡ページ
に受領した者の学籍番号を掲載するので、確認に使ってほしい。