/* Lesson 5-01 */
/* File Name = les0501.sas 10/22/08 */
data naikaku;
infile 'naikaku0710.prn'
firstobs=2;
input name $13. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
proc print data=naikaku(obs=5);
run;
proc means data=naikaku;
var tochi yotyokin total;
run;
proc univariate data=naikaku plot; : 基礎統計量の算出、plot オプション
var tochi yotyokin total; : 指定した変量について計算
run; :
SAS システム 1
11:08 Wednesday, October 29, 2008
OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE
1 Fukuda Kakuryou M 6731 480 7211 7031 0 3800
2 Masuda Kakuryou M 1416 5380 6796 6047 0 0
3 Hatoyama Kakuryou M 52728 20308 73036 72481 0 40000
4 Komoto Kakuryou M 6163 1861 8024 6713 0 0
5 Nukaga Kakuryou M 4695 200 4895 3682 0 7500
SAS システム 2
11:08 Wednesday, October 29, 2008
Variable N Mean Std Dev Minimum Maximum
--------------------------------------------------------------------
TOCHI 69 6451.67 11945.19 0 60729.00
YOTYOKIN 69 3277.99 6557.29 0 36149.00
TOTAL 69 9729.64 16334.46 0 84817.00
--------------------------------------------------------------------
SAS システム 8
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=YOTYOKIN
Moments
N 69 Sum Wgts 69
Mean 3277.986 Sum 226181
Std Dev 6557.285 Variance 42997992
Skewness 3.521234 Kurtosis 13.37013
USS 3.6653E9 CSS 2.9239E9
CV 200.0401 Std Mean 789.4044
T:Mean=0 4.152479 Pr>|T| 0.0001
Num ^= 0 56 Num > 0 56
M(Sign) 28 Pr>=|M| 0.0001
Sgn Rank 798 Pr>=|S| 0.0001
SAS システム 9
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=YOTYOKIN
Quantiles(Def=5)
100% Max 36149 99% 36149
75% Q3 2900 95% 17286
50% Med 1242 90% 7245
25% Q1 115 10% 0
0% Min 0 5% 0
1% 0
Range 36149
Q3-Q1 2785
Mode 0
SAS システム 10
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=YOTYOKIN
Extremes
Lowest Obs Highest Obs
0( 63) 14651( 38)
0( 60) 17286( 23)
0( 59) 20308( 3)
0( 58) 30925( 32)
0( 47) 36149( 7)
SAS システム 11
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=YOTYOKIN
Histogram # Boxplot
37500+* 1 *
.* 1 *
.
.* 1 *
.* 1 *
.* 2 *
.** 4 0
2500+****************************** 59 +--+--+
----+----+----+----+----+----+
* may represent up to 2 counts
SAS システム 12
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=YOTYOKIN
Normal Probability Plot
37500+ *
| *
|
| *
| * ++++++++
| +++**++
| ++++++++***
2500+ * * * ***************************
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
SAS システム 13
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=TOTAL
Moments
N 69 Sum Wgts 69
Mean 9729.638 Sum 671345
Std Dev 16334.46 Variance 2.6681E8
Skewness 3.190038 Kurtosis 10.5297
USS 2.468E10 CSS 1.814E10
CV 167.8835 Std Mean 1966.438
T:Mean=0 4.94785 Pr>|T| 0.0001
Num ^= 0 67 Num > 0 67
M(Sign) 33.5 Pr>=|M| 0.0001
Sgn Rank 1139 Pr>=|S| 0.0001
SAS システム 14
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=TOTAL
Quantiles(Def=5)
100% Max 84817 99% 84817
75% Q3 8024 95% 39829
50% Med 4223 90% 23800
25% Q1 2435 10% 668
0% Min 0 5% 303
1% 0
Range 84817
Q3-Q1 5589
Mode 0
SAS システム 15
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=TOTAL
Extremes
Lowest Obs Highest Obs
0( 63) 37336( 23)
0( 59) 39829( 38)
115( 69) 66804( 19)
303( 50) 73036( 3)
403( 16) 84817( 32)
SAS システム 16
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=TOTAL
Stem Leaf # Boxplot
8 5 1 *
8
7
7 3 1 *
6 7 1 *
6
5
5
4
4 0 1 *
3 67 2 *
3
2
2 114 3 0
1 7 1 0
1 01122 5 +
0 55555566677788899 17 +-----+
0 0000011111111222223333333333444444444 37 *-----*
----+----+----+----+----+----+----+--
Multiply Stem.Leaf by 10**+4
SAS システム 17
11:08 Wednesday, October 29, 2008
Univariate Procedure
Variable=TOTAL
Normal Probability Plot
85000+ *
| *
| *
| +
45000+ ++++++
| +***++
| +++++**
| ++++++ ***
5000+ * * * *************************
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
[参考1] 上記の箱髭図は潰れていて理解し難い部分もあるので、別の例として、皆さんの身長のデータを図に表わしたものを以下に示す。
Univariate Procedure
Variable=SHINTYOU
Histogram # Boxplot
187.5+** 5 |
.******** 23 |
.******************* 57 |
.************************************ 106 +-----+
167.5+************************* 73 *--+--*
.******************** 58 +-----+
.*************** 43 |
.****** 18 |
147.5+** 6 |
----+----+----+----+----+----+----+-
* may represent up to 3 counts
[参考2] 例えば 1000万円の単位に四捨五入して最頻値を調べる方法もある。
そのためには「round」と言う関数を用いればよい。
このようにして求めた最頻値は 1000万円であった。
data naikaku;
infile 'naikaku0710.prn'
firstobs=2;
input name $10. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
tot1000=round(total,1000);
分布形状と統計量
/* Lesson 5-88 */
/* File Name = les0588.sas 10/29/08 */
data gakusei;
infile 'all08be.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
proc print data=gakusei(obs=5);
run;
注意1: 電子メールでの場合は、添付ファイルは使わないこと。
提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。
また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
注意3: 連絡ページ
に受領した者の学籍番号を掲載するので、確認に使ってほしい。