/* Lesson 6-01 */
/* File Name = les0601.sas 11/07/07 */
data naikaku;
infile 'naikaku0611.prn'
firstobs=2;
input name $11. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
proc print data=naikaku(obs=5);
run;
proc means data=naikaku;
var tochi yotyokin total;
run;
proc univariate data=naikaku plot; : 基礎統計量の算出、plot オプション
var tochi yotyokin total; : 指定した変量について計算
run; :
SAS システム 1
10:30 Wednesday, November 7, 2007
OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE
1 Abe Kakuryou M 9760 5030 14790 13990 0 0
2 Kan Kakuryou M 4767 0 4767 4767 0 2556
3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950
4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100
5 Omi Kakuryou M 2788 0 2788 2144 500 0
SAS システム 2
10:30 Wednesday, November 7, 2007
Variable N Mean Std Dev Minimum Maximum
--------------------------------------------------------------------
TOCHI 69 4751.35 9352.40 0 61046.00
YOTYOKIN 69 2541.28 5094.07 0 35400.00
TOTAL 69 7292.65 12135.92 0 67121.00
--------------------------------------------------------------------
SAS システム 8
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=YOTYOKIN
Moments
N 69 Sum Wgts 69
Mean 2541.275 Sum 175348
Std Dev 5094.068 Variance 25949534
Skewness 4.807677 Kurtosis 27.60495
USS 2.2102E9 CSS 1.7646E9
CV 200.4532 Std Mean 613.2538
T:Mean=0 4.143921 Pr>|T| 0.0001
Num ^= 0 55 Num > 0 55
M(Sign) 27.5 Pr>=|M| 0.0001
Sgn Rank 770 Pr>=|S| 0.0001
SAS システム 9
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=YOTYOKIN
Quantiles(Def=5)
100% Max 35400 99% 35400
75% Q3 3065 95% 7100
50% Med 996 90% 6075
25% Q1 94 10% 0
0% Min 0 5% 0
1% 0
Range 35400
Q3-Q1 2971
Mode 0
SAS システム 10
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=YOTYOKIN
Extremes
Lowest Obs Highest Obs
0( 69) 6750( 3)
0( 65) 7100( 52)
0( 63) 7850( 4)
0( 62) 21144( 21)
0( 59) 35400( 33)
SAS システム 11
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=YOTYOKIN
Histogram # Boxplot
37500+* 1 *
.
.
.* 1 *
.
.
.**** 7 0
2500+****************************** 60 +--+--+
----+----+----+----+----+----+
* may represent up to 2 counts
SAS システム 12
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=YOTYOKIN
Normal Probability Plot
37500+ *
|
|
| *
| +
| ++++++++++
| +++++++***** *
2500+ * * * ****************************
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
SAS システム 13
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=TOTAL
Moments
N 69 Sum Wgts 69
Mean 7292.652 Sum 503193
Std Dev 12135.92 Variance 1.4728E8
Skewness 3.552726 Kurtosis 13.43033
USS 1.368E10 CSS 1.002E10
CV 166.413 Std Mean 1460.993
T:Mean=0 4.991571 Pr>|T| 0.0001
Num ^= 0 68 Num > 0 68
M(Sign) 34 Pr>=|M| 0.0001
Sgn Rank 1173 Pr>=|S| 0.0001
SAS システム 14
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=TOTAL
Quantiles(Def=5)
100% Max 67121 99% 67121
75% Q3 5950 95% 27659
50% Med 3249 90% 15540
25% Q1 1734 10% 803
0% Min 0 5% 200
1% 0
Range 67121
Q3-Q1 4216
Mode 10
SAS システム 15
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=TOTAL
Extremes
Lowest Obs Highest Obs
0( 49) 22110( 40)
10( 64) 27659( 21)
10( 35) 49055( 4)
200( 23) 57260( 33)
714( 58) 67121( 26)
SAS システム 16
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=TOTAL
Stem Leaf # Boxplot
6 7 1 *
6
5 7 1 *
5
4 9 1 *
4
3
3
2 8 1 *
2 2 1 *
1 568 3 0
1 000114 6 0
0 55555555666789 14 +--+--+
0 00001111111111122222222223333333333344444 41 *-----*
----+----+----+----+----+----+----+----+-
Multiply Stem.Leaf by 10**+4
SAS システム 17
10:30 Wednesday, November 7, 2007
Univariate Procedure
Variable=TOTAL
Normal Probability Plot
65000+ *
| *
| *
35000+ +++++++
| ++++**++
| +++++++*****
5000+ * * ***************************
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
[参考1] 上記の箱髭図は潰れていて理解し難い部分もあるので、別の例として、皆さんの身長のデータを図に表わしたものを以下に示す。
Univariate Procedure
Variable=SHINTYOU
Histogram # Boxplot
187.5+* 3 |
.******* 21 |
.****************** 54 |
.********************************** 100 +-----+
167.5+************************ 71 *--+--*
.******************* 55 +-----+
.************* 38 |
.****** 18 |
147.5+** 6 |
----+----+----+----+----+----+----
* may represent up to 3 counts
[参考2] 例えば 1000万円の単位に四捨五入して最頻値を調べる方法もある。
そのためには「round」と言う関数を用いればよい。
このようにして求めた最頻値は 1000万円であった。
data naikaku;
infile 'naikaku0611.prn'
firstobs=2;
input name $10. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
tot1000=round(total,1000);
分布形状と統計量
/* Lesson 6-88 */
/* File Name = les0688.sas 11/07/07 */
data gakusei;
infile 'all07be.prn'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
proc print data=gakusei(obs=5);
run;
注意1: 電子メールでの場合は、添付ファイルは使わないこと。
提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。
また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
注意3: 連絡ページ
に受領した者の学籍番号を掲載するので、確認に使ってほしい。