/* Lesson 4-1 */ :
/* File Name = les0401.sas 05/10/07 */ :
:
data naikaku; : データ名の定義
infile 'naikaku0611.prn' : ファイル名の指定
firstobs=2; : 数値は 2行目から入っている
input name $ posit $ sex $ tochi : 読み込む変量名
; : 終りを示すセミコロン
proc print data=naikaku; : データの表示
run; :
proc means data=naikaku; : 平均、標準偏差、最大最小値の算出
run; :
SAS システム 1
00:14 Wednesday, May 9, 2007
OBS NAME POSIT SEX TOCHI
1 Abe Kakuryou M 9760
2 Kan Kakuryou M 4767
3 Nagase Kakuryou M 2175
4 Aso Kakuryou M 41205
5 Omi Kakuryou M 2788
6 Ibuki Kakuryou M 12960
7 Yanagisa Kakuryou M 1921
8 Matsuoka Kakuryou M 2584
9 Amari Kakuryou M 3154
10 Fuyushib Kakuryou M 1435
11 Wakabaya Kakuryou M 3254
<中略>
65 Matsuyam Seimu M 2832
66 Kajiyama Seimu M 2530
67 Yoshida Seimu M 1184
68 Fujino Seimu M 941
69 Kitagawa Seimu M 1374
SAS システム 6
00:14 Wednesday, May 9, 2007
Analysis Variable : TOCHI
N Mean Std Dev Minimum Maximum
----------------------------------------------------------
69 4751.35 9352.40 0 61046.00
----------------------------------------------------------
/* Lesson 4-2 */
/* File Name = les0402.sas 05/10/07 */
data naikaku;
infile 'naikaku0611.prn'
firstobs=2;
input name $11. posit $ sex $ tochi : 文字列長の指定方法
yotyokin total honnin kasituke kariire : 長い場合は 2行に
;
proc print data=naikaku;
run;
proc means data=naikaku;
run;
proc chart data=naikaku; : ヒストグラムを描く
hbar total; : 水平棒グラフで。変量を指定
vbar total; : 垂直棒グラフで。変量を指定
run;
SAS システム 1
00:26 Wednesday, May 9, 2007
Y K
O A K
T H S A
P T Y T O I R
N O O O O N T I
O A S S C K T N U I
B M I E H I A I K R
S E T X I N L N E E
1 Abe Kakuryou M 9760 5030 14790 13990 0 0
2 Kan Kakuryou M 4767 0 4767 4767 0 2556
3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950
4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100
5 Omi Kakuryou M 2788 0 2788 2144 500 0
6 Ibuki Kakuryou M 12960 2580 15540 4462 0 0
7 Yanagisawa Kakuryou M 1921 3065 4986 3215 0 1125
8 Matsuoka Kakuryou M 2584 2065 4649 3528 0 1447
9 Amari Kakuryou M 3154 4450 7604 5039 0 968
10 Fuyushiba Kakuryou M 1435 1000 2435 1435 0 0
11 Wakabayashi Kakuryou M 3254 6445 9699 4854 2100 0
<中略>
SAS システム 7
13:28 Wednesday, May 9, 2007
Variable N Mean Std Dev Minimum Maximum
--------------------------------------------------------------------
TOCHI 69 4751.35 9352.40 0 61046.00
YOTYOKIN 69 2541.28 5094.07 0 35400.00
TOTAL 69 7292.65 12135.92 0 67121.00
HONNIN 69 4804.23 7940.48 0 42666.00
KASITUKE 69 738.4057971 2517.94 0 18800.00
KARIIRE 69 1876.81 2862.83 0 16000.00
--------------------------------------------------------------------
SAS システム 8
00:26 Wednesday, May 9, 2007
TOTAL Cum. Cum.
Midpoint Freq Freq Percent Percent
|
5000 |***************************** 58 58 84.06 84.06
15000 |*** 6 64 8.70 92.75
25000 |* 2 66 2.90 95.65
35000 | 0 66 0.00 95.65
45000 |* 1 67 1.45 97.10
55000 |* 1 68 1.45 98.55
65000 |* 1 69 1.45 100.00
|
-----+----+----+----+----+----
10 20 30 40 50
Frequency
SAS システム 9
00:26 Wednesday, May 9, 2007
Frequency
60 + *****
| *****
45 + *****
| *****
30 + *****
| *****
15 + *****
| ***** *****
--------------------------------------------------------------------
5000 15000 25000 35000 45000 55000 65000
TOTAL Midpoint
/* Lesson 4-3 */
/* File Name = les0403.sas 05/10/07 */
data naikaku;
infile 'naikaku0611.prn'
firstobs=2;
input name $11. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
proc print data=naikaku(obs=5); : 先頭の 5ケースだけを表示。確認用
run;
proc means data=naikaku;
var tochi total; : 平均等を求めたい変量を指定
run;
proc chart data=naikaku;
hbar total;
vbar total;
run;
proc chart data=naikaku;
hbar total / midpoints= 5000 to 50000 by 5000; : 軸の値を指定
vbar total / midpoints=10000 to 50000 by 10000; : 軸の値を指定
run;
SAS システム 1
00:26 Wednesday, May 9, 2007
OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE
1 Abe Kakuryou M 9760 5030 14790 13990 0 0
2 Kan Kakuryou M 4767 0 4767 4767 0 2556
3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950
4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100
5 Omi Kakuryou M 2788 0 2788 2144 500 0
SAS システム 2
13:29 Wednesday, May 9, 2007
Variable N Mean Std Dev Minimum Maximum
--------------------------------------------------------------------
TOCHI 69 4751.35 9352.40 0 61046.00
TOTAL 69 7292.65 12135.92 0 67121.00
--------------------------------------------------------------------
<中略>
SAS システム 5
00:26 Wednesday, May 9, 2007
TOTAL Cum. Cum.
Midpoint Freq Freq Percent Percent
|
5000 |*************************** 53 53 76.81 76.81
10000 |**** 7 60 10.14 86.96
15000 |** 3 63 4.35 91.30
20000 |* 2 65 2.90 94.20
25000 | 0 65 0.00 94.20
30000 |* 1 66 1.45 95.65
35000 | 0 66 0.00 95.65
40000 | 0 66 0.00 95.65
45000 | 0 66 0.00 95.65
50000 |** 3 69 4.35 100.00
|
-----+----+----+----+----+--
10 20 30 40 50
SAS システム 6
00:26 Wednesday, May 9, 2007
Frequency
60 + *****
| *****
45 + *****
| *****
30 + *****
| *****
15 + *****
| *****
--------------------------------------------------------------------
10000 20000 30000 40000 50000
TOTAL Midpoint
stat システム上の SAS に関して言えば、SAS の出力中の日本語は
「EUC コード」を使って表現されているので、
SAS の「計算結果」を Windows マシンに転送する前に
「EUC コード」を「Shift-JIS コード」に変換する必要が生じる。
また、漢字を含む元データを stat システム上で解析したいのなら、
転送後、stat システム上で EUC コードに変換してから利用する必要がある。
同様の理由で、ファイル名に漢字を使うのも避けるべきである。
[Lesson 4-4] Windows 側で読み出せるか、実際に転送してみよ。
[補足] nkf には他に、「-e」オプション(EUCコードに変換)、 「-j」オプション(JISコードに変換)がある。