/* Lesson 4-1 */ : コメント、実行に無関係
/* File Name = les0401.sas 10/27/05 */ : 後々の記録のためのメモ
: 見易さのための空行
data kenshin; : データ名の定義
input name $ shintyou taijyuu; : 読み込む変量名、型($は文字型を示す)
cards; : データの始まりを示す
Valentine 178 84 : Case 1
Oh 176 85 : Case 2
Itoh 181 84 : Case 3
Ohgi 171 71 : Case 4
Hillman 178 81 : Case 5
Tao 174 77 : Case 6
; : データの終りを示す
proc print data=kenshin; : 読み込んだデータの表示
run; : 上記の実行
proc means data=kenshin; : 平均値等の算出
run; : 上記の実行
SAS システム 1
11:48 Wednesday, November 9, 2005
OBS NAME SHINTYOU TAIJYUU
1 Valentin 178 84
2 Oh 176 85
3 Itoh 181 84
4 Ohgi 171 71
5 Hillman 178 81
6 Tao 174 77
SAS システム 2
16:35 Wednesday, October 26, 2005
Variable N Mean Std Dev Minimum Maximum
-------------------------------------------------------------------
SHINTYOU 6 176.3333333 3.5023801 171.0000000 181.0000000
TAIJYUU 6 80.3333333 5.4283208 71.0000000 85.0000000
-------------------------------------------------------------------
MNC では、ファイルの送受信ツールとして
WinSCP
を用意しているので、このソフトウェアの使い方を説明する。
なお、これはフリーソフトウェアであるので、自宅から使うような場合は
各自のパソコンにインストールしておくとよいであろう。
・参考になるWebページ
[Lesson 5-1] : ファイルの転送: Windows ===> stat システム(UNIX)
[参考] PC・ネットワーク利用ガイド2005年度版 の「 第6章 その他のサービス 」に stat システムを使う際の説明が若干載っている。
[Lesson 5-2] : 転送されたファイルの確認
転送したファイルが実際に存在し、ファイル内容も正しいことを確認せよ。
/* Lesson 5-3 */ :
/* File Name = les0503.sas 11/10/05 */ :
:
data naikaku; : データ名の定義
infile 'naikaku0310.prn' : ファイル名の指定
firstobs=2; : 数値は 2行目から入っている
input name $ posit $ sex $ tochi : 読み込む変量名
; : 終りを示すセミコロン
proc print data=naikaku; : データの表示
run; :
proc means data=naikaku; : 平均、標準偏差、最大最小値の算出
run; :
SAS システム 1
11:48 Wednesday, November 9, 2005
OBS NAME POSIT SEX TOCHI
1 Koizumi Kakuryou M 10743
2 Aso Kakuryou M 37772
3 Nozawa Kakuryou M 2315
4 Kawaguch Kakuryou F 2266
5 Kawamura Kakuryou M 6268
6 Sakaguch Kakuryou M 451
7 Nakagawa Kakuryou M 2915
8 Ishihara Kakuryou M 2346
9 Koike Kakuryou F 1393
10 Fukuda Kakuryou M 6036
11 Ono Kakuryou F 2005
12 Mogi Kakuryou M 688
13 Takenaka Kakuryou M 3122
14 Kaneko Kakuryou M 2859
15 Inoue Kakuryou M 5464
<中略>
55 Fukumoto Seimu M 1114
56 Eda Seimu M 1591
57 Kan Seimu M 3401
58 Satou Seimu M 667
59 Saitou Seimu M 3213
60 Sunada Seimu M 5433
SAS システム 5
11:48 Wednesday, November 9, 2005
Analysis Variable : TOCHI
N Mean Std Dev Minimum Maximum
----------------------------------------------------------
60 4077.17 6398.74 0 37772.00
----------------------------------------------------------
/* Lesson 5-4 */
/* File Name = les0504.sas 11/10/05 */
data naikaku;
infile 'naikaku0310.prn'
firstobs=2;
input name $10. posit $ sex $ tochi : 文字列長の指定方法
yotyokin total honnin kasituke kariire : 長い場合は 2行に
;
proc print data=naikaku;
run;
proc means data=naikaku;
var total; : 平均を求める変量を指定
run;
proc chart data=naikaku; : ヒストグラムを描く
hbar total; : 水平棒グラフで。変量を指定
vbar total; : 垂直棒グラフで。変量を指定
run;
SAS システム 5
11:48 Wednesday, November 9, 2005
Analysis Variable : TOTAL
N Mean Std Dev Minimum Maximum
----------------------------------------------------------
60 5761.28 7444.75 0 45522.00
----------------------------------------------------------
SAS システム 6
11:48 Wednesday, November 9, 2005
TOTAL Cum. Cum.
Midpoint Freq Freq Percent Percent
|
4000 |*************************** 53 53 88.33 88.33
12000 |** 3 56 5.00 93.33
20000 |* 1 57 1.67 95.00
28000 |* 2 59 3.33 98.33
36000 | 0 59 0.00 98.33
44000 |* 1 60 1.67 100.00
|
-----+----+----+----+----+--
10 20 30 40 50
Frequency
SAS システム 7
11:48 Wednesday, November 9, 2005
Frequency
| *****
50 + *****
| *****
40 + *****
| *****
30 + *****
| *****
20 + *****
| *****
10 + *****
| ***** *****
------------------------------------------------------------------
4000 12000 20000 28000 36000 44000
TOTAL Midpoint
/* Lesson 5-5 */
/* File Name = les0505.sas 11/10/05 */
data naikaku;
infile 'naikaku0310.prn'
firstobs=2;
input name $10. posit $ sex $ tochi
yotyokin total honnin kasituke kariire
;
proc print data=naikaku(obs=5); : 先頭の 5ケースだけを表示。確認用
run;
proc means data=naikaku;
var total;
run;
proc chart data=naikaku;
hbar total;
vbar total;
run;
proc chart data=naikaku;
hbar total / midpoints= 5000 to 50000 by 5000; : 軸の値を指定
vbar total / midpoints=10000 to 50000 by 10000; : 軸の値を指定
run;
SAS システム 1
11:48 Wednesday, November 9, 2005
OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE
1 Koizumi Kakuryou M 10743 2360 13103 13103 0 0
2 Aso Kakuryou M 37772 7750 45522 40273 20100 2000
3 Nozawa Kakuryou M 2315 2114 4429 2912 0 0
4 Kawaguchi Kakuryou F 2266 14330 16596 11344 0 0
5 Kawamura Kakuryou M 6268 2228 8496 5872 0 1000
SAS システム 2
11:48 Wednesday, November 9, 2005
Analysis Variable : TOTAL
N Mean Std Dev Minimum Maximum
----------------------------------------------------------
60 5761.28 7444.75 0 45522.00
----------------------------------------------------------
<中略>
SAS システム 5
11:48 Wednesday, November 9, 2005
TOTAL Cum. Cum.
Midpoint Freq Freq Percent Percent
|
5000 |************************* 49 49 81.67 81.67
10000 |*** 6 55 10.00 91.67
15000 |* 2 57 3.33 95.00
20000 | 0 57 0.00 95.00
25000 |* 1 58 1.67 96.67
30000 |* 1 59 1.67 98.33
35000 | 0 59 0.00 98.33
40000 | 0 59 0.00 98.33
45000 |* 1 60 1.67 100.00
50000 | 0 60 0.00 100.00
|
-----+----+----+----+----+
10 20 30 40 50
SAS システム 6
11:48 Wednesday, November 9, 2005
Frequency
| *****
45 + *****
| *****
30 + *****
| *****
15 + *****
| *****
--------------------------------------------------------------------
10000 20000 30000 40000 50000
TOTAL Midpoint
stat システム上の SAS に関して言えば、SAS の出力中の日本語は
「EUC コード」を使って表現されているので、
SAS の「計算結果」を Windows マシンに転送する前に
「EUC コード」を「Shift-JIS コード」に変換する必要が生じる。
また、漢字を含む元データを stat システム上で解析したいのなら、
転送後、stat システム上で EUC コードに変換してから利用する必要がある。
同様の理由で、ファイル名に漢字を使うのも避けるべきである。
[Lesson 5-5] : Windows 側で読み出せるか、実際に転送してみよ。