/* Lesson 5-1 */ : /* File Name = les0501.sas 10/31/07 */ : : data naikaku; : データ名の定義 infile 'naikaku0611.prn' : ファイル名の指定 firstobs=2; : 数値は 2行目から入っている input name $ posit $ sex $ tochi : 読み込む変量名 ; : 終りを示すセミコロン proc print data=naikaku; : データの表示 run; : proc means data=naikaku; : 平均、標準偏差、最大最小値の算出 run; :
SAS システム 1 11:48 Tuesday, October 30, 2007 OBS NAME POSIT SEX TOCHI 1 Abe Kakuryou M 9760 2 Kan Kakuryou M 4767 3 Nagase Kakuryou M 2175 4 Aso Kakuryou M 41205 5 Omi Kakuryou M 2788 6 Ibuki Kakuryou M 12960 7 Yanagisa Kakuryou M 1921 8 Matsuoka Kakuryou M 2584 9 Amari Kakuryou M 3154 10 Fuyushib Kakuryou M 1435 <中略> 67 Yoshida Seimu M 1184 68 Fujino Seimu M 941 69 Kitagawa Seimu M 1374 SAS システム 6 11:48 Tuesday, October 30, 2007 Analysis Variable : TOCHI N Mean Std Dev Minimum Maximum ---------------------------------------------------------- 69 4751.35 9352.40 0 61046.00 ----------------------------------------------------------
/* Lesson 5-2 */ /* File Name = les0502.sas 10/31/07 */ data naikaku; infile 'naikaku0611.prn' firstobs=2; input name $11. posit $ sex $ tochi : 文字列長の指定方法 yotyokin total honnin kasituke kariire : 長い場合は 2行に ; proc print data=naikaku; run; proc means data=naikaku; run; proc chart data=naikaku; : ヒストグラムを描く hbar total; : 水平棒グラフで。変量を指定 vbar total; : 垂直棒グラフで。変量を指定 run;
SAS システム 1 11:48 Tuesday, October 30, 2007 Y K O A K T H S A P T Y T O I R N O O O O N T I O A S S C K T N U I B M I E H I A I K R S E T X I N L N E E 1 Abe Kakuryou M 9760 5030 14790 13990 0 0 2 Kan Kakuryou M 4767 0 4767 4767 0 2556 3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950 4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100 5 Omi Kakuryou M 2788 0 2788 2144 500 0 6 Ibuki Kakuryou M 12960 2580 15540 4462 0 0 7 Yanagisawa Kakuryou M 1921 3065 4986 3215 0 1125 8 Matsuoka Kakuryou M 2584 2065 4649 3528 0 1447 9 Amari Kakuryou M 3154 4450 7604 5039 0 968 10 Fuyushiba Kakuryou M 1435 1000 2435 1435 0 0 <中略> SAS システム 7 11:48 Tuesday, October 30, 2007 Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------- TOCHI 69 4751.35 9352.40 0 61046.00 YOTYOKIN 69 2541.28 5094.07 0 35400.00 TOTAL 69 7292.65 12135.92 0 67121.00 HONNIN 69 4804.23 7940.48 0 42666.00 KASITUKE 69 738.4057971 2517.94 0 18800.00 KARIIRE 69 1876.81 2862.83 0 16000.00 -------------------------------------------------------------------- SAS システム 8 11:48 Tuesday, October 30, 2007 TOTAL Cum. Cum. Midpoint Freq Freq Percent Percent | 5000 |***************************** 58 58 84.06 84.06 15000 |*** 6 64 8.70 92.75 25000 |* 2 66 2.90 95.65 35000 | 0 66 0.00 95.65 45000 |* 1 67 1.45 97.10 55000 |* 1 68 1.45 98.55 65000 |* 1 69 1.45 100.00 | -----+----+----+----+----+---- 10 20 30 40 50 Frequency SAS システム 9 11:48 Tuesday, October 30, 2007 Frequency 60 + ***** | ***** 45 + ***** | ***** 30 + ***** | ***** 15 + ***** | ***** ***** -------------------------------------------------------------------- 5000 15000 25000 35000 45000 55000 65000 TOTAL Midpoint
/* Lesson 5-3 */ /* File Name = les0503.sas 10/31/07 */ data naikaku; infile 'naikaku0611.prn' firstobs=2; input name $11. posit $ sex $ tochi yotyokin total honnin kasituke kariire ; proc print data=naikaku(obs=5); : 先頭の 5ケースだけを表示。確認用 run; proc means data=naikaku; var tochi total; : 平均等を求めたい変量を指定 run; proc chart data=naikaku; hbar total; vbar total; run; proc chart data=naikaku; hbar total / midpoints= 5000 to 50000 by 5000; : 軸の値を指定 vbar total / midpoints=10000 to 50000 by 10000; : 軸の値を指定 run;
SAS システム 1 11:48 Tuesday, October 30, 2007 OBS NAME POSIT SEX TOCHI YOTYOKIN TOTAL HONNIN KASITUKE KARIIRE 1 Abe Kakuryou M 9760 5030 14790 13990 0 0 2 Kan Kakuryou M 4767 0 4767 4767 0 2556 3 Nagase Kakuryou M 2175 6750 8925 5649 0 2950 4 Aso Kakuryou M 41205 7850 49055 42666 18800 1100 5 Omi Kakuryou M 2788 0 2788 2144 500 0 SAS システム 2 11:48 Tuesday, October 30, 2007 Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------- TOCHI 69 4751.35 9352.40 0 61046.00 TOTAL 69 7292.65 12135.92 0 67121.00 -------------------------------------------------------------------- <中略> SAS システム 5 11:48 Tuesday, October 30, 2007 TOTAL Cum. Cum. Midpoint Freq Freq Percent Percent | 5000 |*************************** 53 53 76.81 76.81 10000 |**** 7 60 10.14 86.96 15000 |** 3 63 4.35 91.30 20000 |* 2 65 2.90 94.20 25000 | 0 65 0.00 94.20 30000 |* 1 66 1.45 95.65 35000 | 0 66 0.00 95.65 40000 | 0 66 0.00 95.65 45000 | 0 66 0.00 95.65 50000 |** 3 69 4.35 100.00 | -----+----+----+----+----+-- 10 20 30 40 50 SAS システム 6 11:48 Tuesday, October 30, 2007 Frequency 60 + ***** | ***** 45 + ***** | ***** 30 + ***** | ***** 15 + ***** | ***** -------------------------------------------------------------------- 10000 20000 30000 40000 50000 TOTAL Midpoint
stat システム上の SAS に関して言えば、SAS の出力中の日本語は
「EUC コード」を使って表現されているので、
SAS の「計算結果」を Windows マシンに転送する前に
「EUC コード」を「Shift-JIS コード」に変換する必要が生じる。
また、漢字を含む元データを stat システム上で解析したいのなら、
転送後、stat システム上で EUC コードに変換してから利用する必要がある。
同様の理由で、ファイル名に漢字を使うのも避けるべきである。
[Lesson 5-4] Windows 側で読み出せるか、実際に転送してみよ。
[補足] nkf には他に、「-e」オプション(EUCコードに変換)、 「-j」オプション(JISコードに変換)がある。