/* Lesson 2-1 */ : コメント、実行に無関係 /* File Name = les0201.sas 04/19/07 */ : 後々の記録のためのメモ : 見易さのための空行 data kenshin; : データ名の定義 input name $ shintyou taijyuu; : 読み込む変量名、型($は文字型を示す) cards; : データの始まりを示す Ochiai 178 80 : Case 1 Okada 175 77 : Case 2 Furuta 180 80 : Case 3 Hara 181 88 : Case 4 Brown 183 96 : Case 5 Tashiro 185 88 : Case 6 ; : データの終りを示す proc print data=kenshin; : 読み込んだデータの表示 run; : 上記の実行 proc means data=kenshin; : 平均値等の算出 run; : 上記の実行
SAS システム 1 21:17 Friday, April 13, 2007 OBS NAME SHINTYOU TAIJYUU 1 Ochiai 178 80 2 Okada 175 77 3 Furuta 180 80 4 Hara 181 88 5 Brown 183 96 6 Tashiro 185 88 SAS システム 2 21:17 Friday, April 13, 2007 Variable N Mean Std Dev Minimum Maximum ------------------------------------------------------------------- SHINTYOU 6 180.3333333 3.5590261 175.0000000 185.0000000 TAIJYUU 6 84.8333333 7.1110243 77.0000000 96.0000000 -------------------------------------------------------------------
[Lesson 2-3] : データの電子化 : 安倍内閣の資産公開資料のデータを電子化せよ。氏名は姓だけでよい。 [PDF File]
[補足1] SAS は漢字を含むデータを読み込むことができる。 しかし、日本語入力のための作業時間がかかる点や、 ファイル転送時の指定を厳密に行う必要がある点等を考慮して、 講義の中では取り扱わず、半角英数字のみを用いる。
[データ] 第1次安倍内閣の閣僚資産データ(2006年11月03日発表) [部分]
Name | Position | Sex | Tochi | Yotyokin | Total | Honnin | Kasituke | Kariire |
Abe | Kakuryou | M | 9760 | 5030 | 14790 | 13990 | 0 | 0 |
Kan | Kakuryou | M | 4767 | 0 | 4767 | 4767 | 0 | 2556 |
Nagase | Kakuryou | M | 2175 | 6750 | 8925 | 5649 | 0 | 2950 |
Aso | Kakuryou | M | 41205 | 7850 | 49055 | 42666 | 18800 | 1100 |
Omi | Kakuryou | M | 2788 | 0 | 2788 | 2144 | 500 | 0 |
Ibuki | Kakuryou | M | 12960 | 2580 | 15540 | 4462 | 0 | 0 |
Yanagisawa | Kakuryou | M | 1921 | 3065 | 4986 | 3215 | 0 | 1125 |
Matsuoka | Kakuryou | M | 2584 | 2065 | 4649 | 3528 | 0 | 1447 |
Amari | Kakuryou | M | 3154 | 4450 | 7604 | 5039 | 0 | 968 |
Fuyushiba | Kakuryou | M | 1435 | 1000 | 2435 | 1435 | 0 | 0 |
Wakabayashi | Kakuryou | M | 3254 | 6445 | 9699 | 4854 | 2100 | 0 |
Shiozaki | Kakuryou | M | 3512 | 1661 | 5173 | 2683 | 2230 | 871 |
Mizote | Kakuryou | M | 3232 | 2000 | 5232 | 1000 | 1500 | 0 |
Kyuuma | Kakuryou | M | 2091 | 0 | 2091 | 2091 | 0 | 3808 |
Takaichi | Kakuryou | F | 1743 | 996 | 2740 | 1614 | 1333 | 3429 |
Yamamoto | Kakuryou | M | 9873 | 4320 | 14193 | 7286 | 0 | 0 |
Oota | Kakuryou | F | 374 | 4959 | 5333 | 5333 | 0 | 0 |
Sata | Kakuryou | M | 2335 | 2110 | 4445 | 3445 | 0 | 1154 |
[入力画面]
入力画面(拡大)
[Lesson 2-4] : データの保存 : 演習で入力したデータを保存せよ。
今後の説明を簡単にするために、ここでは、ドライブ名に「H:」、
ファイル名に「naikaku0611」を指定したとして説明を進める。
この例の指定を行なえば、H ドライブに「naikaku0611.xls」と言うファイルが
作成されているはずである。確認せよ。
[補足2] stat システム(UNIX)では、 漢字のファイル名や空白を含むファイル名は取り扱いが面倒なので、 「スペースを含まない英数字で」ファイル名を付けることを勧める。
[Lesson 2-5] : データの保存 :
演習で入力したデータを SAS で使うことを考慮して
テキスト形式で保存せよ。
この後の説明を簡単にするために、ここでは、ドライブ名に「H:」、
ファイル名に「naikaku0611」を指定したとして説明を進める
(naikaku0611.prn)。
[補足3] 上記ではExcel の標準形式(*.xls)と
テキスト形式(*.prn)の 2通りの保存方法を紹介したが、
今後とも両方の形式で保存しておくことを勧める。
上記で指摘したように、列幅が足らない状態でテキスト形式の保存を行なうと、
ファイル上で隣同士のセルがくっついてしまい、
以後手作業を行わないと分離できなくなってしまうからである。
Excel の標準形式で保存してあれば、
このファイルを使って幅を再修正し、テキスト形式で再保存することが可能となる。
逆に、テキスト形式だけだと、このような再修正は不可能である。
[補足4] テキスト形式(*.prn)で保存後に、
これを直接編集したい場合は、Excel を使わずともテキストエディタ(秀丸、
NotePad 等)を使えば加工できる。
[補足5] SAS に読み込ませるデータの形式として、
「スペース区切り」以外に「タブ区切り」、「カンマ区切り(CSV 形式)」等も
利用可能であるが、これらについては後日紹介する。
[演習: データの電子化] 本節を参考に、各自が収集したデータも電子化しておくこと。 ファイル名や入力した変量を忘れないように。