/* Lesson 2-1 */ : コメント、実行に無関係 /* File Name = les0201.sas 10/11/06 */ : 後々の記録のためのメモ : 見易さのための空行 data kenshin; : データ名の定義 input name $ shintyou taijyuu; : 読み込む変量名、型($は文字型を示す) cards; : データの始まりを示す Hillman 178 81 : Case 1 Itoh 181 84 : Case 2 Oh 176 85 : Case 3 Valentine 178 84 : Case 4 Nakamura 173 73 : Case 5 Nomura 175 85 : Case 6 ; : データの終りを示す proc print data=kenshin; : 読み込んだデータの表示 run; : 上記の実行 proc means data=kenshin; : 平均値等の算出 run; : 上記の実行
SAS システム 1 11:32 Wednesday, October 11, 2006 OBS NAME SHINTYOU TAIJYUU 1 Hillman 178 81 2 Itoh 181 84 3 Oh 176 85 4 Valentin 178 84 5 Nakamura 173 73 6 Nomura 175 85 SAS システム 2 11:32 Wednesday, October 11, 2006 Variable N Mean Std Dev Minimum Maximum ------------------------------------------------------------------- SHINTYOU 6 176.8333333 2.7868740 173.0000000 181.0000000 TAIJYUU 6 82.0000000 4.6475800 73.0000000 85.0000000 -------------------------------------------------------------------
[Lesson 2-3] : データの電子化 : 小泉内閣の資産公開資料のデータを電子化せよ。氏名は姓だけでよい。 [PDF File]
[補足1] SAS は漢字を含むデータを読み込むことができる。 しかし、日本語入力のための作業時間がかかる点や、 ファイル転送時の指定を厳密に行う必要がある点等を考慮して、 講義の中では取り扱わず、半角英数字のみを用いる。
[データ] 第2次小泉内閣の閣僚資産データ(2005年12月09日発表) [部分]
Name | Position | Sex | Tochi | Yotyokin | Total | Honnin | Kasituke | Kariire |
Koizumi | Kakuryou | M | 10743 | 2360 | 13103 | 13103 | 0 | 0 |
Takenaka | Kakuryou | M | 3002 | 1071 | 4073 | 1213 | 6065 | 1681 |
Sugiura | Kakuryou | M | 1755 | 796 | 2551 | 2071 | 0 | 0 |
Aso | Kakuryou | M | 37779 | 7850 | 45629 | 40379 | 20100 | 2000 |
Kosaka | Kakuryou | M | 5596 | 1300 | 6896 | 5224 | 0 | 0 |
Kawasaki | Kakuryou | M | 4978 | 100 | 5078 | 4978 | 6709 | 0 |
Nikai | Kakuryou | M | 7417 | 3600 | 11017 | 4701 | 0 | 0 |
Kitagawa | Kakuryou | M | 1231 | 0 | 1231 | 1231 | 0 | 4915 |
Tanigaki | Kakuryou | M | 2582 | 3075 | 5657 | 4707 | 0 | 0 |
Nakagawa | Kakuryou | M | 2962 | 4072 | 7034 | 4304 | 0 | 6488 |
Koike | Kakuryou | F | 1220 | 696 | 1916 | 1916 | 0 | 0 |
Abe | Kakuryou | M | 9796 | 5030 | 14826 | 14026 | 0 | 0 |
Kutsukake | Kakuryou | M | 4973 | 4060 | 9033 | 6113 | 0 | 0 |
Nukaga | Kakuryou | M | 5272 | 200 | 5472 | 4055 | 0 | 10000 |
Yosano | Kakuryou | M | 6828 | 9803 | 16631 | 11173 | 0 | 4157 |
Tyuuma | Kakuryou | M | 3400 | 1900 | 5300 | 4500 | 0 | 0 |
Matsuda | Kakuryou | M | 4414 | 2713 | 7127 | 6156 | 0 | 5105 |
Inokuchi | Kakuryou | F | 4307 | 177 | 4484 | 2461 | 0 | 12571 |
[入力画面]
入力画面(拡大)
[Lesson 2-4] : データの保存 : 演習で入力したデータを保存せよ。
今後の説明を簡単にするために、ここでは、ドライブ名に「H:」、
ファイル名に「naikaku0512」を指定したとして説明を進める。
この例の指定を行なえば、H ドライブに「naikaku0512.xls」と言うファイルが
作成されているはずである。確認せよ。
[補足2] stat システム(UNIX)では、 漢字のファイル名や空白を含むファイル名は取り扱いが面倒なので、 「スペースを含まない英数字で」ファイル名を付けることを勧める。
[Lesson 2-5] : データの保存 :
演習で入力したデータを SAS で使うことを考慮して
テキスト形式で保存せよ。
この後の説明を簡単にするために、ここでは、ドライブ名に「H:」、
ファイル名に「naikaku0512」を指定したとして説明を進める
(naikaku0512.prn)。
[補足3] 上記ではExcel の標準形式(*.xls)と
テキスト形式(*.prn)の 2通りの保存方法を紹介したが、
今後とも両方の形式で保存しておくことを勧める。
上記で指摘したように、列幅が足らない状態でテキスト形式の保存を行なうと、
ファイル上で隣同士のセルがくっついてしまい、
以後手作業を行わないと分離できなくなってしまうからである。
Excel の標準形式で保存してあれば、
このファイルを使って幅を再修正し、テキスト形式で再保存することが可能となる。
逆に、テキスト形式だけだと、このような再修正は不可能である。
[補足4] テキスト形式(*.prn)で保存後に、
これを直接編集したい場合は、Excel を使わずともテキストエディタ(秀丸、
NotePad 等)を使えば加工できる。
[補足5] SAS に読み込ませるデータの形式として、
「スペース区切り」以外に「タブ区切り」、「カンマ区切り(CSV 形式)」等も
利用可能であるが、これらについては後日紹介する。
[演習: データの電子化] 本節を参考に、各自が収集したデータも電子化しておくこと。 ファイル名や入力した変量を忘れないように。