MNC のシステム概要
講義で実習する SAS は stat システムという計算機上で稼働しており、
このシステムにログインして利用することになる。
このシステムには、UNIX という OS が使われており、
Windows 環境とは異なった操作体系を修得する必要がある。
しかし幸い、SAS を使うことだけに注目した場合、UNIX の知識はほとんど必要なく、
Windows 環境からあたかも Windowsを使っているかのように
(DOSと言った方がより近い) stat システムを操作・利用することができる。
つまり、前項で作成したデータを SAS で解析するには、
stat システムに持って行く(送信という)必要がある。
また、stat システムにはプリンタが接続されていないので、
出力に関してもstat システムから Windows に転送する必要がある。
後者についての実習は後日行う。
これらをまとめると、以下のようになる。
- SAS は stat システム上にある
- データはパソコンで入力/加工する方が便利であろう : Excel 等を使う
- 表形式で入力。縦:ケース、横:変量
- Excel を使った場合、「テキストファイル(スペース区切り)で保存」すること
- データを Windows側で作成した場合、stat システムに転送する必要がある
[参考] MNC セミナー用テキスト :
統計システム入門 (UNIX で使うSAS) :
URL は http://www.mnc.waseda.ac.jp/ssguide/semisas5/index.html
データ転送(送信) : FFFTP を使ったファイルの送受信
漢字コードを含むファイルの送受信ツールとして
FFFTP が用意されているので、このソフトウェアの使い方を説明する。
なお、これはフリーソフトである。
- [背景] 漢字コードについて
漢字コードには幾つかの体系があって、異なったコード体系間では
変換を行わないと正常には読み出せない。
Windows マシンで利用される漢字コードは、
「Shift-JISコード」に固定されているため、この様な混乱は少ない。
しかし、stat-system を含む UNIX マシンの場合は、
「EUC コード」や「JIS コード」が使われることが多く、
Windows マシンとデータを共有しようとすると、
漢字コードの変換を頭に入れて、
適宜変換しながら利用する必要がある。
- Windows マシン : Shift-JIS コード
- UNIX マシン : EUC コード, JIS コード
stat-system 上の SAS に関して言えば、SAS の出力中の日本語は
「EUC コード」を使って表現されているので、
SAS の「計算結果」を Windows マシンに転送する時には、
「EUC コード」を「Shift-JIS コード」に変換する必要が生じる。
また同様の理由で、ファイル名に漢字を使うのは避けるべきである。
- 操作手順
- 転送プログラム(FFFTP)の起動
「スタート」→「プログラム(P)」→「stat システム」→「FFFTP」とクリックする。
- ホスト「stat-system」を選択し「接続」ボタンをクリックする。
- stat システム用の「ユーザー名 :」を入力する。
- stat システム用の「パスワード :」を入力する。
- 画面の左半分は Windows 側を、
右半分は stat-system 側のファイルを表示している。
- 転送元のドライブ、ファイルを指定する。
- 転送モードには 3種類ある。
- 「A」は ASCII モード(文字型用、行末コード処理機能を利用する)
- 「B」は Binary モード(非文字型用、行末コード処理機能を利用しない)
- 「A/B」は ファイルの拡張子によって自動判定
- 漢字コードには 2種類ある。
- 「EUC」は UNIX 側の漢字コードが EUC コード
- 「JIS」は UNIX 側の漢字コードが JIS コード
- 「無」は無変換
- ファイルを選択すると、左上にある灰色だった矢印キーが
青に変わってクリック可能となる。このキーで送受信を指定する。
- 送信 : 上向き矢印、アップダウンロード、Windows から stat-system へ
- 受信 : 下向き矢印、ダウンロード、stat-system から Winodws へ
- 終了は「接続(F)」→「終了(X)」をクリックする。
- Lesson 2-3 : ファイルの転送: Windows ===> stat システム(UNIX)
- 転送元 : H:les0201.prn
- 転送先 : 各自の stat システムのディレクトリ(正確にはホームディレクトリと呼ぶ)
- 転送モードは「ASCII」を選択
- 漢字コードは「EUC」を選択
- [参考5] テキスト形式のファイル(*.prn)の場合は、
「ASCII モード」で転送したが、Excel 形式のファイル(*.xls)の場合は、
「Binary モード」で転送しないとファイルが壊れてしまう。
- [参考6] 漢字を含まないファイルの転送であれば、
WS_FTP32 と言うソフトを使うこともできるが、
FFFTP を使えるのであれば敢えて両方を知っておく必要はないと思うので、
ここでは取り扱わない。詳しく知りたい場合は、NMC セミナー用テキストの「
WS_FTP32を使ったファイルの転送
」の項を参照のこと
転送されたデータの表示 : 確認のため。簡単な UNIX コマンド
- UNIX にログイン
「スタート」→「プログラム(P)」→「stat システム」→「stat1」とクリックする。
(stat1 と 2, 3 はどれでも対等。混み具合いによって各自の判断で変更してよい)。
- 「login:」、「Password:」と表示されるので、
それぞれ個人のIDとパスワードを入力する。
なお、パスワードはセキュリティの都合上、画面には表示されない。
- UNIX の初歩のコマンド
- ファイル名一覧の表示 : ls
- ファイルの内容の表示 : cat [filename]
- ログアウト : logout
- Lesson 2-4 : 転送されたファイルの確認
転送したファイルが実際に存在し、ファイル内容も正しいことを確認せよ。
- ls
- cat les0201.prn
- logout
宿題 : 5月16日にでも実習してください <=== 私は登校しない日
今後各種データを SAS で解析できるようにしておきたいので、
以下のデータを電子化し stat システムに転送しておいて下さい。
データの形状(ケース数や変量数、データの内容)やファイル名を忘れないように
記録(メモ)を残す習慣を付けよう。
- 皆さんの体格、小遣い、携帯電話に関するデータ : 配布資料
- 連休中に収集してもらった各自の興味あるデータ(個人ごとに異なるはず)(複数がベター)
- [注意] データの電子化のためのコード化については、
Lesson 2-1 を参考にすること。
次回は、... : 4月25日 14:45
- (今週の残り)
- SAS を使ってみよう
- 簡単なデータの特性を明らかにしてみよう
- (興味あるデータの特性を明らかにしてみよう)
[おまけ、蛇足] HTML 形式のメールは避ける
受講上の注意
でも言いましたが、是非 HTML 形式のメールを私に送るのは遠慮ください。
特に Microsoft Outlook Express のユーザーは注意が必要です。
このソフトは、設定を変更せずに使うと
メールの後半に HTML 形式のメールも引っ付けて送信してしまうようです。
同じメール内容が異なった形式で 2回入っている(テキスト形式と HTML 形式)のです。
情報伝達という意味では 1回で十分ですので、後半を削るべく設定をお願いします。
以下に参考になると思われる URL リストのページを挙げておきますので、
参考にしてください。解らなければ質問してください。
講義のホームページへ戻ります