データの電子化と転送方法

コンピュータ応用 D クラス : 第3回目(05/08/97)


今回講義で実習する SAS は stat システムという計算機上で稼働しており、 このシステムにログインして利用することになる。 このシステムには、UNIX という OS が使われており、 操作には Windows 環境とは異なった操作体系を修得する必要がある。 幸い、SAS を使うことだけを取り上げた場合、UNIX の知識は必要なく、 Windows 環境からあたかも Windowsを使っているかのように (DOSと言った方がより近い) stat システムを操作・利用することができる。 ただ、SAS はデータの電子化を行う機能を持っていないので、 手元にある紙媒体のデータは、何らかの形で電子化して SAS で利用できるようにしないといけない。 このためには、UNIX 上で稼働するエディタを使うのが一つの方法であるが、 UNIX 関係の操作体系を新たに覚える必要があり、加えて、 Windows 上にはデータの電子化に都合のよいアプリケーションがあるので、 後者を使うことを勧める。
今回は、データの電子化の方法と stat システムへの転送方法(Windows ==> UNIX) を実習する。なお、stat システムにはプリンタが接続されていないので、 出力に関しても UNIX から Windows に転送する必要がある。 出力の転送に関しては、後日実習する。

  1. データの電子化
    取り扱うデータが長方形(表形式)をしているので、表計算ソフトと呼ばれるアプリケーションを利用するのが便利である。 ここでは、Microsoft Excel を例に実際に電子化の手順を説明する。 なお、Excel のより詳しい使い方については、 「PC・ネットワーク利用ガイド」を参考にしてほしい。
    1. Excel の起動
      「Microsoft オフィス」グループの中から「Microsoft Excel」アイコンを見つけ、ダブルクリックする。
    2. データの入力
      表示された枠に「表形式」と呼ばれる並び(縦:ケース、横:変量) で順にデータをキー入力していく。なお、実習では半角英数字のみを取り扱うことにする。
    3. カーソルの移動には、「Tab」キーが便利である(右方向へ移動)。 縦方向の移動には「Enter」キー。矢印キーやマウスで移動させることもできるが、 次変量の入力のための移動にこれらのキーを使うと入力スピードが遅くなるので得策ではない。
    4. 欠測値(欠損値)データには「.(ピりオド)」を入力 : データ採取は難しい!!
    5. Lesson 3-1: データの電子化 : 以下の10ケース、3変量(身長、体重、胸囲)のデータを電子化せよ
      	167	60	94
      	172	58	不明
      	156	61	90
      	162	62	100
      	166	60	88
      	167	58	不明
      	168	57	不明
      	168	62	80
      	170	58	88
      	170	60	不明
      
      入力画面
    6. 項目の右寄せ
      Excel で入力したデータをファイルに保存する際には、 各数値の間に空白を入れておけば SAS で読み込むときに都合が良いのだが、 欠損値を示す「.」は「文字型」と判断されて「左寄せ」で出力されてしまい 左隣の数値と引っ付いてしまうらしい。そこでこの現象を回避するために 全ての項目を「右寄せ」してから保存するようにしておく。
      表の左上の何も書いていないボタンをクリックすると「表全体」 が選択されて反転表示されるので、この状態で「右寄せ」ボタンを押す。
    7. データの保存
      Excel の標準形式(*.xls)で保存すると、UNIX 上では利用できないので、 テキスト形式で保存する必要がある。
      「ファイル」-「名前を付けて保存」で保存ができる。
      ドライブ名やファイル名を指定後、 「ファイルの種類」の項に対して「テキスト(スペース区切り)(*.prn)」を指定する。
      「選択した種類のファイルでは、作業中のシート以外は保存されません」等のメッセーが出るが、無視してよい。
    8. Lesson 3-2: データの保存 : 上で入力したデータを SAS で使うことを考慮してテキスト形式で保存せよ。
      この後の都合があるので、ここでは、ドライブ名に「H:」、 ファイル名に「les0302」を指定したとして説明を進める (les0302.prn)。
    9. Excel の終了

  2. データ転送(送信)
    1. セミナー用テキストのPage 6〜9を参照
      1. 転送プログラムの起動
        「stat システム」グループの中から「ftp stat-system」アイコンを見つけ、ダブルクリックする。
      2. 「User ID:」を入力後、Tabキーで「Password:」に移動し入力する。
      3. 転送元のドライブ、ファイルを指定する。
      4. 転送モードを「ASCII」に変更する。
      5. 「-->」をクリックすることにより転送できる。
      6. 終了は「Exit」をクリック。
    2. Lesson 3-3: ファイルの転送: Windows ===> stat システム(UNIX)
      • 転送元 : H:les0302.prn

      • 転送先 : 各自の stat システムのディレクトリ(正確にはホームディレクトリと呼ぶ)

      • 転送モードは「ASCII」を選択

  3. 転送されたデータの表示 : 確認のため
    1. UNIX にログイン
      「stat システム」グループの中から「stat1」アイコンを見つけ、ダブルクリックする。(stat1 と 2、3 はどれでも対等。混み具合いによって変えてよい)。
    2. 「login:」、「Password:」と表示されるので、 それぞれ個人のIDとパスワードを入力する。 なお、パスワードはセキュリティの都合上、画面には表示されない。
    3. UNIX の初歩のコマンド
      • ファイル名一覧の表示 : ls
      • ファイルの内容の表示 : cat <file-name>
      • ログアウト : logout
    4. Lesson 3-4: 転送されたファイルの確認
      転送したファイルが実際に存在し、ファイル内容も正しいことを確認せよ。
      • ls
      • cat les0302.prn
      • logout

  4. 宿題 : 5月15日にでも実習してください <=== 私は登校しない
    今後各種データを SAS で解析できるようにしておきたいので、 以下のデータを電子化し stat システムに転送しておいてほしい。 データの形状(ケース数や変量数、データの内容)やファイル名を忘れないように注意せよ。
    1. 皆さんの体格に関するデータ
    2. 皆さんの小遣いに関するデータ
    3. 連休中に収集してもらった興味あるデータ(個人ごとに異なるはず)
    4. [注意] データの電子化のためには、コード化も必要になる。 例えば、「男/女」を「M/F」、「自宅生/下宿生」を「J/G」等と置き換える。 これらは自分の好みで割り当てよ。

  5. 次回は、... : 5月22日 14:45
    • SAS を使ってみよう
    • 興味あるデータの特性を明らかにしてみよう
    [DIR]講義のホームページへ戻ります