SAS を使ってみよう

統計解析 03 クラス : 第02回 (10/09/03)

 メーリングリストを開設したことを電子メールアドレス登録者に送付した。 同じ文は「 連絡事項のページ (10/03/03)」にも掲載しておいたが、各々のアドレスに届いたであろうか?
 今週は、何はともあれ SAS を使ってみよう。 特に知っておくべきコマンドを中心に使い方を解説する。
  1. アンケートの回答

  2. SAS を使うには? 終るには? : stat システムにログインする。2段階になっている。
    1. SAS は stat システム上に存在
      「スタート」→「プログラム(P)」→「stat システム」→「stat1」とクリックする。
      (stat1 と 2, 3 はどれでも対等。混み具合いによって選択してよい。 ただ、講義中は一つのマシンに集中する可能性があるので、座席位置で指定する)。
      [重要な注意] stat システム内ではマウスは使えない。 以後の入力はキーボードからのみ行う。 また、画面サイズも変更しないこと。
    2. 「login:」、「Password:」と表示されるので、 それぞれ stat システム用の IDとパスワードを入力する。 なお、パスワードはセキュリティの都合上、画面には表示されない (盗み見られることを防止するため)。 パスワードの変更方法については、第8節を参照のこと。

    1. stat システムを終了するには「logout」と入力してリターンキーを押す。

  3. SAS を操作してみよう : Lesson 2-1 :
    1. まずは stat システムにログインする。 : 第2節参照

    2. 「vtsas」と入力してリターンキーを押す。
      [注意]来週以降、この状態から講義をスタートする。 今後 stat システムのログイン方法等はいちいち説明しないので、習得しておくこと。

    3. 領域が三種類ある : Program Editor, Output, Log : 役割はおいおい説明する。
      各ウインドウを行き来しよう。コマンド行に以下のコマンドを入力する。
      • Program Editor エリアへ移動 : PGM
      • Log エリアへ移動 : LOG
      • Output エリアへ移動 : OUTput

    4. 何はともあれプログラムを入力してみよう : les0201.sas
      • Program Editor エリアに入力していく : PGM
        [注意] リスト中、コロン(:)以降は解説用なので入力しないように。
      • 当該領域を大きくしたい : ZOOM
      • テンキーは使えない。数字はキーボード上部の数値キーで入力。
      • 講義内では日本語入力は取り扱わない。入力は全て半角英数字のみ。
      • ブランクはいくつあっても一つと見なされる。読み易さのために段下げを
      • カーソルの移動には「←」「→」「↑」「↓」キーを利用。
      • プログラムはセミコロン(;)で終わる。
      • コロン(:)とセミコロン(;)を間違えないように。
     /* Lesson 2-1 */                             : コメント、実行に無関係
     /*    File Name = les0201.sas  10/09/03   */ : 後々の記録のためのメモ
                                                  : 見易さのための空行
    data kenshin;                                 : データ名の定義
      input name $ height weight;                 : 読み込む変量名、型($は文字型を示す)
    cards;                                        : データの始まりを示す
      Hoshino     180  80                         : Case 1
      Yamada      176  76                         :      2
      Wakamatsu   168  76                         :      3
      Hara        181  86                         :      4
      Yamamoto    183  92                         :      5
      Yamashita   175  90                         :      6
    ;                                             : データの終りを示す
    proc print data=kenshin;                      : 読み込んだデータの表示
    run;                                          : 上記の実行
    proc means data=kenshin;                      : 平均値等の算出
    run;                                          : 上記の実行
    
    1. 実行してみよう
      Program Editor エリアの「コマンド =>」の右にカーソルを移動させて「SUBmit」。大文字部分だけで機能する。

    2. 特に知っておくべきコマンド :
      • 実行 : SUBmit : プログラムの実行
      • 前進 : FORWard : 複数画面にまたがっている場合
      • 後退 : BACKward : 複数画面にまたがっている場合

    3. 出力、計算結果 : Outputエリア : les0201.lst
                                    SAS システム                             1
                                              14:42 Wednesday, October 8, 2003
      
                        OBS    NAME        HEIGHT    WEIGHT
      
                         1     Hoshino       180       80  
                         2     Yamada        176       76  
                         3     Wakamats      168       76  
                         4     Hara          181       86  
                         5     Yamamoto      183       92  
                         6     Yamashit      175       90  
      
                                    SAS システム                             2
                                              14:42 Wednesday, October 8, 2003
      
        Variable  N          Mean       Std Dev       Minimum       Maximum
        -------------------------------------------------------------------
        HEIGHT    6   177.1666667     5.4191020   168.0000000   183.0000000
        WEIGHT    6    83.3333333     7.0047603    76.0000000    92.0000000
        -------------------------------------------------------------------
      

    4. 計算結果の説明
      1. 読み込んだデータの表示 : proc print
        • 縦方向にケース、横方向に変量
        • 左端にケース番号(Observation)
        • 入力が期待通りかを確認 : 数値のずれ、異常値、...
      2. 平均値等の算出 : proc means
        • 各変量ごとのサンプル数、平均、標準偏差、最小値、最大値
        • 小サンプル時の注意
      3. 「有効桁数」に注意せよ : どこまでが「意味ある桁」か?
        「計算できる」と「信頼できる」は別。 統計ソフトは単なる道具。使いこなすのは各自。
        [蛇足的例1] 日本の観測史上の 最高気温は、1933(昭和8)年7月25日に山形市で観測された40.8度であり、 最低気温は、1902(明治35)年1月25日に北海道旭川市の-41度であった。
        [蛇足的例2] 2001年のイチロー選手の打率は3割5分であった。

    5. 期待通りの出力が得られなかったら... : Log エリア : les0201.log
      • プログラムのミスが一番に考えられる: スペルやスペースの場所等
      • マウスを使ってスクロールさせようとはしないこと
      • データはきちんと読み込まれているか?
      • エラーメッセージは Log エリアに表示される。 各行ごとにメッセージが表示されるので、エラー個所が特定し易い。
      • エラーを除去する作業 : Debug と言う
      • Debug も経験で要領よく作業ができるようになる : Log エリアの見方

    6. 一旦実行したプログラムの呼び戻し :
      • 実行したら Program Editor エリアから消えたように見える : そう言うものと理解しよう
      • RECall : プログラムの呼び戻し : Program Editor エリアで

  4. プログラムを有効活用しよう
    1. 保存 : 自分のホームディレクトリに判りやすいファイル名で保存。
      • Program Editor エリアのコマンド行で : FILE 'filename.sas'
      • Output エリアのコマンド行で : FILE 'filename.lst'
      • Log エリアのコマンド行で : FILE 'filename.log'
    2. 読み込み : 自分のホームディレクトリから
      • Program Editor エリアのコマンド行で : INC 'filename.sas'
    3. Lesson 2-2 : プログラムを保存しておこう。 Program Editor エリアのコマンド行で。
      [例] file 'les0201.sas'

  5. 知っておくと便利なコマンド一覧

  6. [補足] UNIX の初歩のコマンド : 詳しくは書籍等を参考に

  7. 次回は... : 10月16日 14:45

  8. [おまけ] スペースが余っているようなので、思いつくままに埋めておく。
    1. stat システムのパスワード変更方法 : 割り当てられたパスワードは覚えにくい
      [参照] パスワードを変更する : WASEDA UNIVERSITY statシステム
      • stat システムにログインし、passwd コマンドを使う。
      • 新しいパスワードは短すぎたり、破られ易いものは受け付けられない。
      • 新しいパスワードを二回入力するのは、タイプミスがなかったか確認するため。
      • いずれの入力時にも、入力文字は画面に表示されないので注意すること (盗み見られることを防止するため)。

    2. 学外から stat システムへのアクセスについて : telnet stat1.comp.waseda.ac.jp
      [参照] 自宅からstatシステムへ接続する : WASEDA UNIVERSITY statシステム
      • stat システムも学外からアクセスできる。しかし、 個々人で環境が異なるため具体的な方法については講義の中では取り扱わない。 必要な者は「PC・ネットワーク利用ガイド」を参照せよ。「2002年度版」であれば、 「第3部 個人所有 PC からの早稲田大学ネットワークの利用」に掲載されている。
      • Windows OS として WinMe や Win2000 や XP に付属の telnet コマンドは漢字コードの変更設定ができないようで、 文字化けを起し満足に使えないようである。
      • ターミナルエミュレーターソフトとして、パワフルでかつフリーのソフトに「 Tera Term 」と言うものがある。これは MNC コンピュータ教室にもインストールされており、 講義で使っているのも、実はこれである。
      • Tera Term 」を各自の Win パソコンにインストールして使うことをお勧めする。 設定としては、「漢字(受信)を JIS に」、「漢字(送信)を JIS に」、 「端末 ID を VT100」にしておくとよさそうである。
      • Mac 系については、全く未知なので不明。UNIX 系はそのまま使えるはず。
[DIR]講義のホームページへ戻ります