講義をはじめるにあたって

コンピュータによる統計解析 01 クラス : 第1回(04/17/03)

 講義概要等について述べた後、 SAS を使う動機付けと、SAS を使うために必要な事項について紹介する。
  1. 講義概要や受講時の注意 : 別ページ

  2. 表計算ソフトウェア(Excel 等)から統計解析ソフトへ : 作業手順から眺める
    アンケートの集計 : 目の前に紙の山 ===> さあどうする?
    1. まず電子化
      • 入力作業
      • 場合によってはコード化

    2. スクリーニング
      • 入力ミスの修正
      • 地味だが非常に重要な作業、重労働 <=== チェック方法

    3. 基礎集計 by Excel(表計算ソフト)
      • 組み込み関数を使って : average, min, max, median, ...
        計算 図示、...

    4. 表計算ソフトの限界 <=== Excel で統計処理を全てこなせるか?
      • 大量データになったら?
      • 複雑な統計手法になったら? 多変量解析...
      • 欠損値の取り扱い
      • 統計向けソフトウエアの利用が一般的 : データ解析
        • BMDP : BioMedical Data Programs(?)
        • SPSS : Statistical Package for Social Science
        • SAS : Statistical Analysis System
        • S, S-PLUS : Statistical
        • LISP-STAT : Lisp で実現、フリーソフト
        • Statistica
        • ...
      • [参考] SAS での解析例

  3. [わき道] アンケートの設計
    1. 調査の目的を明確に
    2. 集計方法や予想される回答を予想して設計すべき
    3. 質問項目や選択肢の吟味、予備調査
    4. 解析方法も事前に想定しておく
    5. 設計の善し悪しによって得られる結果の質も変わる

  4. MNC のシステム概要
    講義で実習する SAS は stat システムという計算機上で稼働しており、 このシステムにログインして利用することになる。 このシステムには、UNIX という OS が使われており、 Windows 環境とは異なった操作体系を修得する必要がある。
    しかし幸い、SAS を使うことだけに注目した場合、UNIX の知識はほとんど必要なく、 Windows 環境からあたかも Windowsを使っているかのように (DOSと言った方がより近い) stat システムを操作・利用することができる。
    つまり、前項で作成したデータを SAS で解析するには、 stat システムに持って行く(送信という)必要がある。 また、stat システムにはプリンタが接続されていないので、 出力に関してもstat システムから Windows に転送する必要がある。

    これらをまとめると、以下のようになる。

    [参考] MNC セミナー用テキスト : 統計システム入門 (UNIX で使うSAS) :

    URL は http://www.mnc.waseda.ac.jp/ssguide/semisas5/index.html

  5. 来週 : 4月24日 演習
    • データを探す : 来週に限らず今後とも
      • 自分の興味のあるデータを見つけてくる
      • 新聞、雑誌、書籍、Web、調査、測定、実験、…
      • ( 将来的には電子化する : Excel で )
    • 電子化の演習 : サンプルデータを Excel に入力 : 入力画面
      • 提供したデータ : 小泉内閣の資産公開資料 (2001年5月29日発表)
      • 英字や数字は半角文字で入力すること
      • FDやMOに保存 : ファイル名は自由に付けて良いが、半角英数字で付けておく

  6. 次回は、... : 5月01日 14:50 (遅刻は認めない)
    • SAS を使ってみよう
    • 簡単なデータの特性を明らかにしてみよう
    • (データ入力(電子化)について、stat システムへの接続方法、転送方法、...)

  7. [おまけ、蛇足] HTML 形式のメールは避ける
    受講上の注意 でも言いましたが、是非 HTML 形式のメールを私に送るのは遠慮ください。 特に Microsoft Outlook Express のユーザーは注意が必要です。 このソフトは、設定を変更せずに使うと メールの後半に HTML 形式のメールも引っ付けて送信してしまうようです。
    同じメール内容が異なった形式で 2回入っている(テキスト形式と HTML 形式)のです。 情報伝達という意味では 1回で十分ですので、後半を削るべく設定をお願いします。
    以下に参考になると思われる URL リストのページを挙げておきますので、 参考にしてください。解らなければ質問してください。
[DIR]講義のホームページへ戻ります