講義をはじめるにあたって

コンピュータによる統計解析 03 クラス : 第01回 (10/02/03)

 初回である今回は、この半期間の講義概要や緒注意について述べた後、 SAS を使う動機付けと、SAS を使うために必要な事項について紹介する。
  1. 講義概要や受講時の注意 : 別ページ (PDF ファイル) _

  2. 表計算ソフトウェア(Excel 等)から統計解析ソフトへ : 作業手順から眺める
    アンケートの集計 : 目の前に紙の山 ===> さあどうする?
    1. まず電子化
      • 入力作業
      • 場合によってはコード化

    2. スクリーニング
      • 入力ミスの修正
      • 地味だが非常に重要な作業、重労働 <=== チェック方法

    3. 基礎集計 by Excel(表計算ソフト)
      • 組み込み関数を使って : average, min, max, median, ...
        計算 図示、...

    4. 表計算ソフトの限界 <=== Excel で統計処理を全てこなせるか?
      • 大量データになったら?
      • 複雑な統計手法になったら? 多変量解析...
      • 欠損値の取り扱い
      • 統計向けソフトウエアの利用が一般的 : データ解析
        • BMDP : BioMedical Data Programs(?)
        • SPSS : Statistical Package for Social Science
        • SAS : Statistical Analysis System
        • S, S-PLUS : Statistical
        • LISP-STAT : Lisp で実現、フリーソフト
        • Statistica
        • ...
      • [参考] SAS での解析例

  3. [わき道] アンケートの設計
    1. 調査の目的を明確に
    2. 集計方法や予想される回答を予想して設計すべき
    3. 質問項目や選択肢の吟味、予備調査
    4. 解析方法も事前に想定しておく
    5. 設計の善し悪しによって得られる結果の質も変わる

  4. MNC のシステム概要
    講義で実習する SAS は stat システムという計算機上で稼働しており、 このシステムにログインして利用することになる。 このシステムには、UNIX という OS が使われており、 Windows 環境とは異なった操作体系を修得する必要がある。
    しかし幸い、SAS を使うことだけに注目した場合、UNIX の知識はほとんど必要なく、 Windows 環境からあたかも Windowsを使っているかのように (DOSと言った方がより近い) stat システムを操作・利用することができる。
    つまり、前項で作成したデータを SAS で解析するには、 stat システムに持って行く(送信という)必要がある。 また、stat システムにはプリンタが接続されていないので、 出力に関してもstat システムから Windows に転送する必要がある。

    これらをまとめると、以下のようになる。

  5. 次回は、... : 10月09日 14:50 (遅刻は認めない)

  6. 講義期間中を通しての宿題 : データを探す

  7. [おまけ] HTML 形式のメールは避ける
    受講上の注意 でも言いましたが、是非 HTML 形式のメールを私に送るのは遠慮ください。 特に Microsoft Outlook Express のユーザーは注意が必要です。 このソフトは、設定を変更せずに使うと メールの後半に HTML 形式のメールも引っ付けて送信してしまうようです。
    同じメール内容が異なった形式で 2回入っている(テキスト形式と HTML 形式)のです。 情報伝達という意味では 1回で十分ですので、後半を削るべく設定をお願いします。
    以下に参考になると思われる URL リストのページを挙げておきますので、 参考にしてください。解らなければ質問してください。
[DIR]講義のホームページへ戻ります