講義をはじめるにあたって
コンピュータによる統計解析 03 クラス : 第01回 (10/02/03)
初回である今回は、この半期間の講義概要や緒注意について述べた後、
SAS を使う動機付けと、SAS を使うために必要な事項について紹介する。
- 講義概要や受講時の注意 :
別ページ (PDF ファイル)
_
- 表計算ソフトウェア(Excel 等)から統計解析ソフトへ : 作業手順から眺める
アンケートの集計 : 目の前に紙の山 ===> さあどうする?
- まず電子化
- スクリーニング
- 入力ミスの修正
- 地味だが非常に重要な作業、重労働 <=== チェック方法
- 基礎集計 by Excel(表計算ソフト)
- 組み込み関数を使って : average, min, max, median, ...
計算、
図示、...
- 表計算ソフトの限界 <=== Excel で統計処理を全てこなせるか?
- 大量データになったら?
- 複雑な統計手法になったら? 多変量解析...
- 欠損値の取り扱い
- 統計向けソフトウエアの利用が一般的 : データ解析
- BMDP : BioMedical Data Programs(?)
- SPSS : Statistical Package for Social Science
- SAS : Statistical Analysis System
- S, S-PLUS : Statistical
- LISP-STAT : Lisp で実現、フリーソフト
- Statistica
- ...
- [参考] SAS での解析例
- [わき道] アンケートの設計
- 調査の目的を明確に
- 集計方法や予想される回答を予想して設計すべき
- 質問項目や選択肢の吟味、予備調査
- 解析方法も事前に想定しておく
- 設計の善し悪しによって得られる結果の質も変わる
- MNC のシステム概要
講義で実習する SAS は stat システムという計算機上で稼働しており、
このシステムにログインして利用することになる。
このシステムには、UNIX という OS が使われており、
Windows 環境とは異なった操作体系を修得する必要がある。
しかし幸い、SAS を使うことだけに注目した場合、UNIX の知識はほとんど必要なく、
Windows 環境からあたかも Windowsを使っているかのように
(DOSと言った方がより近い) stat システムを操作・利用することができる。
つまり、前項で作成したデータを SAS で解析するには、
stat システムに持って行く(送信という)必要がある。
また、stat システムにはプリンタが接続されていないので、
出力に関してもstat システムから Windows に転送する必要がある。
これらをまとめると、以下のようになる。
- SAS は stat システム上にある
- データはパソコンで入力/加工する方が便利であろう : Excel 等を使う
- Excel を使った場合、「テキストファイル(スペース区切り)で保存」すること
- データを Windows側で作成した場合、stat システムに転送する必要がある
- 解析結果は Windows側に転送して加工、印刷する
- 次回は、... : 10月09日 14:50 (遅刻は認めない)
- SAS を使ってみよう
- 簡単なデータの特性を明らかにしてみよう
- (データ入力(電子化)について、stat システムへの接続方法、転送方法、...)
- 講義期間中を通しての宿題 : データを探す
- [おまけ] HTML 形式のメールは避ける
受講上の注意
でも言いましたが、是非 HTML 形式のメールを私に送るのは遠慮ください。
特に Microsoft Outlook Express のユーザーは注意が必要です。
このソフトは、設定を変更せずに使うと
メールの後半に HTML 形式のメールも引っ付けて送信してしまうようです。
同じメール内容が異なった形式で 2回入っている(テキスト形式と HTML 形式)のです。
情報伝達という意味では 1回で十分ですので、後半を削るべく設定をお願いします。
以下に参考になると思われる URL リストのページを挙げておきますので、
参考にしてください。解らなければ質問してください。
講義のホームページへ戻ります