SAS OnDemand for Academics を使ってみよう

統計モデル解析特論I/II : 第09回 (12/14/17)

 今回から統計ソフトSAS を使って統計の面白みを実感してもらおうと思う。 今回は手始めに SAS の利用環境を整える。
  1. Excel じゃダメなの? : 表計算ソフトウェア(Excel 等)から統計解析ソフトへ : 作業手順から眺める
    アンケートの集計 : 目の前に紙の山 ===> さあどうする?
    1. まず電子化
      • 入力作業
      • 場合によってはコード化

    2. スクリーニング
      • 入力ミスの修正
      • 地味だが非常に重要な作業、重労働 <=== チェック方法

    3. 基礎集計 by Excel(表計算ソフト)
      • 組み込み関数を使って : average, min, max, median, ...
        計算 図示、...

    4. 表計算ソフトの限界 <=== Excel で統計処理を全てこなせるか?
      • 大量データになったら?
      • 複雑な統計手法になったら? 多変量解析...
      • 欠損値の取り扱い
      • 統計向けソフトウエアの利用が一般的 : データ解析
        • BMDP : BioMedical Data Programs(?)
        • SPSS : Statistical Package for Social Science
        • SAS : Statistical Analysis System
        • S, S-PLUS, R : Statistical
        • LISP-STAT : Lisp で実現、フリーソフト
        • Statistica
        • STAT
        • ...
      • [参考] SAS での解析例

  2. SASとは

  3. 無料で使える2つのSAS
    SAS社の説明: SAS Analytics U へようこそ

    1. SAS University Edition (別名 SAS 9.4 とか 製品版SAS と呼ぶらしい)
      • 「費用はゼロ。成果は無限大。」
      • 各自のPCにインストール(VirtualBox上で稼働): OSを選ばない
      • 自身のCPUスピードに依存
      • 自分のストレージを利用
      • インストール方法: クイックスタート・ガイド (リンク)

    2. SAS OnDemand for Academics (別名 SAS Studio とも呼ぶらしい)
      • 「無償で利用できるクラウド方式のSAS ソフトウェア」
      • SAS社の計算サーバー上で計算(アジアの場合はシンガポールにあるらしい)
      • 各自のPCはブラウザとして機能
      • トラフィック(インターネット回線)スピードに依存。オンラインである必要あり
      • 自身のPCへのインストール不要
      • 秘密のデータは扱いにくい (サーバーに転送する必要があるため)

      • お勧めの関連資料 : SAS社の説明

     当初、この講義では前者を扱う予定にしていたが、先日になって後者の存在を知り、 個々のマシンへのインストールが不要なこと、受講者のPC的負担が少ないこと、 コースウェアが使えるらしい(確認中)こと等の観点から、後者を使うことにする。

  4. 導入: SAS 社の提供している導入手順スライドに基づいて説明

  5. 早速試してみよう
    「SAS(r) OnDemand for Academics」にSASプログラムを入力して実行してみる

    1. SASプログラムの入力
       右側の画面中で「右クリック」すると「New SAS Program(F4)」と表示されるので クリック。もしくは「F4」を押す。表示されたエリアにSASプログラムを入力する。 既に電子化されている場合は、プログラムをコピー&ペーストしても良い。

    2. 実行してみる
       画面左上の「駆け足(恐らくRunをイメージ)」アイコンをクリックする。

    3. 実行の様子が「LOG」タグに、計算結果が「RESULTS」タグに、 各変数の値が「OUTPUT DATA」タグに表示される。

    4. 各種情報を保存するために新しくディレクトリを作成する。
       画面左側の「Files(Home)」で右クリック。「New」-「Folder」を順にクリック。 新しいディレクトリ名を入力する。ここでは「Kougi」としてみる。
      [例] Kougi

    5. プログラム(CODE)を保存する。
       「CODE」を選択してSAS プログラムが表示されているところで、 画面左上の「フロッピーディスク」アイコンをクリックして Kougi ディレクトリの下にSAS プログラムを保存する。 適宜ファイル名を付ける。
      [例] les0101.sas
       なお、アイコン上にマウスを移動させると「Save program」のポップアップが表示される。 その右隣のアイコン(鉛筆マークが付加)は「Save As」である。

    6. 他にRESULTS やLOG をファイルに保存したい場合は、 それぞれのタブ上で前項と同様の作業をすれば良い。
      [例] les0101_Results.sas
      [例] les0101_Log.sas

    7. 印刷したければ、プリンタのアイコン(Print のポップアップ)をクリック すれば良い。

  6. サンプル

  7. 参考書の紹介
    1. ダレル・ハフ著(高木秀玄訳)、統計でウソをつく法、講談社ブルーバックス、ISBN4-06-117720-6、924円
    2. David Salsburg著(竹内・熊谷訳)、統計学を拓いた異才たち、 日本経済新聞社、ISBN4-532-35194-4、2200円+税。

    3. 市川 伸一他著、SAS によるデータ解析入門[第2版]、東大出版会、ISBN4-13-064048-8、3570円
    4. 高橋 行雄他著、SAS による実験データ解析入門、東大出版会、ISBN4-13-064044-5、4410円
    5. Geoff Der 他, A Handbook of Statistical Analyses Using SAS, Chapman & Hall/CRC, ISBN158488245X, 6456円

    6. 永田 靖・棟近 雅彦著、多変量解析法入門、サイエンス社、ISBN4-7810-0980-9、2310円

    7. 前川 眞一著、SAS による多変量データの解析、東大出版会、ISBN4-13-064043-7、4830円
    8. 豊田 秀樹著、SAS による共分散構造分析、東大出版会、ISBN4-13-064042-9、3990円
    9. 豊田 秀樹他著、原因をさぐる統計学、講談社ブルーバックス、 ISBN4-06-132926-X、945円

  8. 次回は、... : 12月21日(年内最後)
[DIR]講義のホームページへ戻ります