各統計手法のproc、レポート課題、まとめ

統計モデル解析特論I/II : 第14回 (02/08/18)

 最終回の今回は、Q3 で紹介した統計手法について、SASでの実行方法を示すと共に、 その他 SAS を利用する上で参考になるサイトを紹介する。 最後にまとめとレポート課題を提示する。
  1. 重回帰分析

  2. 主成分分析

  3. 因子分析

  4. 実験計画法:

  5. クラスター分析
                                   2018年 2月 7日 水曜日 19時50分05秒  84
    MEANS プロシジャ
    
    変数       N         平均   標準偏差      最小値      最大値
    --------------------------------------------------------------------------
    shintyou   119    167.4126050      8.8080429    146.7000000    187.0000000
    taijyuu    119     59.0285714     11.1248321     35.0000000    100.0000000
    kyoui      119     86.2100840      8.3289102     46.0000000    112.0000000
    kodukai    114       56951.75       62262.36              0      350000.00
    tsuuwa      42        7996.43        4843.33    350.0000000       25000.00
    --------------------------------------------------------------------------
    
                                   2018年 2月 7日 水曜日 19時50分05秒  85
    FASTCLUS プロシジャ
    置き換え=FULL  半径=0  最大クラスター=2 最大反復数=1
    
                               初期シード
    クラスター          shintyou           taijyuu             kyoui
    ---------------------------------------------------------------------
       1                  178.0000000       100.0000000       112.0000000
       2                  168.0000000        54.0000000        56.0000000
    
          最終シードによる     7.4675
    
                             クラスターの要約
                                                     シードから
                                       RMS  オブザベーション   半径
    クラスター   度数  標準偏差     までの最大距離  超える
    ---------------------------------------------------------------------------
       1                  34        6.9338                   30.3911           
       2                  85        7.4991                   47.9149           
    
                                   2018年 2月 7日 水曜日 19時50分05秒  86
    FASTCLUS プロシジャ
    置き換え=FULL  半径=0  最大クラスター=2 最大反復数=1
    
                   クラスターの要約
     
                        最も近い       クラスター
    クラスター  クラスター    重心間の距離
    ------------------------------------------------------
       1                           2               23.1478
       2                           1               23.1478
    
                          変数に対する統計量
     
    変数         総 STD    群内 STD        R2 乗    R2 乗/(1-R2 乗)
    -----------------------------------------------------------------------
    shintyou       8.80804       7.11333      0.353318             0.546355
    taijyuu       11.12483       7.89588      0.500521             1.002085
    kyoui          8.32891       6.99023      0.301590             0.431823
    OVER-ALL       9.49937       7.34411      0.407359             0.687362
    
         擬似 F 統計    80.42
    
                                   2018年 2月 7日 水曜日 19時50分05秒  87
    FASTCLUS プロシジャ
    置き換え=FULL  半径=0  最大クラスター=2 最大反復数=1
    
                 すべての R2 乗の近似   0.35226
    
    
        3 次クラスタリン     2.390
    
    WARNING: 
    上記の2値は相関のある変数に対して適切ではありません。
    
                            クラスター平均
     
    クラスター          shintyou           taijyuu             kyoui
    ---------------------------------------------------------------------
       1                  175.6558824        71.4205882        93.4117647
       2                  164.1152941        54.0717647        83.3294118
    
                                   2018年 2月 7日 水曜日 19時50分05秒  88
    FASTCLUS プロシジャ
    置き換え=FULL  半径=0  最大クラスター=2 最大反復数=1
    
                         クラスター標準偏差
     
    クラスター          shintyou           taijyuu             kyoui
    ---------------------------------------------------------------------
       1                  5.096772073       8.602740205       6.652033852
       2                  7.763536655       7.600213214       7.118701452
    
                                   2018年 2月 7日 水曜日 19時50分05秒  89
       プロット : shintyou*taijyuu=CLUSTER
              200 +
                  |
                  |
                  |
                  |                                 1           1
                  |                            2    1 1            1
              180 +                         2  2  1   1
                  |                          222  112 1   11             1
                  |                            221  1111       2
         shintyou |                         2 22222  11 11        1
                  |                    2  222 222 2
                  |                   22 22 2  22
              160 +                    2222  22
                  |                2 222222     2
                  |            2   2 22     2
                  |                   2
                  |                22
                  |
              140 +
                  ---+------------+------------+------------+------------+--
                    20           40           60           80           100
                                            taijyuu
    NOTE: 43 obs  は表示されません。
    
                                   2018年 2月 7日 水曜日 19時50分05秒  90
        プロット : taijyuu*kyoui=CLUSTER
            100 +                                                    1
                |
                |                                            1
                |                                        1   1
                |      2
                |                                         1         1
             75 +                              1      1   1
                |                                    11  11  1
                |                              2 1 211221 1     1
        taijyuu |                              2   2 221  1  2
                |                             22  22222  2
                |             2         2   2 222 22 22
             50 +                       2   2   22 2 2
                |                           2  222 22
                |                              2   2
                |
                |                            2
                |
             25 +
                ---+-------------+-------------+-------------+-------------+--
                  40            60            80            100           120
                                             kyoui
    NOTE: 54 obs  は表示されません。
    

  6. ファイルへの書き出し
     第1節の重回帰分析(outreg)や第2節の主成分分析(outprin)、 また前節のクラスター分析(outclust)では、 前のproc で生成したデータを後ろのproc に引き継いで利用しているが、 SAS 以外のプログラムで計算結果を利用する場合は、 データをファイルに書き出す必要がある。

    data _null_;                              : ファイルに書き出す
      set outclust;                           : 書き出すデータセットを指定
      file 'Kougi/les1403_out.txt';           : ファイル名を指定
      put shintyou taijyuu kyoui cluster;     : 書き出す変量を指定
    run;
    

  7. 基礎統計量

  8. 全体を通してのデータ分析の手順
     データを分析する際の、全体的な流れについて紹介しておく。

    1. 取り組む問題の理解
    2. データ採取計画の立案
    3. データ収集
      • 試しに採ってみる
      • 正式に大規模に採取
    4. データクリーニング
    5. 基礎統計量
    6. 各種分析
    7. 考察
    8. 報告

  9. お役立ちサイト

  10. 課題提出(レポート)
     Q4を通して学んできた SAS を使って、 自分が興味を持ったデータを分析して、興味深い知見を得る体験をしてもらう。 以下の事項について、レポートを作成し、電子メールで提出下さい。

  11. 講義を終えるにあたって
     この講義を通して、「データとの接し方」や「統計の考え方」が 多少なりとも理解できたであろうか? 大量の数値群からその中に内在する構造を見つけることが 「解析」であり「統計の面白味」でもあると思う。 そのためには、理論や目的を知っている必要があるのは勿論だが、 対象とするデータの背景を知っておくことや、 統計ソフトを"道具"として使いこなす必要もあろう。
     統計手法については、数式よりもその手法の考え方や利用目的に重点をおいて 説明したつもりである。
     今後、各自の実験や修論をまとめる際は勿論のこと、 日頃目にする新聞や雑誌と言った生活等のいろいろな場面で、 種々のデータに出会うことになると思うが、 提示された数値にはどの様な意味(と意図)があり、 どう理解して、個々人としてどうアクションを起すかの、 一つの判断手段として活用してもらえれば幸いである。
     今後、もし統計に関して何か疑問に出会い、 私に連絡・相談してみたいと思った時は、上記アドレスを使ってください。

     皆さんのご期待にどこまで応えられか心許無い部分もありますが、 14回の講義、お疲れ様でした。

[DIR]講義のホームページへ戻ります