因子分析とアンケート調査の手順

統計モデル解析特論I/II : 第07回 (11/19/19)

 いくつか(p個)の変量の値を情報の損失をできるだけ少なくして、 少数変量(m個、m<p)の総合的指標(主成分)で代表させる方法として 主成分分析(Principal Component Analysis, PCA)と 因子分析(Factor Analysis, FA)がある。 いくつかのテストの成績を総合した総合的成績、 いろいろな症状を総合した総合的な重症度、 種々の財務指標に基づく企業の評価 等を求めたいといった場合に用いられる。 p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、 次元を減少させる(reduce)方法と言うこともでき、 多変量データを要約する有力な方法である。
 両者は似た目的に使われるが、元になっている考え方は異なるので 利用する場面では注意が必要である。 前回は主成分分析を取り上げたが、今回は因子分析を取り上げる。 残りの時間でアンケート調査の手順について紹介する。

 ● 目次: 主成分分析と因子分析 : 次元の縮約手法
   1.  2変量の場合の主成分分析 : 理解を助けるため [第06回へ]
   2.  3変量以上の主成分分析 [第06回へ]
   3.  相関行列を使う理由 [第06回へ]
   4.  主成分の数の決定基準 : 配布資料 80ページ [第06回へ]
   5.  [例題1] 食品の嗜好性を探ってみよう [第06回へ]
   6.  同じデータを両手法に適用して、その共通性と違いを体験してみよう [第06回へ]
   7.  【参考】読み物 [第06回へ]
   8.  因子分析: モデルの説明
   9.  [例題1] 食品の嗜好性を探ってみよう
   10.  [例題2] 趣味の特性を探ってみよう
   11.  因子数の決定基準
   12.  主成分分析(PCA)と因子分析(FA): 目的は同じでも異なる手法

   13.  アンケート調査の手順と解析例


  1. 因子分析: モデルの説明
     前述の主成分分析の場合は、 データの散らばり方(分散)を捉えてデータ特性を把握する手法であった。 一方、因子分析は、変数間に(潜在的な)構造を持ち込んで関係を探る手法である (少し理解しにくいかもしれないが)。 この手法は心理学の分野で広く利用されている。
    1. 定式化 : 配布資料 180ページ〜
      • Z=F*A+e
      • 測定対象 zji : 成績、測定値、...。
      • 共通因子 : fi : 因子得点(測定不能)、個体の特徴付け、i=1,2,...,n.
      • 因子負荷量 : aj : 因子の特徴付け、j=1,2,...,p.
      • 独自因子 : eji : 変動
      • いくつかの仮定 : fi、aj、eji

    2. 因子の解釈
    3. 因子軸の回転 : 直交回転、斜交回転

    4. 因子数を決めるために行きつ戻りつの試行錯誤が必要になる

  2. [例題1] 食品の嗜好性を探ってみよう : 196ページ〜、データは第06回配付の90ページ〜
    100種類の食品の性、年齢毎の嗜好度調査の結果 : データ : food.dat

    1. まずは因子数を決めよう : プログラム : les0701.sas

       /* Lesson 07-1 */
       /*    File Name = les0701.sas   11/19/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0701_log.txt'
                   print = 'Kougi19/les0701_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data food;                  
        infile 'Kougi/food.dat';          : ファイルの読み込み
        input X01-X10;                    : 変量リスト、連続的に
          label X01='M(-15)'              : 各変量に解りやすい名前を付ける
                X02='M(16-20)'            :   M : 男性
                X03='M(21-30)'            :   F : 女性
                X04='M(31-40)'            :  ()内 : 年齢
                X05='M(41-)'              :
                X06='F(-15)'              :
                X07='F(16-20)'            :
                X08='F(21-30)'            :
                X09='F(31-40)'            :
                X10='F(41-)';             :
                                          :
      proc print data=food(obs=10);       : データの表示
      run;                                :
      proc factor data=food;              : オプションを付けないと主成分分析
        var X01-X10;                      : 解析に使う変量リスト
      run;                                :
      
    2. 出力結果 : les0701_Results.txt , les0701-output.pdf
                                     2019年11月13日 水曜日 12時54分57秒   7
      
      Obs    X01    X02    X03    X04    X05    X06    X07    X08    X09    X10
      
        1   7.69   7.31   7.47   7.76   7.87   7.51   7.24   7.70   7.91   7.95
        2   6.59   5.56   6.21   6.04   5.81   6.64   6.11   6.53   6.44   6.64
        3   4.55   4.18   4.36   4.25   4.53   4.60   3.66   4.04   3.68   4.43
        4   6.78   6.11   6.30   5.98   5.56   6.37   6.29   5.43   5.32   5.28
        5   6.47   6.24   6.02   5.42   5.88   6.00   5.60   4.60   5.40   5.95
        6   6.96   6.81   6.91   6.48   6.23   7.09   7.27   7.13   6.86   7.36
        7   6.57   5.70   5.89   5.16   5.30   6.07   5.56   4.50   4.92   5.33
        8   7.32   6.95   6.02   4.98   4.88   6.82   6.40   5.53   5.61   5.33
        9   6.51   6.15   5.51   4.68   4.16   5.17   4.81   4.70   4.86   3.82
       10   6.86   6.05   5.85   6.14   6.75   6.71   5.39   5.42   6.03   6.59
      
                                     2019年11月13日 水曜日 12時54分57秒   8
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
                                     2019年11月13日 水曜日 12時54分57秒   9
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 10  平均 = 1
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      2 因子が MINEIGEN 基準により示されます。
      
                                     2019年11月13日 水曜日 12時54分57秒  10
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                     因子パターン
                                Factor1         Factor2
      X01      M(-15)           0.74741        -0.59244
      X02      M(16-20)         0.86579        -0.31836
      X03      M(21-30)         0.84491         0.22079
      X04      M(31-40)         0.78216         0.47602
      X05      M(41-)           0.68129         0.67325
      X06      F(-15)           0.80647        -0.54140
      X07      F(16-20)         0.89959        -0.33542
      X08      F(21-30)         0.90901        -0.04289
      X09      F(31-40)         0.90316         0.21817
      X10      F(41-)           0.79262         0.35477
      
            因子の分散
         Factor1         Factor2
       6.8279551       1.7618731
      
                                     2019年11月13日 水曜日 12時54分57秒  11
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                 最終的な共通性の推定値 : 合計 = 8.589828
       
             X01             X02             X03             X04             X05
      0.90961791      0.85094991      0.76262367      0.83837129      0.91741340
      
             X06             X07             X08             X09             X10
      0.94352040      0.92177476      0.82814690      0.86329813      0.75411185
      
    3. 解釈方法 :
      • 固有値(Eigenvalue) : 相関行列を用いた主成分分析の計算結果
        • 相関行列を用いた主成分が計算される (因子数を決めるため)
        • [コメント] 理解を難しくしている一つの理由かもしれない
      • システム側からは因子数は2だと判断された : 固有値が1より大きい
      • 因子負荷量(Factor Pattern) : aj
      • 因子毎の分散(Variance explained by each factor) : 総分散(10, 変量数と等しくなる)のどれだけを説明しているか。因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。

      • 因子数の決定 : 解析者側の判断
        • 固有値の変化量からすると、3 でも良さそう : 3 と 4 の間が空いてる
        • 因子数を 3 として計算してみよう

        • 因子数の決め方は、主成分分析の時と同様の考え方
          • 累積寄与率(Cumulative)
          • 固有値の値(Eigenvalue, Proportion)
          • 固有値間のギャップ(Difference) 等

    4. 因子数3で解析 : プログラム : les0702.sas

       /* Lesson 07-2 */
       /*    File Name = les0702.sas   11/19/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0702_log.txt'
                   print = 'Kougi19/les0702_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data food;                  
        infile 'Kougi19/food.dat';
        input X01-X10;            
          label X01='M(-15)'      
                X02='M(16-20)'    
                X03='M(21-30)'    
                X04='M(31-40)'    
                X05='M(41-)'      
                X06='F(-15)'      
                X07='F(16-20)'    
                X08='F(21-30)'    
                X09='F(31-40)'    
                X10='F(41-)';     
                                  
      proc print data=food(obs=10);
      run;                                          :
      proc factor data=food nfactor=3 out=fscore;   : 因子数3、出力の保存
        var X01-X10;                                :
      run;                                          :
      
      proc plot data=fscore;                        :
        plot factor1*factor2/vref=0.0 href=0.0;     : 第1因子 x 第2因子、軸
        plot factor2*factor3/vref=0.0 href=0.0;     : 第2因子 x 第3因子、軸
      run;                                          :
      
    5. 出力結果 : les0702_Results.txt , les0702-output.pdf
                                     2019年11月13日 水曜日 12時57分55秒  29
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
                                     2019年11月13日 水曜日 12時57分55秒  30
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 10  平均 = 1
       
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      3 因子が NFACTOR 基準により示されます。
      
                                     2019年11月13日 水曜日 12時57分55秒  31
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                             因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.74741        -0.59244         0.16808
      X02      M(16-20)         0.86579        -0.31836         0.29190
      X03      M(21-30)         0.84491         0.22079         0.38417
      X04      M(31-40)         0.78216         0.47602         0.32604
      X05      M(41-)           0.68129         0.67325         0.11067
      X06      F(-15)           0.80647        -0.54140        -0.07270
      X07      F(16-20)         0.89959        -0.33542        -0.14888
      X08      F(21-30)         0.90901        -0.04289        -0.25110
      X09      F(31-40)         0.90316         0.21817        -0.27989
      X10      F(41-)           0.79262         0.35477        -0.45389
      
                    因子の分散
         Factor1         Factor2         Factor3
       6.8279551       1.7618731       0.7544512
      
                                     2019年11月13日 水曜日 12時57分55秒  32
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                 最終的な共通性の推定値 : 合計 = 9.344279
      
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
                                     2019年11月13日 水曜日 12時57分55秒  33
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
       1.0000000       1.0000000       1.0000000
      
                                     2019年11月13日 水曜日 12時57分56秒  34
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                          標準化スコア係数
       
                                Factor1         Factor2         Factor3
      
      X01      M(-15)           0.10946        -0.33626         0.22279
      X02      M(16-20)         0.12680        -0.18069         0.38691
      X03      M(21-30)         0.12374         0.12531         0.50920
      X04      M(31-40)         0.11455         0.27018         0.43215
      X05      M(41-)           0.09978         0.38212         0.14670
      X06      F(-15)           0.11811        -0.30729        -0.09636
      X07      F(16-20)         0.13175        -0.19038        -0.19733
      X08      F(21-30)         0.13313        -0.02434        -0.33282
      X09      F(31-40)         0.13227         0.12383        -0.37099
      X10      F(41-)           0.11609         0.20136        -0.60162
      
                                     2019年11月13日 水曜日 12時57分56秒  35
               Plot of Factor1*Factor2.  Legend: A = 1 obs, B = 2 obs, etc.
      Factor1 |                                        |
            4 +                                        |
              |                                        |
              |                                        |
              |                                        |             A
            2 +                          A             |A        A
              |                          A        A   A|A        AA
              |                            A A   A  A  A A  A A      A   A  AA
              |             A   AA  AA A A     ACC   A |BAA AA   A  A
            0 +-------------------A-----------A------A-B-A---B--A-AAA--AA--A--A--A--
              |    A         A   A  A  A       A  A   A|  A         A
              |                    A  A A  A  A  A   A | AA  AAD   A   A       A
              |                                     A  |  AA       A      A
           -2 +                       A         A      |       A         A
              |                                        |    A
              |                                        |
              |                                        |
           -4 +                                        |
              |                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      
                                     2019年11月13日 水曜日 12時57分56秒  36
               Plot of Factor2*Factor3.  Legend: A = 1 obs, B = 2 obs, etc.
            2 +                       |  A                              A
              |          A A       A  |  A
              |                 A     | AAA                 A      A
              |     A     AA  B AAA  A|  A
              |      A   AA   B A   AA|      A    A            A
              |   AB      A A AA    A |  A A       A   AA           A
            0 +----------A-A--B-A-----+-AEA-A-------------A-------------------------
              |           A  A B     A| A A  A      A
              |                AA   AA| AA     AAA
      Factor2 |                 A A   A       AA A
              |                    A  BAA     A                   A
              |                AA  A A|  A
           -2 +             AA        |
              |                       |
              |                       |     A
              |                       |
              |                       |
              |                       |
           -4 +                       |
              --+----------+----------+----------+----------+----------+----------+-
               -2         -1          0          1          2          3          4
                                              Factor3
      
    6. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 固有値(Eigenvalue)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(標準化スコア係数, Standardized Scoring Coefficients) : aj : ラインマーカーの利用が効果的
        • 第1因子 : 全体的な嗜好
        • 第2因子 : 年齢効果 (+ 年輩、- 若年)
        • 第3因子 : 性別効果 (+ 男性、- 女性)
      • 各個体の散布図 : 第2因子と第3因子の関係が面白い

    7. 回転させてみよう : プログラム : les0703.sas

      • 回転の不定性から。
      • 回転させた方が解釈がし易いことも多いから。
       /* Lesson 07-3 */
       /*    File Name = les0703.sas   11/19/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0703_log.txt'
                   print = 'Kougi19/les0703_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data food;                  
        infile 'Kougi19/food.dat';
        input X01-X10;            
          label X01='M(-15)'      
                X02='M(16-20)'    
                X03='M(21-30)'    
                X04='M(31-40)'    
                X05='M(41-)'      
                X06='F(-15)'      
                X07='F(16-20)'    
                X08='F(21-30)'    
                X09='F(31-40)'    
                X10='F(41-)';     
                                  
      proc print data=food(obs=10);
      run;                         
      
      proc factor data=food nfactor=3 rotate=varimax out=fscore2;
        var X01-X10;                                : 回転の指定
      run;                                          :
      proc print data=fscore2;
      run;
      proc plot data=fscore2;
        plot factor1*factor2/vref=0.0 href=0.0;
        plot factor2*factor3/vref=0.0 href=0.0;
        plot factor3*factor1/vref=0.0 href=0.0;
      run;
      
    8. 出力結果 : les0703_Results.txt , les0703-output.pdf
                                     2019年11月13日 水曜日 13時00分34秒  38
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
                                     2019年11月13日 水曜日 13時00分34秒  39
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 10  平均 = 1
       
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      3 因子が NFACTOR 基準により示されます。
      
                                     2019年11月13日 水曜日 13時00分34秒  40
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                             因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.74741        -0.59244         0.16808
      X02      M(16-20)         0.86579        -0.31836         0.29190
      X03      M(21-30)         0.84491         0.22079         0.38417
      X04      M(31-40)         0.78216         0.47602         0.32604
      X05      M(41-)           0.68129         0.67325         0.11067
      X06      F(-15)           0.80647        -0.54140        -0.07270
      X07      F(16-20)         0.89959        -0.33542        -0.14888
      X08      F(21-30)         0.90901        -0.04289        -0.25110
      X09      F(31-40)         0.90316         0.21817        -0.27989
      X10      F(41-)           0.79262         0.35477        -0.45389
      
                    因子の分散
         Factor1         Factor2         Factor3
       6.8279551       1.7618731       0.7544512
      
                                     2019年11月13日 水曜日 13時00分34秒  41
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                 最終的な共通性の推定値 : 合計 = 9.344279
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
                                     2019年11月13日 水曜日 13時00分34秒  42
      FACTOR プロシジャ
      回転方法 : Varimax
      
                         直交変換行列
                             1               2               3
             1         0.65777         0.53529         0.52990
             2        -0.73396         0.61357         0.29126
             3         0.16922         0.58051        -0.79647
      
                       回転後の因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.95490         0.13415         0.08963
      X02      M(16-20)         0.85255         0.43757         0.13357
      X03      M(21-30)         0.45872         0.81076         0.20605
      X04      M(31-40)         0.22027         0.90003         0.29343
      X05      M(41-)          -0.02727         0.84202         0.46896
      X06      F(-15)           0.91555         0.05731         0.32756
      X07      F(16-20)         0.81272         0.18932         0.49758
      X08      F(21-30)         0.58692         0.31451         0.66919
      X09      F(31-40)         0.38658         0.45484         0.76506
      X10      F(41-)           0.18417         0.37847         0.88485
      
                                     2019年11月13日 水曜日 13時00分34秒  43
      FACTOR プロシジャ
      回転方法 : Varimax
      
                    因子の分散
         Factor1         Factor2         Factor3
       3.9249494       2.8740019       2.5453282
      
                 最終的な共通性の推定値 : 合計 = 9.344279
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
                                     2019年11月13日 水曜日 13時00分34秒  44
      FACTOR プロシジャ
      回転方法 : Varimax
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
       1.0000000       1.0000000       1.0000000
      
                                     2019年11月13日 水曜日 13時00分34秒  45
      FACTOR プロシジャ
      回転方法 : Varimax
      
                          標準化スコア係数
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.35650        -0.01839        -0.21738
      X02      M(16-20)         0.28150         0.18161        -0.29360
      X03      M(21-30)         0.07559         0.43873        -0.30350
      X04      M(31-40)        -0.04982         0.47796        -0.20481
      X05      M(41-)          -0.19000         0.37303         0.04733
      X06      F(-15)           0.28692        -0.18126         0.04983
      X07      F(16-20)         0.19300        -0.16084         0.17154
      X08      F(21-30)         0.04912        -0.13688         0.32854
      X09      F(31-40)        -0.06666        -0.06858         0.40164
      X10      F(41-)          -0.17324        -0.16356         0.59933
      
                                     2019年11月13日 水曜日 13時00分34秒  46
      Obs     X01     X02     X03     X04     X05     X06     X07     X08
        1    7.69    7.31    7.47    7.76    7.87    7.51    7.24    7.70
        2    6.59    5.56    6.21    6.04    5.81    6.64    6.11    6.53
        3    4.55    4.18    4.36    4.25    4.53    4.60    3.66    4.04
        4    6.78    6.11    6.30    5.98    5.56    6.37    6.29    5.43
        5    6.47    6.24    6.02    5.42    5.88    6.00    5.60    4.60
        6    6.96    6.81    6.91    6.48    6.23    7.09    7.27    7.13
        7    6.57    5.70    5.89    5.16    5.30    6.07    5.56    4.50
        8    7.32    6.95    6.02    4.98    4.88    6.82    6.40    5.53
        9    6.51    6.15    5.51    4.68    4.16    5.17    4.81    4.70
       10    6.86    6.05    5.85    6.14    6.75    6.71    5.39    5.42
       11    7.04    6.03    6.53    6.02    6.68    6.78    5.91    6.26
      
      Obs     X09     X10     Factor1     Factor2     Factor3
        1    7.91    7.95     0.66956     1.82121     1.58069
        2    6.44    6.64     0.16626    -0.19916     1.19252
        3    3.68    4.43    -1.03468    -1.43973    -0.47173
        4    5.32    5.28     0.63900     0.22553    -0.50004
        5    5.40    5.95     0.18242     0.09152    -0.20811
        6    6.86    7.36     0.74034     0.36710     1.34854
        7    4.92    5.33     0.32215    -0.32438    -0.54816
        8    5.61    5.33     1.29334    -0.70969    -0.33933
        9    4.86    3.82     0.58581    -0.75180    -1.38820
       10    6.03    6.59     0.02089     0.39898     0.55070
       11    5.76    5.95     0.40396     0.58950     0.17643
      ≪中略≫
      
                                     2019年11月13日 水曜日 13時00分34秒  56
               Plot of Factor1*Factor2.  Legend: A = 1 obs, B = 2 obs, etc.
            2 +                 A                |   A
              |                                  |
              |                 A   A A       A  |
              |                          A  A    |A B     A
      Factor1 |                      A     A     |     A A A
              |           A         B           AA    B                       A
              |                          A A AA  A B A  A      A  A  A
              |               A            A     |   A A    A A    A
              |                              A A |A    B
            0 +-------------------A------------A-+-A-A----A--A----------------------
              |               A     A    AA    A |          AA     A
              |                            A    A|  A                A  A
              |                            AA    |
              |                       A    A    A|A  BA    AA
              |              A   AA      A   A   |   A
              |                A       A  A  A   |         A                 A
              |                 A             A  |    B         A
              |                         A        |
           -2 +                     A           A|             A
              --+----------+----------+----------+----------+----------+----------+-
               -3         -2         -1          0          1          2          3
                                              Factor2
      
                                     2019年11月13日 水曜日 13時00分34秒  57
               Plot of Factor2*Factor3.  Legend: A = 1 obs, B = 2 obs, etc.
            4 +                                             |
              |                                             |
              |                                             |
              |                                             |
              |                   A                 A       |
              |                                             |
            2 +                                 A           |
              |                                  A  A       |       AA       A
              |              A                              | A A          A
      Factor2 |                                 A           | AAA A A    A      A
              |                A                         A  |AAA   A        A A
              |        A                    B A    B  BAA  A|  A  AAA  A   A A
            0 +-------------------------------------A-----A-+-AAA---AAAA------------
              |                                       AA   A|AB A A  AB  A
              |                            A A   AAA    A A |  A   B  A A  A
              |                                        A   A| A A A
              |                                 A     AAA A |        A  A
              |                            AA       A  A    |   A   AA
           -2 +                                          A  |
              --+----------+----------+----------+----------+----------+----------+-
               -4         -3         -2         -1          0          1          2
                                              Factor3
      
                                     2019年11月13日 水曜日 13時00分34秒  58
               Plot of Factor3*Factor1.  Legend: A = 1 obs, B = 2 obs, etc.
            2 +                                        |
              |                         A   A          |        A     A
              |                             A        A |AA     A A
              |                        A  A A    A A   |       AB
              |               A     AAB A   AA    CA   AA            A   A A     A
              |              A      A A  A B   A   A   |    B  A B       A AA
            0 +---------------------A------------------+--AAA-A------A----B---------
              |                     A     A         AA | AA  A    AA A  B
              |                A         A            A|   AA  AAAAA   A
      Factor3 |                                A  A A A|         AA
              |                             B          |A      A                A
              |                                     A  |     A
           -2 +                                        |
              |                       A                |
              |               A                        |             A
              |                                        |
              |                    A                   |
              |                                        |
           -4 +                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor1
      
    9. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • (回転行列, Orthogonal Transformation Matrix)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(標準化スコア係数, Standardized Scoring Coefficients) : aj
        • 第1因子 : 若年層の嗜好 (+ 若年、- 年輩)
        • 第2因子 : 成人男性の嗜好 (+ 成年男子)
        • 第3因子 : 成人女性の嗜好 (+ 成年女子)
      • 各個体の散布図 : 各因子間の関係が面白い。各個体の具体的な位置を把握。
      • 回転前と回転後でどのように解釈が変化したか?

    10. 代表的な回転法 :
      • バリマックス法(rotate=varimax) : 直交回転 : 因子軸間は直交(因子軸同士は独立(無相関))
      • プロマックス法(rotate=promax) : 斜交回転 : 因子軸間に相関性

  3. [例題2] 趣味の特性を探ってみよう
    30種類の趣味の性、年齢毎の特性調査の結果 : データ : syumi.dat
    [例題1]と同様の調査手法。男性/女性別。年齢は3群ずつ。興味の程度は5段階(五件法)

    1. プログラム : les0704.sas

       /* Lesson 07-4 */
       /*    File Name = les0704.sas   11/19/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0704_log.txt'
                   print = 'Kougi19/les0704_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data hobby;
        infile 'Kougi19/syumi.dat';
        input code $ X1-X6;
          label X1='M(-29)'
                X2='M(30-49)'
                X3='M(50-)'
                X4='F(-29)'
                X5='F(30-49)'
                X6='F(50-)';
      
      proc print data=hobby(obs=10);
      run;
      
      proc factor data=hobby nfactor=2 out=fscore;
        var X1-X6;
      run;
      proc plot data=fscore;                           : 回転前
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      
      proc factor data=hobby nfactor=2 rotate=varimax out=fscore2;
        var X1-X6;
      run;
      proc plot data=fscore2;                          : 回転後
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      
    2. 出力結果 : les0704_Results.txt , les0704-output.pdf
                                     2019年11月13日 水曜日 13時38分16秒  59
      
      Obs    code     X1      X2      X3      X4      X5      X6
      
        1     A      4.00    4.25    3.83    4.50    4.67    4.00
        2     B      4.17    3.89    4.00    4.50    4.17    3.75
        3     C      3.83    3.44    2.83    3.57    3.17    1.50
        4     D      2.83    4.22    3.83    3.71    3.00    2.25
        5     E      4.17    4.11    3.83    3.57    4.00    3.75
        6     F      2.33    3.56    3.33    2.93    2.83    2.75
        7     G      1.83    2.44    2.33    3.71    3.83    3.75
        8     H      2.50    1.89    2.00    4.21    3.17    3.75
        9     I      2.00    1.44    2.00    4.07    3.33    3.50
       10     J      4.00    3.33    3.33    3.00    3.17    2.25
      
                                     2019年11月13日 水曜日 13時38分16秒  60
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2019年11月13日 水曜日 13時38分16秒  61
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 6  平均 = 1
       
               固有値           差           比率        累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                                     2019年11月13日 水曜日 13時38分16秒  62
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                                     2019年11月13日 水曜日 13時38分16秒  63
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                 最終的な共通性の推定値 : 合計 = 4.491236
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2019年11月13日 水曜日 13時38分16秒  64
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)           0.19212         0.36217
      X2      M(30-49)         0.21734         0.36976
      X3      M(50-)           0.23398         0.27104
      X4      F(-29)           0.30164        -0.20320
      X5      F(30-49)         0.29016        -0.24622
      X6      F(50-)           0.22454        -0.35904
      
                                     2019年11月13日 水曜日 13時38分16秒  65
                    Plot of Factor1*Factor2.  Symbol is value of code.
            4 +                                        |
              |                                        |
              |                                        |
              |                                        |
              |                                        |
              |                                        |
            2 +                                        A B
              |                                        |   Z  E
              |                                        |
      Factor1 |                               R        |
              |                                        |           D
              |                          3   Q     M   |           J    O
            0 +---------------HG-------------------2---+--F--------C----------------
              |           I            K     S    P    |              N
              |                                        |          V    U
              |                                        |Y                  W
              |                                      1 T         X
              |                                        |
           -2 +                                    4   |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      NOTE: 1 obs は表示されません。
      
                                     2019年11月13日 水曜日 13時38分16秒  66
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2019年11月13日 水曜日 13時38分16秒  67
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 6  平均 = 1
       
               固有値           差           比率        累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                                     2019年11月13日 水曜日 13時38分16秒  68
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                                     2019年11月13日 水曜日 13時38分16秒  69
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
                 最終的な共通性の推定値 : 合計 = 4.491236
       
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2019年11月13日 水曜日 13時38分16秒  70
      FACTOR プロシジャ
      回転方法 : Varimax
      
                 直交変換行列
                             1               2
             1         0.77751         0.62886
             2        -0.62886         0.77751
      
               回転後の因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.01176         0.82361
      X2      M(30-49)         0.05723         0.87743
      X3      M(50-)           0.20121         0.77199
      X4      F(-29)           0.86678         0.24430
      X5      F(30-49)         0.88957         0.16603
      X6      F(50-)           0.87359        -0.10049
      
                                     2019年11月13日 水曜日 13時38分16秒  71
      FACTOR プロシジャ
      回転方法 : Varimax
      
            因子の分散
         Factor1         Factor2
       2.3497071       2.1415286
      
                 最終的な共通性の推定値 : 合計 = 4.491236
       
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2019年11月13日 水曜日 13時38分16秒  72
      FACTOR プロシジャ
      回転方法 : Varimax
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)          -0.07838         0.40241
      X2      M(30-49)        -0.06354         0.42417
      X3      M(50-)           0.01147         0.35788
      X4      F(-29)           0.36232         0.03170
      X5      F(30-49)         0.38045        -0.00897
      X6      F(50-)           0.40037        -0.13795
      
                                     2019年11月13日 水曜日 13時38分16秒  73
                    Plot of Factor1*Factor2.  Symbol is value of code.
                2 +                              |
                  |                              |                  A
                  |                              |
                  |                              |  R               B
          Factor1 |  I     H G           3       |                 Z
                  |                              |                  E
                  |                        Q     |
                  |              K               |M
                  |                    S      2  |
                0 +------------------------P-----+------------------------------
                  |                              |F             D
                  |                              |           J     O
                  |                              |         C
                  |                      Y       |   V      N
                  |                1 T           |
                  |         4                    |     U
                  |                          X   |
                  |                              |        W
               -2 +                              |
                  ---+-------------+-------------+-------------+-------------+--
                    -2            -1             0             1             2
                                              Factor2
      NOTE: 1 obs は表示されません。
      
    3. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj

      • 因子数は2で良さそう
      • 回転前 : 因子の特徴付け
        • 第1因子 : 全体的な傾向
        • 第2因子 : 性別因子 (+ 男性、- 女性)
        • 各個体の散布図 : 各趣味がどの性別に好まれるか
      • 回転後 : 因子の特徴付け
        • 第1因子 : 女性因子 (+ 女性)
        • 第2因子 : 男性因子 (+ 男性)
        • 各個体の散布図 : 性別毎の特徴付け、両性に好まれる趣味
      • 記号を付けたことにより、より判り易く(& 解り易く)なっている
      • 年齢の効果はあまり見られない
      • 回転前と回転後でどのように解釈が変化したか?

  4. 因子数の決定基準


  5. 主成分分析(PCA)と因子分析(FA): 目的は同じでも異なる手法


  6. アンケート調査の手順と解析例 :
     調査を実施する際の作業内容を手順を追って列挙してみる。
    1. 設計
      • 設計の善し悪しによって得られる結果の質も変わる
      • 調査の動機付け : なぜその調査を実施したいのか?
      • 調査の目的を明確に : 何を知りたいのか?
      • 調査対象者の選定 : 規模、予算、...
      • 調査対象分野の熟知度合い : 勉強
      • 予想される回答を想定して設計すべき
      • 回答のし易さ
      • 質問項目や選択肢の吟味
      • 偏りの少ない調査 : 対象集団、調査方法、...
      • 予備調査の実施
      • 解析方法も事前に想定しておく
    2. 調査と回収
      • 方法 : 面接、電話、郵送、Web、...
      • 回収率 : 事前に最低ラインは設定しておくべき
      • 場合によっては対象者を追加
    3. 電子化とスクリーニング
      • 「人間は間違う動物」
      • ノイズや入力ミスを見つけ出し修正 : ピュアなデータにする
      • 単純集計やクロス集計が威力を発揮する
      • 体力が要るがサボってはいけない
      • スクリーニングが不完全だと解析結果に影響する
    4. 解析
      • いろいろな角度からの吟味
      • 各種の統計手法を駆使
      • 過去の経験
      • 予想に反した結果も多いにあり得る
      • データを加工する(データ変容)の必要性も
      • 「道具(統計ソフト等)」や「機械」に使われないように
    5. 結果の公表
      • 報告書、論文の作成
      • 学会発表 : プレゼン技術
      • 今後の方針、フィードバック


  7. ちょっとした話題: 法科大学院適性試験の対応表 .

  8. 次回は、... : 11月26日 16:20-17:50
[DIR]講義のホームページへ戻ります