主成分分析と因子分析

統計モデル解析特論I/II : 第6回 (11/16/17)

 いくつか(p個)の変量の値を情報の損失をできるだけ少なくして、 少数変量(m個、m<p)の総合的指標(主成分)で代表させる方法として 主成分分析(Principal Component Analysis, PCA)と 因子分析(Factor Analysis, FA)がある。 いくつかのテストの成績を総合した総合的成績、 いろいろな症状を総合した総合的な重症度、 種々の財務指標に基づく企業の評価 等を求めたいといった場合に用いられる。 p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、 次元を減少させる(reduce)方法と言うこともでき、 多変量データを要約する有力な方法である。
 両者は似た目的に使われるが、元になっている考え方は異なるので 利用する場面では注意が必要である。違いに焦点を当てながら説明する。
  1. 2変量の場合の主成分分析 : 理解を助けるため
    1. 定式化 : 配布資料 54ページ〜
      • 重み(係数) : a1、a2
      • 合成変量(線形結合) : z
      • よく代表するように、a1 と a2 を決める。
      • より広がって測定できる軸に沿うと情報量が多い。
           [参考:立体の測定] ノギスノギスの使い方 _
      • 全測定値の分散を最大化する軸を決定する。

    2. 身長と体重の総合指標を求めよう : プログラム : les0511.sas

       /* Lesson 05-11 */
       /*    File Name = les0511.sas   11/09/17   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0511.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0511.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data gakusei;
        infile '/folders/myfolders/Kougi/all07ae.prn'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc plot data=gakusei;                        : 散布図
        plot shintyou*taijyuu;                       : 元の変量のプロット
      run;                                           :
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu;                        : 2変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
      run;                                           :
                                                     : 参考までに、
      proc sort data=outprin;                        : 説明のためにソートしてみる
        by prin1;                                    : 第一主成分で
      run;                                           :
      proc print data=outprin;                       : 体重がややが効いていることの確認
      run;                                           :
      

    3. 出力結果 : SAS_out0511.txt, les0511_out.pdf
      • 身長と体重の散布図
      • 各変量の平均、標準偏差、分散共分散行列
      • 固有値、比率(寄与率)、累積寄与率 : 解釈に使う
      • 固有ベクトル(係数a1とa2) : 解釈に使う
      • 主成分得点 : 各個人の得点(z)、2つある
      • 第1軸と第2軸の主成分得点の散布図
                                     2017年11月 9日 木曜日 11時13分08秒  57
      
           プロット : shintyou*taijyuu   凡例 : A = 1 obs, B = 2 obs, ...
           shintyou |
                200 +
                    |
                    |                               A B  A     A
                180 +                         A BFCCGCD H B  B       A  A  A
                    |                      CFCJHHUQIKCIBFBB BC   A
                    |                    H DHFMDFBCBGA A  AA A      A
                160 +                 ABDFEGKADBACB
                    |            A   EADECAE  A   A
                    |              A BAA
                140 +
                    ---+------------+------------+------------+------------+--
                      20           40           60           80           100
                                              taijyuu
      
                                     2017年11月 9日 木曜日 11時13分08秒  58
      PRINCOMP プロシジャ
      
      オブザベーション数         325
      変数の数                          2
      
                  単純統計量
                    shintyou           taijyuu
      Mean       168.6947692       58.78092308
      StD          8.0436274        9.34693152
      
                                     2017年11月 9日 木曜日 11時13分08秒  59
      PRINCOMP プロシジャ
                    共分散行列
                        shintyou           taijyuu
      shintyou       64.69994169       52.97829497
      taijyuu        52.97829497       87.36512877
      
      総分散    152.06507047
      
                     共分散行列の固有値
               固有値           差      比率      累積
         1    130.209351    108.353632      0.8563      0.8563
         2     21.855719                    0.1437      1.0000
      
               固有ベクトル
                       Prin1         Prin2
      shintyou      0.628817      0.777553
      taijyuu       0.777553      -.628817
      
                                     2017年11月 9日 木曜日 11時13分08秒  61
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s       P         P
                t      j    y  t     u       r        u       r         r
       O   s    y      y    o  a     k       y        u       i         i
       B   e    o      u    u  k     a       e        w       n         n
       S   x    u      u    i  u     i       r        a       1         2
      
        1  F  145.0  38.0   .  J   10000               .  -31.0580  -5.35654
        2  F  146.7  41.0  85  J   10000  Vodafone  6000  -27.6563  -5.92115
        3  F  148.0  42.0   .  J   50000               .  -26.0613  -5.53915
        4  F  148.0  43.0  80  J   50000  DoCoMo    4000  -25.2837  -6.16797
        5  F  149.0  45.0   .  G   60000               .  -23.0998  -6.64805
        6  F  150.0  46.0  86      40000               .  -21.6934  -6.49931
        7  F  151.0  45.0   .  J   20000  docomo    5000  -21.8422  -5.09294
        8  F  151.0  50.0   .  G   60000  J-PHONE      .  -17.9544  -8.23703
        9  F  151.7  41.5  80  J   35000               .  -24.1234  -2.34780
       10  F  152.0  35.0  77  J   60000  DoCoMo    2000  -28.9889   1.97278
       11  F  152.0  43.0   .  J   20000  au        3500  -22.7685  -3.05776
       12  F  152.0  44.0   .      45000  DoCoMo    4000  -21.9909  -3.68657
       13  F  153.0  41.0   .  J  125000  No           .  -23.6948  -1.02257
       14  F  153.0  42.0   .  G       0  Vodafone  1000  -22.9172  -1.65139
       15  F  153.0  46.5  87  G   10000               .  -19.4182  -4.48106
      
                                     2017年11月 9日 木曜日 11時13分08秒  63
             プロット : Prin2*Prin1   凡例 : A = 1 obs, B = 2 obs, ...
          20 +                                  |
             |                                  |
       Prin2 |                                A |   A
             |                              B B DABBABACABA AAA
             |                      AB DDAADDBEEECCHEFCABDD   A A
           0 +-----------A---AABBABCAFC-FE-BGGBFEEEKFDACCEB--G-AA------A-----------
             |         A  AA ABABABBDC BAF B ABAB CBDDBACED  A  AA
             |              A AA  AA  A  A  B  B|BA    A  A  A AB         A
             |                             A    |        AA  A    A
             |                                  |         A                A
         -20 +                                  |                  A          A
             ---+-------+-------+-------+-------+-------+-------+-------+-------+--
               -40     -30     -20     -10      0      10      20      30      40
                                              Prin1
      
                                     2017年11月 9日 木曜日 11時13分08秒  64
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s        P         P
                t      j    y  t     u       r        u        r         r
       O   s    y      y    o  a     k       y        u        i         i
       B   e    o      u    u  k     a       e        w        n         n
       S   x    u      u    i  u     i       r        a        1         2
      
        1  F  145.0  38.0   .  J   10000                .  -31.0580  -5.35654
        2  F  152.0  35.0  77  J   60000  DoCoMo     2000  -28.9889   1.97278
        3  F  146.7  41.0  85  J   10000  Vodafone   6000  -27.6563  -5.92115
      ≪中略≫
                                     2017年11月 9日 木曜日 11時13分09秒  89
      
      OBS sex shintyou taijyuu kyoui jitaku kodukai carryer  tsuuwa  Prin1     Prin2
      
      292  M    177.0     68      .    G      80000               . 12.3908   0.6606
      293  M    182.0     64      .    G          0               . 12.4247   7.0637
      294  M    165.0     78      .    G          0            2098 12.6205 -14.9582
      295  M    170.0     74     90    J          0               . 12.6544  -8.5551
      296  M    175.0     70     95    G      50000            8000 12.6883  -2.1521
      297  M    178.0     68      .    J     100000 DoCoMo     4000 13.0196   1.4382
      298  M    184.0     65      .    G     140000 au        10000 14.4599   7.9900
      299  M    170.0     78      .           45000 Vodafone  10000 15.7646 -11.0704
      300  M    179.9     70      .    J      15000 DoCoMo      700 15.7695   1.6579
      301  M    175.0     74      .    J          0               . 15.7985  -4.6674
      302  M    180.0     70     94    G      70000 au         5000 15.8324   1.7357
      303  M    180.0     70      .    J      40000 au         4000 15.8324   1.7357
      304  M    180.0     70      .               .               . 15.8324   1.7357
      305  M    180.0     70      .    J      40000 DoCoMo     6500 15.8324   1.7357
      306  M    180.0     70      .            5000            3000 15.8324   1.7357
      307  M    178.7    71.2    95               0              .  15.9480  -0.0297
      308  M    184.0    68.0    85           30000              .  16.7925   6.1035
      309  M    173.5    76.5     .    G     100000              .  16.7991  -7.4057
      310  M    182.0    70.0    90    G     100000              .  17.0900   3.2908
      311  M    185.0    68.0    93    J          0              .  17.4213   6.8811
      312  M    175.0    77.0    95    G     130000              .  18.1311  -6.5538
      313  M    179.1    74.2     .               0   au      4000  18.5321  -1.6052
      314  M    175.0    79.0     .    J          0   No         0  19.6862  -7.8115
      315  M    176.5    78.0    96    J      10000              .  19.8519  -6.0163
      316  M    177.0    78.0     .    J      40000              .  20.1663  -5.6275
      317  M    181.5    74.5     .    G     120000   au      3000  20.2746   0.0723
      318  M    185.0    72.0     .    J      30000           7000  20.5315   4.3658
      319  M    178.0    78.0   110    G      50000              .  20.7951  -4.8500
      320  M    173.0    84.0    46    G     350000              .  22.3164 -12.5106
      321  M    169.3    88.5    94    J          0              .  23.4887 -18.2173
      322  M     186      82      .    J         0              .   28.9359  -1.1448
      323  M     182      90    100    J     40000              .   32.6411  -9.2856
      324  M     178      95      .           1000    No        .   34.0135 -15.5399
      325  M     178     100    112    G     60000              .   37.9013 -18.6840
      

    4. 解釈方法
      • 寄与率 : その軸がどの程度説明力を持っているか : 第1軸だけで十分(85.6%)。第2軸に含まれる説明力は小さい(14.4%)。
      • 固有ベクトル : その軸の特徴を示している : 身長と体重の重みはほぼ同等だが、体重がやや大きめに効いている(第1軸)
      • 主成分得点と散布図 : 各個人がどこに付置されているか
      • 第1軸 : 全体的な体格の指標。身長と体重を足したような指標。

  2. 3変量以上の主成分分析
    1. 定式化 : 資料 71ページ〜
      • 2変量の拡張
      • 合成変量(線形結合) : z
      • 合成変量の分散を最大化する軸を決定する。

    2. 身長、体重、胸囲での総合指標を求めてみよう : プログラム : les0512.sas
       /* Lesson 05-12 */
       /*    File Name = les0512.sas   11/09/17   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0512.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0512.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data gakusei;
        infile '/folders/myfolders/Kougi/all07ae.prn'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu kyoui;                  : 3変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
        plot prin3*prin2/vref=0 href=0;              :
        plot prin3*prin1/vref=0 href=0;              :
      run;                                           :
      

    3. 出力結果 : SAS_out0512.txt, les0512_out.pdf
      • 各変量の平均、標準偏差、共分散行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

                                     2017年11月 9日 木曜日 11時15分29秒  94
      PRINCOMP プロシジャ
      
      オブザベーション数         114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                             共分散行列
                        shintyou           taijyuu             kyoui
      shintyou        76.0865898        69.6653222        23.7439373
      taijyuu         69.6653222       118.0010123        43.5906226
      kyoui           23.7439373        43.5906226        69.9335507
      
      総分散    264.02115277
      
                     共分散行列の固有値
               固有値           差      比率      累積
         1    189.966471    138.636164      0.7195      0.7195
         2     51.330307     28.605932      0.1944      0.9139
         3     22.724375                    0.0861      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.539085      -.407903      0.736887
      taijyuu       0.751825      -.161336      -.639320
      kyoui         0.379667      0.898658      0.219698
      
                                     2017年11月 9日 木曜日 11時15分29秒  98
              s
              h     t          k      c
              i     a     j    o      a       t
              n     i   k i    d      r       s      P       P        P
              t     j   y t    u      r       u      r       r        r
       O  s   y     y   o a    k      y       u      i       i        i
       B  e   o     u   u k    a      e       w      n       n        n
       S  x   u     u   i u    i      r       a      1       2        3
      
        1 F 145.0 38.0  . J  10000             .    .       .       .     
        2 F 146.7 41.0 85 J  10000 Vodafone 6000 -24.9565 10.2382 -4.10085
        3 F 148.0 42.0  . J  50000             .    .       .       .     
        4 F 148.0 43.0 80 J  50000 DoCoMo   4000 -24.6504  4.8920 -5.52002
        5 F 149.0 45.0  . G  60000             .    .       .       .     
        6 F 150.0 46.0 86    40000             . -19.0388  8.9841 -4.64602
        7 F 151.0 45.0  . J  20000 docomo   5000    .       .       .     
        8 F 151.0 50.0  . G  60000 J-PHONE     .    .       .       .     
        9 F 151.7 41.5 80 J  35000             . -23.7835  3.6248 -1.83456
       10 F 152.0 35.0 77 J  60000 DoCoMo   2000 -29.6477  1.8551  1.88299
       11 F 152.0 43.0  . J  20000 au       3500    .       .       .     
       12 F 152.0 44.0  .    45000 DoCoMo   4000    .       .       .     
       13 F 153.0 41.0  . J 125000 No          .    .       .       .     
       14 F 153.0 42.0  . G      0 Vodafone 1000    .       .       .     
       15 F 153.0 46.5 87 G  10000             . -16.6659  8.5784 -2.53532
      
                                     2017年11月 9日 木曜日 11時15分29秒 100
      
             プロット : Prin2*Prin1   凡例 : A = 1 obs, B = 2 obs, ...
             (NOTE: 211 obs が欠損値です。)
      Prin2 |                            |
         20 +                            |
            |           A                |  A    A           A            A
            |           B   BAAABCA   AC |  A AC     A
          0 +-------A----A--ABACCBDD-BCA-AD-CG-ABAFBA-C-AA-A-------A----------------
            |              A  AA      A  A C AAAAAA AA
            |                       AA   | A A A
        -20 +                            |
            |                  A         |
            |                            |
        -40 +                            |    A
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      
                                     2017年11月 9日 木曜日 11時15分29秒 101
             プロット : Prin3*Prin2   凡例 : A = 1 obs, B = 2 obs, ...
             (NOTE: 211 obs が欠損値です。)
      Prin3 |                                                  |
         10 +                                         A   A A  |
            |                                      AA A  AAAB  | B
            |                                         AA   C BCEEDA  B
          0 +-----------------------------------A----B-A---AA-BEBGDCAADA-----AA-----
            |                       A                    A  ACBAAEACA  ABA   A
            |                                          A A     AA   B
        -10 +                                                 A|       A
            |                                                  |           A
            |                                                  |A
        -20 +        A                                         |
            -+---------+---------+---------+---------+---------+---------+---------+
            -50       -40       -30       -20       -10        0        10        20
                                              Prin2
      
                                     2017年11月 9日 木曜日 11時15分29秒 102
             プロット : Prin3*Prin1   凡例 : A = 1 obs, B = 2 obs, ...
             (NOTE: 211 obs が欠損値です。)
      Prin3 |                            |
         10 +                            | A   A      A
            |                            |AB AA   CAA
            |       A       A  BB BB  B  |AABD BAA   AB
          0 +---------------ABB-CDBAABBB-AB-AC-BAAB-AA-------A----------------------
            |           BA  AAAC AAA A   A  BAAAAAB     AA
            |           A  A          AA |         A               A
        -10 +                  A       A |
            |                            |                                A
            |                            |                 A
        -20 +                            |    A
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      

    4. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.4%)。
      • 第1軸 : 全体的な体格の因子。特に体重が効いている。
      • 第2軸 : 太さの因子(?)。胸囲が正で身長が負。

      • 第3軸 : 華奢さの因子(?)。無視しても良い軸であるが。(8.6%)。

  3. 相関行列を使う理由
    • 変量によって測定単位が異なる
    • 使う単位によって解析結果が異なる
    • 分散の影響を受ける
    • 各変量を標準化して用いる : 相関行列 <===> 分散共分散行列

    1. 相関行列を用いて体格の総合指標を求めてみよう : プログラム : les0513.sas

       /* Lesson 05-13 */
       /*    File Name = les0513.sas   11/09/17   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0513.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0513.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data gakusei;
        infile '/folders/myfolders/Kougi/all07ae.prn'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      
      run;                                          :
      proc princomp data=gakusei out=outprin;       : 相関係数を使って
        var shintyou taijyuu kyoui;                 :
      run;                                          :
      proc print data=outprin(obs=15);
      run;
      proc plot data=outprin;
        plot prin2*prin1/vref=0 href=0;
        plot prin3*prin2/vref=0 href=0;
        plot prin3*prin1/vref=0 href=0;
      run;
      

    2. 出力結果 : SAS_out0513.txt, les0513_out.pdf
      • 各変量の平均、標準偏差、相関行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

      
                                     2017年11月 9日 木曜日 11時16分02秒 143
      PRINCOMP プロシジャ
      
      オブザベーション数         114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                       相関行列
                    shintyou      taijyuu       kyoui
      shintyou        1.0000       0.7352      0.3255
      taijyuu         0.7352       1.0000      0.4799
      kyoui           0.3255       0.4799      1.0000
      
                      相関行列の固有値
               固有値           差      比率      累積
         1    2.04696555    1.33664820      0.6823      0.6823
         2    0.71031735    0.46760025      0.2368      0.9191
         3    0.24271710                    0.0809      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.599200      -.483881      0.637823
      taijyuu       0.640769      -.187770      -.744418
      kyoui         0.479974      0.854752      0.197544
      

    3. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.9%)。
      • 第1軸 : 全体的な体格の因子。
      • 第2軸 : 太さの因子。
      • 分散共分散行列を使ったときよりも 第1軸の固有ベクトル同士が近い値になった。 しかし、軸の解釈に違いはない。 その理由はこの例では 3変量のスケールや分散に それほどの違いがないためと想像される。
      • 分散共分散行列と相関行列を使ったときの違いを見てみたければ、 shintyou のみを mm 単位で測定したと考えて、 100倍したものをデータとして両者の出力を比較してみよ。
        プログラム : les0514.sas 、出力結果 : SAS_out0514.txt, les0514_out.pdf

  4. 主成分の数の決定基準 : 配布資料 80ページ
    明確に決まっているわけではないが、以下のような基準が一般的に 用いられている。また、結果の解釈の都合上、多少増減させることもある。


  5. 因子分析
     前述の主成分分析の場合は、 データの散らばり方(分散)を捉えてデータ特性を把握する手法であった。 一方、因子分析は、変数間に(潜在的な)構造を持ち込んで関係を探る手法である (少し理解しにくいかもしれないが)。 この手法は心理学の分野で広く利用されている。
    1. 定式化 : 配布資料 180ページ〜
      • 測定対象 zji : 成績、測定値、...。
      • 共通因子 : fi : 因子得点(測定不能)、個体の特徴付け、i=1,2,...,n.
      • 因子負荷量 : aj : 因子の特徴付け、j=1,2,...,p.
      • 独自因子 : eji : 変動
      • いくつかの仮定 : fi、aj、eji

    2. 因子の解釈
    3. 因子軸の回転 : 直交回転、斜交回転

    4. 因子数を決めるために行きつ戻りつの試行錯誤が必要になる

  6. [例題1] 食品の嗜好性を探ってみよう : 196ページ〜、データは90ページ〜
    100種類の食品の性、年齢毎の嗜好度調査の結果 : データ : food.dat

    1. まずは因子数を決めよう : プログラム : les0621.sas

       /* Lesson 06-21 */
       /*    File Name = lec0621.sas   11/16/07   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0621.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0621.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data food;                  
        infile '/folders/myfolders/Kougi/food.dat';   : ファイルの読み込み
        input X01-X10;                    : 変量リスト、連続的に
          label X01='M(-15)'              : 各変量に解りやすい名前を付ける
                X02='M(16-20)'            :   M : 男性
                X03='M(21-30)'            :   F : 女性
                X04='M(31-40)'            :  ()内 : 年齢
                X05='M(41-)'              :
                X06='F(-15)'              :
                X07='F(16-20)'            :
                X08='F(21-30)'            :
                X09='F(31-40)'            :
                X10='F(41-)';             :
                                          :
      proc print data=food(obs=10);       : データの表示
      run;                                :
      proc factor data=food;              : オプションを付けないと主成分分析
        var X01-X10;                      : 解析に使う変量リスト
      run;                                :
      
    2. 出力結果 : SAS_out0621.txt
                                     2017年11月16日 木曜日 11時47分57秒  90
      
      OBS    X01    X02    X03    X04    X05    X06    X07    X08    X09    X10
      
        1   7.69   7.31   7.47   7.76   7.87   7.51   7.24   7.70   7.91   7.95
        2   6.59   5.56   6.21   6.04   5.81   6.64   6.11   6.53   6.44   6.64
        3   4.55   4.18   4.36   4.25   4.53   4.60   3.66   4.04   3.68   4.43
        4   6.78   6.11   6.30   5.98   5.56   6.37   6.29   5.43   5.32   5.28
        5   6.47   6.24   6.02   5.42   5.88   6.00   5.60   4.60   5.40   5.95
        6   6.96   6.81   6.91   6.48   6.23   7.09   7.27   7.13   6.86   7.36
        7   6.57   5.70   5.89   5.16   5.30   6.07   5.56   4.50   4.92   5.33
        8   7.32   6.95   6.02   4.98   4.88   6.82   6.40   5.53   5.61   5.33
        9   6.51   6.15   5.51   4.68   4.16   5.17   4.81   4.70   4.86   3.82
       10   6.86   6.05   5.85   6.14   6.75   6.71   5.39   5.42   6.03   6.59
      
                                     2017年11月16日 木曜日 11時47分57秒  91
      
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
         相関行列の固有値 : 合計 = 10  平均 = 1
       
               固有値           差      比率      累積
      
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      2 因子が MINEIGEN 基準により示されます。
      
                                     2017年11月16日 木曜日 11時47分57秒  94
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                     因子パターン
                                Factor1         Factor2
      X01      M(-15)           0.74741        -0.59244
      X02      M(16-20)         0.86579        -0.31836
      X03      M(21-30)         0.84491         0.22079
      X04      M(31-40)         0.78216         0.47602
      X05      M(41-)           0.68129         0.67325
      X06      F(-15)           0.80647        -0.54140
      X07      F(16-20)         0.89959        -0.33542
      X08      F(21-30)         0.90901        -0.04289
      X09      F(31-40)         0.90316         0.21817
      X10      F(41-)           0.79262         0.35477
      
                                     2017年11月16日 木曜日 11時47分57秒  95
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
            因子の分散
       
         Factor1         Factor2
       6.8279551       1.7618731
      
                 最終的な共通性の推定値 : 合計 = 8.589828
       
             X01             X02             X03             X04             X05
      0.90961791      0.85094991      0.76262367      0.83837129      0.91741340
      
             X06             X07             X08             X09             X10
      0.94352040      0.92177476      0.82814690      0.86329813      0.75411185
      
    3. 解釈方法 :
      • 固有値(Eigenvalue) : 相関行列を用いた主成分分析の計算結果
        • 相関行列を用いた主成分が計算される (因子数を決めるため)
        • [コメント] 理解を難しくしている一つの理由かもしれない
        • 比較のためのプログラム : les0621pca.sas, 出力結果 : SAS_out0621pca.txt
      • システム側からは因子数は2だと判断された : 固有値が1より大きい
      • 因子負荷量(Factor Pattern) : aj
      • 因子毎の分散(Variance explained by each factor) : 総分散(10, 変量数と等しくなる)のどれだけを説明しているか。因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。

      • 因子数の決定 : 解析者側の判断
        • 固有値の変化量からすると、3 でも良さそう : 3 と 4 の間が空いてる
        • 因子数を 3 として計算してみよう

        • 因子数の決め方は、主成分分析の時と同様の考え方
          • 累積寄与率(Cumulative)
          • 固有値の値(Eigenvalue, Proportion)
          • 固有値間のギャップ(Difference) 等

    4. 因子数3で解析 : プログラム : les0622.sas

       /* Lesson 06-22 */
       /*    File Name = lec0622.sas   11/16/07   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0622.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0622.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data food;                  
        infile '/folders/myfolders/Kougi/food.dat';
        input X01-X10;
          label X01='M(-15)'
                X02='M(16-20)'
                X03='M(21-30)'
                X04='M(31-40)'
                X05='M(41-)'
                X06='F(-15)'
                X07='F(16-20)'
                X08='F(21-30)'
                X09='F(31-40)'
                X10='F(41-)';
      
      proc print data=food(obs=10);
      run;                                          :
      proc factor data=food nfactor=3 out=fscore;   : 因子数3、出力の保存
        var X01-X10;                                :
      run;                                          :
      proc plot data=fscore;                        :
        plot factor1*factor2/vref=0.0 href=0.0;     : 第1因子 x 第2因子、軸
        plot factor2*factor3/vref=0.0 href=0.0;     : 第2因子 x 第3因子、軸
      run;                                          :
      
    5. 出力結果 : SAS_out0622.txt
                                     2017年11月16日 木曜日 11時47分53秒  80
      
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
         相関行列の固有値 : 合計 = 10  平均 = 1
       
               固有値           差      比率      累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      3 因子が NFACTOR 基準により示されます。
      
                                     2017年11月16日 木曜日 11時47分53秒  83
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                             因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.74741        -0.59244         0.16808
      X02      M(16-20)         0.86579        -0.31836         0.29190
      X03      M(21-30)         0.84491         0.22079         0.38417
      X04      M(31-40)         0.78216         0.47602         0.32604
      X05      M(41-)           0.68129         0.67325         0.11067
      X06      F(-15)           0.80647        -0.54140        -0.07270
      X07      F(16-20)         0.89959        -0.33542        -0.14888
      X08      F(21-30)         0.90901        -0.04289        -0.25110
      X09      F(31-40)         0.90316         0.21817        -0.27989
      X10      F(41-)           0.79262         0.35477        -0.45389
      
                                     2017年11月16日 木曜日 11時47分53秒  84
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                    因子の分散
         Factor1         Factor2         Factor3
       6.8279551       1.7618731       0.7544512
      
                 最終的な共通性の推定値 : 合計 = 9.344279
       
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
                                     2017年11月16日 木曜日 11時47分53秒  86
      
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
      
       1.0000000       1.0000000       1.0000000
      
                                     2017年11月16日 木曜日 11時47分53秒  87
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                          標準化スコア係数
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.10946        -0.33626         0.22279
      X02      M(16-20)         0.12680        -0.18069         0.38691
      X03      M(21-30)         0.12374         0.12531         0.50920
      X04      M(31-40)         0.11455         0.27018         0.43215
      X05      M(41-)           0.09978         0.38212         0.14670
      X06      F(-15)           0.11811        -0.30729        -0.09636
      X07      F(16-20)         0.13175        -0.19038        -0.19733
      X08      F(21-30)         0.13313        -0.02434        -0.33282
      X09      F(31-40)         0.13227         0.12383        -0.37099
      X10      F(41-)           0.11609         0.20136        -0.60162
      
                                     2017年11月16日 木曜日 11時47分53秒  88
           プロット : Factor1*Factor2   凡例 : A = 1 obs, B = 2 obs, ...
            5 +                                        |
              |                                        |
      Factor1 |                                        |
              |                          A        A    |A        B   A
              |                 A    A   A A A AAC  A AABBA BAA   A AA   A  AA
            0 +----A--------A----AA-B--B-A----AABA---BABAAA--B--AAAAA--AA--A--A--A--
              |              A   A A  A A  A  A  AA  A | ABA AAD   BA  A  A    A
              |                       A         A   A  |       A         A
              |                                        |    A
              |                                        |
           -5 +                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      
                                     2017年11月16日 木曜日 11時47分53秒  89
           プロット : Factor2*Factor3   凡例 : A = 1 obs, B = 2 obs, ...
      Factor2 |                       |
          2.5 +                       |
              |          A A    A  A  | AC                  A      A    A
              |     AA   ABA  E BAA AB|  AA  A    AA   AA      A
          0.0 +---AB-----AAAA-BCA---A-+-BFAAA-------A-----A---------A---------------
              |           A  A AB A ABB AAA  AABAB
              |             AA AA  B AAAAA    A                   A
         -2.5 +                       |     A
              |                       |
              |                       |
         -5.0 +                       |
              --+----------+----------+----------+----------+----------+----------+-
               -2         -1          0          1          2          3          4
                                              Factor3
      
    6. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 固有値(Eigenvalue)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj : ラインマーカーの利用が効果的
        • 第1因子 : 全体的な嗜好
        • 第2因子 : 年齢効果 (+ 年輩、- 若年)
        • 第3因子 : 性別効果 (+ 男性、- 女性)
      • 各個体の散布図 : 第2因子と第3因子の関係が面白い

    7. 回転させてみよう : プログラム : les0623.sas

      • 回転の不定性から。
      • 回転させた方が解釈がし易いことも多いから。
       /* Lesson 06-23 */
       /*    File Name = lec0623.sas   11/16/07   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0623.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0623.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data food;                  
        infile '/folders/myfolders/Kougi/food.dat';
        input X01-X10;
          label X01='M(-15)'
                X02='M(16-20)'
                X03='M(21-30)'
                X04='M(31-40)'
                X05='M(41-)'
                X06='F(-15)'
                X07='F(16-20)'
                X08='F(21-30)'
                X09='F(31-40)'
                X10='F(41-)';
      
      proc print data=food(obs=10);
      run;
      proc factor data=food nfactor=3 rotate=varimax out=fscore2;
        var X01-X10;                                : 回転の指定
      run;                                          :
      proc print data=fscore2;
      run;
      proc plot data=fscore2;
        plot factor1*factor2/vref=0.0 href=0.0;
        plot factor2*factor3/vref=0.0 href=0.0;
        plot factor3*factor1/vref=0.0 href=0.0;
      run;
      
    8. 出力結果 : SAS_out0623.txt
                                     2017年11月16日 木曜日 11時45分54秒  33
      FACTOR プロシジャ
      回転方法 : Varimax
                         直交変換行列
                             1               2               3
             1         0.65777         0.53529         0.52990
             2        -0.73396         0.61357         0.29126
             3         0.16922         0.58051        -0.79647
      
                                     2017年11月16日 木曜日 11時45分54秒  34
      FACTOR プロシジャ
      回転方法 : Varimax
      
                       回転後の因子パターン
       
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.95490         0.13415         0.08963
      X02      M(16-20)         0.85255         0.43757         0.13357
      X03      M(21-30)         0.45872         0.81076         0.20605
      X04      M(31-40)         0.22027         0.90003         0.29343
      X05      M(41-)          -0.02727         0.84202         0.46896
      X06      F(-15)           0.91555         0.05731         0.32756
      X07      F(16-20)         0.81272         0.18932         0.49758
      X08      F(21-30)         0.58692         0.31451         0.66919
      X09      F(31-40)         0.38658         0.45484         0.76506
      X10      F(41-)           0.18417         0.37847         0.88485
      
                                     2017年11月16日 木曜日 11時45分54秒  35
      FACTOR プロシジャ
      回転方法 : Varimax
      
                    因子の分散
         Factor1         Factor2         Factor3
       3.9249494       2.8740019       2.5453282
      
                 最終的な共通性の推定値 : 合計 = 9.344279
       
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
                                     2017年11月16日 木曜日 11時45分54秒  37
      FACTOR プロシジャ
      回転方法 : Varimax
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
       1.0000000       1.0000000       1.0000000
      
                                     2017年11月16日 木曜日 11時45分54秒  38
      FACTOR プロシジャ
      回転方法 : Varimax
      
                          標準化スコア係数
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.35650        -0.01839        -0.21738
      X02      M(16-20)         0.28150         0.18161        -0.29360
      X03      M(21-30)         0.07559         0.43873        -0.30350
      X04      M(31-40)        -0.04982         0.47796        -0.20481
      X05      M(41-)          -0.19000         0.37303         0.04733
      X06      F(-15)           0.28692        -0.18126         0.04983
      X07      F(16-20)         0.19300        -0.16084         0.17154
      X08      F(21-30)         0.04912        -0.13688         0.32854
      X09      F(31-40)        -0.06666        -0.06858         0.40164
      X10      F(41-)          -0.17324        -0.16356         0.59933
      
                                     2017年11月16日 木曜日 11時45分54秒  39
      OBS     X01     X02     X03     X04     X05     X06     X07     X08
        1    7.69    7.31    7.47    7.76    7.87    7.51    7.24    7.70
        2    6.59    5.56    6.21    6.04    5.81    6.64    6.11    6.53
        3    4.55    4.18    4.36    4.25    4.53    4.60    3.66    4.04
        4    6.78    6.11    6.30    5.98    5.56    6.37    6.29    5.43
        5    6.47    6.24    6.02    5.42    5.88    6.00    5.60    4.60
        6    6.96    6.81    6.91    6.48    6.23    7.09    7.27    7.13
      
      OBS     X09     X10     Factor1     Factor2     Factor3
        1    7.91    7.95     0.66956     1.82121     1.58069
        2    6.44    6.64     0.16626    -0.19916     1.19252
        3    3.68    4.43    -1.03468    -1.43973    -0.47173
        4    5.32    5.28     0.63900     0.22553    -0.50004
        5    5.40    5.95     0.18242     0.09152    -0.20811
        6    6.86    7.36     0.74034     0.36710     1.34854
      
                                     2017年11月16日 木曜日 11時45分54秒  40
      OBS     X01     X02     X03     X04     X05     X06     X07     X08
        7    6.57    5.70    5.89    5.16    5.30    6.07    5.56    4.50
        8    7.32    6.95    6.02    4.98    4.88    6.82    6.40    5.53
        9    6.51    6.15    5.51    4.68    4.16    5.17    4.81    4.70
       10    6.86    6.05    5.85    6.14    6.75    6.71    5.39    5.42
       11    7.04    6.03    6.53    6.02    6.68    6.78    5.91    6.26
       12    6.59    6.30    6.29    5.94    6.10    5.93    5.52    5.35
      
      OBS     X09     X10     Factor1     Factor2     Factor3
        7    4.92    5.33     0.32215    -0.32438    -0.54816
        8    5.61    5.33     1.29334    -0.70969    -0.33933
        9    4.86    3.82     0.58581    -0.75180    -1.38820
       10    6.03    6.59     0.02089     0.39898     0.55070
       11    5.76    5.95     0.40396     0.58950     0.17643
       12    5.45    5.85     0.19873     0.54822    -0.27773
                                     2017年11月16日 木曜日 11時45分54秒  56
           プロット : Factor1*Factor2   凡例 : A = 1 obs, B = 2 obs, ...
            2 +                 A                |   A
              |                 A   A A     A A  |  A     A
      Factor1 |                      A   A A     |A A  A A A
              |           A         B      A A  AB B AB A      A  A  A        A
              |               A          A A AA  |   A B    A A    A
            0 +-------------------A-A----------B-+AA-A-A--A-AA----------------------
              |               A          AAAA  AA|  A        A     A A  A
              |                       A    B    A|A  BA    AA
              |              A   AA    A AA  B   |   A     A                 A
              |                AA             A  |    B         A
           -2 +                     A   A       A|             A
              --+----------+----------+----------+----------+----------+----------+-
               -3         -2         -1          0          1          2          3
                                              Factor2
      
                                     2017年11月16日 木曜日 11時45分54秒  57
           プロット : Factor2*Factor3   凡例 : A = 1 obs, B = 2 obs, ...
      Factor2 |                                             |
            4 +                                             |
              |                                             |
              |                   A                 A       |
            2 +                                 A           |        A       A
              |              A                  AA  A       | A B   A    A A
              |        A       A            A A    A  A AA  |ABB  BAB      AAAA A
            0 +-----------------------------A------AA-BB--AA+ABBA-AAABAB-A----------
              |                            A A   AAA    A AB| AAA AB  C A  A
              |                             A   A     ABA A | A B   AB  A
           -2 +                            A        A  A A  |
              --+----------+----------+----------+----------+----------+----------+-
               -4         -3         -2         -1          0          1          2
                                              Factor3
      
                                     2017年11月16日 木曜日 11時45分54秒  58
           プロット : Factor3*Factor1   凡例 : A = 1 obs, B = 2 obs, ...
      Factor3 |                                        |
          2.5 +                                        |
              |                         A   B          |A      AAA    A
              |               A     AABAA A BA   ACB A AAA     AB    A   A A     A
          0.0 +--------------A------C-A--A-B---A---A-A-+-ABACAAA-BAA-A--AABAA-------
              |                A         AA A  A  A B B|   AA  AABBA A AA
              |                             A       A  |A    A A                A
         -2.5 +               A       A                |             A
              |                    A                   |
              |                                        |
         -5.0 +                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor1
      
    9. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • (回転行列, Orthogonal Transformation Matrix)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj
        • 第1因子 : 若年層の嗜好 (+ 若年、- 年輩)
        • 第2因子 : 成人男性の嗜好 (+ 成年男子)
        • 第3因子 : 成人女性の嗜好 (+ 成年女子)
      • 各個体の散布図 : 各因子間の関係が面白い。各個体の具体的な位置を把握。
      • 回転前と回転後でどのように解釈が変化したか?

    10. 代表的な回転法 :
      • バリマックス法(rotate=varimax) : 直交回転 : 因子軸間は直交(独立性)
      • プロマックス法(rotate=promax) : 斜交回転 : 因子軸間に相関性

  7. [例題2] 趣味の特性を探ってみよう : 193 ページ
    30種類の趣味の性、年齢毎の特性調査の結果 : データ : syumi.dat

    1. プログラム : les0624.sas

       /* Lesson 06-24 */
       /*    File Name = lec0624.sas   11/16/07   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=20;
      
      proc printto log   = '/folders/myfolders/Kougi/SAS_log0624.txt'
                   print = '/folders/myfolders/Kougi/SAS_out0624.txt' new;
      
      ods listing gpath='/folders/myfolders/Kougi/SAS_ODS99';
      
      data hobby;
        infile '/folders/myfolders/Kougi/syumi.dat';
        input code $ X1-X6;
          label X1='M(-29)'
                X2='M(30-49)'
                X3='M(50-)'
                X4='F(-29)'
                X5='F(30-49)'
                X6='F(50-)';
      
      proc print data=hobby(obs=10);
      run;
      proc factor data=hobby nfactor=2 out=fscore;
        var X1-X6;
      run;
      proc plot data=fscore;                           : 回転前
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      proc factor data=hobby nfactor=2 rotate=varimax out=fscore2;
        var X1-X6;
      run;
      proc plot data=fscore2;                          : 回転後
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      
    2. 出力結果 : SAS_out0624.txt
                                     2017年11月16日 木曜日 11時47分02秒  59
      OBS    code     X1      X2      X3      X4      X5      X6
        1     A      4.00    4.25    3.83    4.50    4.67    4.00
        2     B      4.17    3.89    4.00    4.50    4.17    3.75
        3     C      3.83    3.44    2.83    3.57    3.17    1.50
        4     D      2.83    4.22    3.83    3.71    3.00    2.25
        5     E      4.17    4.11    3.83    3.57    4.00    3.75
        6     F      2.33    3.56    3.33    2.93    2.83    2.75
        7     G      1.83    2.44    2.33    3.71    3.83    3.75
        8     H      2.50    1.89    2.00    4.21    3.17    3.75
        9     I      2.00    1.44    2.00    4.07    3.33    3.50
       10     J      4.00    3.33    3.33    3.00    3.17    2.25
      
                                     2017年11月16日 木曜日 11時47分02秒  60
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2017年11月16日 木曜日 11時47分02秒  61
      
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値 : 合計 = 6  平均 = 1
       
               固有値           差      比率      累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                                     2017年11月16日 木曜日 11時47分02秒  63
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
                                     2017年11月16日 木曜日 11時47分02秒  64
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                 最終的な共通性の推定値 : 合計 = 4.491236
       
              X1           X2           X3           X4           X5           X6
      
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                                     2017年11月16日 木曜日 11時47分02秒  66
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)           0.19212         0.36217
      X2      M(30-49)         0.21734         0.36976
      X3      M(50-)           0.23398         0.27104
      X4      F(-29)           0.30164        -0.20320
      X5      F(30-49)         0.29016        -0.24622
      X6      F(50-)           0.22454        -0.35904
      
                                     2017年11月16日 木曜日 11時47分02秒  67
             プロット : Factor1*Factor2   記号は code の値です。
               (NOTE: 2 obs は表示されません。)
            2 +                                        A B
              |                                        |   Z  E
      Factor1 |                               R        |
              |                                        |
              |                          3   Q     M   |           D    O
            0 +---------------HG-------------S-----2---+--F--------C----------------
              |           I            K          P    |          V   N
              |                                        |               U   W
              |                                      1 |Y
              |                                        T         X
           -2 +                                    4   |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      
                                     2017年11月16日 木曜日 11時47分02秒  68
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2017年11月16日 木曜日 11時47分02秒  69
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値 : 合計 = 6  平均 = 1
       
               固有値           差      比率      累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                                     2017年11月16日 木曜日 11時47分02秒  71
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
                                     2017年11月16日 木曜日 11時47分02秒  72
      FACTOR プロシジャ
      初期因子抽出法 : 主成分解
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                 最終的な共通性の推定値 : 合計 = 4.491236
       
              X1           X2           X3           X4           X5           X6
      
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2017年11月16日 木曜日 11時47分02秒  73
      FACTOR プロシジャ
      回転方法 : Varimax
      
                 直交変換行列
                             1               2
             1         0.77751         0.62886
             2        -0.62886         0.77751
      
               回転後の因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.01176         0.82361
      X2      M(30-49)         0.05723         0.87743
      X3      M(50-)           0.20121         0.77199
      X4      F(-29)           0.86678         0.24430
      X5      F(30-49)         0.88957         0.16603
      X6      F(50-)           0.87359        -0.10049
      
            因子の分散
         Factor1         Factor2
       2.3497071       2.1415286
      
                 最終的な共通性の推定値 : 合計 = 4.491236
       
              X1           X2           X3           X4           X5           X6
      
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2017年11月16日 木曜日 11時47分02秒  76
      FACTOR プロシジャ
      回転方法 : Varimax
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)          -0.07838         0.40241
      X2      M(30-49)        -0.06354         0.42417
      X3      M(50-)           0.01147         0.35788
      X4      F(-29)           0.36232         0.03170
      X5      F(30-49)         0.38045        -0.00897
      X6      F(50-)           0.40037        -0.13795
      
                                     2017年11月16日 木曜日 11時47分02秒  78
             プロット : Factor1*Factor2   記号は code の値です。
                2 +                              |
                  |                              |                  A
          Factor1 |  I     H G           3       |  R              ZB
                  |                        Q     |                  E
                  |              K     S         |M
                0 +------------------------P--2--+--------------D---------------
                  |                              |F        C J  L  O
                  |                      Y       |   V      N
                  |         4      1 T           |     U
                  |                          X   |        W
               -2 +                              |
                  ---+-------------+-------------+-------------+-------------+--
                    -2            -1             0             1             2
                                              Factor2
      
    3. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj

      • 因子数は2で良さそう
      • 回転前 : 因子の特徴付け
        • 第1因子 : 全体的な傾向
        • 第2因子 : 性別因子 (+ 男性、- 女性)
        • 各個体の散布図 : 各趣味がどの性別に好まれるか
      • 回転後 : 因子の特徴付け
        • 第1因子 : 女性因子 (+ 女性)
        • 第2因子 : 男性因子 (+ 男性)
        • 各個体の散布図 : 性別毎の特徴付け、両性に好まれる趣味
      • 記号を付けたことにより、より判り易く(& 解り易く)なっている
      • 年齢の効果はあまり見られない
      • 回転前と回転後でどのように解釈が変化したか?

  8. 因子数の決定基準


  9. 主成分分析(PCA)と因子分析(FA): 目的は同じでも異なる手法

  10. 同じデータを両手法に適用して、その共通性と違いを体験してみよう
    上記で示したデータも含めていくつかデータを置いておく。 興味があればダウンロードして両手法に適用してはどうだろうか。
    1. seiseki.dat
      中学2年生の成績データ。23名x5科目。国語、社会、数学、理科、英語。
      配布資料に掲載され、例題に使われていたデータ。
    2. food.dat
      100 種類の食品の嗜好度データ。100食品x10グループ。
    3. syumi.dat
      趣味に関するアンケート調査データ。30種類x6グループ。

  11. 次回は、... : 11月30日
[DIR]講義のホームページへ戻ります