主成分分析と因子分析

統計モデル解析特論I/II : 第05回 (10/30/18)

 いくつか(p個)の変量の値を情報の損失をできるだけ少なくして、 少数変量(m個、m<p)の総合的指標(主成分)で代表させる方法として 主成分分析(Principal Component Analysis, PCA)と 因子分析(Factor Analysis, FA)がある。 いくつかのテストの成績を総合した総合的成績、 いろいろな症状を総合した総合的な重症度、 種々の財務指標に基づく企業の評価 等を求めたいといった場合に用いられる。 p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、 次元を減少させる(reduce)方法と言うこともでき、 多変量データを要約する有力な方法である。
 両者は似た目的に使われるが、元になっている考え方は異なるので 利用する場面では注意が必要である。違いに焦点を当てながら説明する。
  1. 2変量の場合の主成分分析 : 理解を助けるため
    1. 定式化 : 配布資料 54ページ〜
      • 重み(係数) : a1、a2
      • 合成変量(線形結合) : z
      • よく代表するように、a1 と a2 を決める。
      • より広がって測定できる軸に沿うと情報量が多い。
           [参考:立体の測定] ノギス
      • 全測定値の分散を最大化する軸を決定する。

    2. 身長と体重の総合指標を求めよう : プログラム : les0501.sas

       /* Lesson 05-1 */
       /*    File Name = les0501.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0501_log.txt'
                   print = 'Kougi/les0501_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc plot data=gakusei;                        : 散布図
        plot shintyou*taijyuu;                       : 元の変量のプロット
      run;                                           :
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu;                        : 2変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
      run;                                           :
                                                     : 参考までに、
      proc sort data=outprin;                        : 説明のためにソートしてみる
        by prin1;                                    : 第一主成分で
      run;                                           :
      proc print data=outprin;                       : 体重がややが効いていることの確認
      run;                                           :
      

    3. 出力結果 : les0501_Results.txt , les0501_out.pdf
      • 身長と体重の散布図
      • 各変量の平均、標準偏差、分散共分散行列
      • 固有値、比率(寄与率)、累積寄与率 : 解釈に使う
      • 固有ベクトル(係数a1とa2) : 解釈に使う
      • 主成分得点 : 各個人の得点(z)、2つある
      • 第1軸と第2軸の主成分得点の散布図
                                     2018年10月30日 火曜日 07時50分38秒  23
      
          : shintyou*taijyuu. A=1, B=2, ...
                200 +
                    |
                    |
                    |
                    |                                 A  A     A
                    |                            AA B A A            A
                180 +                         A  BACEA  G B
                    |                      AB BBCGCBDCH A A AD          A  A
                    |                      ABBCBDIJCCADBCB  A    A
           shintyou |                      BBBGEEHFDEBAAB A  A      A
                    |                    H AHEKCDBBAF     AA A
                    |                   BA EF A  BBAA
                160 +                  B DCCDACAAA
                    |                BAACDCDA  A  A
                    |            A   CABC  A  A
                    |                  BA  A
                    |              A BA
                    |
                140 +
                    ---+------------+------------+------------+------------+--
                      20           40           60           80           100
                                              taijyuu
      
                                     2018年10月30日 火曜日 07時50分38秒  24
      PRINCOMP プロシジャ
      
      オブザベーション数              325
      変数の数                          2
      
                  単純統計量
                    shintyou           taijyuu
      Mean       168.6947692       58.78092308
      StD          8.0436274        9.34693152
      
                    共分散行列
                        shintyou           taijyuu
      shintyou       64.69994169       52.97829497
      taijyuu        52.97829497       87.36512877
      
      総分散    152.06507047
      
                                     2018年10月30日 火曜日 07時50分38秒  25
      PRINCOMP プロシジャ
                     共分散行列の固有値
               固有値           差           比率        累積
         1    130.209351    108.353632      0.8563      0.8563
         2     21.855719                    0.1437      1.0000
      
               固有ベクトル
                       Prin1         Prin2
      shintyou      0.628817      0.777553
      taijyuu       0.777553      -.628817
      
                                     2018年10月30日 火曜日 07時50分38秒  26
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s       P         P
                t      j    y  t     u       r        u       r         r
       O   s    y      y    o  a     k       y        u       i         i
       b   e    o      u    u  k     a       e        w       n         n
       s   x    u      u    i  u     i       r        a       1         2
      
        1  F  145.0  38.0   .  J   10000               .  -31.0580  -5.35654
        2  F  146.7  41.0  85  J   10000  Vodafone  6000  -27.6563  -5.92115
        3  F  148.0  42.0   .  J   50000               .  -26.0613  -5.53915
        4  F  148.0  43.0  80  J   50000  DoCoMo    4000  -25.2837  -6.16797
        5  F  149.0  45.0   .  G   60000               .  -23.0998  -6.64805
        6  F  150.0  46.0  86      40000               .  -21.6934  -6.49931
        7  F  151.0  45.0   .  J   20000  docomo    5000  -21.8422  -5.09294
        8  F  151.0  50.0   .  G   60000  J-PHONE      .  -17.9544  -8.23703
        9  F  151.7  41.5  80  J   35000               .  -24.1234  -2.34780
       10  F  152.0  35.0  77  J   60000  DoCoMo    2000  -28.9889   1.97278
       11  F  152.0  43.0   .  J   20000  au        3500  -22.7685  -3.05776
       12  F  152.0  44.0   .      45000  DoCoMo    4000  -21.9909  -3.68657
       13  F  153.0  41.0   .  J  125000  No           .  -23.6948  -1.02257
       14  F  153.0  42.0   .  G       0  Vodafone  1000  -22.9172  -1.65139
       15  F  153.0  46.5  87  G   10000               .  -19.4182  -4.48106
      
                                     2018年10月30日 火曜日 07時50分38秒  27
            : Prin2*Prin1. A=1, B=2, ...
       Prin2 |                                  |
          20 +                                  |
             |                                  |
             |                                  |
             |                                  |   A
          10 +                                A |      B A
             |                              B   DAAAABAA AA A A
             |                         DD  AA DACACADCA BCB  A  A
             |           A         BAC   AACEEDDEBCHDDBAACC  FA
           0 +---------------A-BAAAAABC-FD-BEDAFBEBGCCACBCA--A--A------A-----------
             |               AC AAABAF AAD A  AAA DDBCAACBA    A
             |         A  AAA  AB B C  A C A AA AA BBAAAACC  A  BA
             |                AA  AA     A  B  B|AA       A  A AA
         -10 +                        A         |        AA  A            A
             |                             A    |                 A
             |                                  |         A                A
             |                                  |                  A          A
         -20 +                                  |
             |                                  |
             ---+-------+-------+-------+-------+-------+-------+-------+-------+--
               -40     -30     -20     -10      0      10      20      30      40
                                              Prin1
      
                                     2018年10月30日 火曜日 07時50分38秒  28
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s        P         P
                t      j    y  t     u       r        u        r         r
       O   s    y      y    o  a     k       y        u        i         i
       b   e    o      u    u  k     a       e        w        n         n
       s   x    u      u    i  u     i       r        a        1         2
      
        1  F  145.0  38.0   .  J   10000                .  -31.0580  -5.35654
        2  F  152.0  35.0  77  J   60000  DoCoMo     2000  -28.9889   1.97278
        3  F  146.7  41.0  85  J   10000  Vodafone   6000  -27.6563  -5.92115
      ≪中略≫
                                     2018年10月30日 火曜日 07時50分39秒  42
      Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa  Prin1     Prin2
      309  M    173.5    76.5     .    G     100000             .  16.7991  -7.4057
      310  M    182.0    70.0    90    G     100000             .  17.0900   3.2908
      311  M    185.0    68.0    93    J          0             .  17.4213   6.8811
      312  M    175.0    77.0    95    G     130000             .  18.1311  -6.5538
      313  M    179.1    74.2     .               0 au       4000  18.5321  -1.6052
      314  M    175.0    79.0     .    J          0 No          0  19.6862  -7.8115
      315  M    176.5    78.0    96    J      10000             .  19.8519  -6.0163
      316  M    177.0    78.0     .    J      40000             .  20.1663  -5.6275
      317  M    181.5    74.5     .    G     120000 au       3000  20.2746   0.0723
      318  M    185.0    72.0     .    J      30000          7000  20.5315   4.3658
      319  M    178.0    78.0   110    G      50000             .  20.7951  -4.8500
      320  M    173.0    84.0    46    G     350000             .  22.3164 -12.5106
      321  M    169.3    88.5    94    J          0             .  23.4887 -18.2173
      322  M    186.0    82.0     .    J          0             .  28.9359  -1.1448
      323  M    182.0    90.0   100    J      40000             .  32.6411  -9.2856
      324  M    178.0    95.0     .            1000 No          .  34.0135 -15.5399
      325  M    178.0   100.0   112    G      60000             .  37.9013 -18.6840
      

    4. 解釈方法
      • 寄与率 : その軸がどの程度説明力を持っているか : 第1軸だけで十分(85.6%)。第2軸に含まれる説明力は小さい(14.4%)。
      • 固有ベクトル : その軸の特徴を示している : 身長と体重の重みはほぼ同等だが、体重がやや大きめに効いている(第1軸)
      • 主成分得点と散布図 : 各個人がどこに付置されているか
      • 第1軸 : 全体的な体格の指標。身長と体重を足したような指標。

  2. 3変量以上の主成分分析
    1. 定式化 : 資料 71ページ〜
      • 2変量の拡張
      • 合成変量(線形結合) : z
      • 合成変量の分散を最大化する軸を決定する。

    2. 身長、体重、胸囲での総合指標を求めてみよう : プログラム : les0502.sas
       /* Lesson 05-2 */
       /*    File Name = les0502.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0502_log.txt'
                   print = 'Kougi/les0502_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu kyoui;                  : 3変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
        plot prin3*prin2/vref=0 href=0;              :
        plot prin3*prin1/vref=0 href=0;              :
      run;                                           :
      

    3. 出力結果 : les0502_Results.txt , les0502_out.pdf
      • 各変量の平均、標準偏差、共分散行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

      
                                     2018年10月30日 火曜日 07時54分57秒  45
      PRINCOMP プロシジャ
      
      オブザベーション数              114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                             共分散行列
                        shintyou           taijyuu             kyoui
      shintyou        76.0865898        69.6653222        23.7439373
      taijyuu         69.6653222       118.0010123        43.5906226
      kyoui           23.7439373        43.5906226        69.9335507
      
      総分散    264.02115277
      
               固有値           差          比率        累積
         1    189.966471    138.636164      0.7195      0.7195
         2     51.330307     28.605932      0.1944      0.9139
         3     22.724375                    0.0861      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.539085      -.407903      0.736887
      taijyuu       0.751825      -.161336      -.639320
      kyoui         0.379667      0.898658      0.219698
      
                                     2018年10月30日 火曜日 07時54分58秒  47
              s
              h     t          k      c
              i     a     j    o      a       t
              n     i   k i    d      r       s      P       P        P
              t     j   y t    u      r       u      r       r        r
       O  s   y     y   o a    k      y       u      i       i        i
       b  e   o     u   u k    a      e       w      n       n        n
       s  x   u     u   i u    i      r       a      1       2        3
      
        1 F 145.0 38.0  . J  10000             .    .       .       .     
        2 F 146.7 41.0 85 J  10000 Vodafone 6000 -24.9565 10.2382 -4.10085
        3 F 148.0 42.0  . J  50000             .    .       .       .     
        4 F 148.0 43.0 80 J  50000 DoCoMo   4000 -24.6504  4.8920 -5.52002
        5 F 149.0 45.0  . G  60000             .    .       .       .     
        6 F 150.0 46.0 86    40000             . -19.0388  8.9841 -4.64602
        7 F 151.0 45.0  . J  20000 docomo   5000    .       .       .     
        8 F 151.0 50.0  . G  60000 J-PHONE     .    .       .       .     
        9 F 151.7 41.5 80 J  35000             . -23.7835  3.6248 -1.83456
       10 F 152.0 35.0 77 J  60000 DoCoMo   2000 -29.6477  1.8551  1.88299
       11 F 152.0 43.0  . J  20000 au       3500    .       .       .     
       12 F 152.0 44.0  .    45000 DoCoMo   4000    .       .       .     
       13 F 153.0 41.0  . J 125000 No          .    .       .       .     
       14 F 153.0 42.0  . G      0 Vodafone 1000    .       .       .     
       15 F 153.0 46.5 87 G  10000             . -16.6659  8.5784 -2.53532
      
                                     2018年10月30日 火曜日 07時54分58秒  48
            : Prin2*Prin1. A=1, B=2, ...
      Prin2 |                            |
         20 +                            |
            |                            |  A    A           A
            |           A   AA         A |     A     A                    A
            |           B   AAAACDAA  AB |  A AB    A
          0 +-------A----A--AAACBADC-BCA-AC-CF-ABADB--B-AA-A-------A----------------
            |                 A       A  AAA BAA AC  AA
            |              A   A     A   | C A AA   A
            |                       A    |
        -20 +                            |
            |                  A         |
            |                            |
            |                            |
        -40 +                            |    A
            |                            |
            |                            |
            |                            |
        -60 +                            |
            |                            |
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      NOTE: 211 obs が欠損値です。
      
                                     2018年10月30日 火曜日 07時54分58秒  49
            : Prin3*Prin2. A=1, B=2, ...
      Prin3 |                                                  |
         20 +                                                  |
            |                                                  |
            |                                                  |
            |                                                  |
         10 +                                         A   A    |
            |                                       A    A AC  |
            |                                      A  AA  AA  BAABA
            |                                         A    B BADEE  ABA
          0 +-----------------------------------A----A-A---AA-ADAEDB-ACA-----AA-----
            |                       A                A   A  ACAB D DA  AA    A
            |                                          A A    B|BBA B   AA
            |                                                  A
        -10 +                                                 A|       A
            |                                                  |           A
            |                                                  |A
            |                                                  |
        -20 +        A                                         |
            |                                                  |
            -+---------+---------+---------+---------+---------+---------+---------+
            -50       -40       -30       -20       -10        0        10        20
                                              Prin2
      NOTE: 211 obs が欠損値です。
      
                                     2018年10月30日 火曜日 07時54分58秒  50
            : Prin3*Prin1. A=1, B=2, ...
      Prin3 |                            |
         20 +                            |
            |                            |
            |                            |
            |                            |
         10 +                            | A   A
            |                            | A AA   B   A
            |                  AA B      |AA A    AAAAA
            |       A       A  AA  B  BA AAABD CAA    A
          0 +---------------ABB-CCBAABB--+A-AB--AAA-AA-------A----------------------
            |           AA   AAC AAA   A AA BAAB  B      A
            |           B  AA    A   AAA |      AAA     A          A
            |                            |         A
        -10 +                  A       A |
            |                            |                                A
            |                            |                 A
            |                            |
        -20 +                            |    A
            |                            |
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      NOTE: 211 obs が欠損値です。
      

    4. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.4%)。
      • 第1軸 : 全体的な体格の因子。特に体重が効いている。
      • 第2軸 : 太さの因子(?)。胸囲が正で身長が負。

      • 第3軸 : 華奢さの因子(?)。無視しても良い軸であるが。(8.6%)。

  3. 相関行列を使う理由

    1. 相関行列を用いて体格の総合指標を求めてみよう : プログラム : les0503.sas

       /* Lesson 05-3 */
       /*    File Name = les0503.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0503_log.txt'
                   print = 'Kougi/les0503_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      
      run;                                          :
      proc princomp data=gakusei out=outprin;       : 相関係数を使って
        var shintyou taijyuu kyoui;                 :
      run;                                          :
      proc print data=outprin(obs=15);
      run;
      proc plot data=outprin;
        plot prin2*prin1/vref=0 href=0;
        plot prin3*prin2/vref=0 href=0;
        plot prin3*prin1/vref=0 href=0;
      run;
      

    2. 出力結果 : les0503_Results.txt , les0503_out.pdf
      • 各変量の平均、標準偏差、相関行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

      
                                     2018年10月30日 火曜日 07時56分11秒  99
      PRINCOMP プロシジャ
      
      オブザベーション数             114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                       相関行列
                    shintyou      taijyuu       kyoui
      shintyou        1.0000       0.7352      0.3255
      taijyuu         0.7352       1.0000      0.4799
      kyoui           0.3255       0.4799      1.0000
      
                      相関行列の固有値
               固有値           差           比率        累積
         1    2.04696555    1.33664820      0.6823      0.6823
         2    0.71031735    0.46760025      0.2368      0.9191
         3    0.24271710                    0.0809      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.599200      -.483881      0.637823
      taijyuu       0.640769      -.187770      -.744418
      kyoui         0.479974      0.854752      0.197544
      

    3. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.9%)。
      • 第1軸 : 全体的な体格の因子。
      • 第2軸 : 太さの因子。
      • 分散共分散行列を使ったときよりも 第1軸の固有ベクトル同士が近い値になった。 しかし、軸の解釈に違いはない。 その理由はこの例では 3変量のスケールや分散に それほどの違いがないためと想像される。
      • 分散共分散行列と相関行列を使ったときの違いを見てみたければ、 shintyou のみを mm 単位で測定したと考えて、 100倍したものをデータとして両者の出力を比較してみよ。
        プログラム : les0504.sas 、出力結果 : les0504_Results.txt , les0504_out.pdf

  4. 主成分の数の決定基準 : 配布資料 80ページ
    明確に決まっているわけではないが、以下のような基準が一般的に 用いられている。また、結果の解釈の都合上、多少増減させることもある。


  5. 因子分析
     前述の主成分分析の場合は、 データの散らばり方(分散)を捉えてデータ特性を把握する手法であった。 一方、因子分析は、変数間に(潜在的な)構造を持ち込んで関係を探る手法である (少し理解しにくいかもしれないが)。 この手法は心理学の分野で広く利用されている。
    1. 定式化 : 配布資料 180ページ〜
      • 測定対象 zji : 成績、測定値、...。
      • 共通因子 : fi : 因子得点(測定不能)、個体の特徴付け、i=1,2,...,n.
      • 因子負荷量 : aj : 因子の特徴付け、j=1,2,...,p.
      • 独自因子 : eji : 変動
      • いくつかの仮定 : fi、aj、eji

    2. 因子の解釈
    3. 因子軸の回転 : 直交回転、斜交回転

    4. 因子数を決めるために行きつ戻りつの試行錯誤が必要になる

  6. [例題1] 食品の嗜好性を探ってみよう : 196ページ〜、データは90ページ〜
    100種類の食品の性、年齢毎の嗜好度調査の結果 : データ : food.dat

    1. まずは因子数を決めよう : プログラム : les0505.sas

       /* Lesson 05-5 */
       /*    File Name = les0505.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0505_log.txt'
                   print = 'Kougi/les0505_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data food;                  
        infile 'Kougi/food.dat';          : ファイルの読み込み
        input X01-X10;                    : 変量リスト、連続的に
          label X01='M(-15)'              : 各変量に解りやすい名前を付ける
                X02='M(16-20)'            :   M : 男性
                X03='M(21-30)'            :   F : 女性
                X04='M(31-40)'            :  ()内 : 年齢
                X05='M(41-)'              :
                X06='F(-15)'              :
                X07='F(16-20)'            :
                X08='F(21-30)'            :
                X09='F(31-40)'            :
                X10='F(41-)';             :
                                          :
      proc print data=food(obs=10);       : データの表示
      run;                                :
      proc factor data=food;              : オプションを付けないと主成分分析
        var X01-X10;                      : 解析に使う変量リスト
      run;                                :
      
    2. 出力結果 : les0505_Results.txt , les0505_out.pdf
                                     2018年10月30日 火曜日 07時56分46秒 176
      
      Obs    X01    X02    X03    X04    X05    X06    X07    X08    X09    X10
      
        1   7.69   7.31   7.47   7.76   7.87   7.51   7.24   7.70   7.91   7.95
        2   6.59   5.56   6.21   6.04   5.81   6.64   6.11   6.53   6.44   6.64
        3   4.55   4.18   4.36   4.25   4.53   4.60   3.66   4.04   3.68   4.43
        4   6.78   6.11   6.30   5.98   5.56   6.37   6.29   5.43   5.32   5.28
        5   6.47   6.24   6.02   5.42   5.88   6.00   5.60   4.60   5.40   5.95
        6   6.96   6.81   6.91   6.48   6.23   7.09   7.27   7.13   6.86   7.36
        7   6.57   5.70   5.89   5.16   5.30   6.07   5.56   4.50   4.92   5.33
        8   7.32   6.95   6.02   4.98   4.88   6.82   6.40   5.53   5.61   5.33
        9   6.51   6.15   5.51   4.68   4.16   5.17   4.81   4.70   4.86   3.82
       10   6.86   6.05   5.85   6.14   6.75   6.71   5.39   5.42   6.03   6.59
      
                                     2018年10月30日 火曜日 07時56分46秒 177
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
                                     2018年10月30日 火曜日 07時56分46秒 178
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 10  平均 = 1
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      2 因子が MINEIGEN 基準により示されます。
      
                     因子パターン
                                Factor1         Factor2
      X01      M(-15)           0.74741        -0.59244
      X02      M(16-20)         0.86579        -0.31836
      X03      M(21-30)         0.84491         0.22079
      X04      M(31-40)         0.78216         0.47602
      X05      M(41-)           0.68129         0.67325
      X06      F(-15)           0.80647        -0.54140
      X07      F(16-20)         0.89959        -0.33542
      X08      F(21-30)         0.90901        -0.04289
      X09      F(31-40)         0.90316         0.21817
      X10      F(41-)           0.79262         0.35477
      
            因子の分散
         Factor1         Factor2
       6.8279551       1.7618731
      
                 最終的な共通性の推定値 : 合計 = 8.589828
       
             X01             X02             X03             X04             X05
      0.90961791      0.85094991      0.76262367      0.83837129      0.91741340
      
             X06             X07             X08             X09             X10
      0.94352040      0.92177476      0.82814690      0.86329813      0.75411185
      
    3. 解釈方法 :
      • 固有値(Eigenvalue) : 相関行列を用いた主成分分析の計算結果
        • 相関行列を用いた主成分が計算される (因子数を決めるため)
        • [コメント] 理解を難しくしている一つの理由かもしれない
        • 比較のためのプログラム : les0505pca.sas,
        • 出力結果 : les0505pca_Results.txt , les0505pca_out.pdf
      • システム側からは因子数は2だと判断された : 固有値が1より大きい
      • 因子負荷量(Factor Pattern) : aj
      • 因子毎の分散(Variance explained by each factor) : 総分散(10, 変量数と等しくなる)のどれだけを説明しているか。因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。

      • 因子数の決定 : 解析者側の判断
        • 固有値の変化量からすると、3 でも良さそう : 3 と 4 の間が空いてる
        • 因子数を 3 として計算してみよう

        • 因子数の決め方は、主成分分析の時と同様の考え方
          • 累積寄与率(Cumulative)
          • 固有値の値(Eigenvalue, Proportion)
          • 固有値間のギャップ(Difference) 等

    4. 因子数3で解析 : プログラム : les0506.sas

       /* Lesson 05-6 */
       /*    File Name = les0506.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0506_log.txt'
                   print = 'Kougi/les0506_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data food;                  
        infile 'Kougi/food.dat';
        input X01-X10;
          label X01='M(-15)'
                X02='M(16-20)'
                X03='M(21-30)'
                X04='M(31-40)'
                X05='M(41-)'
                X06='F(-15)'
                X07='F(16-20)'
                X08='F(21-30)'
                X09='F(31-40)'
                X10='F(41-)';
      
      proc print data=food(obs=10);
      run;                                          :
      proc factor data=food nfactor=3 out=fscore;   : 因子数3、出力の保存
        var X01-X10;                                :
      run;                                          :
      proc plot data=fscore;                        :
        plot factor1*factor2/vref=0.0 href=0.0;     : 第1因子 x 第2因子、軸
        plot factor2*factor3/vref=0.0 href=0.0;     : 第2因子 x 第3因子、軸
      run;                                          :
      
    5. 出力結果 : les0506_Results.txt , les0506_out.pdf
                                     2018年10月30日 火曜日 10時19分47秒  31
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード             100
      使用されたレコード             100
      有意性検定のための             100
      
                                     2018年10月30日 火曜日 10時19分47秒  32
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 10  平均 = 1
       
               固有値           差           比率       累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
      3 因子が NFACTOR 基準により示されます。
      
                             因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.74741        -0.59244         0.16808
      X02      M(16-20)         0.86579        -0.31836         0.29190
      X03      M(21-30)         0.84491         0.22079         0.38417
      X04      M(31-40)         0.78216         0.47602         0.32604
      X05      M(41-)           0.68129         0.67325         0.11067
      X06      F(-15)           0.80647        -0.54140        -0.07270
      X07      F(16-20)         0.89959        -0.33542        -0.14888
      X08      F(21-30)         0.90901        -0.04289        -0.25110
      X09      F(31-40)         0.90316         0.21817        -0.27989
      X10      F(41-)           0.79262         0.35477        -0.45389
      
                    因子の分散
         Factor1         Factor2         Factor3
       6.8279551       1.7618731       0.7544512
      
                 最終的な共通性の推定値 : 合計 = 9.344279
      
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
       1.0000000       1.0000000       1.0000000
      
                          標準化スコア係数
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.10946        -0.33626         0.22279
      X02      M(16-20)         0.12680        -0.18069         0.38691
      X03      M(21-30)         0.12374         0.12531         0.50920
      X04      M(31-40)         0.11455         0.27018         0.43215
      X05      M(41-)           0.09978         0.38212         0.14670
      X06      F(-15)           0.11811        -0.30729        -0.09636
      X07      F(16-20)         0.13175        -0.19038        -0.19733
      X08      F(21-30)         0.13313        -0.02434        -0.33282
      X09      F(31-40)         0.13227         0.12383        -0.37099
      X10      F(41-)           0.11609         0.20136        -0.60162
      
                                     2018年10月30日 火曜日 10時19分47秒  37
      Obs     Factor1     Factor2     Factor3
        1     2.25291     1.08640    -0.08844
        2     0.63467     0.10311    -1.03729
        3    -1.70123    -0.26136    -0.63515
        4     0.27607    -0.47626     0.63732
        5     0.05870    -0.13835     0.24975
        6     1.39807     0.07464    -0.73569
        7    -0.25220    -0.59513     0.30280
        8     0.29102    -1.48354     0.07715
        9    -0.75271    -1.29557     0.76837
       10     0.51913     0.38987    -0.20348
       11     0.67476     0.11659     0.27005
       12     0.27701     0.10962     0.57308
       13    -0.46265     0.26118    -0.61307
       14     0.54447    -0.57035     0.82553
       15    -0.81584    -1.12638     1.02178
       16    -0.08734    -1.60852    -0.07858
       17    -0.85600    -0.70655    -0.56938
       18     0.29910    -0.54190    -0.19285
       19     0.64620    -1.36604    -0.00671
       20     1.15931     1.59311     0.30809
       21     0.34115     0.78412    -0.73851
       22    -1.03516    -0.48533     0.34267
       23    -1.22772    -0.16432     0.30277
       24     0.94436     0.53398     0.62397
       25     0.71842     0.49797     1.59663
      
                                     2018年10月30日 火曜日 10時19分47秒  38
      Obs     Factor1     Factor2     Factor3
       26    -0.02493     0.45009     1.50165
       27    -0.94010     1.22439     0.31906
       28    -0.63520    -0.36217     1.28858
       29    -0.27147    -1.48307    -0.28496
       30     0.44299    -1.08307     0.84483
       31    -0.48070    -0.09009     0.23657
       32     1.59074     0.74856     2.26516
       33     0.33662    -0.54712     1.01287
       34     1.02984     1.40739     0.31105
       35    -1.29967     1.47454    -0.57722
       36    -0.56029     0.96566    -1.12981
       37    -1.46600     0.88510    -1.66154
       38     0.23978     1.25254     2.03818
       39    -1.07785     0.91302    -0.49913
       40    -0.83919     0.62523    -0.55280
       41    -0.04105     2.01037     0.29261
       42     0.07093     1.74158    -0.28557
       43     0.08957     0.45607    -0.69377
       44    -1.90141    -1.30662     0.17474
       45    -1.15144     0.44262     1.22169
       46     1.07517     1.10314    -0.39911
       47     0.91237     0.00029     0.21220
       48     0.90790     0.39605     0.43370
       49     0.13268    -0.65832     0.86390
       50     0.58014    -0.57837    -0.12539
      
                                     2018年10月30日 火曜日 10時19分47秒  39
      Obs     Factor1     Factor2     Factor3
       51    -0.08833     0.67625    -1.55588
       52     0.24065     1.50576    -1.19261
       53    -0.84391     0.24188    -1.79801
       54    -1.41049     0.24703    -1.72548
       55     0.93494     1.71335    -0.99357
       56     0.21329    -0.01602    -0.52089
       57    -0.06281     0.86939    -0.98196
       58    -1.37917     0.33731    -1.76559
       59    -2.10010     0.64278    -0.12422
       60    -1.05416    -0.92697    -0.37916
       61     0.87483    -0.20714    -0.65199
       62    -0.96357     0.18088    -1.06158
       63    -0.09304     0.93893    -0.70392
       64     0.06870     1.03025    -0.54047
       65    -1.03859     0.59915    -1.19403
       66    -1.05786     0.62918    -0.76168
       67     1.86031     0.73991    -0.22697
       68    -0.03094     1.32584     0.21104
       69     0.57275     1.00920     0.29732
       70    -0.78306     0.58721    -1.08461
       71    -2.04951    -0.53223    -0.63354
       72    -0.96342     0.50500     1.08553
       73    -2.08427     1.36773     2.61978
       74    -0.76252     1.83433     3.11299
       75    -2.56225     0.41055     2.71276
      
                                     2018年10月30日 火曜日 10時19分47秒  40
      Obs     Factor1     Factor2     Factor3
       76     1.26345     0.86968    -0.68290
       77     0.36863    -0.13772     0.35973
       78     0.50118     0.19461     0.27650
       79     0.83592     0.12211     1.82324
       80     1.20860    -0.79238     0.18272
       81     0.76647    -0.95335     0.73736
       82    -0.70281    -1.66718     0.31564
       83    -0.38247    -1.26079     2.57768
       84     0.35184    -1.20152    -0.03267
       85    -0.69007    -2.03109    -0.85416
       86    -0.11142     0.02665    -1.16091
       87    -0.18462     0.18421    -0.89120
       88     0.72255    -0.45039    -0.83044
       89     0.78014    -0.49627    -1.07607
       90    -0.34617    -2.77596     0.56304
       91    -0.84080    -1.57456    -0.61244
       92     0.41212    -1.66774    -0.26617
       93     0.52353    -1.79544    -0.54812
       94     1.32037    -1.06882    -0.51353
       95     0.44211    -2.05232    -0.92455
       96     1.80427    -1.07554     0.02542
       97     2.05647     0.06837    -0.71320
       98     1.70709    -0.36141     0.18110
       99     0.70018    -0.47201    -0.12915
      100     1.49208    -0.05946     0.24152
      
                                     2018年10月30日 火曜日 10時19分47秒  41
          : Factor1*Factor2. A=1, B=2, ...
      Factor1 |                                        |
            4 +                                        |
              |                                        |
              |                                        |
              |                                        |             A
            2 +                          A             |A        A
              |                          A        A   A|A        AA
              |                            A A   A  A  A A  A A      A   A  AA
              |             A   AA  AA A A     ACC   A |BAA AA   A  A
            0 +-------------------A-----------A------A-B-A---B--A-AAA--AA--A--A--A--
              |    A         A   A  A  A       A  A   A|  A         A
              |                    A  A A  A  A  A   A | AA  AAD   A   A       A
              |                                     A  |  AA       A      A
           -2 +                       A         A      |       A         A
              |                                        |    A
              |                                        |
              |                                        |
           -4 +                                        |
              |                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      
                                     2018年10月30日 火曜日 10時19分47秒  42
          : Factor2*Factor3. A=1, B=2, ...
            2 +                       |  A                              A
              |          A A       A  |  A
              |                 A     | AAA                 A      A
              |     A     AA  B AAA  A|  A
              |      A   AA   B A   AA|      A    A            A
              |   AB      A A AA    A |  A A       A   AA           A
            0 +----------A-A--B-A-----+-AEA-A-------------A-------------------------
              |           A  A B     A| A A  A      A
              |                AA   AA| AA     AAA
      Factor2 |                 A A   A       AA A
              |                    A  BAA     A                   A
              |                AA  A A|  A
           -2 +             AA        |
              |                       |
              |                       |     A
              |                       |
              |                       |
              |                       |
           -4 +                       |
              --+----------+----------+----------+----------+----------+----------+-
               -2         -1          0          1          2          3          4
                                              Factor3
      
    6. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 固有値(Eigenvalue)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj : ラインマーカーの利用が効果的
        • 第1因子 : 全体的な嗜好
        • 第2因子 : 年齢効果 (+ 年輩、- 若年)
        • 第3因子 : 性別効果 (+ 男性、- 女性)
      • 各個体の散布図 : 第2因子と第3因子の関係が面白い

    7. 回転させてみよう : プログラム : les0507.sas

      • 回転の不定性から。
      • 回転させた方が解釈がし易いことも多いから。
       /* Lesson 05-7 */
       /*    File Name = les0507.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0507_log.txt'
                   print = 'Kougi/les0507_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data food;                  
        infile 'Kougi/food.dat';
        input X01-X10;
          label X01='M(-15)'
                X02='M(16-20)'
                X03='M(21-30)'
                X04='M(31-40)'
                X05='M(41-)'
                X06='F(-15)'
                X07='F(16-20)'
                X08='F(21-30)'
                X09='F(31-40)'
                X10='F(41-)';
      
      proc print data=food(obs=10);
      run;
      proc factor data=food nfactor=3 rotate=varimax out=fscore2;
        var X01-X10;                                : 回転の指定
      run;                                          :
      proc print data=fscore2;
      run;
      proc plot data=fscore2;
        plot factor1*factor2/vref=0.0 href=0.0;
        plot factor2*factor3/vref=0.0 href=0.0;
        plot factor3*factor1/vref=0.0 href=0.0;
      run;
      
    8. 出力結果 : les0507_Results.txt , les0507_out.pdf
                                     2018年10月30日 火曜日 08時13分20秒 207
      FACTOR プロシジャ
      回転方法 : Varimax
                         直交変換行列
                             1               2               3
             1         0.65777         0.53529         0.52990
             2        -0.73396         0.61357         0.29126
             3         0.16922         0.58051        -0.79647
      
                       回転後の因子パターン
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.95490         0.13415         0.08963
      X02      M(16-20)         0.85255         0.43757         0.13357
      X03      M(21-30)         0.45872         0.81076         0.20605
      X04      M(31-40)         0.22027         0.90003         0.29343
      X05      M(41-)          -0.02727         0.84202         0.46896
      X06      F(-15)           0.91555         0.05731         0.32756
      X07      F(16-20)         0.81272         0.18932         0.49758
      X08      F(21-30)         0.58692         0.31451         0.66919
      X09      F(31-40)         0.38658         0.45484         0.76506
      X10      F(41-)           0.18417         0.37847         0.88485
      
                    因子の分散
         Factor1         Factor2         Factor3
       3.9249494       2.8740019       2.5453282
      
                 最終的な共通性の推定値 : 合計 = 9.344279
       
             X01             X02             X03             X04             X05
      0.93786990      0.93615660      0.91021020      0.94467297      0.92966229
      
             X06             X07             X08             X09             X10
      0.94880526      0.94393897      0.89119742      0.94163724      0.96012863
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2         Factor3
       1.0000000       1.0000000       1.0000000
      
                          標準化スコア係数
                                Factor1         Factor2         Factor3
      X01      M(-15)           0.35650        -0.01839        -0.21738
      X02      M(16-20)         0.28150         0.18161        -0.29360
      X03      M(21-30)         0.07559         0.43873        -0.30350
      X04      M(31-40)        -0.04982         0.47796        -0.20481
      X05      M(41-)          -0.19000         0.37303         0.04733
      X06      F(-15)           0.28692        -0.18126         0.04983
      X07      F(16-20)         0.19300        -0.16084         0.17154
      X08      F(21-30)         0.04912        -0.13688         0.32854
      X09      F(31-40)        -0.06666        -0.06858         0.40164
      X10      F(41-)          -0.17324        -0.16356         0.59933
      
                                     2018年10月30日 火曜日 08時13分20秒 211
      
      Obs     X01     X02     X03     X04     X05     X06     X07     X08
      
        1    7.69    7.31    7.47    7.76    7.87    7.51    7.24    7.70
        2    6.59    5.56    6.21    6.04    5.81    6.64    6.11    6.53
        3    4.55    4.18    4.36    4.25    4.53    4.60    3.66    4.04
        4    6.78    6.11    6.30    5.98    5.56    6.37    6.29    5.43
        5    6.47    6.24    6.02    5.42    5.88    6.00    5.60    4.60
        6    6.96    6.81    6.91    6.48    6.23    7.09    7.27    7.13
        7    6.57    5.70    5.89    5.16    5.30    6.07    5.56    4.50
        8    7.32    6.95    6.02    4.98    4.88    6.82    6.40    5.53
        9    6.51    6.15    5.51    4.68    4.16    5.17    4.81    4.70
       10    6.86    6.05    5.85    6.14    6.75    6.71    5.39    5.42
       11    7.04    6.03    6.53    6.02    6.68    6.78    5.91    6.26
      
      Obs     X09     X10     Factor1     Factor2     Factor3
      
        1    7.91    7.95     0.66956     1.82121     1.58069
        2    6.44    6.64     0.16626    -0.19916     1.19252
        3    3.68    4.43    -1.03468    -1.43973    -0.47173
        4    5.32    5.28     0.63900     0.22553    -0.50004
        5    5.40    5.95     0.18242     0.09152    -0.20811
        6    6.86    7.36     0.74034     0.36710     1.34854
        7    4.92    5.33     0.32215    -0.32438    -0.54816
        8    5.61    5.33     1.29334    -0.70969    -0.33933
        9    4.86    3.82     0.58581    -0.75180    -1.38820
       10    6.03    6.59     0.02089     0.39898     0.55070
       11    5.76    5.95     0.40396     0.58950     0.17643
      
                                     2018年10月30日 火曜日 08時13分20秒 221
          : Factor1*Factor2. A=1, B=2, ...
            2 +                 A                |   A
              |                                  |
              |                 A   A A       A  |
              |                          A  A    |A B     A
      Factor1 |                      A     A     |     A A A
              |           A         B           AA    B                       A
              |                          A A AA  A B A  A      A  A  A
              |               A            A     |   A A    A A    A
              |                              A A |A    B
            0 +-------------------A------------A-+-A-A----A--A----------------------
              |               A     A    AA    A |          AA     A
              |                            A    A|  A                A  A
              |                            AA    |
              |                       A    A    A|A  BA    AA
              |              A   AA      A   A   |   A
              |                A       A  A  A   |         A                 A
              |                 A             A  |    B         A
              |                         A        |
           -2 +                     A           A|             A
              --+----------+----------+----------+----------+----------+----------+-
               -3         -2         -1          0          1          2          3
                                              Factor2
      
                                     2018年10月30日 火曜日 08時13分20秒 222
          : Factor2*Factor3. A=1, B=2, ...
            4 +                                             |
              |                                             |
              |                                             |
              |                                             |
              |                   A                 A       |
              |                                             |
            2 +                                 A           |
              |                                  A  A       |       AA       A
              |              A                              | A A          A
      Factor2 |                                 A           | AAA A A    A      A
              |                A                         A  |AAA   A        A A
              |        A                    B A    B  BAA  A|  A  AAA  A   A A
            0 +-------------------------------------A-----A-+-AAA---AAAA------------
              |                                       AA   A|AB A A  AB  A
              |                            A A   AAA    A A |  A   B  A A  A
              |                                        A   A| A A A
              |                                 A     AAA A |        A  A
              |                            AA       A  A    |   A   AA
           -2 +                                          A  |
              --+----------+----------+----------+----------+----------+----------+-
               -4         -3         -2         -1          0          1          2
                                              Factor3
      
                                     2018年10月30日 火曜日 08時13分20秒 223
          : Factor3*Factor1. A=1, B=2, ...
            2 +                                        |
              |                         A   A          |        A     A
              |                             A        A |AA     A A
              |                        A  A A    A A   |       AB
              |               A     AAB A   AA    CA   AA            A   A A     A
              |              A      A A  A B   A   A   |    B  A B       A AA
            0 +---------------------A------------------+--AAA-A------A----B---------
              |                     A     A         AA | AA  A    AA A  B
              |                A         A            A|   AA  AAAAA   A
      Factor3 |                                A  A A A|         AA
              |                             B          |A      A                A
              |                                     A  |     A
           -2 +                                        |
              |                       A                |
              |               A                        |             A
              |                                        |
              |                    A                   |
              |                                        |
           -4 +                                        |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor1
      
    9. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • (回転行列, Orthogonal Transformation Matrix)
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj
        • 第1因子 : 若年層の嗜好 (+ 若年、- 年輩)
        • 第2因子 : 成人男性の嗜好 (+ 成年男子)
        • 第3因子 : 成人女性の嗜好 (+ 成年女子)
      • 各個体の散布図 : 各因子間の関係が面白い。各個体の具体的な位置を把握。
      • 回転前と回転後でどのように解釈が変化したか?

    10. 代表的な回転法 :
      • バリマックス法(rotate=varimax) : 直交回転 : 因子軸間は直交(独立性)
      • プロマックス法(rotate=promax) : 斜交回転 : 因子軸間に相関性

  7. [例題2] 趣味の特性を探ってみよう : 193 ページ
    30種類の趣味の性、年齢毎の特性調査の結果 : データ : syumi.dat

    1. プログラム : les0508.sas

       /* Lesson 05-8 */
       /*    File Name = les0508.sas   10/30/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/les0508_log.txt'
                   print = 'Kougi/les0508_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data hobby;
        infile 'Kougi/syumi.dat';
        input code $ X1-X6;
          label X1='M(-29)'
                X2='M(30-49)'
                X3='M(50-)'
                X4='F(-29)'
                X5='F(30-49)'
                X6='F(50-)';
      
      proc print data=hobby(obs=10);
      run;
      proc factor data=hobby nfactor=2 out=fscore;
        var X1-X6;
      run;
      proc plot data=fscore;                           : 回転前
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      proc factor data=hobby nfactor=2 rotate=varimax out=fscore2;
        var X1-X6;
      run;
      proc plot data=fscore2;                          : 回転後
        plot factor1*factor2=code/vref=0.0 href=0.0;   : コード化した記号
      run;                                             :
      
    2. 出力結果 : les0508_Results.txt , les0508_out.pdf
                                     2018年10月30日 火曜日 08時13分53秒 224
      
      Obs    code     X1      X2      X3      X4      X5      X6
      
        1     A      4.00    4.25    3.83    4.50    4.67    4.00
        2     B      4.17    3.89    4.00    4.50    4.17    3.75
        3     C      3.83    3.44    2.83    3.57    3.17    1.50
        4     D      2.83    4.22    3.83    3.71    3.00    2.25
        5     E      4.17    4.11    3.83    3.57    4.00    3.75
        6     F      2.33    3.56    3.33    2.93    2.83    2.75
        7     G      1.83    2.44    2.33    3.71    3.83    3.75
        8     H      2.50    1.89    2.00    4.21    3.17    3.75
        9     I      2.00    1.44    2.00    4.07    3.33    3.50
       10     J      4.00    3.33    3.33    3.00    3.17    2.25
      
                                     2018年10月30日 火曜日 08時13分53秒 225
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2018年10月30日 火曜日 08時13分53秒 226
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 6  平均 = 1
       
               固有値           差           比率        累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                 最終的な共通性の推定値 : 合計 = 4.491236
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
      回帰による因子スコア係数の推定
      
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)           0.19212         0.36217
      X2      M(30-49)         0.21734         0.36976
      X3      M(50-)           0.23398         0.27104
      X4      F(-29)           0.30164        -0.20320
      X5      F(30-49)         0.29016        -0.24622
      X6      F(50-)           0.22454        -0.35904
      
                                     2018年10月30日 火曜日 08時13分53秒 230
           プロット : Factor1*Factor2=code
            4 +                                        |
              |                                        |
              |                                        |
              |                                        |
              |                                        |
              |                                        |
            2 +                                        A B
              |                                        |   Z  E
              |                                        |
      Factor1 |                               R        |
              |                                        |           D
              |                          3   Q     M   |           J    O
            0 +---------------HG-------------------2---+--F--------C----------------
              |           I            K     S    P    |              N
              |                                        |          V    U
              |                                        |Y                  W
              |                                      1 T         X
              |                                        |
           -2 +                                    4   |
              --+------------+------------+------------+------------+------------+--
               -3           -2           -1            0            1            2
                                              Factor2
      NOTE: 1 obs  は表示されません。
      
                                     2018年10月30日 火曜日 08時13分53秒 231
      FACTOR プロシジャ
      
      入力データタイプ           Raw Data
      読み込んだレコード              30
      使用されたレコード              30
      有意性検定のための              30
      
                                     2018年10月30日 火曜日 08時13分53秒 232
      FACTOR プロシジャ
      初期因子抽出の方法 : 主成分解
      
      事前共通性の推定値 : ONE    
      
          相関行列の固有値: 合計 = 6  平均 = 1
       
               固有値           差      比率      累積
         1    2.74351441    0.99579304      0.4573      0.4573
         2    1.74772137    1.00266247      0.2913      0.7485
         3    0.74505889    0.35714702      0.1242      0.8727
         4    0.38791187    0.16159911      0.0647      0.9374
         5    0.22631276    0.07683206      0.0377      0.9751
         6    0.14948070                    0.0249      1.0000
      
      2 因子が NFACTOR 基準により示されます。
      
                     因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.52708         0.63297
      X2      M(30-49)         0.59628         0.64623
      X3      M(50-)           0.64192         0.47370
      X4      F(-29)           0.82757        -0.35514
      X5      F(30-49)         0.79607        -0.43033
      X6      F(50-)           0.61604        -0.62750
      
            因子の分散
         Factor1         Factor2
       2.7435144       1.7477214
      
                 最終的な共通性の推定値 : 合計 = 4.491236
      
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
                                     2018年10月30日 火曜日 08時13分53秒 235
      FACTOR プロシジャ
      回転方法 : Varimax
                 直交変換行列
                             1               2
             1         0.77751         0.62886
             2        -0.62886         0.77751
      
               回転後の因子パターン
                               Factor1         Factor2
      X1      M(-29)           0.01176         0.82361
      X2      M(30-49)         0.05723         0.87743
      X3      M(50-)           0.20121         0.77199
      X4      F(-29)           0.86678         0.24430
      X5      F(30-49)         0.88957         0.16603
      X6      F(50-)           0.87359        -0.10049
      
            因子の分散
         Factor1         Factor2
       2.3497071       2.1415286
      
                 最終的な共通性の推定値 : 合計 = 4.491236
              X1           X2           X3           X4           X5           X6
      0.67846653   0.77316605   0.63644687   0.81099331   0.81890556   0.77325745
      
      回帰による因子スコア係数の推定
      変数群と各因子の重相関係数の 2 乗
       
         Factor1         Factor2
       1.0000000       1.0000000
      
                  標準化スコア係数
                               Factor1         Factor2
      X1      M(-29)          -0.07838         0.40241
      X2      M(30-49)        -0.06354         0.42417
      X3      M(50-)           0.01147         0.35788
      X4      F(-29)           0.36232         0.03170
      X5      F(30-49)         0.38045        -0.00897
      X6      F(50-)           0.40037        -0.13795
      
                                     2018年10月30日 火曜日 08時13分53秒 238
           プロット : Factor1*Factor2=code
                2 +                              |
                  |                              |                  A
                  |                              |
                  |                              |  R               B
          Factor1 |  I     H G           3       |                 Z
                  |                              |                  E
                  |                        Q     |
                  |              K               |M
                  |                    S      2  |
                0 +------------------------P-----+------------------------------
                  |                              |F             D
                  |                              |           J     O
                  |                              |         C
                  |                      Y       |   V      N
                  |                1 T           |
                  |         4                    |     U
                  |                          X   |
                  |                              |        W
               -2 +                              |
                  ---+-------------+-------------+-------------+-------------+--
                    -2            -1             0             1             2
                                              Factor2
      NOTE: 1 obs  は表示されません。
      
    3. 解釈方法 : 因子の特徴付け : 因子負荷量の大小から。
      • 因子毎の分散(Variance explained by each factor) : 因子毎の説明量。
      • 共通性(Final Communality Estimates, Σaj^2) : 変数毎の説明割合。
      • 因子負荷量(Standardized Scoring Coefficients) : aj

      • 因子数は2で良さそう
      • 回転前 : 因子の特徴付け
        • 第1因子 : 全体的な傾向
        • 第2因子 : 性別因子 (+ 男性、- 女性)
        • 各個体の散布図 : 各趣味がどの性別に好まれるか
      • 回転後 : 因子の特徴付け
        • 第1因子 : 女性因子 (+ 女性)
        • 第2因子 : 男性因子 (+ 男性)
        • 各個体の散布図 : 性別毎の特徴付け、両性に好まれる趣味
      • 記号を付けたことにより、より判り易く(& 解り易く)なっている
      • 年齢の効果はあまり見られない
      • 回転前と回転後でどのように解釈が変化したか?

  8. 因子数の決定基準


  9. 主成分分析(PCA)と因子分析(FA): 目的は同じでも異なる手法

  10. 同じデータを両手法に適用して、その共通性と違いを体験してみよう
    上記で示したデータも含めていくつかデータを置いておく。 興味があればダウンロードして両手法に適用してはどうだろうか。
    1. seiseki.txt
      • 中学2年生の成績データ。23名x5科目。国語、社会、数学、理科、英語。
      • 配布資料に掲載され、例題に使われていたデータ。
    2. food.txt
      • 100 種類の食品の嗜好度データ。100食品x10グループ。
    3. syumi.txt
      • 趣味に関するアンケート調査データ。30種類x6グループ。

  11. 読み物

  12. 次回は、... : 11月056日 16:20-17:50
[DIR]講義のホームページへ戻ります