主成分分析

データサイエンス : 第5回 (11/05/18)

 いくつか(p個)の変量の値を情報の損失をできるだけ少なくして、 少数変量(m個、m<p)の総合的指標(主成分)で代表させる方法として 主成分分析(Principal Component Analysis, PCA)と 因子分析(Factor Analysis, FA)がある。 いくつかのテストの成績を総合した総合的成績、 いろいろな症状を総合した総合的な重症度、 種々の財務指標に基づく企業の評価 等を求めたいといった場合に用いられる。 p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、 次元を減少させる(reduce)方法と言うこともでき、 多変量データを要約する有力な方法である。
 両者は似た目的に使われるが、元になっている考え方は異なるので 利用する場面では注意が必要である。違いに焦点を当てながら今週は主成分分析を紹介する。
  1. 2変量の場合の主成分分析 : 理解を助けるため
    1. 定式化 : 配付資料 54ページ〜
      • 重み(係数) : a1、a2
      • 合成変量(線形結合) : z=a1*x1+a2*x2
      • よく代表するように、a1 と a2 を決める。
      • より広がって測定できる軸に沿うと情報量が多い。
           [参考:立体の測定] ノギス
      • 全測定値の分散を最大化する軸を決定する。
          定式化については配付資料を参照のこと

    2. 身長と体重の総合指標を求めよう : プログラム : DSles0501.sas

       /* Lesson 05-1 */
       /*    File Name = DSles0501.sas   11/05/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/DSles0501_log.txt'
                   print = 'Kougi/DSles0501_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc plot data=gakusei;                        : 散布図
        plot shintyou*taijyuu;                       : 元の変量のプロット
      run;                                           :
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列を用いて)
        var shintyou taijyuu;                        : 2変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
      run;                                           :
                                                     : 参考までに、
      proc sort data=outprin;                        : 説明のためにソートしてみる
        by prin1;                                    : 第一主成分で
      run;                                           :
      proc print data=outprin;                       : 体重がややが効いていることの確認
      run;                                           :
      

    3. 出力結果 : DSles0501_Results.txt , DSles0501_out.pdf
      • 身長と体重の散布図
      • 各変量の平均、標準偏差、分散共分散行列
      • 固有値、比率(寄与率)、累積寄与率 : 解釈に使う
      • 固有ベクトル(係数a1とa2) : 解釈に使う
      • 主成分得点 : 各個人の得点(z)、2つある
      • 第1軸と第2軸の主成分得点の散布図
                                     2018年11月 1日 木曜日 07時50分38秒  23
      
          : shintyou*taijyuu. A=1, B=2, ...
                200 +
                    |
                    |
                    |
                    |                                 A  A     A
                    |                            AA B A A            A
                180 +                         A  BACEA  G B
                    |                      AB BBCGCBDCH A A AD          A  A
                    |                      ABBCBDIJCCADBCB  A    A
           shintyou |                      BBBGEEHFDEBAAB A  A      A
                    |                    H AHEKCDBBAF     AA A
                    |                   BA EF A  BBAA
                160 +                  B DCCDACAAA
                    |                BAACDCDA  A  A
                    |            A   CABC  A  A
                    |                  BA  A
                    |              A BA
                    |
                140 +
                    ---+------------+------------+------------+------------+--
                      20           40           60           80           100
                                              taijyuu
      
                                     2018年11月 1日 木曜日 07時50分38秒  24
      PRINCOMP プロシジャ
      
      オブザベーション数              325
      変数の数                          2
      
                  単純統計量
                    shintyou           taijyuu
      Mean       168.6947692       58.78092308
      StD          8.0436274        9.34693152
      
                    共分散行列
                        shintyou           taijyuu
      shintyou       64.69994169       52.97829497
      taijyuu        52.97829497       87.36512877
      
      総分散    152.06507047
      
                                     2018年11月 1日 木曜日 07時50分38秒  25
      PRINCOMP プロシジャ
                     共分散行列の固有値
               固有値           差           比率        累積
         1    130.209351    108.353632      0.8563      0.8563
         2     21.855719                    0.1437      1.0000
      
               固有ベクトル
                       Prin1         Prin2
      shintyou      0.628817      0.777553
      taijyuu       0.777553      -.628817
      
                                     2018年11月 1日 木曜日 07時50分38秒  26
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s       P         P
                t      j    y  t     u       r        u       r         r
       O   s    y      y    o  a     k       y        u       i         i
       b   e    o      u    u  k     a       e        w       n         n
       s   x    u      u    i  u     i       r        a       1         2
      
        1  F  145.0  38.0   .  J   10000               .  -31.0580  -5.35654
        2  F  146.7  41.0  85  J   10000  Vodafone  6000  -27.6563  -5.92115
        3  F  148.0  42.0   .  J   50000               .  -26.0613  -5.53915
        4  F  148.0  43.0  80  J   50000  DoCoMo    4000  -25.2837  -6.16797
        5  F  149.0  45.0   .  G   60000               .  -23.0998  -6.64805
        6  F  150.0  46.0  86      40000               .  -21.6934  -6.49931
        7  F  151.0  45.0   .  J   20000  docomo    5000  -21.8422  -5.09294
        8  F  151.0  50.0   .  G   60000  J-PHONE      .  -17.9544  -8.23703
        9  F  151.7  41.5  80  J   35000               .  -24.1234  -2.34780
       10  F  152.0  35.0  77  J   60000  DoCoMo    2000  -28.9889   1.97278
       11  F  152.0  43.0   .  J   20000  au        3500  -22.7685  -3.05776
       12  F  152.0  44.0   .      45000  DoCoMo    4000  -21.9909  -3.68657
       13  F  153.0  41.0   .  J  125000  No           .  -23.6948  -1.02257
       14  F  153.0  42.0   .  G       0  Vodafone  1000  -22.9172  -1.65139
       15  F  153.0  46.5  87  G   10000               .  -19.4182  -4.48106
      
                                     2018年11月 1日 木曜日 07時50分38秒  27
            : Prin2*Prin1. A=1, B=2, ...
       Prin2 |                                  |
          20 +                                  |
             |                                  |
             |                                  |
             |                                  |   A
          10 +                                A |      B A
             |                              B   DAAAABAA AA A A
             |                         DD  AA DACACADCA BCB  A  A
             |           A         BAC   AACEEDDEBCHDDBAACC  FA
           0 +---------------A-BAAAAABC-FD-BEDAFBEBGCCACBCA--A--A------A-----------
             |               AC AAABAF AAD A  AAA DDBCAACBA    A
             |         A  AAA  AB B C  A C A AA AA BBAAAACC  A  BA
             |                AA  AA     A  B  B|AA       A  A AA
         -10 +                        A         |        AA  A            A
             |                             A    |                 A
             |                                  |         A                A
             |                                  |                  A          A
         -20 +                                  |
             |                                  |
             ---+-------+-------+-------+-------+-------+-------+-------+-------+--
               -40     -30     -20     -10      0      10      20      30      40
                                              Prin1
      
                                     2018年11月 1日 木曜日 07時50分38秒  28
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s        P         P
                t      j    y  t     u       r        u        r         r
       O   s    y      y    o  a     k       y        u        i         i
       b   e    o      u    u  k     a       e        w        n         n
       s   x    u      u    i  u     i       r        a        1         2
      
        1  F  145.0  38.0   .  J   10000                .  -31.0580  -5.35654
        2  F  152.0  35.0  77  J   60000  DoCoMo     2000  -28.9889   1.97278
        3  F  146.7  41.0  85  J   10000  Vodafone   6000  -27.6563  -5.92115
      ≪中略≫
                                     2018年11月 1日 木曜日 07時50分39秒  42
      Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa  Prin1     Prin2
      309  M    173.5    76.5     .    G     100000             .  16.7991  -7.4057
      310  M    182.0    70.0    90    G     100000             .  17.0900   3.2908
      311  M    185.0    68.0    93    J          0             .  17.4213   6.8811
      312  M    175.0    77.0    95    G     130000             .  18.1311  -6.5538
      313  M    179.1    74.2     .               0 au       4000  18.5321  -1.6052
      314  M    175.0    79.0     .    J          0 No          0  19.6862  -7.8115
      315  M    176.5    78.0    96    J      10000             .  19.8519  -6.0163
      316  M    177.0    78.0     .    J      40000             .  20.1663  -5.6275
      317  M    181.5    74.5     .    G     120000 au       3000  20.2746   0.0723
      318  M    185.0    72.0     .    J      30000          7000  20.5315   4.3658
      319  M    178.0    78.0   110    G      50000             .  20.7951  -4.8500
      320  M    173.0    84.0    46    G     350000             .  22.3164 -12.5106
      321  M    169.3    88.5    94    J          0             .  23.4887 -18.2173
      322  M    186.0    82.0     .    J          0             .  28.9359  -1.1448
      323  M    182.0    90.0   100    J      40000             .  32.6411  -9.2856
      324  M    178.0    95.0     .            1000 No          .  34.0135 -15.5399
      325  M    178.0   100.0   112    G      60000             .  37.9013 -18.6840
      

    4. 解釈方法
      • 寄与率 : その軸がどの程度説明力を持っているか : 第1軸だけで十分(85.6%)。第2軸に含まれる説明力は小さい(14.4%)。
      • 固有ベクトル : その軸の特徴を示している : 身長と体重の重みはほぼ同等だが、体重がやや大きめに効いている(第1軸)
      • 主成分得点と散布図 : 各個人がどこに付置されているか
      • 第1軸 : 全体的な体格の指標。身長と体重を足したような指標。

  2. 3変量以上の主成分分析
    1. 定式化 : 資料 71ページ〜
      • 2変量の拡張
      • 合成変量(線形結合) : z
      • 合成変量の分散を最大化する軸を決定する。

    2. 身長、体重、胸囲での総合指標を求めてみよう : プログラム : DSles0502.sas
       /* Lesson 05-2 */
       /*    File Name = DSles0502.sas   11/05/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/DSles0502_log.txt'
                   print = 'Kougi/DSles0502_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列を用いて)
        var shintyou taijyuu kyoui;                  : 3変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
        plot prin3*prin2/vref=0 href=0;              :
        plot prin3*prin1/vref=0 href=0;              :
      run;                                           :
      

    3. 出力結果 : DSles0502_Results.txt , DSles0502_out.pdf
      • 各変量の平均、標準偏差、共分散行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

      
                                     2018年11月 1日 木曜日 07時54分57秒  45
      PRINCOMP プロシジャ
      
      オブザベーション数              114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                             共分散行列
                        shintyou           taijyuu             kyoui
      shintyou        76.0865898        69.6653222        23.7439373
      taijyuu         69.6653222       118.0010123        43.5906226
      kyoui           23.7439373        43.5906226        69.9335507
      
      総分散    264.02115277
      
               固有値           差          比率        累積
         1    189.966471    138.636164      0.7195      0.7195
         2     51.330307     28.605932      0.1944      0.9139
         3     22.724375                    0.0861      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.539085      -.407903      0.736887
      taijyuu       0.751825      -.161336      -.639320
      kyoui         0.379667      0.898658      0.219698
      
                                     2018年11月 1日 木曜日 07時54分58秒  47
              s
              h     t          k      c
              i     a     j    o      a       t
              n     i   k i    d      r       s      P       P        P
              t     j   y t    u      r       u      r       r        r
       O  s   y     y   o a    k      y       u      i       i        i
       b  e   o     u   u k    a      e       w      n       n        n
       s  x   u     u   i u    i      r       a      1       2        3
      
        1 F 145.0 38.0  . J  10000             .    .       .       .     
        2 F 146.7 41.0 85 J  10000 Vodafone 6000 -24.9565 10.2382 -4.10085
        3 F 148.0 42.0  . J  50000             .    .       .       .     
        4 F 148.0 43.0 80 J  50000 DoCoMo   4000 -24.6504  4.8920 -5.52002
        5 F 149.0 45.0  . G  60000             .    .       .       .     
        6 F 150.0 46.0 86    40000             . -19.0388  8.9841 -4.64602
        7 F 151.0 45.0  . J  20000 docomo   5000    .       .       .     
        8 F 151.0 50.0  . G  60000 J-PHONE     .    .       .       .     
        9 F 151.7 41.5 80 J  35000             . -23.7835  3.6248 -1.83456
       10 F 152.0 35.0 77 J  60000 DoCoMo   2000 -29.6477  1.8551  1.88299
       11 F 152.0 43.0  . J  20000 au       3500    .       .       .     
       12 F 152.0 44.0  .    45000 DoCoMo   4000    .       .       .     
       13 F 153.0 41.0  . J 125000 No          .    .       .       .     
       14 F 153.0 42.0  . G      0 Vodafone 1000    .       .       .     
       15 F 153.0 46.5 87 G  10000             . -16.6659  8.5784 -2.53532
      
                                     2018年11月 1日 木曜日 07時54分58秒  48
            : Prin2*Prin1. A=1, B=2, ...
      Prin2 |                            |
         20 +                            |
            |                            |  A    A           A
            |           A   AA         A |     A     A                    A
            |           B   AAAACDAA  AB |  A AB    A
          0 +-------A----A--AAACBADC-BCA-AC-CF-ABADB--B-AA-A-------A----------------
            |                 A       A  AAA BAA AC  AA
            |              A   A     A   | C A AA   A
            |                       A    |
        -20 +                            |
            |                  A         |
            |                            |
            |                            |
        -40 +                            |    A
            |                            |
            |                            |
            |                            |
        -60 +                            |
            |                            |
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      NOTE: 211 obs が欠損値です。
      
                                     2018年11月 1日 木曜日 07時54分58秒  49
            : Prin3*Prin2. A=1, B=2, ...
      Prin3 |                                                  |
         20 +                                                  |
            |                                                  |
            |                                                  |
            |                                                  |
         10 +                                         A   A    |
            |                                       A    A AC  |
            |                                      A  AA  AA  BAABA
            |                                         A    B BADEE  ABA
          0 +-----------------------------------A----A-A---AA-ADAEDB-ACA-----AA-----
            |                       A                A   A  ACAB D DA  AA    A
            |                                          A A    B|BBA B   AA
            |                                                  A
        -10 +                                                 A|       A
            |                                                  |           A
            |                                                  |A
            |                                                  |
        -20 +        A                                         |
            |                                                  |
            -+---------+---------+---------+---------+---------+---------+---------+
            -50       -40       -30       -20       -10        0        10        20
                                              Prin2
      NOTE: 211 obs が欠損値です。
      
                                     2018年11月 1日 木曜日 07時54分58秒  50
            : Prin3*Prin1. A=1, B=2, ...
      Prin3 |                            |
         20 +                            |
            |                            |
            |                            |
            |                            |
         10 +                            | A   A
            |                            | A AA   B   A
            |                  AA B      |AA A    AAAAA
            |       A       A  AA  B  BA AAABD CAA    A
          0 +---------------ABB-CCBAABB--+A-AB--AAA-AA-------A----------------------
            |           AA   AAC AAA   A AA BAAB  B      A
            |           B  AA    A   AAA |      AAA     A          A
            |                            |         A
        -10 +                  A       A |
            |                            |                                A
            |                            |                 A
            |                            |
        -20 +                            |    A
            |                            |
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      NOTE: 211 obs が欠損値です。
      

    4. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.4%)。
      • 第1軸 : 全体的な体格の因子。特に体重が効いている。
      • 第2軸 : 太さの因子(?)。胸囲が正で身長が負。

      • 第3軸 : 華奢さの因子(?)。無視しても良い軸であるが。(8.6%)。

  3. 相関行列を使う理由
    • 変量によって測定単位が異なる
    • 使う単位によって解析結果が異なる
    • 分散の影響を受ける
    • 各変量を標準化して用いる : 相関行列 <===> 分散共分散行列

    1. 相関行列を用いて体格の総合指標を求めてみよう : プログラム : DSles0503.sas

       /* Lesson 05-3 */
       /*    File Name = DSles0503.sas   11/05/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/DSles0503_log.txt'
                   print = 'Kougi/DSles0503_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data gakusei;
        infile 'Kougi/all07au.txt'
          firstobs=2;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex^='M' & sex^='F' then delete;
      if shintyou=. | taijyuu=. then delete;
      
      proc print data=gakusei(obs=10);
      
      run;                                          :
      proc princomp data=gakusei out=outprin;       : 主成分分析(相関係数を用いて)
        var shintyou taijyuu kyoui;                 :
      run;                                          :
      proc print data=outprin(obs=15);
      run;
      proc plot data=outprin;
        plot prin2*prin1/vref=0 href=0;
        plot prin3*prin2/vref=0 href=0;
        plot prin3*prin1/vref=0 href=0;
      run;
      

    2. 出力結果 : DSles0503_Results.txt , DSles0503_out.pdf
      • 各変量の平均、標準偏差、相関行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

      
                                     2018年11月 1日 木曜日 07時56分11秒  99
      PRINCOMP プロシジャ
      
      オブザベーション数             114
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.3517544       58.79298246       86.17543860
      StD          8.7227627       10.86282708        8.36262822
      
                       相関行列
                    shintyou      taijyuu       kyoui
      shintyou        1.0000       0.7352      0.3255
      taijyuu         0.7352       1.0000      0.4799
      kyoui           0.3255       0.4799      1.0000
      
                      相関行列の固有値
               固有値           差           比率        累積
         1    2.04696555    1.33664820      0.6823      0.6823
         2    0.71031735    0.46760025      0.2368      0.9191
         3    0.24271710                    0.0809      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.599200      -.483881      0.637823
      taijyuu       0.640769      -.187770      -.744418
      kyoui         0.479974      0.854752      0.197544
      

    3. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(91.9%)。
      • 第1軸 : 全体的な体格の因子。
      • 第2軸 : 太さの因子。
      • 分散共分散行列を使ったときよりも 第1軸の固有ベクトル同士が近い値になった。 しかし、軸の解釈に違いはない。 その理由はこの例では 3変量のスケールや分散に それほどの違いがないためと想像される。
      • 分散共分散行列と相関行列を使ったときの違いを見てみたければ、 shintyou のみを mm 単位で測定したと考えて、 100倍したものをデータとして両者の出力を比較してみよ。
        プログラム : DSles0504.sas 、出力結果 : DSles0504_Results.txt , DSles0504_out.pdf

  4. 主成分の数の決定基準 : 配付資料 80ページ
    明確に決まっているわけではないが、以下のような基準が一般的に 用いられている。また、結果の解釈の都合上、多少増減させることもある。

  5. [例題1] 食品の嗜好性を探ってみよう : データは90ページ〜
     食品の志向に関するデータを主成分分析にかけてみよう。 100種類の食品の性、年齢毎の嗜好度調査の結果 : データ : food.dat

    1. プログラム : DSles0505.sas

       /* Lesson 05-5 */
       /*    File Name = DSles0505.sas   11/05/18   */
      options linesize=72 pagesize=20;
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi/DSles0505_log.txt'
                   print = 'Kougi/DSles0505_Results.txt' new;
      
      ods listing gpath='Kougi/SAS_ODS99';
      
      data food;                  
        infile 'Kougi/food.dat';          : ファイルの読み込み
        input X01-X10;                    : 変量リスト、連続的に
          label X01='M(-15)'              : 各変量に解りやすい名前を付ける
                X02='M(16-20)'            :   M : 男性
                X03='M(21-30)'            :   F : 女性
                X04='M(31-40)'            :  ()内 : 年齢
                X05='M(41-)'              :
                X06='F(-15)'              :
                X07='F(16-20)'            :
                X08='F(21-30)'            :
                X09='F(31-40)'            :
                X10='F(41-)';             :
                                          :
      proc print data=food(obs=10);       : データの表示
      run;                                :
      
      proc princomp data=food out=out_prin;  : 相関係数を用いた主成分分析
      run;
      proc print data=out_prin;              : 第5因子までの得点を表示
        var prin1-prin5;
      run;
      proc plot data=out_prin;
        plot prin2*prin1/vref=0 href=0;
        plot prin3*prin2/vref=0 href=0;
        plot prin3*prin1/vref=0 href=0;
      run;
      
    2. 出力結果 : DSles0505_Results.txt , DSles0505_out.pdf
                                     2018年10月31日 水曜日 18時59分17秒  22
      
      Obs    X01    X02    X03    X04    X05    X06    X07    X08    X09    X10
      
        1   7.69   7.31   7.47   7.76   7.87   7.51   7.24   7.70   7.91   7.95
        2   6.59   5.56   6.21   6.04   5.81   6.64   6.11   6.53   6.44   6.64
        3   4.55   4.18   4.36   4.25   4.53   4.60   3.66   4.04   3.68   4.43
        4   6.78   6.11   6.30   5.98   5.56   6.37   6.29   5.43   5.32   5.28
        5   6.47   6.24   6.02   5.42   5.88   6.00   5.60   4.60   5.40   5.95
        6   6.96   6.81   6.91   6.48   6.23   7.09   7.27   7.13   6.86   7.36
        7   6.57   5.70   5.89   5.16   5.30   6.07   5.56   4.50   4.92   5.33
        8   7.32   6.95   6.02   4.98   4.88   6.82   6.40   5.53   5.61   5.33
        9   6.51   6.15   5.51   4.68   4.16   5.17   4.81   4.70   4.86   3.82
       10   6.86   6.05   5.85   6.14   6.75   6.71   5.39   5.42   6.03   6.59
      
                                     2018年10月31日 水曜日 18時59分17秒  23
      PRINCOMP プロシジャ
      
      オブザベーション数              100
      変数の数                         10
      
                                   単純統計量
                     X01           X02           X03           X04           X05
      Mean   6.038100000   5.784800000   5.947100000   5.669500000   5.640600000
      StD    1.239147389   1.034139939   0.825972699   0.915395124   0.884228614
      
                     X06           X07           X08           X09           X10
      Mean   5.781300000   5.563900000   5.379400000   5.517400000   5.542100000
      StD    1.294327683   1.182607883   1.121124814   1.016264322   1.130856737
      
                                     2018年10月31日 水曜日 18時59分17秒  24
      PRINCOMP プロシジャ
                                      相関行列
                                X01         X02         X03         X04         X05
      X01      M(-15)        1.0000      0.8708      0.5158      0.3701      0.1723
      X02      M(16-20)      0.8708      1.0000      0.7588      0.6043      0.4021
      X03      M(21-30)      0.5158      0.7588      1.0000      0.8524      0.7262
      X04      M(31-40)      0.3701      0.6043      0.8524      1.0000      0.8742
      X05      M(41-)        0.1723      0.4021      0.7262      0.8742      1.0000
      X06      F(-15)        0.9384      0.8207      0.5164      0.3580      0.2077
      X07      F(16-20)      0.8107      0.8381      0.6584      0.4875      0.3543
      X08      F(21-30)      0.6161      0.7095      0.6990      0.6199      0.5235
      X09      F(31-40)      0.5003      0.6470      0.7013      0.7207      0.7101
      X10      F(41-)        0.3298      0.4569      0.5584      0.6321      0.7479
      
                  X06         X07         X08         X09         X10
      X01      0.9384      0.8107      0.6161      0.5003      0.3298
      X02      0.8207      0.8381      0.7095      0.6470      0.4569
      X03      0.5164      0.6584      0.6990      0.7013      0.5584
      X04      0.3580      0.4875      0.6199      0.7207      0.6321
      X05      0.2077      0.3543      0.5235      0.7101      0.7479
      X06      1.0000      0.8888      0.7465      0.6215      0.4932
      X07      0.8888      1.0000      0.8949      0.7679      0.6415
      X08      0.7465      0.8949      1.0000      0.8528      0.7741
      X09      0.6215      0.7679      0.8528      1.0000      0.9112
      X10      0.4932      0.6415      0.7741      0.9112      1.0000
      
                      相関行列の固有値
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
                                     2018年10月31日 水曜日 18時59分17秒  26
      PRINCOMP プロシジャ
                                  固有ベクトル
                            Prin1       Prin2       Prin3       Prin4       Prin5
      X01    M(-15)      0.286033    -.446335    0.193512    0.428019    0.162365
      X02    M(16-20)    0.331337    -.239842    0.336063    0.022488    -.559594
      X03    M(21-30)    0.323345    0.166337    0.442291    -.436029    -.168594
      X04    M(31-40)    0.299329    0.358627    0.375366    0.063449    0.367912
      X05    M(41-)      0.260727    0.507209    0.127419    0.375425    0.146879
      X06    F(-15)      0.308635    -.407882    -.083695    0.267375    0.286866
      X07    F(16-20)    0.344271    -.252697    -.171400    -.295655    -.025050
      X08    F(21-30)    0.347877    -.032314    -.289087    -.507508    0.452377
      X09    F(31-40)    0.345636    0.164368    -.322236    0.040012    -.388944
      X10    F(41-)      0.303334    0.267273    -.522559    0.251270    -.190507
      
                Prin6         Prin7         Prin8         Prin9        Prin10
      X01    -.016413      -.062138      -.038493      -.141617      0.668052
      X02    -.212367      0.479465      0.283325      -.013739      -.225064
      X03    0.476929      -.416354      0.136150      0.085922      0.163960
      X04    -.562491      -.066245      -.114301      0.403713      -.068344
      X05    0.385123      0.325310      -.167534      -.437833      -.148648
      X06    0.209878      -.335058      0.176137      0.090538      -.618107
      X07    0.137469      0.236104      -.762654      0.204382      -.046351
      X08    -.128390      0.256135      0.382983      -.303270      0.106863
      X09    -.387189      -.488821      -.161974      -.425188      -.030381
      X10    0.181955      0.100632      0.270185      0.543107      0.229904
      
                                     2018年10月31日 水曜日 18時59分17秒  28
      Obs      Prin1       Prin2       Prin3       Prin4       Prin5
        1     5.88693     1.44204    -0.07682     0.40809     0.25348
        2     1.65842     0.13686    -0.90098    -0.05516     0.42231
        3    -4.44537    -0.34692    -0.55169     0.23782     0.37097
        4     0.72138    -0.63217     0.55357    -0.08449     0.21583
        5     0.15339    -0.18363     0.21693     0.67993    -0.55569
        6     3.65322     0.09908    -0.63902    -0.35301    -0.06665
        7    -0.65902    -0.78995     0.26301     0.42015    -0.16052
        8     0.76044    -1.96919     0.06701    -0.04720    -0.60733
        9    -1.96687    -1.71968     0.66740    -0.33431    -0.54215
       10     1.35649     0.51749    -0.17674     1.31452     0.21057
       11     1.76317     0.15476     0.23456     0.33063     0.60092
       12     0.72383     0.14551     0.49777     0.35538    -0.09548
       13    -1.20892     0.34668    -0.53251     0.85212     0.41764
       14     1.42272    -0.75706     0.71704    -0.53272     0.19744
       15    -2.13183    -1.49511     0.88751     0.23480     0.36191
       16    -0.22823    -2.13507    -0.06826    -0.60678    -0.38494
       17    -2.23675    -0.93785    -0.49456     0.29268    -0.15555
       18     0.78156    -0.71930    -0.16751    -0.66281     0.23746
       19     1.68853    -1.81322    -0.00583    -0.94849     0.02742
       20     3.02932     2.11463     0.26760    -0.11444     0.06117
       21     0.89143     1.04081    -0.64146    -0.01164     0.06023
       22    -2.70490    -0.64420     0.29764     0.08428    -0.27269
       23    -3.20808    -0.21811     0.26298     0.08994     0.07329
       24     2.46766     0.70878     0.54198    -0.03425    -0.34601
       25     1.87725     0.66098     1.38682     0.06428    -0.46598
      
                                     2018年10月31日 水曜日 18時59分17秒  29
      Obs      Prin1       Prin2       Prin3       Prin4       Prin5
       26    -0.06515     0.59743     1.30432     0.34178    -0.63469
       27    -2.45651     1.62520     0.27713    -0.56809    -0.42847
       28    -1.65980    -0.48072     1.11925     0.10371    -0.62247
       29    -0.70936    -1.96856    -0.24751     0.22094     0.01911
       30     1.15755    -1.43761     0.73381    -0.34791    -0.09441
       31    -1.25609    -0.11958     0.20548    -0.19162    -0.49946
       32     4.15665     0.99361     1.96750    -0.01536    -0.32314
       33     0.87959    -0.72622     0.87977     0.21228    -0.27865
       34     2.69100     1.86811     0.27018    -0.14817    -0.39702
       35    -3.39609     1.95724    -0.50137    -0.41672    -0.04933
       36    -1.46405     1.28178    -0.98134     0.72639    -0.17374
       37    -3.83071     1.17484    -1.44320     0.50418    -0.32666
       38     0.62654     1.66256     1.77034     1.31481    -0.55369
       39    -2.81646     1.21191    -0.43354    -0.27683    -0.30271
       40    -2.19282     0.82990    -0.48016    -0.40091    -0.41151
       41    -0.10726     2.66847     0.25416    -1.00040    -0.14954
       42     0.18534     2.31169    -0.24804     0.19271     0.30828
       43     0.23405     0.60537    -0.60261     0.35660     0.07954
       44    -4.96845    -1.73436     0.15178     0.22405     0.05195
       45    -3.00876     0.58751     1.06115     0.60239     0.26927
       46     2.80946     1.46426    -0.34666     0.36858     0.23395
       47     2.38406     0.00039     0.18432     0.11466     0.33701
       48     2.37237     0.52570     0.37671     0.18942     0.20364
       49     0.34669    -0.87383     0.75038    -0.35310    -0.08275
       50     1.51592    -0.76771    -0.10891     0.06443     0.00694
      
                                     2018年10月31日 水曜日 18時59分17秒  30
      Obs      Prin1       Prin2       Prin3       Prin4       Prin5
       51    -0.23080     0.89763    -1.35143    -0.83166     0.07704
       52     0.62882     1.99869    -1.03589    -0.17191     0.66387
       53    -2.20517     0.32106    -1.56173    -0.18367     0.05051
       54    -3.68567     0.32790    -1.49874     0.85133    -0.36279
       55     2.44302     2.27423    -0.86301    -0.50732     0.52770
       56     0.55733    -0.02127    -0.45244     0.36514    -0.09239
       57    -0.16412     1.15398    -0.85292    -0.17950    -0.32030
       58    -3.60382     0.44773    -1.53357     0.56014    -0.01870
       59    -5.48764     0.85320    -0.10789    -0.39219     0.19040
       60    -2.75455    -1.23042    -0.32934    -0.46590    -0.08459
       61     2.28595    -0.27494    -0.56631    -1.69147    -0.37823
       62    -2.51783     0.24010    -0.92208    -0.84380    -0.19438
       63    -0.24313     1.24629    -0.61142    -0.99697    -0.11334
       64     0.17952     1.36751    -0.46945    -0.33387     0.06304
       65    -2.71387     0.79529    -1.03713     0.43733     0.08730
       66    -2.76422     0.83514    -0.66159    -0.93860     0.80144
       67     4.86105     0.98212    -0.19715     0.43307     0.28542
       68    -0.08084     1.75986     0.18331     0.21542     0.05887
       69     1.49661     1.33957     0.25825    -0.45242    -0.11428
       70    -2.04617     0.77944    -0.94209     0.60610    -0.41306
       71    -5.35545    -0.70646    -0.55029     0.59217     0.03381
       72    -2.51744     0.67032     0.94289    -0.36661     0.13565
       73    -5.44628     1.81546     2.27551     0.40818     0.95580
       74    -1.99249     2.43480     2.70391    -0.45051     0.57040
       75    -6.69526     0.54494     2.35628    -0.42058     0.41302
      
                                     2018年10月31日 水曜日 18時59分18秒  31
      Obs      Prin1       Prin2       Prin3       Prin4       Prin5
       76     3.30144     1.15437    -0.59316    -0.57804     0.18524
       77     0.96325    -0.18280     0.31246    -0.66925    -0.48003
       78     1.30961     0.25832     0.24017    -0.75023    -0.32933
       79     2.18430     0.16208     1.58365     0.68238    -0.48030
       80     3.15811    -1.05177     0.15871     0.28531     0.07612
       81     2.00280    -1.26544     0.64047     0.28309     0.44063
       82    -1.83647    -2.21294     0.27417     0.28935     0.64235
       83    -0.99940    -1.67352     2.23895    -0.37569    -0.08958
       84     0.91938    -1.59484    -0.02837     0.48157    -0.12558
       85    -1.80317    -2.69597    -0.74192     0.24157     0.37071
       86    -0.29115     0.03537    -1.00836     0.15843    -0.44535
       87    -0.48243     0.24451    -0.77409     0.10671    -0.57441
       88     1.88804    -0.59783    -0.72131     0.66432     0.15155
       89     2.03853    -0.65873    -0.93466     0.49960    -0.07722
       90    -0.90455    -3.68468     0.48905    -0.71467     0.63319
       91    -2.19704    -2.09000    -0.53196     0.14201    -0.05220
       92     1.07690    -2.21368    -0.23119    -0.13569    -0.33986
       93     1.36800    -2.38319    -0.47609    -0.05553     0.44995
       94     3.45017    -1.41870    -0.44605     0.04710     0.05992
       95     1.15525    -2.72416    -0.80306    -0.21563     0.09521
       96     4.71461    -1.42762     0.02208    -0.04089     0.37429
       97     5.37363     0.09075    -0.61948     0.10720     0.27373
       98     4.46070    -0.47972     0.15730     0.63293     0.09759
       99     1.82961    -0.62653    -0.11218     0.25781     0.09109
      100     3.89885    -0.07893     0.20978     0.01719     0.19092
      
                                     2018年10月31日 水曜日 18時59分18秒  32
            : Prin2*Prin1. A=1, B=2, ...
      Prin2 |                                        |
          4 +                                        |
            |                                        |
            |                                        |
            |                              A        A|A          A
          2 +             A         A                A  A         A A
            |                            A    A      |A A   A      A              A
            |             A       A    C  AA        C|   A            A   A  A
            |       A              B  A A A    A     AA     B A  B
          0 +------------------------A--A------A---AA+A-AAA--AA-AA-----AA-------A---
            |             A    A       A     A       |   C    BAA          A
            |                          A  A       A  | A    AA       A
            |               A             AA    A    |    AA   A      A      A
         -2 +                             A A    A  A|   AA  A
            |                               A        |     AA
            |                                        |
            |                                   A    |
         -4 +                                        |
            |                                        |
            -+---------+---------+---------+---------+---------+---------+---------+
            -8        -6        -4        -2         0         2         4         6
                                              Prin1
      
                                     2018年10月31日 水曜日 18時59分18秒  33
            : Prin3*Prin2. A=1, B=2, ...
          4 +                                        |
            |                                        |
            |                                        |
            |                                        |
            |                                        |                       A
            |                       A                |    A            A
          2 +                                        |         A
            |                                        | A              A
            |                                        |     AA
      Prin3 |                         A       A A    |     AA
            |                       A  AA   AA A     |      A
            |   A              A             A A   CBAAAA A       A  A AA A     A
          0 +-------------------AA-AAA-A--A--A-AA----+--------A----A----------------
            |                A A A     A A  A A      A    A  A A A AA       A
            |             B     A             AA  B  |BAA  A A A B       A
            |                                 A      AAA     B   AA      A  A
            |                                        |  A     A  A
            |                                        |  AA
         -2 +                                        |
            -+---------+---------+---------+---------+---------+---------+---------+
            -4        -3        -2        -1         0         1         2         3
                                              Prin2
      
                                     2018年10月31日 水曜日 18時59分18秒  34
            : Prin3*Prin1. A=1, B=2, ...
          4 +                                        |
            |                                        |
            |                                        |
            |                                        |
            |                              A         |
            |       A     A                     A    |
          2 +                                        |                    A
            |                                        |  A       A
            |                                        A        A
      Prin3 |                         A A A  A       |   A
            |                              A         | A A AA  A A
            |                        A A A  A  AA A AAA  AA B A  BA A   A
          0 +-------------A-A-----------------------A+---AA--BA------A-----A-A----A-
            |                          B  B      A   |B AAA B      A  A      A
            |             A    A    A  A  A A  A   AA|A  A A  A A     AA        A
            |                          AA  A  A     B|  A    A A A
            |                     AA                A|
            |                      A      A          |
         -2 +                                        |
            -+---------+---------+---------+---------+---------+---------+---------+
            -8        -6        -4        -2         0         2         4         6
                                              Prin1
      
    3. 解釈方法 :
      • 累積寄与率の観点からは2軸まで取れば十分のようだ(85.9%)だが、固有値の下がり方を見ると3軸まで取っても良さそうだ。
      • 第1軸 : 全体的な嗜好度合いを表しているようだ。寄与率 68.3%。
      • 第2軸 : 年齢による嗜好の違いを表しているようだ。寄与率 17.6%
      • 第3軸 : 性別の違いによる嗜好の違いを表しているようだ。寄与率 7.5%。
      • 散布図にプロットして、これら食品の嗜好傾向を確認してみよう。

  6. 次回は、... : 11月12日 13:00-14:30
[DIR]講義のホームページへ戻ります