主成分分析

統計モデル解析特論I/II : 第06回 (11/12/19)

 いくつか(p個)の変量の値を情報の損失をできるだけ少なくして、 少数変量(m個、m<p)の総合的指標(主成分)で代表させる方法として 主成分分析(Principal Component Analysis, PCA)と 因子分析(Factor Analysis, FA)がある。 いくつかのテストの成績を総合した総合的成績、 いろいろな症状を総合した総合的な重症度、 種々の財務指標に基づく企業の評価 等を求めたいといった場合に用いられる。 p変量(p次元)の観測値をm個(m次元)の主成分に縮約させるという意味で、 次元を減少させる(reduce)方法と言うこともでき、 多変量データを要約する有力な方法である。
 両者は似た目的に使われるが、元になっている考え方は異なるので 利用する場面では注意が必要である。違いに焦点を当てながら説明する。 今回は主成分分析を取り上げ、次回因子分析を取り上げる。
  1. 2変量の場合の主成分分析 : 理解を助けるため
    1. 定式化 : 配布資料 54ページ〜
      • 重み(係数) : a1、a2
      • 合成変量(線形結合) : z
      • よく代表するように、a1 と a2 を決める。
      • より広がって測定できる軸に沿うと情報量が多い。
           [参考:立体の測定] ノギス
      • 全測定値の分散を最大化する軸を決定する。

    2. 身長と体重の総合指標を求めよう : プログラム : les0601.sas

       /* Lesson 06-1 */
       /*    File Name = les0601.sas   11/12/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0601_log.txt'
                   print = 'Kougi19/les0601_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data gakusei;
        infile 'Kougi19/all19bu.csv'
          firstobs=2 
               truncover lrecl=80
               dlm=','  dsd missover
          ;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      /* if sex^='M' & sex^='F' then delete; */
      if shintyou=. | taijyuu=. | kyoui=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc plot data=gakusei;                        : 散布図
        plot shintyou*taijyuu;                       : 元の変量のプロット
      run;                                           :
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu;                        : 2変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
      run;                                           :
                                                     : 参考までに、
      proc sort data=outprin;                        : 説明のためにソートしてみる
        by prin1;                                    : 第一主成分で
      run;                                           :
      proc print data=outprin;                       : 体重がややが効いていることの確認
      run;                                           :
      

    3. 出力結果 : les0601_Results.txt , les0601-output.pdf
      • 身長と体重の散布図
      • 各変量の平均、標準偏差、分散共分散行列
      • 固有値、比率(寄与率)、累積寄与率 : 解釈に使う
      • 固有ベクトル(係数a1とa2) : 解釈に使う
      • 主成分得点 : 各個人の得点(z)、2つある
      • 第1軸と第2軸の主成分得点の散布図
      • 第1軸の小さいものから並べ直して状況を確かめてみる
                                     2019年11月12日 火曜日 11時22分53秒   2
              Plot of shintyou*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
                200 +
                    |
                    |
                    |
                    |                                 A
                    |                            A    A A            A
                180 +                       A A  C  C   B
                    |                          AAA  ABB B   AB             A
                    |                            BCB  AABB       A
           shintyou |                         C ACACB AAA A         A
                    |                    C  BBC BBA D
                    |                   BA CA A  AA
                160 +                    BCCB  AA
                    |                A ABBBBA     A
                    |            A   A AA     A
                    |                   A
                    |                AA
                    |
                140 +
                    ---+------------+------------+------------+------------+--
                      20           40           60           80           100
                                              taijyuu
      
                                     2019年11月12日 火曜日 11時22分53秒   3
      PRINCOMP プロシジャ
      
      オブザベーション数              122
      変数の数                          2
      
                  単純統計量
                    shintyou           taijyuu
      Mean       167.7467213       59.06065574
      StD          8.6343843       10.68154783
      
                    共分散行列
                        shintyou           taijyuu
      shintyou        74.5525925        66.2839195
      taijyuu         66.2839195       114.0954640
      
      総分散    188.6480565
      
                                     2019年11月12日 火曜日 11時22分53秒   4
      PRINCOMP プロシジャ
                     共分散行列の固有値
               固有値           差          比率          累積
         1    163.493875    138.339693      0.8667      0.8667
         2     25.154182                    0.1333      1.0000
      
               固有ベクトル
                       Prin1         Prin2
      shintyou      0.597562      0.801823
      taijyuu       0.801823      -.597562
      
                                     2019年11月12日 火曜日 11時22分56秒   5
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s        P         P
                t      j    y  t     u       r        u        r         r
       O   s    y      y    o  a     k       y        u        i         i
       b   e    o      u    u  k     a       e        w        n         n
       s   x    u      u    i  u     i       r        a        1         2
      
        1  F  146.7  41.0  85  J   10000  Vodafone   6000  -27.0582   -6.0834
        2  F  148.0  43.0  80  J   50000  DoCoMo     4000  -24.6777   -6.2361
        3  F  150.0  46.0  86      40000                .  -21.0771   -6.4252
        4  F  151.7  41.5  80  J   35000                .  -23.6694   -2.3730
        5  F  152.0  35.0  77  J   60000  DoCoMo     2000  -28.7020    1.7517
        6  F  153.0  46.5  87  G   10000                .  -18.8835   -4.3185
        7  F  153.0  55.0  78  J   30000                .  -12.0680   -9.3978
        8  F  154.4  44.0  75  J    9000  au         2000  -20.0515   -1.7020
        9  F  155.0  48.0  83  G  180000                .  -16.4856   -3.6112
       10  F  156.0  42.0  85  J       0  DoCoMo    15000  -20.6990    0.7760
       11  F  156.0  46.0  82  J   10000  Vodafone   7000  -17.4917   -1.6142
       12  F  156.0  48.0  70  J   30000                .  -15.8881   -2.8094
       13  F  156.0  49.0  85  J   25000                .  -15.0863   -3.4069
       14  F  156.0  50.0  82  J   40000  Vodafone  10000  -14.2844   -4.0045
       15  M  156.0  61.0  90  J       0                .   -5.4644  -10.5777
      
                                     2019年11月12日 火曜日 11時22分56秒   6
                 Plot of Prin2*Prin1.  Legend: A = 1 obs, B = 2 obs, etc.
      Prin2 |                              |
         20 +                              |
            |                              |
            |                              |
            |                              |A  A
         10 +                              |       AB
            |                              |  A  AA   BA    B
            |                 A AB       AA|   AA      A    A
            | A              AA   B   BA B A   BB B A B    B
          0 +---------A--A-AA-DC--B--AAA--AA-C-AC----A-AAA--------------------------
            |      A   A  ABAAA   B  A   A A  A BB  A AAAA      A
            |   A A     A    A  A    AA  A |   B    A A A     AA
            |         A                   A|            A                   A
        -10 +                  A      A    |                      A
            |                              |
            |                              |                                      A
            |                              |                        A
        -20 +                              |
            |                              |
            -+---------+---------+---------+---------+---------+---------+---------+
            -30       -20       -10        0        10        20        30        40
                                              Prin1
      
                                     2019年11月12日 火曜日 11時22分56秒   7
                s
                h      t             k       c
                i      a       j     o       a        t
                n      i    k  i     d       r        s        P         P
                t      j    y  t     u       r        u        r         r
       O   s    y      y    o  a     k       y        u        i         i
       b   e    o      u    u  k     a       e        w        n         n
       s   x    u      u    i  u     i       r        a        1         2
      
        1  F  152.0  35.0  77  J   60000  DoCoMo     2000  -28.7020   1.75166
        2  F  146.7  41.0  85  J   10000  Vodafone   6000  -27.0582  -6.08337
        3  F  148.0  43.0  80  J   50000  DoCoMo     4000  -24.6777  -6.23613
        4  F  151.7  41.5  80  J   35000                .  -23.6694  -2.37304
        5  F  150.0  46.0  86      40000                .  -21.0771  -6.42517
        6  F  156.0  42.0  85  J       0  DoCoMo    15000  -20.6990   0.77602
      ≪中略≫
       94  M  173.0  68.0  93.0        30000 au         350 10.3069  -1.1296
       95  M  171.0  70.0  89.0   J    60000              . 10.7154  -3.9284
       96  M  177.0  66.0  87.0   G    40000 DoCoMo    6000 11.0935   3.2728
       97  M  180.0  64.0  90.0   J    35000              . 11.2826   6.8734
       98  M  180.0  64.0  90.0   G    60000 au       10000 11.2826   6.8734
       99  M  176.0  67.0  83.0   G        0              . 11.2978   1.8734
      100  M  172.0  70.0  90.0   J    30000              . 11.3130  -3.1266
      101  M  175.0  68.0  80.0       150000 au       15000 11.5021   0.4740
      102  M  178.0  66.0  95.0   J    30000 au        3000 11.6911   4.0746
      103  M  173.8  69.6  90.0   J    30000 DoCoMo   13000 12.0679  -1.4443
      104  M  180.0  65.0  88.0   J    30000              . 12.0844   6.2758
      105  M  173.0  71.0 100     G        0              . 12.7124  -2.9223
      106  M  172.0  72.0  89     G   150000              . 12.9167  -4.3217
      107  M  175.0  70.0  95     G    50000           8000 13.1057  -0.7211
      108  M  170.0  74.0  90     J        0              . 13.3252  -7.1205
      109     173.0  72.0  90     J        0           1500 13.5142  -3.5199
      110     177.0  70.0  86     J        0           5500 14.3008   0.8825
      111  M  180.0  70.0  94     G    70000   au      5000 16.0935   3.2880
      

    4. 解釈方法
      • 寄与率 : その軸がどの程度説明力を持っているか : 第1軸だけで十分(86.7%)。第2軸に含まれる説明力は小さい(13.3%)。
      • 固有ベクトル : その軸の特徴を示している : 身長と体重の重みはほぼ同等だが、体重がやや大きめに効いている(第1軸)
      • 主成分得点と散布図 : 各個人がどこに付置されているか
      • 第1軸 : 全体的な体格の指標。身長と体重を足したような指標。

  2. 3変量以上の主成分分析
    1. 定式化 : 資料 71ページ〜
      • 2変量の時の考え方を拡張したもの
      • 合成変量(線形結合) : z
      • 合成変量の分散を最大化する軸を決定する。

    2. 身長、体重、胸囲での総合指標を求めてみよう : プログラム : les0602.sas
       /* Lesson 06-1 */
       /*    File Name = les0602.sas   11/12/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0602_log.txt'
                   print = 'Kougi19/les0602_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data gakusei;
        infile 'Kougi19/all19bu.csv'
          firstobs=2 
               truncover lrecl=80
               dlm=','  dsd missover
          ;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      /* if sex^='M' & sex^='F' then delete; */
      if shintyou=. | taijyuu=. | kyoui=. then delete;
      
      proc print data=gakusei(obs=10);
      run;
      
      proc princomp cov data=gakusei out=outprin;    : 主成分分析(分散共分散行列)
        var shintyou taijyuu kyoui;                  : 3変量
      run;                                           :
      proc print data=outprin(obs=15);               : 結果の出力
      run;                                           :
      proc plot data=outprin;                        : 散布図
        plot prin2*prin1/vref=0 href=0;              : 主成分得点のプロット
        plot prin3*prin2/vref=0 href=0;              :
        plot prin3*prin1/vref=0 href=0;              :
      run;                                           :
      

    3. 出力結果 : les0602_Results.txt , les0602-output.pdf
      • 各変量の平均、標準偏差、共分散行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

                                     2019年11月12日 火曜日 11時26分04秒  15
      PRINCOMP プロシジャ
      
      オブザベーション数              122
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.7467213       59.06065574       86.06065574
      StD          8.6343843       10.68154783        8.18762983
      
                             共分散行列
                        shintyou           taijyuu             kyoui
      shintyou        74.5525925        66.2839195        21.3452418
      taijyuu         66.2839195       114.0954640        41.6409186
      kyoui           21.3452418        41.6409186        67.0372822
      
      総分散    255.68533871
      
                                     2019年11月12日 火曜日 11時26分04秒  16
      PRINCOMP プロシジャ
                     共分散行列の固有値
               固有値           差          比率         累積
         1    182.066441    131.507664      0.7121      0.7121
         2     50.558777     27.498656      0.1977      0.9098
         3     23.060121                    0.0902      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.539431      -.435853      0.720449
      taijyuu       0.754749      -.129063      -.643193
      kyoui         0.373320      0.890716      0.259339
      
                                     2019年11月12日 火曜日 11時26分04秒  17
              s
              h     t          k      c
              i     a     j    o      a       t
              n     i   k i    d      r       s       P        P        P
              t     j   y t    u      r       u       r        r        r
       O  s   y     y   o a    k      y       u       i        i        i
       b  e   o     u   u k    a      e       w       n        n        n
       s  x   u     u   i u    i      r       a       1        2        3
      
        1 F 146.7 41.0 85 J  10000 Vodafone  6000 -25.3805  10.5595  -3.8217
        2 F 148.0 43.0 80 J  50000 DoCoMo    4000 -25.0363   5.2812  -5.4682
        3 F 150.0 46.0 86    40000              . -19.4533   9.3666  -4.4008
        4 F 151.7 41.5 80 J  35000              . -24.1726   3.8621  -1.8377
        5 F 152.0 35.0 77 J  60000 DoCoMo    2000 -30.0366   1.8981   1.7812
        6 F 153.0 46.5 87 G  10000              . -17.0843   8.8852  -2.3017
        7 F 153.0 55.0 78 J  30000              . -14.0288  -0.2283 -10.1029
        8 F 154.4 44.0 75 J   9000 au        2000 -22.6958  -2.0909  -2.7972
        9 F 155.0 48.0 83 G 180000              . -16.3666   4.2570  -2.8630
       10 F 156.0 42.0 85 J      0 DoCoMo   15000 -19.6090   6.3770   2.2353
       11 F 156.0 46.0 82 J  10000 Vodafone  7000 -17.7100   3.1886  -1.1155
       12 F 156.0 48.0 70 J  30000              . -20.6803  -7.7581  -5.5139
       13 F 156.0 49.0 85 J  25000              . -14.3258   5.4736  -2.2670
       14 F 156.0 50.0 82 J  40000 Vodafone 10000 -14.6910   2.6723  -3.6882
       15 M 156.0 61.0 90 J      0              .  -3.4022   8.3784  -8.6887
      
                                     2019年11月12日 火曜日 11時26分04秒  18
                 Plot of Prin2*Prin1.  Legend: A = 1 obs, B = 2 obs, etc.
         20 +                            |
            |                            |       A
            |                            |  A                A           A
            |          A   A A         A |    A      A
            |          A   A   A AA   AB | A  AA
            |       A   A    AABEBAB A   B A D AA AAA   AA A      A
          0 +---------------AAABABAA-CAB-AA-AC--BBBB-AA-----------------------------
            |            A    A   A      |AAABA AC   AA
            |              A   A      A  B A A AA A
      Prin2 |                        A   | C A A    A
            |                       A  A |
            |                            |
        -20 +                            |
            |                            |
            |                  A         |
            |                            |
            |                            |
            |                            |
        -40 +                            |    A
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      
                                     2019年11月12日 火曜日 11時26分04秒  19
                 Plot of Prin3*Prin2.  Legend: A = 1 obs, B = 2 obs, etc.
         20 +                                                  |
            |                                                  |
            |                                                  |
            |                                     A   A   AA A |
            |                                      AA A  A B B | AA
            |                                         AA   C BBGDEA  BA
          0 +-----------------------------------A----A--B-AAA-AEBGDCBAC-A----AA-----
            |                        A               A  AA  ACACACCCB  AB A   A
            |                                          A  A    |AA  B
      Prin3 |                                                  A       A
            |                                                  |            A
            |                                                  |  A
        -20 +                                                  |
            |         A                                        |
            |                                                  |
            |                                                  |
            |                                                  |
            |                                                  |
        -40 +                                                  |
            -+---------+---------+---------+---------+---------+---------+---------+
            -50       -40       -30       -20       -10        0        10        20
                                              Prin2
      
                                     2019年11月12日 火曜日 11時26分04秒  20
                 Plot of Prin3*Prin1.  Legend: A = 1 obs, B = 2 obs, etc.
         20 +                            |
            |                            |
            |                            |
            |                          A | A  AA      A
            |                            A B B   C AA
            |       A      A   CAB B B A |ABADABB    BA
          0 +---------------ABB-EBBAABBB-CAA-C--AAC-AA-------A----------------------
            |          AAA A AAC AB  A   A ABBAABBAA    AA
            |          A   A          AA |         A              A
      Prin3 |                  A       A |
            |                            |                               A
            |                            |                 A
        -20 +                            |
            |                            |    A
            |                            |
            |                            |
            |                            |
            |                            |
        -40 +                            |
            -+-------------+-------------+-------------+-------------+-------------+
            -40           -20            0            20            40            60
                                              Prin1
      

    4. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(累積の項 91.0%)。
      • 各軸の意味付け
        • 第1軸 : 全体的な体格の因子。特に体重が効いている。
        • 第2軸 : 太さの因子(?)。胸囲が正で大きく、身長が負。

        • 第3軸 : 華奢さの因子(?)。無視しても良い軸であるが。(9.0%)。

  3. 相関行列を使う理由

    1. 相関行列を用いて体格の総合指標を求めてみよう : プログラム : les0603.sas

       /* Lesson 06-3 */
       /*    File Name = les0603.sas   11/12/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0603_log.txt'
                   print = 'Kougi19/les0603_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data gakusei;
        infile 'Kougi19/all19bu.csv'
          firstobs=2 
               truncover lrecl=80
               dlm=','  dsd missover
          ;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      /* if sex^='M' & sex^='F' then delete; */
      if shintyou=. | taijyuu=. | kyoui=. then delete;
      
      proc print data=gakusei(obs=10);
      
      run;                                          :
      proc princomp data=gakusei out=outprin;       : 相関係数を使って
        var shintyou taijyuu kyoui;                 :
      run;                                          :
      proc print data=outprin(obs=15);
      run;
      proc plot data=outprin;
        plot prin2*prin1/vref=0 href=0;
        plot prin3*prin2/vref=0 href=0;
        plot prin3*prin1/vref=0 href=0;
      run;
      

    2. 出力結果 : les0603_Results.txt , les0603-output.pdf
      • 各変量の平均、標準偏差、相関行列
      • 固有値、比率(寄与率)、累積寄与率
      • 固有ベクトル
      • 主成分得点
      • 第1軸〜第3軸の散布図

                                     2019年11月12日 火曜日 11時29分24秒  30
      PRINCOMP プロシジャ
      
      オブザベーション数              122
      変数の数                          3
      
                           単純統計量
                    shintyou           taijyuu             kyoui
      Mean       167.7467213       59.06065574       86.06065574
      StD          8.6343843       10.68154783        8.18762983
      
                       相関行列
                    shintyou      taijyuu       kyoui
      shintyou        1.0000       0.7187      0.3019
      taijyuu         0.7187       1.0000      0.4761
      kyoui           0.3019       0.4761      1.0000
      
                                     2019年11月12日 火曜日 11時29分24秒  31
      PRINCOMP プロシジャ
                      相関行列の固有値
               固有値           差          比率        累積
         1    2.01846742    1.29015748      0.6728      0.6728
         2    0.72830994    0.47508731      0.2428      0.9156
         3    0.25322264                    0.0844      1.0000
      
                      固有ベクトル
                       Prin1         Prin2         Prin3
      shintyou      0.596585      -.499433      0.628214
      taijyuu       0.644536      -.168237      -.745834
      kyoui         0.478183      0.849861      0.221535
      

    3. 解釈方法
      • 寄与率 : 2軸まで取れば十分のようだ(累積の項 91.6%)。
      • 各軸の意味付け
        • 第1軸 : 全体的な体格の因子。
        • 第2軸 : 太さの因子。
      • 分散共分散行列を使ったときよりも 第1軸の固有ベクトル同士が近い値になった。 しかし、軸の解釈に違いはない。 その理由はこの例では 3変量のスケールや分散に それほどの違いがないためと想像される。
      • 分散共分散行列と相関行列を使ったときの違いを見てみたければ、 shintyou のみを mm 単位で測定したと考えて、 100倍したものをデータとして両者の出力を比較してみよ。
        プログラム : les0604.sas 、出力結果 : les0604_Results.txt , les0604-output.pdf

  4. 主成分の数の決定基準 : 配布資料 80ページ
    明確に決まっているわけではないが、以下のような基準が一般的に 用いられている。また、結果の解釈の都合上、多少増減させることもある。

  5. [例題1] 食品の嗜好性を探ってみよう : 90ページ〜
    100種類の食品の性、年齢毎の嗜好度調査の結果 : データ : food.dat

    1. 相関行列を用いて総合指標を求めてみよう : プログラム : les0605.sas
       /* Lesson 06-5 */
       /*    File Name = les0605.sas   11/12/19   */
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0605_log.txt'
                   print = 'Kougi19/les0605_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data food;                  
        infile 'Kougi19/food.dat';
        input X01-X10;            
          label X01='M(-15)'      
                X02='M(16-20)'    
                X03='M(21-30)'    
                X04='M(31-40)'    
                X05='M(41-)'      
                X06='F(-15)'      
                X07='F(16-20)'    
                X08='F(21-30)'    
                X09='F(31-40)'    
                X10='F(41-)';     
                                  
      proc print data=food(obs=10);
      run;                         
      
      proc princomp data=food out=outprin;
        var X01-X10;               
      run;                         
      
      proc print data=outprin(obs=15);
      run;
      
    2. 出力結果 : les0605_Results.txt , les0605-output.pdf
                                     2019年11月12日 火曜日 13時18分19秒   1
      
      Obs    X01    X02    X03    X04    X05    X06    X07    X08    X09    X10
      
        1   7.69   7.31   7.47   7.76   7.87   7.51   7.24   7.70   7.91   7.95
        2   6.59   5.56   6.21   6.04   5.81   6.64   6.11   6.53   6.44   6.64
        3   4.55   4.18   4.36   4.25   4.53   4.60   3.66   4.04   3.68   4.43
        4   6.78   6.11   6.30   5.98   5.56   6.37   6.29   5.43   5.32   5.28
        5   6.47   6.24   6.02   5.42   5.88   6.00   5.60   4.60   5.40   5.95
        6   6.96   6.81   6.91   6.48   6.23   7.09   7.27   7.13   6.86   7.36
        7   6.57   5.70   5.89   5.16   5.30   6.07   5.56   4.50   4.92   5.33
        8   7.32   6.95   6.02   4.98   4.88   6.82   6.40   5.53   5.61   5.33
        9   6.51   6.15   5.51   4.68   4.16   5.17   4.81   4.70   4.86   3.82
       10   6.86   6.05   5.85   6.14   6.75   6.71   5.39   5.42   6.03   6.59
      
                                     2019年11月12日 火曜日 13時18分19秒   2
      PRINCOMP プロシジャ
      
      オブザベーション数              100
      変数の数                         10
      
                                   単純統計量
                     X01           X02           X03           X04           X05
      Mean   6.038100000   5.784800000   5.947100000   5.669500000   5.640600000
      StD    1.239147389   1.034139939   0.825972699   0.915395124   0.884228614
      
                                   単純統計量
                     X06           X07           X08           X09           X10
      Mean   5.781300000   5.563900000   5.379400000   5.517400000   5.542100000
      StD    1.294327683   1.182607883   1.121124814   1.016264322   1.130856737
      
                                     2019年11月12日 火曜日 13時18分20秒   3
      PRINCOMP プロシジャ
                                      相関行列
                                X01         X02         X03         X04         X05
      X01      M(-15)        1.0000      0.8708      0.5158      0.3701      0.1723
      X02      M(16-20)      0.8708      1.0000      0.7588      0.6043      0.4021
      X03      M(21-30)      0.5158      0.7588      1.0000      0.8524      0.7262
      X04      M(31-40)      0.3701      0.6043      0.8524      1.0000      0.8742
      X05      M(41-)        0.1723      0.4021      0.7262      0.8742      1.0000
      X06      F(-15)        0.9384      0.8207      0.5164      0.3580      0.2077
      X07      F(16-20)      0.8107      0.8381      0.6584      0.4875      0.3543
      X08      F(21-30)      0.6161      0.7095      0.6990      0.6199      0.5235
      X09      F(31-40)      0.5003      0.6470      0.7013      0.7207      0.7101
      X10      F(41-)        0.3298      0.4569      0.5584      0.6321      0.7479
      
                               相関行列
                  X06         X07         X08         X09         X10
      X01      0.9384      0.8107      0.6161      0.5003      0.3298
      X02      0.8207      0.8381      0.7095      0.6470      0.4569
      X03      0.5164      0.6584      0.6990      0.7013      0.5584
      X04      0.3580      0.4875      0.6199      0.7207      0.6321
      X05      0.2077      0.3543      0.5235      0.7101      0.7479
      X06      1.0000      0.8888      0.7465      0.6215      0.4932
      
                                     2019年11月12日 火曜日 13時18分20秒   4
      PRINCOMP プロシジャ
                               相関行列
                  X06         X07         X08         X09         X10
      X07      0.8888      1.0000      0.8949      0.7679      0.6415
      X08      0.7465      0.8949      1.0000      0.8528      0.7741
      X09      0.6215      0.7679      0.8528      1.0000      0.9112
      X10      0.4932      0.6415      0.7741      0.9112      1.0000
      
                      相関行列の固有値
               固有値           差           比率        累積
         1    6.82795512    5.06608201      0.6828      0.6828
         2    1.76187311    1.00742187      0.1762      0.8590
         3    0.75445124    0.49207487      0.0754      0.9344
         4    0.26237637    0.14082435      0.0262      0.9607
         5    0.12155202    0.02358655      0.0122      0.9728
         6    0.09796547    0.02586580      0.0098      0.9826
         7    0.07209967    0.02801926      0.0072      0.9898
         8    0.04408041    0.00832792      0.0044      0.9942
         9    0.03575249    0.01385842      0.0036      0.9978
        10    0.02189408                    0.0022      1.0000
      
                                     2019年11月12日 火曜日 13時18分20秒   5
      PRINCOMP プロシジャ
                                  固有ベクトル
                            Prin1       Prin2       Prin3       Prin4       Prin5
      X01    M(-15)      0.286033    -.446335    0.193512    0.428019    0.162365
      X02    M(16-20)    0.331337    -.239842    0.336063    0.022488    -.559594
      X03    M(21-30)    0.323345    0.166337    0.442291    -.436029    -.168594
      X04    M(31-40)    0.299329    0.358627    0.375366    0.063449    0.367912
      X05    M(41-)      0.260727    0.507209    0.127419    0.375425    0.146879
      X06    F(-15)      0.308635    -.407882    -.083695    0.267375    0.286866
      X07    F(16-20)    0.344271    -.252697    -.171400    -.295655    -.025050
      X08    F(21-30)    0.347877    -.032314    -.289087    -.507508    0.452377
      X09    F(31-40)    0.345636    0.164368    -.322236    0.040012    -.388944
      X10    F(41-)      0.303334    0.267273    -.522559    0.251270    -.190507
      
                                固有ベクトル
                Prin6         Prin7         Prin8         Prin9        Prin10
      X01    -.016413      -.062138      -.038493      -.141617      0.668052
      X02    -.212367      0.479465      0.283325      -.013739      -.225064
      X03    0.476929      -.416354      0.136150      0.085922      0.163960
      X04    -.562491      -.066245      -.114301      0.403713      -.068344
      X05    0.385123      0.325310      -.167534      -.437833      -.148648
      X06    0.209878      -.335058      0.176137      0.090538      -.618107
      
                                     2019年11月12日 火曜日 13時18分20秒   6
      PRINCOMP プロシジャ
                                固有ベクトル
                Prin6         Prin7         Prin8         Prin9        Prin10
      X07    0.137469      0.236104      -.762654      0.204382      -.046351
      X08    -.128390      0.256135      0.382983      -.303270      0.106863
      X09    -.387189      -.488821      -.161974      -.425188      -.030381
      X10    0.181955      0.100632      0.270185      0.543107      0.229904
      
                                     2019年11月12日 火曜日 13時18分22秒   7
      
      Obs  X01  X02  X03  X04  X05  X06  X07  X08  X09  X10   Prin1    Prin2
        1 7.69 7.31 7.47 7.76 7.87 7.51 7.24 7.70 7.91 7.95  5.88693  1.44204
        2 6.59 5.56 6.21 6.04 5.81 6.64 6.11 6.53 6.44 6.64  1.65842  0.13686
        3 4.55 4.18 4.36 4.25 4.53 4.60 3.66 4.04 3.68 4.43 -4.44537 -0.34692
        4 6.78 6.11 6.30 5.98 5.56 6.37 6.29 5.43 5.32 5.28  0.72138 -0.63217
        5 6.47 6.24 6.02 5.42 5.88 6.00 5.60 4.60 5.40 5.95  0.15339 -0.18363
        6 6.96 6.81 6.91 6.48 6.23 7.09 7.27 7.13 6.86 7.36  3.65322  0.09908
        7 6.57 5.70 5.89 5.16 5.30 6.07 5.56 4.50 4.92 5.33 -0.65902 -0.78995
        8 7.32 6.95 6.02 4.98 4.88 6.82 6.40 5.53 5.61 5.33  0.76044 -1.96919
        9 6.51 6.15 5.51 4.68 4.16 5.17 4.81 4.70 4.86 3.82 -1.96687 -1.71968
       10 6.86 6.05 5.85 6.14 6.75 6.71 5.39 5.42 6.03 6.59  1.35649  0.51749
       11 7.04 6.03 6.53 6.02 6.68 6.78 5.91 6.26 5.76 5.95  1.76317  0.15476
      
      Obs   Prin3    Prin4    Prin5    Prin6    Prin7    Prin8    Prin9   Prin10
        1 -0.07682  0.40809  0.25348 -0.08404  0.00629  0.07518 -0.29432  0.07804
        2 -0.90098 -0.05516  0.42231 -0.06712 -0.42537  0.15924  0.03126  0.21633
        3 -0.55169  0.23782  0.37097  0.08301  0.22924  0.36927  0.13546 -0.13545
        4  0.55357 -0.08449  0.21583  0.10836 -0.04069 -0.30130  0.23414  0.03747
        5  0.21693  0.67993 -0.55569  0.43975  0.12407 -0.03449  0.20098  0.03292
        6 -0.63902 -0.35301 -0.06665  0.08296  0.01967  0.09429  0.27099  0.10991
        7  0.26301  0.42015 -0.16052  0.48267 -0.13359 -0.13508  0.28383  0.14238
        8  0.06701 -0.04720 -0.60733  0.05720  0.07830  0.10980 -0.04606  0.07099
        9  0.66740 -0.33431 -0.54215 -0.50605 -0.09164  0.28167 -0.34880  0.33721
       10 -0.17674  1.31452  0.21057  0.17171  0.08563  0.18324 -0.13665 -0.09062
       11  0.23456  0.33063  0.60092  0.58481  0.05801  0.16376 -0.43135  0.07070
      
                                     2019年11月12日 火曜日 13時18分22秒   8
      
      Obs  X01  X02  X03  X04  X05  X06  X07  X08  X09  X10   Prin1    Prin2
       12 6.59 6.30 6.29 5.94 6.10 5.93 5.52 5.35 5.45 5.85  0.72383  0.14551
       13 5.93 4.76 5.09 5.51 5.79 5.49 4.97 4.69 5.30 5.61 -1.20892  0.34668
       14 7.00 6.31 6.82 6.26 5.26 6.69 6.27 5.94 5.78 5.26  1.42272 -0.75706
       15 6.63 5.47 5.54 4.88 4.70 5.89 4.64 4.43 4.00 3.98 -2.13183 -1.49511
      
      Obs   Prin3    Prin4    Prin5    Prin6    Prin7    Prin8    Prin9   Prin10
       12  0.49777  0.35538 -0.09548  0.21636  0.19362  0.18252  0.04441 0.14858
       13 -0.53251  0.85212  0.41764 -0.06351 -0.06122 -0.26835 -0.02047 0.09838
       14  0.71704 -0.53272  0.19744 -0.12540 -0.54510  0.00683  0.21138 0.12406
       15  0.88751  0.23480  0.36191  0.24293 -0.09797  0.25997  0.00113 0.14547
      

    3. 解釈方法 : 95ページ〜
      • 寄与率 : 2軸まで取れば十分のようではある(累積の項 85.9%)。
      • しかし、固有値の変化量からすると、3軸でも良さそう : 3と4の間が空いてるから
      • 主成分の数を3として意味付けを考えてみよう
      • 各軸の意味付け
        • 第1軸 : 全体的な嗜好度合い。
        • 第2軸 : 年齢による嗜好度合い(若いとマイナス)。
        • 第3軸 : 性別による嗜好度合い(男性だとプラス)。


  6. 同じデータを両手法に適用して、その共通性と違いを体験してみよう
    上記で示したデータも含めていくつかデータを置いておく。 興味があればダウンロードして両手法に適用してはどうだろうか。
    1. seiseki.txt
      • 中学2年生の成績データ。23名x5科目。国語、社会、数学、理科、英語。
      • 配布資料に掲載され、例題に使われていたデータ。
    2. food.txt
      • 100 種類の食品の嗜好度データ。100食品x10グループ。
    3. syumi.txt
      • 趣味に関するアンケート調査データ。30種類x6グループ。

  7. 【参考】読み物

  8. 次回は、... : 11月19日 16:20-17:50
[DIR]講義のホームページへ戻ります