主成分分析の演習

統計処理 01 クラス : 第19回目(11/08/01)

  1. 分散共分散行列(Variance Covariance Matrix)と 相関行列(Correlation Matrix)の関係

    単位系に依存する/しないを確認してみよう

    1. プログラム : les1901.sas

       /* Lesson 19-1 */
       /*    File Name = les1901.sas   11/01/08   */
      
      data gakusei;
        infile 'all01.prn';
        input seibetsu $ height weight chest jitaku $ kodukai;
      
        he10=height*10;
        we10=weight*1000;
        ch10=chest*10;
      
      proc print data=gakusei(obs=10);
        var height weight chest he10 we10 ch10;
      run;
      
      proc princomp cov data=gakusei out=out_pr1;
        var height weight chest he10 we10 ch10;
      run;
      
      proc princomp data=gakusei out=out_pr2;
        var height weight chest he10 we10 ch10;
      run;
      

    2. 出力結果 : les1901.lst
      • 分散共分散行列(Variance Covariance Matrix) : 単位系に依存する。
      • 相関行列(Correlation Matrix) : 単位系に依存しない。
      • 身長(height)の 10倍(he10)、体重(weight)の 1000倍(we10)、 胸囲(chest)の 10倍(ch10) した変量を用意したので、 それぞれの変量の関係を見てみよう。
                                    SAS システム                             1
                                              10:00 Thursday, November 8, 2001
      
             OBS    HEIGHT    WEIGHT    CHEST    HE10     WE10    CH10
      
               1     145.0     38.0        .     1450    38000       .
               2     148.0     42.0        .     1480    42000       .
               3     148.9       .         .     1489        .       .
               4     149.0     45.0        .     1490    45000       .
               5     150.0     46.0       86     1500    46000     860
               6     151.7     41.5       80     1517    41500     800
               7     153.0     46.5       87     1530    46500     870
               8     153.0     55.0       78     1530    55000     780
               9     154.0     46.0        .     1540    46000       .
              10     155.0     48.0       83     1550    48000     830
      
                                    SAS システム                             2
                                              10:00 Thursday, November 8, 2001
      
                            Principal Component Analysis
      
            72 Observations
             6 Variables
                                 Simple Statistics
      
                             HEIGHT            WEIGHT             CHEST
      
             Mean       168.6805556       60.95972222       87.55555556
             StD          8.2911057       10.76027723        7.86127770
      
                                    SAS システム                             3
                                              10:00 Thursday, November 8, 2001
      
                            Principal Component Analysis
      
                                 Simple Statistics
      
                               HE10              WE10              CH10
      
             Mean       1686.805556       60959.72222       875.5555556
             StD          82.911057       10760.27723        78.6127770
      
                                    SAS システム                             4
                                              10:00 Thursday, November 8, 2001
      
                            Principal Component Analysis
      
                                 Covariance Matrix
      
                              HEIGHT            WEIGHT             CHEST
      
            HEIGHT              68.7              58.5              22.6
            WEIGHT              58.5             115.8              55.7
            CHEST               22.6              55.7              61.8
            HE10               687.4             585.4             226.2
            WE10             58542.7          115783.6           55653.7
            CH10               226.2             556.5             618.0
      
                                    SAS システム                             5
                                              10:00 Thursday, November 8, 2001
      
                            Principal Component Analysis
      
                                 Covariance Matrix
      
                                HE10              WE10              CH10
      
            HEIGHT             687.4           58542.7             226.2
            WEIGHT             585.4          115783.6             556.5
            CHEST              226.2           55653.7             618.0
            HE10              6874.2          585427.3            2261.9
            WE10            585427.3       115783566.1          556536.8
            CH10              2261.9          556536.8            6180.0
      
      
                                    SAS システム                            10
                                              10:00 Thursday, November 8, 2001
      
                            Principal Component Analysis
      
                                 Correlation Matrix
      
                 HEIGHT     WEIGHT      CHEST       HE10       WE10       CH10
      
      HEIGHT     1.0000     0.6562     0.3470     1.0000     0.6562     0.3470
      WEIGHT     0.6562     1.0000     0.6579     0.6562     1.0000     0.6579
      CHEST      0.3470     0.6579     1.0000     0.3470     0.6579     1.0000
      HE10       1.0000     0.6562     0.3470     1.0000     0.6562     0.3470
      WE10       0.6562     1.0000     0.6579     0.6562     1.0000     0.6579
      CH10       0.3470     0.6579     1.0000     0.3470     0.6579     1.0000
      
      

  2. 上記の説明の後は、 前回 やり残した第4節以降を実施。

  3. 次回は、... : 11月15日 14:45
[DIR]講義のホームページへ戻ります