回帰分析(前編)

統計モデル解析特論I/II : 第04回 (10/29/19)

 今回は、多変量解析の代表的な手法である回帰分析について解説する。
 本講義では、数理的な導出方法よりも、当該手法がどのようなモデルや アイディアに基づいて構成されたかの考え方や原理に重点を置いて説明する。 その最初に紹介する統計解析手法として、回帰分析を取り上げる。 工学系の実験等を行う領域では頻繁に使用される手法であるが、 日常的な話題の中でも概念は広く利用されているので、 取っ付き易い手法ではないだろうか。
 過去のデータからその構造を把握し、新規に測定されたデータに対する予測を 行ないたいと言うときに、回帰分析は有用である。 構造のシンプルな単回帰分析でこの手法の原理を理解し、 複数の説明変量を用いた重回帰分析に拡張する。 残差の取り方や、その二乗和を最少にするという考えは同じである。
 ここでは SAS プログラムとその出力を例示しながら説明するが、 データは掲載されているので、ご自身の手慣れたプログラム言語を使って 各自実践してほしい。

 ● 目次

   1. 単回帰分析 : 予測等に使う、連続変量の関係
   2. 「体重の大きい者を除外」して実行するには?
   3. 有効桁数に注意せよ : どこまでが「意味ある桁」か?
   4. 重回帰分析 : 2変量以上の説明する変量(説明変量)で 1変量(目的変量)を説明
   5. 特定グループでの解析
   6. [要点] 解析する上での注意点
   7. 誤用?!
   8. 4つの尺度と回帰分析
   9. 回帰分析における変数選択、総当たり法
  10. 次回は、...


 ● 回帰分析 : 連続変量の予測

  1. 単回帰分析 : 予測等に使う、連続変量の関係
    • 体重を身長で説明(回帰)したい : [体重]=a[身長]+b : 回帰係数
    • 説明される変量と説明する変量 : 説明する変数が一つ = 「単」 <===>「重」
    • 説明される変量 : 目的変数、従属変数、dependent variable
    • 説明する変量 : 説明変数、独立変数、independent variable
    • どうやって直線を決める? : 予測誤差の2乗和を最小にする
    • 誤差の取り方 : 指定された独立変数における測定誤差
    • 式の展開、解法。

    1. プログラム : les0402.sas
       /* Lesson 04-2 */
       /*    File Name = les0402.sas   10/29/18   */
      
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0402_log.txt'
                   print = 'Kougi19/les0402_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data gakusei;
        infile 'Kougi19/all19bu.csv'
          firstobs=2 
               truncover lrecl=80
               dlm=','  dsd missover
          ;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      /* if sex^='M' & sex^='F' then delete; */
      
      proc print data=gakusei(obs=10);                       : 先頭10行を試しに表示
      run;
      
      proc reg data=gakusei;                                 : 回帰分析
        model taijyuu=shintyou;                              : 変量を指定
        output out=outreg1 predicted=pred1 residual=resid1;  : 結果項目の保存
      run;                                                   :
                                                             :
      proc print data=outreg1(obs=15);                       : 表示してみる
      run;                                                   :
                                                             :
      proc plot data=outreg1;                        : 散布図を描く
        plot taijyuu*shintyou/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
        plot pred1*taijyuu;                          : 予測値と観測値
        plot resid1*pred1   /vref=0;                 : 残差と予測値(残差解析)(水平軸指定)
        plot resid1*shintyou/vref=0;                 : 残差と説明変数(残差解析)
        plot resid1*taijyuu /vref=0;                 : 残差と目的変数(残差解析)
      run;                                           :
                                                     :
      proc univariate data=outreg1 plot normal;      : 残差を正規プロットして確かめる
        var resid1;                                  :
      run;                                           :
      
      [備考] 上記のコロン以降は説明のためのものであり、 SAS のプログラムではありません。

    2. 出力結果 : les0402_Results.txt , les0402_output.pdf
                                     2019年10月29日 火曜日 09時02分06秒  27
      
      Obs   sex   shintyou   taijyuu   kyoui   jitaku   kodukai   carryer    tsuuwa
      
        1    F      145.0      38.0       .      J       10000                   . 
        2    F      146.7      41.0      85      J       10000    Vodafone    6000 
        3    F      148.0      42.0       .      J       50000                   . 
        4    F      148.0      43.0      80      J       50000    DoCoMo      4000 
        5    F      148.9        .        .      J       60000                   . 
        6    F      149.0      45.0       .      G       60000                   . 
        7    F      150.0      46.0      86              40000                   . 
        8    F      151.0      45.0       .      J       20000    docomo      5000 
        9    F      151.0      50.0       .      G       60000    J-PHONE        . 
       10    F      151.7      41.5      80      J       35000                   . 
      
                                     2019年10月29日 火曜日 09時02分06秒  28
      REG プロシジャ
      モデル : MODEL1
      従属変数 : taijyuu 
      
      読み込んだオブザベーション数            399
      使用されたオブザベーション数            350
      欠損値を含むオブザベーション数           49
      
                                      分散分析
       
      要因                   自由度        平方和      平均平方     F 値   Pr > F
      
      Model                       1         14602          14602    325.81   <.0001
      Error                     348         15596       44.81605                   
      Corrected Total           349         30198                                  
      
      Root MSE                 6.69448    R2 乗                  0.4835
      従属変数の平均          58.95800    調整済み R2 乗         0.4821
      変動係数                11.35466                                  
      
                                     2019年10月29日 火曜日 09時02分06秒  29
      REG プロシジャ
      モデル : MODEL1
      従属変数 : taijyuu 
                               パラメータの推定
       
                              パラメータ
      変数          自由度             推定値       標準誤差     t 値   Pr > |t|
      
      Intercept           1         -78.49464        7.62341    -10.30     <.0001
      shintyou            1           0.81370        0.04508     18.05     <.0001
      
                                     2019年10月29日 火曜日 09時02分07秒  30
      Obs sex shintyou taijyuu kyoui jitaku kodukai carryer  tsuuwa  pred1    resid1
      
        1  F    145.0    38.0     .    J      10000              .  39.4924  -1.4924
        2  F    146.7    41.0    85    J      10000 Vodafone  6000  40.8757   0.1243
        3  F    148.0    42.0     .    J      50000              .  41.9335   0.0665
        4  F    148.0    43.0    80    J      50000 DoCoMo    4000  41.9335   1.0665
        5  F    148.9      .      .    J      60000              .  42.6658    .    
        6  F    149.0    45.0     .    G      60000              .  42.7472   2.2528
        7  F    150.0    46.0    86           40000              .  43.5609   2.4391
        8  F    151.0    45.0     .    J      20000 docomo    5000  44.3746   0.6254
        9  F    151.0    50.0     .    G      60000 J-PHONE      .  44.3746   5.6254
       10  F    151.7    41.5    80    J      35000              .  44.9442  -3.4442
       11  F    152.0    35.0    77    J      60000 DoCoMo    2000  45.1883 -10.1883
       12  F    152.0    43.0     .    J      20000 au        3500  45.1883  -2.1883
       13  F    152.0    44.0     .           45000 DoCoMo    4000  45.1883  -1.1883
       14  F    153.0    41.0     .    J     125000 No           .  46.0020  -5.0020
       15  F    153.0    42.0     .    G          0 Vodafone  1000  46.0020  -4.0020
      
                                     2019年10月29日 火曜日 09時02分07秒  31
              Plot of taijyuu*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
      
      taijyuu |
          100 +                                                  A
              |                                                  A
              |                                       A                A
              |                                            A     A
           80 +                                  A     A      AAAA          A
              |                                     B  A    A B    A  A
              |                                       ACB EEB C BBA F  A A B
              |                                B B BC AHC BBB FDCB CEA B A
           60 +                      A   AA  BB  AACDABJFBHIFADCDC ACA AA
              |                  A    B   EC CA  FCIHACDF EBB EB     A
              |               A  A  CDAC DE  DEB CFCBA AA A   A    A
              |           A AAA BABA BAB AB ABA   A
           40 +        A AA    A B   B
              |                 A
              |
              |
           20 +
              |
              --+------------+------------+------------+------------+------------+--
               140          150          160          170          180          190
                                             shintyou
      NOTE: 49 obs が欠損値です。
      
                                     2019年10月29日 火曜日 09時02分07秒  32
                Plot of pred1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
              80 +
          予     |
          測     |
          値     |                                             A
                 |                               A  A B A
          t      |                           A  DABCC  G  A          A
          a      |                        A    BB A CAA B A  A    A      A  A
          i      |                       A BABBBFCCAFDCB  A AC
          j      |                       A BBDBCIJBBB ECD   A    A
          y   60 +                       AAABHCDIFDBF CBA A  A      A
          u      |                      AAEDCHCDBBA D     AA
          u      |                     BEACABEAAA ABA        A
                 |                    BB  ICAB  BB
                 |                    DAGDAAACAAA
                 |                 BA B CB A  A  A
                 |                 B ABABAA  A
                 |             A   AAAB  A
                 |                 AA A
              40 +               A A
                 ---+-------------+-------------+-------------+-------------+--
                   20            40            60            80            100
                                             taijyuu
      NOTE: 49 obs が欠損値です。
      
                                     2019年10月29日 火曜日 09時02分07秒  33
                Plot of resid1*pred1.  Legend: A = 1 obs, B = 2 obs, etc.
           40 +
              |
              |                                                A
              |                                       A        A
              |
              |                                  A        A
      残   20 +                                                A   A
      差      |                                      B A    A
              |                         A              A  A A B
              |                      A     A  A AA    AABDB A  A        A
              |                    A     A  B ABAA  BBAEAACAA  AA  A
              |                  AA  A A A  CAA  A AADAGABABEAB AF
            0 +-------------A-A-B--AABABDACAABEA-D-BDEAFGFDCCBCCA--A---A------------
              |                    AAAA AABCF AEBB DFEBGEBFDCCB BE A  AA
              |                      A  BA  B CA C ABDAABCBABBBBABBA  A
              |                     A              DA   AC BD AA  AA A
              |                                             A     A
              |                                                 A
          -20 +
              --+------------+------------+------------+------------+------------+--
               30           40           50           60           70           80
                                         予測値 taijyuu
      NOTE: 49 obs が欠損値です。
      
                                     2019年10月29日 火曜日 09時02分07秒  34
               Plot of resid1*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
           40 +
              |
              |                                                  A
              |                                       A          A
              |
              |                                  A         A
      残   20 +                                                  A     A
      差      |                                     B  A      A
              |                      A                 A    A AAA
              |                  A       A   A A A    AAB DB  A  A          A
              |               A       A   B  ABA A BB AEA ACA A  A A  A
              |             AA   A  A A   CA A   AAAD AFB BAB EAB A F
            0 +--------A-AB---A-AAB-BDAC-AAB-EA--DBDCBAFFAFDBACBCC-A---A---A--------
              |                AAA A B B DE  AEB BCGE BGDABFD CCB  BE  A A A
              |                  A   BA   B ABA  CABCAAAB CBA BBBB ACA A A
              |                 A                 DA    A C B DA A   A AA
              |                                               A      A
              |                                                    A
          -20 +
              --+------------+------------+------------+------------+------------+--
               140          150          160          170          180          190
                                             shintyou
      NOTE: 49 obs が欠損値です。
      
                                     2019年10月29日 火曜日 09時02分07秒  35
               Plot of resid1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
               40 +
                  |
                  |                                                          A
                  |                                                  A    A
                  |
                  |                                           A   A
          残   20 +                                                A  A
          差      |                                        AA B
                  |                               A        A BB
                  |                           A  AA AA ADE A  A A
                  |                       A    BABAAAI FBA B
                  |                    B  AAAAD ACDEDDCDGA
                0 +---------------A-BAACAGCDDAHDEJMDAGBAAA----------------------
                  |                 BAADAECJDENCFLDCBD B
                  |                 CA DCBBEBBDDCFAAAA
                  |             A       ADB DCB ABA
                  |                       A   A
                  |                        A
              -20 +
                  ---+-------------+-------------+-------------+-------------+--
                    20            40            60            80            100
                                              taijyuu
      NOTE: 49 obs が欠損値です。
      
                                     2019年10月29日 火曜日 09時02分07秒  36
      UNIVARIATE プロシジャ
      変数 :  resid1  (残差)
                                  モーメント
      
      N                        350    重み変数の合計                350
      平均                       0    合計                            0
      標準偏差          6.68488112    分散                   44.6876356
      歪度              1.32528304    尖度                   3.64226422
      無修正平方和      15595.9848    修正済平方和           15595.9848
      変動係数                   .    平均の標準誤差         0.35732193
      
                         基本統計量
             位置                    ばらつき
      
      平均      0.00000     標準偏差         6.68488
      中央値   -0.99468     分散            44.68764
      最頻値    0.16506     範囲            48.81370
                            四分位範囲       7.24519
      
                                     2019年10月29日 火曜日 09時02分07秒  37
      UNIVARIATE プロシジャ
      変数 :  resid1  (残差)
      
                      位置の検定 H0: Mu0=0
       
      検定                   -統計量-    ------p 値-------
      
      Student の t 検定     t         0    Pr > |t|    1.0000
      符号検定              M       -22    Pr >= |M|   0.0214
      符号付順位検定        S   -3526.5    Pr >= |S|   0.0626
      
                          正規性の検定
       
      検定                --統計量---    ------p 値-------
      
      Shapiro-Wilk          W     0.924907    Pr < W     <0.0001
      Kolmogorov-Smirnov    D     0.102661    Pr > D     <0.0100
      Cramer-von Mises      W-Sq  0.870412    Pr > W-Sq  <0.0050
      Anderson-Darling      A-Sq  5.095018    Pr > A-Sq  <0.0050
      
                                     2019年10月29日 火曜日 09時02分07秒  38
      UNIVARIATE プロシジャ
      変数 :  resid1  (残差)
      
         分位点 (定義 5)
       
      水準            分位点
      
      100% 最大値     33.65543
      99%                22.23358
      95%                11.65543
      90%                 8.38562
      75% Q3              3.09654
      50% 中央値      -0.99468
      25% Q1             -4.14864
      10%                -7.49661
      5%                 -8.78568
      1%                -11.46235
      0% 最小値      -15.15827
      
                                     2019年10月29日 火曜日 09時02分07秒  39
      UNIVARIATE プロシジャ
      変数 :  resid1  (残差)
      
                        極値
      ----最小値----        ----最大値----
           値      Obs             値      Obs
      
      -15.1583      350         21.7239      281
      -13.9035      296         22.2336      129
      -13.3788      370         28.6554      347
      -11.4623      242         29.2347      190
      -10.9035      298         33.6554      348
      
                           欠損値
                                   ---パーセント---
      欠損値    カウント      全体    欠損値
      
              .              49       12.28       100.00
      
    3. 結果の見方
      • 対象になったのは 350名。
      • 説明変量が予測に役立っているか?
        • 回帰に役立っているか : Prob>F : 小さいと有意(役立っている)
          [この例] 1% 未満(0.01%) なので役に立っていると言える。
      • 決定係数 : R-Square ( 相関係数 : R )
        • 目的変量が説明変量でどの程度説明しているかの割合。
        • 1 に近いほど当てはまりが良いと言える。
          [この例] 50%程度(約半分, 48.4%)を説明できている。
      • 回帰係数 : Parameter Estimate
        [この例] a=0.814, b=-78.5
      • 説明変数が予測に役立っているか?
        回帰係数の検定(係数=0 か?) : Prob>|T| : 小さいと有意(ゼロではないと言える)
        [この例] 両者とも 1% 未満(0.01%) なので回帰係数はゼロではない(何らかの意味がある数字と言える)。
      • 残差の性質 ===> 正規性 : 残差プロット、残差解析
        • 残差(予測誤差)は正規分布をしていると仮定してモデルが構築されている。
        • この仮定が覆ると、回帰分析として成立していないことになる。
        • 残差が正規分布をしているか確認する必要がある。
        • 均等に散らばっているか?
        • 傾向はないか?
        • ...
        [この例] 残差には概ね傾向は見られない。 ただし体重の大きい 6例程度は要確認。場合によっては外れ値として除外も。 ===> 次節

      [注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。

  2. 「体重の大きい者を除外」して実行するには?
     前節の正規確率プロットを見ると、体重の大きい 6例程度が正規性を乱していることが判った。 そこで体重の大きい者を除外して再度回帰分析にかけてみよう。 その際、除外すると言うよりは、「解析対象者を条件付けして絞る」と 考えた方が解りやすいかもしれない。 ここでは「85Kg 未満の者を対象として」解析を行なう例を示す。

    [注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。

    1. プログラム : les0403.sas
       /* Lesson 04-3 */
       /*    File Name = les0403.sas   10/29/18   */
      
      options nocenter linesize=78 pagesize=30;
      
      proc printto log   = 'Kougi19/les0402_log.txt'
                   print = 'Kougi19/les0402_Results.txt' new;
      
      /* ods listing gpath='Kougi19/SAS_ODS99'; */
      
      data gakusei;
        infile 'Kougi19/all19bu.csv'
          firstobs=2 
               truncover lrecl=80
               dlm=','  dsd missover
          ;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      /* if sex^='M' & sex^='F' then delete; */
      if shintyou=. | taijyuu=. then delete;                 : 欠損値データを除外
      
      proc print data=gakusei(obs=10);
      run;
      
      proc corr data=gakusei;                                : 相関係数を求める
        where taijyuu<85;                                    : 対象データを絞る
      run;
      
      proc reg data=gakusei;
        model taijyuu=shintyou;
        where taijyuu<85;                                    : 対象データを絞る
        output out=outreg1 predicted=pred1 residual=resid1;
      run;
      
      proc print data=outreg1(obs=15);
      run;
      
      proc plot data=outreg1;
        where taijyuu<85;                                    : 対象データを絞る
        plot taijyuu*shintyou/vaxis=20 to 100 by 20;
        plot pred1*taijyuu;
        plot resid1*pred1   /vref=0;
        plot resid1*shintyou/vref=0;
        plot resid1*taijyuu /vref=0;
        plot resid1*(pred1 shintyou taijyuu)/vref=0;         : まとめて指定することも可
      run;
      
      proc univariate data=outreg1 plot normal;
        var resid1;
      run;
      
    2. 出力結果 : les0403_Results.txt , les0403_output.pdf
                                     2019年10月29日 火曜日 09時08分47秒  41
      
      CORR プロシジャ
      
         5  変数 :    shintyou taijyuu  kyoui    kodukai  tsuuwa   
      
      
                              単純統計量
       
      変数             N        平均            標準偏差        合計
      
      shintyou         345     168.80435         7.92952         58238
      taijyuu          345      58.48348         8.46021         20177
      kyoui            119      85.65882         7.79075         10193
      kodukai          324         48387           51078      15677500
      tsuuwa           151          6469            4339        976892
      
                単純統計量
       
      変数         最小値        最大値
      
      shintyou     145.00000     186.00000
      taijyuu       35.00000      84.00000
      kyoui         46.00000     110.00000
      kodukai              0        350000
      tsuuwa               0         30000
      
                                     2019年10月29日 火曜日 09時08分47秒  42
      CORR プロシジャ
                                 Pearson の相関係数
                            H0: Rho=0 に対する Prob > |r|
                               オブザベーション数
      
                    shintyou       taijyuu         kyoui       kodukai        tsuuwa
      
      shintyou       1.00000       0.71811       0.26538       0.03542      -0.07704
                                    <.0001        0.0035        0.5252        0.3471
                         345           345           119           324           151
      
      taijyuu        0.71811       1.00000       0.38233       0.05242      -0.06881
                      <.0001                      <.0001        0.3469        0.4012
                         345           345           119           324           151
      
      kyoui          0.26538       0.38233       1.00000      -0.27453      -0.17995
                      0.0035        <.0001                      0.0030        0.2369
                         119           119           119           115            45
      
      kodukai        0.03542       0.05242      -0.27453       1.00000       0.22221
                      0.5252        0.3469        0.0030                      0.0070
                         324           324           115           324           146
      
      tsuuwa        -0.07704      -0.06881      -0.17995       0.22221       1.00000
                      0.3471        0.4012        0.2369        0.0070              
                         151           151            45           146           151
      
                                     2019年10月29日 火曜日 09時08分47秒  43
      REG プロシジャ
      モデル : MODEL1
      従属変数 : taijyuu 
      
      読み込んだオブザベーション数         345
      使用されたオブザベーション数         345
      
                                      分散分析
       
      要因                   自由度        平方和       平均平方     F 値   Pr > F
      
      Model                       1         12697          12697    365.20   <.0001
      Error                     343         11925       34.76667                   
      Corrected Total           344         24622                                  
      
      Root MSE                     5.89633    R2 乗                  0.5157
      従属変数の平均              58.48348    調整済み R2 乗         0.5143
      変動係数                    10.08204                                  
      
                                     2019年10月29日 火曜日 09時08分47秒  44
      REG プロシジャ
      モデル : MODEL1
      従属変数 : taijyuu 
                               パラメータの推定
      
                              パラメータ
      変数          自由度             推定値       標準誤差     t 値   Pr > |t|
      
      Intercept           1         -70.84864        6.77511    -10.46     <.0001
      shintyou            1           0.76617        0.04009     19.11     <.0001
      
                                     2019年10月29日 火曜日 09時08分48秒  45
      Obs sex shintyou taijyuu kyoui jitaku kodukai carryer  tsuuwa  pred1    resid1
      
        1  F    145.0    38.0     .    J      10000              .  40.2454  -2.2454
        2  F    146.7    41.0    85    J      10000 Vodafone  6000  41.5479  -0.5479
        3  F    148.0    42.0     .    J      50000              .  42.5439  -0.5439
        4  F    148.0    43.0    80    J      50000 DoCoMo    4000  42.5439   0.4561
        5  F    149.0    45.0     .    G      60000              .  43.3101   1.6899
        6  F    150.0    46.0    86           40000              .  44.0762   1.9238
        7  F    151.0    45.0     .    J      20000 docomo    5000  44.8424   0.1576
        8  F    151.0    50.0     .    G      60000 J-PHONE      .  44.8424   5.1576
        9  F    151.7    41.5    80    J      35000              .  45.3787  -3.8787
       10  F    152.0    35.0    77    J      60000 DoCoMo    2000  45.6086 -10.6086
       11  F    152.0    43.0     .    J      20000 au        3500  45.6086  -2.6086
       12  F    152.0    44.0     .           45000 DoCoMo    4000  45.6086  -1.6086
       13  F    153.0    41.0     .    J     125000 No           .  46.3747  -5.3747
       14  F    153.0    42.0     .    G          0 Vodafone  1000  46.3747  -4.3747
       15  F    153.0    46.5    87    G      10000              .  46.3747   0.1253
      
                                     2019年10月29日 火曜日 09時08分48秒  46
              Plot of taijyuu*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
      taijyuu |
          100 +
              |
              |
              |                                            A
           80 +                                  A     A      AAAA          A
              |                                     B  A    A B    A  A
              |                                       ACB EEB C BBA F  A A B
              |                                B B BC AHC BBB FDCB CEA B A
           60 +                      A   AA  BB  AACDABJFBHIFADCDC ACA AA
              |                  A    B   EC CA  FCIHACDF EBB EB     A
              |               A  A  CDAC DE  DEB CFCBA AA A   A    A
              |           A AAA BABA BAB AB ABA   A
           40 +        A AA    A B   B
              |                 A
              |
              |
           20 +
              |
              --+------------+------------+------------+------------+------------+--
               140          150          160          170          180          190
                                             shintyou
      
                                     2019年10月29日 火曜日 09時08分48秒  47
                Plot of pred1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
             |
      予  80 +
      測     |
      値     |
             |                                                          A
      t   70 +                                   A    A  B   A
      a      |                         A   A    EA CC DA   G    B
      i      |                              AABAEAAAA ACCB AAA      C
      j      |                       A  BC B BC JDBDA DABEABAA A  AA A    A
      y   60 +                       B ACA CGBDAJBHDBADA C DAB A    A
      u      |                    AD B FCF GDDCBC CA  DA  A    A A
      u      |                   A C  DCAA E  A A AAB A             A
             |                  C CB CACDB D A AA A
          50 +               A  BA AEA AA    A  A
             |             AC A  D CACA    A     A
             |       A      AAA AA   A
             |             AAA  A
          40 +          A
             |
             --+----------+----------+----------+----------+----------+----------+--
              30         40         50         60         70         80         90
                                             taijyuu
      
                                     2019年10月29日 火曜日 09時08分48秒  48
                Plot of resid1*pred1.  Legend: A = 1 obs, B = 2 obs, etc.
               40 +
                  |
                  |
                  |
                  |
                  |                        A       A
           残  20 +                             A
           差     |                           B       A
                  |              A              A   A AAAA
                  |           A     A   A AB   ACBDB  A          A
                  |         A     A  AA ABA  BCACAACB A ABA A
                  |       AA  A A A  CA A  AAACAFEABA GBBA F
                0 +----A-B--AABABDACAA-BEA-EBECCICGDCAABBBB--A--A---------------
                  |  A       BAA AABCF  AEBACFFCDDDHD CCC AEAB AA
                  |           A  BA  B ABA CABBAABCA  CB CACA  A
                  |          A              DA   AA B CA     AA
                  |                                   A   AA
                  |
              -20 +
                  ---+-------------+-------------+-------------+-------------+--
                    40            50            60            70            80
                                         予測値 taijyuu
      
                                     2019年10月29日 火曜日 09時08分48秒  49
               Plot of resid1*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
           40 +
              |
              |
              |
              |
              |                                  A         A
       残  20 +                                        A
       差     |                                     B         A
              |                      A                 A    A AAAA
              |                  A       A   A A B    ACB DB  A             A
              |               A       A   B  ABA   BC ACA ACB A AAAA  A
              |             AA   A  A A   CA A   AAAC AFE BAA GBBA  F
            0 +----------AB---A-AAB-BDAC-AAB-EA--EBECBAICAFDCAABBB-B---A---A--------
              |        A       AAA A B B DE  AEB ACFF CDDADGD CBD  AEA B A A
              |                  A   BA   B ABA  CABBA AB CA  CB C ACA   A
              |                 A                 DA    A A B CA       AA
              |                                               A    A A
              |
          -20 +
              --+------------+------------+------------+------------+------------+--
               140          150          160          170          180          190
                                             shintyou
      
                                     2019年10月29日 火曜日 09時08分48秒  50
               Plot of resid1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
           40 +
              |
              |
              |
              |
              |                                                      A     A
       残  20 +                                                      A
       差     |                                                 A A   A
              |                                   A             A  AAC
              |                             A    A A B A  BADBC A        A
              |                       A       B AB AB  GB DACAA  B
              |                  AA   AA AA D  A C GDCAEBDD F
            0 +-------------AAAA-AC-DCC-DDB-GBDFBJEFEA-BCA--A-A---------------------
              |          A   BAA BBABCCEEDF GICCANBACC C  B
              |             ABA  CABC B ECA C BCAEA    A
              |       A            AD B  BC  A   AA
              |                       A A   A
              |
          -20 +
              --+----------+----------+----------+----------+----------+----------+-
               30         40         50         60         70         80         90
                                              taijyuu
      
    3. 結果の見方 : 前節と本節の出力結果を比較して違いを明確にせよ
      • 対象になったのは 345名。
      • 当てはまりは良くなったか? : 異常値と外れ値の意味するもの
      • 残差の正規性はどのように変化したか?
      • 回帰係数はどのように変化したか?
      • 説明力(決定係数)はどのように変化したか?

      • 75Kg以上の体重の者を再度除外して分析してみることも一案。
      • 単に体重の重い者だけが正規性を乱している訳ではなさそうだ。

  3. 有効桁数に注意せよ : どこまでが「意味ある桁」か?
    測定精度上回る計算結果は出せても、意味はない。
    [重要な注意] 統計ソフトは単なる道具。使いこなすのは各自。
      [例1] 四捨五入の数値で考えてみれば : 精度(正確さ)が異なることに注意
        12.3 <=== 12.25〜12.34
        12  <=== 11.5 〜12.4

        67.8 <=== 67.75〜67.84
        68  <=== 67.5 〜68.4

      [例2] 日本の観測史上の最高気温は、 2018(平成30)年7月23日に熊谷市で観測された41.1度であり、 最低気温は、1902(明治35)年1月25日に北海道旭川市の-41度であった。===> -41.0度
    なお、参考までに最高気温の2位は41.0度で岐阜県の美濃市と金山町の2ヶ所。
      [例3] 2001年のイチロー選手の打率は3割5分であった。 2006年は3割3分1厘であった。===> 3割5分0厘

  4. 重回帰分析 : 2変量以上の説明する変量(説明変量)で 1変量(目的変量)を説明
    • 説明変量が複数になる : 単 ===> 重
    • 体重を 身長と胸囲で説明したい。予測したい。
    • [体重]=a[身長]+b[胸囲]+c : 回帰係数を求めたい。
    • 単回帰とアイディアは同じ : 残差(予測誤差)の二乗和を最小にする(最小二乗法)
    • 説明される変量(目的変量)と平行に残差を取る。

 10. 次回は、... : 11月05日 16:20-17:50

[DIR]講義のホームページへ戻ります