● 目次
   1. 単回帰分析 : 予測等に使う、連続変量の関係
   2. 「体重の大きい者を除外」して実行するには?
   3. 有効桁数に注意せよ : どこまでが「意味ある桁」か?
   4. 重回帰分析 : 2変量以上の説明する変量(説明変量)で 1変量(目的変量)を説明
   5. 特定グループでの解析
   6. [要点] 解析する上での注意点
   7. 誤用?!
   8. 4つの尺度と回帰分析
   9. 回帰分析における変数選択、総当たり法
  10. 次回は、...
● 回帰分析 : 連続変量の予測
 /* Lesson 04-2 */
 /*    File Name = les0402.sas   10/29/18   */
options nocenter linesize=78 pagesize=30;
proc printto log   = 'Kougi19/les0402_log.txt'
             print = 'Kougi19/les0402_Results.txt' new;
/* ods listing gpath='Kougi19/SAS_ODS99'; */
data gakusei;
  infile 'Kougi19/all19bu.csv'
    firstobs=2 
         truncover lrecl=80
         dlm=','  dsd missover
    ;
  input sex $ shintyou taijyuu kyoui 
        jitaku $ kodukai carryer $ tsuuwa;
/* if sex^='M' & sex^='F' then delete; */
proc print data=gakusei(obs=10);                       : 先頭10行を試しに表示
run;
proc reg data=gakusei;                                 : 回帰分析
  model taijyuu=shintyou;                              : 変量を指定
  output out=outreg1 predicted=pred1 residual=resid1;  : 結果項目の保存
run;                                                   :
                                                       :
proc print data=outreg1(obs=15);                       : 表示してみる
run;                                                   :
                                                       :
proc plot data=outreg1;                        : 散布図を描く
  plot taijyuu*shintyou/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
  plot pred1*taijyuu;                          : 予測値と観測値
  plot resid1*pred1   /vref=0;                 : 残差と予測値(残差解析)(水平軸指定)
  plot resid1*shintyou/vref=0;                 : 残差と説明変数(残差解析)
  plot resid1*taijyuu /vref=0;                 : 残差と目的変数(残差解析)
run;                                           :
                                               :
proc univariate data=outreg1 plot normal;      : 残差を正規プロットして確かめる
  var resid1;                                  :
run;                                           :
[備考] 上記のコロン以降は説明のためのものであり、
SAS のプログラムではありません。
                               2019年10月29日 火曜日 09時02分06秒  27
Obs   sex   shintyou   taijyuu   kyoui   jitaku   kodukai   carryer    tsuuwa
  1    F      145.0      38.0       .      J       10000                   . 
  2    F      146.7      41.0      85      J       10000    Vodafone    6000 
  3    F      148.0      42.0       .      J       50000                   . 
  4    F      148.0      43.0      80      J       50000    DoCoMo      4000 
  5    F      148.9        .        .      J       60000                   . 
  6    F      149.0      45.0       .      G       60000                   . 
  7    F      150.0      46.0      86              40000                   . 
  8    F      151.0      45.0       .      J       20000    docomo      5000 
  9    F      151.0      50.0       .      G       60000    J-PHONE        . 
 10    F      151.7      41.5      80      J       35000                   . 
                               2019年10月29日 火曜日 09時02分06秒  28
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu 
読み込んだオブザベーション数            399
使用されたオブザベーション数            350
欠損値を含むオブザベーション数           49
                                分散分析
 
要因                   自由度        平方和      平均平方     F 値   Pr > F
Model                       1         14602          14602    325.81   <.0001
Error                     348         15596       44.81605                   
Corrected Total           349         30198                                  
Root MSE                 6.69448    R2 乗                  0.4835
従属変数の平均          58.95800    調整済み R2 乗         0.4821
変動係数                11.35466                                  
                               2019年10月29日 火曜日 09時02分06秒  29
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu 
                         パラメータの推定
 
                        パラメータ
変数          自由度             推定値       標準誤差     t 値   Pr > |t|
Intercept           1         -78.49464        7.62341    -10.30     <.0001
shintyou            1           0.81370        0.04508     18.05     <.0001
                               2019年10月29日 火曜日 09時02分07秒  30
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer  tsuuwa  pred1    resid1
  1  F    145.0    38.0     .    J      10000              .  39.4924  -1.4924
  2  F    146.7    41.0    85    J      10000 Vodafone  6000  40.8757   0.1243
  3  F    148.0    42.0     .    J      50000              .  41.9335   0.0665
  4  F    148.0    43.0    80    J      50000 DoCoMo    4000  41.9335   1.0665
  5  F    148.9      .      .    J      60000              .  42.6658    .    
  6  F    149.0    45.0     .    G      60000              .  42.7472   2.2528
  7  F    150.0    46.0    86           40000              .  43.5609   2.4391
  8  F    151.0    45.0     .    J      20000 docomo    5000  44.3746   0.6254
  9  F    151.0    50.0     .    G      60000 J-PHONE      .  44.3746   5.6254
 10  F    151.7    41.5    80    J      35000              .  44.9442  -3.4442
 11  F    152.0    35.0    77    J      60000 DoCoMo    2000  45.1883 -10.1883
 12  F    152.0    43.0     .    J      20000 au        3500  45.1883  -2.1883
 13  F    152.0    44.0     .           45000 DoCoMo    4000  45.1883  -1.1883
 14  F    153.0    41.0     .    J     125000 No           .  46.0020  -5.0020
 15  F    153.0    42.0     .    G          0 Vodafone  1000  46.0020  -4.0020
                               2019年10月29日 火曜日 09時02分07秒  31
        Plot of taijyuu*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
taijyuu |
    100 +                                                  A
        |                                                  A
        |                                       A                A
        |                                            A     A
     80 +                                  A     A      AAAA          A
        |                                     B  A    A B    A  A
        |                                       ACB EEB C BBA F  A A B
        |                                B B BC AHC BBB FDCB CEA B A
     60 +                      A   AA  BB  AACDABJFBHIFADCDC ACA AA
        |                  A    B   EC CA  FCIHACDF EBB EB     A
        |               A  A  CDAC DE  DEB CFCBA AA A   A    A
        |           A AAA BABA BAB AB ABA   A
     40 +        A AA    A B   B
        |                 A
        |
        |
     20 +
        |
        --+------------+------------+------------+------------+------------+--
         140          150          160          170          180          190
                                       shintyou
NOTE: 49 obs が欠損値です。
                               2019年10月29日 火曜日 09時02分07秒  32
          Plot of pred1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
        80 +
    予     |
    測     |
    値     |                                             A
           |                               A  A B A
    t      |                           A  DABCC  G  A          A
    a      |                        A    BB A CAA B A  A    A      A  A
    i      |                       A BABBBFCCAFDCB  A AC
    j      |                       A BBDBCIJBBB ECD   A    A
    y   60 +                       AAABHCDIFDBF CBA A  A      A
    u      |                      AAEDCHCDBBA D     AA
    u      |                     BEACABEAAA ABA        A
           |                    BB  ICAB  BB
           |                    DAGDAAACAAA
           |                 BA B CB A  A  A
           |                 B ABABAA  A
           |             A   AAAB  A
           |                 AA A
        40 +               A A
           ---+-------------+-------------+-------------+-------------+--
             20            40            60            80            100
                                       taijyuu
NOTE: 49 obs が欠損値です。
                               2019年10月29日 火曜日 09時02分07秒  33
          Plot of resid1*pred1.  Legend: A = 1 obs, B = 2 obs, etc.
     40 +
        |
        |                                                A
        |                                       A        A
        |
        |                                  A        A
残   20 +                                                A   A
差      |                                      B A    A
        |                         A              A  A A B
        |                      A     A  A AA    AABDB A  A        A
        |                    A     A  B ABAA  BBAEAACAA  AA  A
        |                  AA  A A A  CAA  A AADAGABABEAB AF
      0 +-------------A-A-B--AABABDACAABEA-D-BDEAFGFDCCBCCA--A---A------------
        |                    AAAA AABCF AEBB DFEBGEBFDCCB BE A  AA
        |                      A  BA  B CA C ABDAABCBABBBBABBA  A
        |                     A              DA   AC BD AA  AA A
        |                                             A     A
        |                                                 A
    -20 +
        --+------------+------------+------------+------------+------------+--
         30           40           50           60           70           80
                                   予測値 taijyuu
NOTE: 49 obs が欠損値です。
                               2019年10月29日 火曜日 09時02分07秒  34
         Plot of resid1*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
     40 +
        |
        |                                                  A
        |                                       A          A
        |
        |                                  A         A
残   20 +                                                  A     A
差      |                                     B  A      A
        |                      A                 A    A AAA
        |                  A       A   A A A    AAB DB  A  A          A
        |               A       A   B  ABA A BB AEA ACA A  A A  A
        |             AA   A  A A   CA A   AAAD AFB BAB EAB A F
      0 +--------A-AB---A-AAB-BDAC-AAB-EA--DBDCBAFFAFDBACBCC-A---A---A--------
        |                AAA A B B DE  AEB BCGE BGDABFD CCB  BE  A A A
        |                  A   BA   B ABA  CABCAAAB CBA BBBB ACA A A
        |                 A                 DA    A C B DA A   A AA
        |                                               A      A
        |                                                    A
    -20 +
        --+------------+------------+------------+------------+------------+--
         140          150          160          170          180          190
                                       shintyou
NOTE: 49 obs が欠損値です。
                               2019年10月29日 火曜日 09時02分07秒  35
         Plot of resid1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
         40 +
            |
            |                                                          A
            |                                                  A    A
            |
            |                                           A   A
    残   20 +                                                A  A
    差      |                                        AA B
            |                               A        A BB
            |                           A  AA AA ADE A  A A
            |                       A    BABAAAI FBA B
            |                    B  AAAAD ACDEDDCDGA
          0 +---------------A-BAACAGCDDAHDEJMDAGBAAA----------------------
            |                 BAADAECJDENCFLDCBD B
            |                 CA DCBBEBBDDCFAAAA
            |             A       ADB DCB ABA
            |                       A   A
            |                        A
        -20 +
            ---+-------------+-------------+-------------+-------------+--
              20            40            60            80            100
                                        taijyuu
NOTE: 49 obs が欠損値です。
                               2019年10月29日 火曜日 09時02分07秒  36
UNIVARIATE プロシジャ
変数 :  resid1  (残差)
                            モーメント
N                        350    重み変数の合計                350
平均                       0    合計                            0
標準偏差          6.68488112    分散                   44.6876356
歪度              1.32528304    尖度                   3.64226422
無修正平方和      15595.9848    修正済平方和           15595.9848
変動係数                   .    平均の標準誤差         0.35732193
                   基本統計量
       位置                    ばらつき
平均      0.00000     標準偏差         6.68488
中央値   -0.99468     分散            44.68764
最頻値    0.16506     範囲            48.81370
                      四分位範囲       7.24519
                               2019年10月29日 火曜日 09時02分07秒  37
UNIVARIATE プロシジャ
変数 :  resid1  (残差)
                位置の検定 H0: Mu0=0
 
検定                   -統計量-    ------p 値-------
Student の t 検定     t         0    Pr > |t|    1.0000
符号検定              M       -22    Pr >= |M|   0.0214
符号付順位検定        S   -3526.5    Pr >= |S|   0.0626
                    正規性の検定
 
検定                --統計量---    ------p 値-------
Shapiro-Wilk          W     0.924907    Pr < W     <0.0001
Kolmogorov-Smirnov    D     0.102661    Pr > D     <0.0100
Cramer-von Mises      W-Sq  0.870412    Pr > W-Sq  <0.0050
Anderson-Darling      A-Sq  5.095018    Pr > A-Sq  <0.0050
                               2019年10月29日 火曜日 09時02分07秒  38
UNIVARIATE プロシジャ
変数 :  resid1  (残差)
   分位点 (定義 5)
 
水準            分位点
100% 最大値     33.65543
99%                22.23358
95%                11.65543
90%                 8.38562
75% Q3              3.09654
50% 中央値      -0.99468
25% Q1             -4.14864
10%                -7.49661
5%                 -8.78568
1%                -11.46235
0% 最小値      -15.15827
                               2019年10月29日 火曜日 09時02分07秒  39
UNIVARIATE プロシジャ
変数 :  resid1  (残差)
                  極値
----最小値----        ----最大値----
     値      Obs             値      Obs
-15.1583      350         21.7239      281
-13.9035      296         22.2336      129
-13.3788      370         28.6554      347
-11.4623      242         29.2347      190
-10.9035      298         33.6554      348
                     欠損値
                             ---パーセント---
欠損値    カウント      全体    欠損値
        .              49       12.28       100.00
  [注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。
 /* Lesson 04-3 */
 /*    File Name = les0403.sas   10/29/18   */
options nocenter linesize=78 pagesize=30;
proc printto log   = 'Kougi19/les0402_log.txt'
             print = 'Kougi19/les0402_Results.txt' new;
/* ods listing gpath='Kougi19/SAS_ODS99'; */
data gakusei;
  infile 'Kougi19/all19bu.csv'
    firstobs=2 
         truncover lrecl=80
         dlm=','  dsd missover
    ;
  input sex $ shintyou taijyuu kyoui 
        jitaku $ kodukai carryer $ tsuuwa;
/* if sex^='M' & sex^='F' then delete; */
if shintyou=. | taijyuu=. then delete;                 : 欠損値データを除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei;                                : 相関係数を求める
  where taijyuu<85;                                    : 対象データを絞る
run;
proc reg data=gakusei;
  model taijyuu=shintyou;
  where taijyuu<85;                                    : 対象データを絞る
  output out=outreg1 predicted=pred1 residual=resid1;
run;
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
  where taijyuu<85;                                    : 対象データを絞る
  plot taijyuu*shintyou/vaxis=20 to 100 by 20;
  plot pred1*taijyuu;
  plot resid1*pred1   /vref=0;
  plot resid1*shintyou/vref=0;
  plot resid1*taijyuu /vref=0;
  plot resid1*(pred1 shintyou taijyuu)/vref=0;         : まとめて指定することも可
run;
proc univariate data=outreg1 plot normal;
  var resid1;
run;
                                 2019年10月29日 火曜日 09時08分47秒  41
CORR プロシジャ
   5  変数 :    shintyou taijyuu  kyoui    kodukai  tsuuwa   
                        単純統計量
 
変数             N        平均            標準偏差        合計
shintyou         345     168.80435         7.92952         58238
taijyuu          345      58.48348         8.46021         20177
kyoui            119      85.65882         7.79075         10193
kodukai          324         48387           51078      15677500
tsuuwa           151          6469            4339        976892
          単純統計量
 
変数         最小値        最大値
shintyou     145.00000     186.00000
taijyuu       35.00000      84.00000
kyoui         46.00000     110.00000
kodukai              0        350000
tsuuwa               0         30000
                               2019年10月29日 火曜日 09時08分47秒  42
CORR プロシジャ
                           Pearson の相関係数
                      H0: Rho=0 に対する Prob > |r|
                         オブザベーション数
              shintyou       taijyuu         kyoui       kodukai        tsuuwa
shintyou       1.00000       0.71811       0.26538       0.03542      -0.07704
                              <.0001        0.0035        0.5252        0.3471
                   345           345           119           324           151
taijyuu        0.71811       1.00000       0.38233       0.05242      -0.06881
                <.0001                      <.0001        0.3469        0.4012
                   345           345           119           324           151
kyoui          0.26538       0.38233       1.00000      -0.27453      -0.17995
                0.0035        <.0001                      0.0030        0.2369
                   119           119           119           115            45
kodukai        0.03542       0.05242      -0.27453       1.00000       0.22221
                0.5252        0.3469        0.0030                      0.0070
                   324           324           115           324           146
tsuuwa        -0.07704      -0.06881      -0.17995       0.22221       1.00000
                0.3471        0.4012        0.2369        0.0070              
                   151           151            45           146           151
                               2019年10月29日 火曜日 09時08分47秒  43
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu 
読み込んだオブザベーション数         345
使用されたオブザベーション数         345
                                分散分析
 
要因                   自由度        平方和       平均平方     F 値   Pr > F
Model                       1         12697          12697    365.20   <.0001
Error                     343         11925       34.76667                   
Corrected Total           344         24622                                  
Root MSE                     5.89633    R2 乗                  0.5157
従属変数の平均              58.48348    調整済み R2 乗         0.5143
変動係数                    10.08204                                  
                               2019年10月29日 火曜日 09時08分47秒  44
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu 
                         パラメータの推定
                        パラメータ
変数          自由度             推定値       標準誤差     t 値   Pr > |t|
Intercept           1         -70.84864        6.77511    -10.46     <.0001
shintyou            1           0.76617        0.04009     19.11     <.0001
                               2019年10月29日 火曜日 09時08分48秒  45
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer  tsuuwa  pred1    resid1
  1  F    145.0    38.0     .    J      10000              .  40.2454  -2.2454
  2  F    146.7    41.0    85    J      10000 Vodafone  6000  41.5479  -0.5479
  3  F    148.0    42.0     .    J      50000              .  42.5439  -0.5439
  4  F    148.0    43.0    80    J      50000 DoCoMo    4000  42.5439   0.4561
  5  F    149.0    45.0     .    G      60000              .  43.3101   1.6899
  6  F    150.0    46.0    86           40000              .  44.0762   1.9238
  7  F    151.0    45.0     .    J      20000 docomo    5000  44.8424   0.1576
  8  F    151.0    50.0     .    G      60000 J-PHONE      .  44.8424   5.1576
  9  F    151.7    41.5    80    J      35000              .  45.3787  -3.8787
 10  F    152.0    35.0    77    J      60000 DoCoMo    2000  45.6086 -10.6086
 11  F    152.0    43.0     .    J      20000 au        3500  45.6086  -2.6086
 12  F    152.0    44.0     .           45000 DoCoMo    4000  45.6086  -1.6086
 13  F    153.0    41.0     .    J     125000 No           .  46.3747  -5.3747
 14  F    153.0    42.0     .    G          0 Vodafone  1000  46.3747  -4.3747
 15  F    153.0    46.5    87    G      10000              .  46.3747   0.1253
                               2019年10月29日 火曜日 09時08分48秒  46
        Plot of taijyuu*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
taijyuu |
    100 +
        |
        |
        |                                            A
     80 +                                  A     A      AAAA          A
        |                                     B  A    A B    A  A
        |                                       ACB EEB C BBA F  A A B
        |                                B B BC AHC BBB FDCB CEA B A
     60 +                      A   AA  BB  AACDABJFBHIFADCDC ACA AA
        |                  A    B   EC CA  FCIHACDF EBB EB     A
        |               A  A  CDAC DE  DEB CFCBA AA A   A    A
        |           A AAA BABA BAB AB ABA   A
     40 +        A AA    A B   B
        |                 A
        |
        |
     20 +
        |
        --+------------+------------+------------+------------+------------+--
         140          150          160          170          180          190
                                       shintyou
                               2019年10月29日 火曜日 09時08分48秒  47
          Plot of pred1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
       |
予  80 +
測     |
値     |
       |                                                          A
t   70 +                                   A    A  B   A
a      |                         A   A    EA CC DA   G    B
i      |                              AABAEAAAA ACCB AAA      C
j      |                       A  BC B BC JDBDA DABEABAA A  AA A    A
y   60 +                       B ACA CGBDAJBHDBADA C DAB A    A
u      |                    AD B FCF GDDCBC CA  DA  A    A A
u      |                   A C  DCAA E  A A AAB A             A
       |                  C CB CACDB D A AA A
    50 +               A  BA AEA AA    A  A
       |             AC A  D CACA    A     A
       |       A      AAA AA   A
       |             AAA  A
    40 +          A
       |
       --+----------+----------+----------+----------+----------+----------+--
        30         40         50         60         70         80         90
                                       taijyuu
                               2019年10月29日 火曜日 09時08分48秒  48
          Plot of resid1*pred1.  Legend: A = 1 obs, B = 2 obs, etc.
         40 +
            |
            |
            |
            |
            |                        A       A
     残  20 +                             A
     差     |                           B       A
            |              A              A   A AAAA
            |           A     A   A AB   ACBDB  A          A
            |         A     A  AA ABA  BCACAACB A ABA A
            |       AA  A A A  CA A  AAACAFEABA GBBA F
          0 +----A-B--AABABDACAA-BEA-EBECCICGDCAABBBB--A--A---------------
            |  A       BAA AABCF  AEBACFFCDDDHD CCC AEAB AA
            |           A  BA  B ABA CABBAABCA  CB CACA  A
            |          A              DA   AA B CA     AA
            |                                   A   AA
            |
        -20 +
            ---+-------------+-------------+-------------+-------------+--
              40            50            60            70            80
                                   予測値 taijyuu
                               2019年10月29日 火曜日 09時08分48秒  49
         Plot of resid1*shintyou.  Legend: A = 1 obs, B = 2 obs, etc.
     40 +
        |
        |
        |
        |
        |                                  A         A
 残  20 +                                        A
 差     |                                     B         A
        |                      A                 A    A AAAA
        |                  A       A   A A B    ACB DB  A             A
        |               A       A   B  ABA   BC ACA ACB A AAAA  A
        |             AA   A  A A   CA A   AAAC AFE BAA GBBA  F
      0 +----------AB---A-AAB-BDAC-AAB-EA--EBECBAICAFDCAABBB-B---A---A--------
        |        A       AAA A B B DE  AEB ACFF CDDADGD CBD  AEA B A A
        |                  A   BA   B ABA  CABBA AB CA  CB C ACA   A
        |                 A                 DA    A A B CA       AA
        |                                               A    A A
        |
    -20 +
        --+------------+------------+------------+------------+------------+--
         140          150          160          170          180          190
                                       shintyou
                               2019年10月29日 火曜日 09時08分48秒  50
         Plot of resid1*taijyuu.  Legend: A = 1 obs, B = 2 obs, etc.
     40 +
        |
        |
        |
        |
        |                                                      A     A
 残  20 +                                                      A
 差     |                                                 A A   A
        |                                   A             A  AAC
        |                             A    A A B A  BADBC A        A
        |                       A       B AB AB  GB DACAA  B
        |                  AA   AA AA D  A C GDCAEBDD F
      0 +-------------AAAA-AC-DCC-DDB-GBDFBJEFEA-BCA--A-A---------------------
        |          A   BAA BBABCCEEDF GICCANBACC C  B
        |             ABA  CABC B ECA C BCAEA    A
        |       A            AD B  BC  A   AA
        |                       A A   A
        |
    -20 +
        --+----------+----------+----------+----------+----------+----------+-
         30         40         50         60         70         80         90
                                        taijyuu
  
10. 次回は、... : 11月05日 16:20-17:50