● 目次
1. 単回帰分析 : 予測等に使う、連続変量の関係
2. 「体重の大きい者を除外」して実行するには?
3. 有効桁数に注意せよ : どこまでが「意味ある桁」か?
4. 重回帰分析 : 2変量以上の説明する変量(説明変量)で 1変量(目的変量)を説明
5. 特定グループでの解析
6. [要点] 解析する上での注意点
7. 誤用?!
8. 4つの尺度と回帰分析
9. 回帰分析における変数選択、総当たり法
10. 次回は、...
● 回帰分析 : 連続変量の予測
/* Lesson 04-2 */
/* File Name = les0402.sas 10/29/18 */
options nocenter linesize=78 pagesize=30;
proc printto log = 'Kougi19/les0402_log.txt'
print = 'Kougi19/les0402_Results.txt' new;
/* ods listing gpath='Kougi19/SAS_ODS99'; */
data gakusei;
infile 'Kougi19/all19bu.csv'
firstobs=2
truncover lrecl=80
dlm=',' dsd missover
;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
/* if sex^='M' & sex^='F' then delete; */
proc print data=gakusei(obs=10); : 先頭10行を試しに表示
run;
proc reg data=gakusei; : 回帰分析
model taijyuu=shintyou; : 変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
:
proc print data=outreg1(obs=15); : 表示してみる
run; :
:
proc plot data=outreg1; : 散布図を描く
plot taijyuu*shintyou/vaxis=20 to 100 by 20; : 体重と身長(縦軸指定)
plot pred1*taijyuu; : 予測値と観測値
plot resid1*pred1 /vref=0; : 残差と予測値(残差解析)(水平軸指定)
plot resid1*shintyou/vref=0; : 残差と説明変数(残差解析)
plot resid1*taijyuu /vref=0; : 残差と目的変数(残差解析)
run; :
:
proc univariate data=outreg1 plot normal; : 残差を正規プロットして確かめる
var resid1; :
run; :
[備考] 上記のコロン以降は説明のためのものであり、
SAS のプログラムではありません。
2019年10月29日 火曜日 09時02分06秒 27
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa
1 F 145.0 38.0 . J 10000 .
2 F 146.7 41.0 85 J 10000 Vodafone 6000
3 F 148.0 42.0 . J 50000 .
4 F 148.0 43.0 80 J 50000 DoCoMo 4000
5 F 148.9 . . J 60000 .
6 F 149.0 45.0 . G 60000 .
7 F 150.0 46.0 86 40000 .
8 F 151.0 45.0 . J 20000 docomo 5000
9 F 151.0 50.0 . G 60000 J-PHONE .
10 F 151.7 41.5 80 J 35000 .
2019年10月29日 火曜日 09時02分06秒 28
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
読み込んだオブザベーション数 399
使用されたオブザベーション数 350
欠損値を含むオブザベーション数 49
分散分析
要因 自由度 平方和 平均平方 F 値 Pr > F
Model 1 14602 14602 325.81 <.0001
Error 348 15596 44.81605
Corrected Total 349 30198
Root MSE 6.69448 R2 乗 0.4835
従属変数の平均 58.95800 調整済み R2 乗 0.4821
変動係数 11.35466
2019年10月29日 火曜日 09時02分06秒 29
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
パラメータの推定
パラメータ
変数 自由度 推定値 標準誤差 t 値 Pr > |t|
Intercept 1 -78.49464 7.62341 -10.30 <.0001
shintyou 1 0.81370 0.04508 18.05 <.0001
2019年10月29日 火曜日 09時02分07秒 30
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa pred1 resid1
1 F 145.0 38.0 . J 10000 . 39.4924 -1.4924
2 F 146.7 41.0 85 J 10000 Vodafone 6000 40.8757 0.1243
3 F 148.0 42.0 . J 50000 . 41.9335 0.0665
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.9335 1.0665
5 F 148.9 . . J 60000 . 42.6658 .
6 F 149.0 45.0 . G 60000 . 42.7472 2.2528
7 F 150.0 46.0 86 40000 . 43.5609 2.4391
8 F 151.0 45.0 . J 20000 docomo 5000 44.3746 0.6254
9 F 151.0 50.0 . G 60000 J-PHONE . 44.3746 5.6254
10 F 151.7 41.5 80 J 35000 . 44.9442 -3.4442
11 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.1883 -10.1883
12 F 152.0 43.0 . J 20000 au 3500 45.1883 -2.1883
13 F 152.0 44.0 . 45000 DoCoMo 4000 45.1883 -1.1883
14 F 153.0 41.0 . J 125000 No . 46.0020 -5.0020
15 F 153.0 42.0 . G 0 Vodafone 1000 46.0020 -4.0020
2019年10月29日 火曜日 09時02分07秒 31
Plot of taijyuu*shintyou. Legend: A = 1 obs, B = 2 obs, etc.
taijyuu |
100 + A
| A
| A A
| A A
80 + A A AAAA A
| B A A B A A
| ACB EEB C BBA F A A B
| B B BC AHC BBB FDCB CEA B A
60 + A AA BB AACDABJFBHIFADCDC ACA AA
| A B EC CA FCIHACDF EBB EB A
| A A CDAC DE DEB CFCBA AA A A A
| A AAA BABA BAB AB ABA A
40 + A AA A B B
| A
|
|
20 +
|
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
NOTE: 49 obs が欠損値です。
2019年10月29日 火曜日 09時02分07秒 32
Plot of pred1*taijyuu. Legend: A = 1 obs, B = 2 obs, etc.
80 +
予 |
測 |
値 | A
| A A B A
t | A DABCC G A A
a | A BB A CAA B A A A A A
i | A BABBBFCCAFDCB A AC
j | A BBDBCIJBBB ECD A A
y 60 + AAABHCDIFDBF CBA A A A
u | AAEDCHCDBBA D AA
u | BEACABEAAA ABA A
| BB ICAB BB
| DAGDAAACAAA
| BA B CB A A A
| B ABABAA A
| A AAAB A
| AA A
40 + A A
---+-------------+-------------+-------------+-------------+--
20 40 60 80 100
taijyuu
NOTE: 49 obs が欠損値です。
2019年10月29日 火曜日 09時02分07秒 33
Plot of resid1*pred1. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
| A
| A A
|
| A A
残 20 + A A
差 | B A A
| A A A A B
| A A A AA AABDB A A A
| A A B ABAA BBAEAACAA AA A
| AA A A A CAA A AADAGABABEAB AF
0 +-------------A-A-B--AABABDACAABEA-D-BDEAFGFDCCBCCA--A---A------------
| AAAA AABCF AEBB DFEBGEBFDCCB BE A AA
| A BA B CA C ABDAABCBABBBBABBA A
| A DA AC BD AA AA A
| A A
| A
-20 +
--+------------+------------+------------+------------+------------+--
30 40 50 60 70 80
予測値 taijyuu
NOTE: 49 obs が欠損値です。
2019年10月29日 火曜日 09時02分07秒 34
Plot of resid1*shintyou. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
| A
| A A
|
| A A
残 20 + A A
差 | B A A
| A A A AAA
| A A A A A AAB DB A A A
| A A B ABA A BB AEA ACA A A A A
| AA A A A CA A AAAD AFB BAB EAB A F
0 +--------A-AB---A-AAB-BDAC-AAB-EA--DBDCBAFFAFDBACBCC-A---A---A--------
| AAA A B B DE AEB BCGE BGDABFD CCB BE A A A
| A BA B ABA CABCAAAB CBA BBBB ACA A A
| A DA A C B DA A A AA
| A A
| A
-20 +
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
NOTE: 49 obs が欠損値です。
2019年10月29日 火曜日 09時02分07秒 35
Plot of resid1*taijyuu. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
| A
| A A
|
| A A
残 20 + A A
差 | AA B
| A A BB
| A AA AA ADE A A A
| A BABAAAI FBA B
| B AAAAD ACDEDDCDGA
0 +---------------A-BAACAGCDDAHDEJMDAGBAAA----------------------
| BAADAECJDENCFLDCBD B
| CA DCBBEBBDDCFAAAA
| A ADB DCB ABA
| A A
| A
-20 +
---+-------------+-------------+-------------+-------------+--
20 40 60 80 100
taijyuu
NOTE: 49 obs が欠損値です。
2019年10月29日 火曜日 09時02分07秒 36
UNIVARIATE プロシジャ
変数 : resid1 (残差)
モーメント
N 350 重み変数の合計 350
平均 0 合計 0
標準偏差 6.68488112 分散 44.6876356
歪度 1.32528304 尖度 3.64226422
無修正平方和 15595.9848 修正済平方和 15595.9848
変動係数 . 平均の標準誤差 0.35732193
基本統計量
位置 ばらつき
平均 0.00000 標準偏差 6.68488
中央値 -0.99468 分散 44.68764
最頻値 0.16506 範囲 48.81370
四分位範囲 7.24519
2019年10月29日 火曜日 09時02分07秒 37
UNIVARIATE プロシジャ
変数 : resid1 (残差)
位置の検定 H0: Mu0=0
検定 -統計量- ------p 値-------
Student の t 検定 t 0 Pr > |t| 1.0000
符号検定 M -22 Pr >= |M| 0.0214
符号付順位検定 S -3526.5 Pr >= |S| 0.0626
正規性の検定
検定 --統計量--- ------p 値-------
Shapiro-Wilk W 0.924907 Pr < W <0.0001
Kolmogorov-Smirnov D 0.102661 Pr > D <0.0100
Cramer-von Mises W-Sq 0.870412 Pr > W-Sq <0.0050
Anderson-Darling A-Sq 5.095018 Pr > A-Sq <0.0050
2019年10月29日 火曜日 09時02分07秒 38
UNIVARIATE プロシジャ
変数 : resid1 (残差)
分位点 (定義 5)
水準 分位点
100% 最大値 33.65543
99% 22.23358
95% 11.65543
90% 8.38562
75% Q3 3.09654
50% 中央値 -0.99468
25% Q1 -4.14864
10% -7.49661
5% -8.78568
1% -11.46235
0% 最小値 -15.15827
2019年10月29日 火曜日 09時02分07秒 39
UNIVARIATE プロシジャ
変数 : resid1 (残差)
極値
----最小値---- ----最大値----
値 Obs 値 Obs
-15.1583 350 21.7239 281
-13.9035 296 22.2336 129
-13.3788 370 28.6554 347
-11.4623 242 29.2347 190
-10.9035 298 33.6554 348
欠損値
---パーセント---
欠損値 カウント 全体 欠損値
. 49 12.28 100.00
[注意] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。 誤差は測定時に混入していると考えてモデルが構築されているから。
[注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。
/* Lesson 04-3 */
/* File Name = les0403.sas 10/29/18 */
options nocenter linesize=78 pagesize=30;
proc printto log = 'Kougi19/les0402_log.txt'
print = 'Kougi19/les0402_Results.txt' new;
/* ods listing gpath='Kougi19/SAS_ODS99'; */
data gakusei;
infile 'Kougi19/all19bu.csv'
firstobs=2
truncover lrecl=80
dlm=',' dsd missover
;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
/* if sex^='M' & sex^='F' then delete; */
if shintyou=. | taijyuu=. then delete; : 欠損値データを除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei; : 相関係数を求める
where taijyuu<85; : 対象データを絞る
run;
proc reg data=gakusei;
model taijyuu=shintyou;
where taijyuu<85; : 対象データを絞る
output out=outreg1 predicted=pred1 residual=resid1;
run;
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
where taijyuu<85; : 対象データを絞る
plot taijyuu*shintyou/vaxis=20 to 100 by 20;
plot pred1*taijyuu;
plot resid1*pred1 /vref=0;
plot resid1*shintyou/vref=0;
plot resid1*taijyuu /vref=0;
plot resid1*(pred1 shintyou taijyuu)/vref=0; : まとめて指定することも可
run;
proc univariate data=outreg1 plot normal;
var resid1;
run;
2019年10月29日 火曜日 09時08分47秒 41
CORR プロシジャ
5 変数 : shintyou taijyuu kyoui kodukai tsuuwa
単純統計量
変数 N 平均 標準偏差 合計
shintyou 345 168.80435 7.92952 58238
taijyuu 345 58.48348 8.46021 20177
kyoui 119 85.65882 7.79075 10193
kodukai 324 48387 51078 15677500
tsuuwa 151 6469 4339 976892
単純統計量
変数 最小値 最大値
shintyou 145.00000 186.00000
taijyuu 35.00000 84.00000
kyoui 46.00000 110.00000
kodukai 0 350000
tsuuwa 0 30000
2019年10月29日 火曜日 09時08分47秒 42
CORR プロシジャ
Pearson の相関係数
H0: Rho=0 に対する Prob > |r|
オブザベーション数
shintyou taijyuu kyoui kodukai tsuuwa
shintyou 1.00000 0.71811 0.26538 0.03542 -0.07704
<.0001 0.0035 0.5252 0.3471
345 345 119 324 151
taijyuu 0.71811 1.00000 0.38233 0.05242 -0.06881
<.0001 <.0001 0.3469 0.4012
345 345 119 324 151
kyoui 0.26538 0.38233 1.00000 -0.27453 -0.17995
0.0035 <.0001 0.0030 0.2369
119 119 119 115 45
kodukai 0.03542 0.05242 -0.27453 1.00000 0.22221
0.5252 0.3469 0.0030 0.0070
324 324 115 324 146
tsuuwa -0.07704 -0.06881 -0.17995 0.22221 1.00000
0.3471 0.4012 0.2369 0.0070
151 151 45 146 151
2019年10月29日 火曜日 09時08分47秒 43
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
読み込んだオブザベーション数 345
使用されたオブザベーション数 345
分散分析
要因 自由度 平方和 平均平方 F 値 Pr > F
Model 1 12697 12697 365.20 <.0001
Error 343 11925 34.76667
Corrected Total 344 24622
Root MSE 5.89633 R2 乗 0.5157
従属変数の平均 58.48348 調整済み R2 乗 0.5143
変動係数 10.08204
2019年10月29日 火曜日 09時08分47秒 44
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
パラメータの推定
パラメータ
変数 自由度 推定値 標準誤差 t 値 Pr > |t|
Intercept 1 -70.84864 6.77511 -10.46 <.0001
shintyou 1 0.76617 0.04009 19.11 <.0001
2019年10月29日 火曜日 09時08分48秒 45
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa pred1 resid1
1 F 145.0 38.0 . J 10000 . 40.2454 -2.2454
2 F 146.7 41.0 85 J 10000 Vodafone 6000 41.5479 -0.5479
3 F 148.0 42.0 . J 50000 . 42.5439 -0.5439
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 42.5439 0.4561
5 F 149.0 45.0 . G 60000 . 43.3101 1.6899
6 F 150.0 46.0 86 40000 . 44.0762 1.9238
7 F 151.0 45.0 . J 20000 docomo 5000 44.8424 0.1576
8 F 151.0 50.0 . G 60000 J-PHONE . 44.8424 5.1576
9 F 151.7 41.5 80 J 35000 . 45.3787 -3.8787
10 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.6086 -10.6086
11 F 152.0 43.0 . J 20000 au 3500 45.6086 -2.6086
12 F 152.0 44.0 . 45000 DoCoMo 4000 45.6086 -1.6086
13 F 153.0 41.0 . J 125000 No . 46.3747 -5.3747
14 F 153.0 42.0 . G 0 Vodafone 1000 46.3747 -4.3747
15 F 153.0 46.5 87 G 10000 . 46.3747 0.1253
2019年10月29日 火曜日 09時08分48秒 46
Plot of taijyuu*shintyou. Legend: A = 1 obs, B = 2 obs, etc.
taijyuu |
100 +
|
|
| A
80 + A A AAAA A
| B A A B A A
| ACB EEB C BBA F A A B
| B B BC AHC BBB FDCB CEA B A
60 + A AA BB AACDABJFBHIFADCDC ACA AA
| A B EC CA FCIHACDF EBB EB A
| A A CDAC DE DEB CFCBA AA A A A
| A AAA BABA BAB AB ABA A
40 + A AA A B B
| A
|
|
20 +
|
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2019年10月29日 火曜日 09時08分48秒 47
Plot of pred1*taijyuu. Legend: A = 1 obs, B = 2 obs, etc.
|
予 80 +
測 |
値 |
| A
t 70 + A A B A
a | A A EA CC DA G B
i | AABAEAAAA ACCB AAA C
j | A BC B BC JDBDA DABEABAA A AA A A
y 60 + B ACA CGBDAJBHDBADA C DAB A A
u | AD B FCF GDDCBC CA DA A A A
u | A C DCAA E A A AAB A A
| C CB CACDB D A AA A
50 + A BA AEA AA A A
| AC A D CACA A A
| A AAA AA A
| AAA A
40 + A
|
--+----------+----------+----------+----------+----------+----------+--
30 40 50 60 70 80 90
taijyuu
2019年10月29日 火曜日 09時08分48秒 48
Plot of resid1*pred1. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
|
|
|
| A A
残 20 + A
差 | B A
| A A A AAAA
| A A A AB ACBDB A A
| A A AA ABA BCACAACB A ABA A
| AA A A A CA A AAACAFEABA GBBA F
0 +----A-B--AABABDACAA-BEA-EBECCICGDCAABBBB--A--A---------------
| A BAA AABCF AEBACFFCDDDHD CCC AEAB AA
| A BA B ABA CABBAABCA CB CACA A
| A DA AA B CA AA
| A AA
|
-20 +
---+-------------+-------------+-------------+-------------+--
40 50 60 70 80
予測値 taijyuu
2019年10月29日 火曜日 09時08分48秒 49
Plot of resid1*shintyou. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
|
|
|
| A A
残 20 + A
差 | B A
| A A A AAAA
| A A A A B ACB DB A A
| A A B ABA BC ACA ACB A AAAA A
| AA A A A CA A AAAC AFE BAA GBBA F
0 +----------AB---A-AAB-BDAC-AAB-EA--EBECBAICAFDCAABBB-B---A---A--------
| A AAA A B B DE AEB ACFF CDDADGD CBD AEA B A A
| A BA B ABA CABBA AB CA CB C ACA A
| A DA A A B CA AA
| A A A
|
-20 +
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2019年10月29日 火曜日 09時08分48秒 50
Plot of resid1*taijyuu. Legend: A = 1 obs, B = 2 obs, etc.
40 +
|
|
|
|
| A A
残 20 + A
差 | A A A
| A A AAC
| A A A B A BADBC A A
| A B AB AB GB DACAA B
| AA AA AA D A C GDCAEBDD F
0 +-------------AAAA-AC-DCC-DDB-GBDFBJEFEA-BCA--A-A---------------------
| A BAA BBABCCEEDF GICCANBACC C B
| ABA CABC B ECA C BCAEA A
| A AD B BC A AA
| A A A
|
-20 +
--+----------+----------+----------+----------+----------+----------+-
30 40 50 60 70 80 90
taijyuu
10. 次回は、... : 11月05日 16:20-17:50