● 目次: 回帰分析 : 連続変量の予測
4. 単回帰分析 : 予測等に使う、連続変量の関係 [第3回の資料へジャンプ]
5. 幾つかのチェック項目 [第3回の資料へジャンプ]
6. 有効桁数に注意せよ : どこまでが「意味ある桁」か? [第3回の資料へジャンプ]
7. 「体重の大きい者を除外」して実行するには?
8. 重回帰分析 : 2変量以上の説明する変量(説明変量)で 1変量(目的変量)を説明
9. 特定グループでの解析
10. [回帰分析:要点] 解析する上での注意点
11. 4つの尺度と回帰分析
12. 誤用?! : 外挿
[注意] 「正規性を乱している者は何でも除外してかまわない」というわけではない。 今回の場合は、元データに戻ったところ、体育会系のずんぐりした者であったため、 普通の大学生とは異なる性質を有していると判断し除外対象とした。 除外する場合にはその根拠を明確にしないと、「恣意的な解析」と言われかねないことに注意せよ。
/* Lesson 04-1 */
/* File Name = les0401.sas 10/29/18 */
options linesize=72 pagesize=20;
options nocenter linesize=78 pagesize=30;
proc printto log = 'Kougi/les0401_log.txt'
print = 'Kougi/les0401_Results.txt' new;
ods listing gpath='Kougi/SAS_ODS99';
data gakusei;
infile 'Kougi/all07au.txt'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
if shintyou=. | taijyuu=. then delete; : 欠損値データを除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei;
where taijyuu<80; : 対象データを絞る
run;
proc reg data=gakusei;
model taijyuu=shintyou;
where taijyuu<80; : 対象データを絞る
output out=outreg1 predicted=pred1 residual=resid1;
run;
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
where taijyuu<80; : 対象データを絞る
plot taijyuu*shintyou/vaxis=20 to 100 by 20;
plot pred1*taijyuu;
plot resid1*pred1 /vref=0;
plot resid1*shintyou/vref=0;
plot resid1*taijyuu /vref=0;
plot resid1*(pred1 shintyou taijyuu)/vref=0; : まとめて指定することも可
run;
proc univariate data=outreg1 plot normal;
var resid1;
run;
2018年10月26日 金曜日 20時38分36秒 69
CORR プロシジャ
5 変数 : shintyou taijyuu kyoui kodukai tsuuwa
単純統計量
変数 N 平均 標準偏差 合計
shintyou 321 168.59346 8.02514 54119
taijyuu 321 58.34984 8.54729 18730
kyoui 111 85.74775 7.95609 9518
kodukai 303 49107 51751 14879500
tsuuwa 132 6742 4470 890002
単純統計量
変数 最小値 最大値
shintyou 145.00000 186.00000
taijyuu 35.00000 84.00000
kyoui 46.00000 110.00000
kodukai 0 350000
tsuuwa 0 30000
2018年10月26日 金曜日 20時38分36秒 70
CORR プロシジャ
Pearson の相関係数
H0: Rho=0 に対する Prob > |r|
オブザベーション数
shintyou taijyuu kyoui kodukai tsuuwa
shintyou 1.00000 0.72880 0.28729 0.06533 -0.05960
<.0001 0.0022 0.2569 0.4972
321 321 111 303 132
taijyuu 0.72880 1.00000 0.38406 0.06408 -0.04543
<.0001 <.0001 0.2662 0.6050
321 321 111 303 132
kyoui 0.28729 0.38406 1.00000 -0.28125 -0.17722
0.0022 <.0001 0.0033 0.2940
111 111 111 107 37
kodukai 0.06533 0.06408 -0.28125 1.00000 0.26949
0.2569 0.2662 0.0033 0.0021
303 303 107 303 128
tsuuwa -0.05960 -0.04543 -0.17722 0.26949 1.00000
0.4972 0.6050 0.2940 0.0021
132 132 37 128 132
2018年10月26日 金曜日 20時38分36秒 71
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
読み込んだオブザベーション数 321
使用されたオブザベーション数 321
分散分析
要因 自由度 平方和 平均平方 F 値 Pr > F
Model 1 12417 12417 361.39 <.0001
Error 319 10961 34.35989
Corrected Total 320 23378
Root MSE 5.86173 R2 乗 0.5311
従属変数の平均 58.34984 調整済み R2 乗 0.5297
変動係数 10.04584
2018年10月26日 金曜日 20時38分36秒 72
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
パラメータの推定
パラメータ
変数 自由度 推定値 標準誤差 t 値 Pr > |t|
Intercept 1 -72.51537 6.89174 -10.52 <.0001
shintyou 1 0.77622 0.04083 19.01 <.0001
2018年10月26日 金曜日 20時38分37秒 73
Obs sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa pred1 resid1
1 F 145.0 38.0 . J 10000 . 40.0362 -2.0362
2 F 146.7 41.0 85 J 10000 Vodafone 6000 41.3558 -0.3558
3 F 148.0 42.0 . J 50000 . 42.3648 -0.3648
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 42.3648 0.6352
5 F 149.0 45.0 . G 60000 . 43.1411 1.8589
6 F 150.0 46.0 86 40000 . 43.9173 2.0827
7 F 151.0 45.0 . J 20000 docomo 5000 44.6935 0.3065
8 F 151.0 50.0 . G 60000 J-PHONE . 44.6935 5.3065
9 F 151.7 41.5 80 J 35000 . 45.2368 -3.7368
10 F 152.0 35.0 77 J 60000 DoCoMo 2000 45.4697 -10.4697
11 F 152.0 43.0 . J 20000 au 3500 45.4697 -2.4697
12 F 152.0 44.0 . 45000 DoCoMo 4000 45.4697 -1.4697
13 F 153.0 41.0 . J 125000 No . 46.2459 -5.2459
14 F 153.0 42.0 . G 0 Vodafone 1000 46.2459 -4.2459
15 F 153.0 46.5 87 G 10000 . 46.2459 0.2541
2018年10月26日 金曜日 20時38分37秒 74
: taijyuu*shintyou. A=1, B=2, ...
taijyuu |
100 +
|
|
| A
80 + A A AAAA A
| B A A B A A
| AAB EDB C AAA F A A B
| B B BC AGC BBB DDCB CEA A A
60 + A AA BB AACCABIFBHIFACCDC AAA AA
| A B EC AA ECHGACDF EBB DB A
| A A CDAC DE DDB CFBAA AA A A
| A AAA BABA BAB AB ABA A
40 + A AA A B B
| A
|
|
20 +
|
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2018年10月26日 金曜日 20時38分37秒 75
: pred1*taijyuu. A=1, B=2, ...
|
予 80 +
測 |
値 |
| A
t 70 + AA A A B A A
a | A BA CB CA F B
i | AABAEAAAA ACCB A C
j | A BB BABB JDBDA D AEABA A AA A A
y 60 + B ACA CFBDAIBHDBACA B CAB A A
u | AD A ECE GCDCBB CA DA A A A
u | A C DBAA D A A AAB A A
| C CB CACDA C A AA A
50 + A BA AEA AA A A
| B A C CABA A
| A ABAA AB B A
| AAA A
40 + A
|
--+----------+----------+----------+----------+----------+----------+--
30 40 50 60 70 80 90
taijyuu
2018年10月26日 金曜日 20時38分37秒 76
: resid1*pred1. A=1, B=2, ...
40 +
|
|
|
|
| A A
残 20 + A
差 | B A
| A A A AAAA
| A A A AB AABDA A A
| A A AA ABA BCABAACAAA B A
| AA A A A CA AAABAFEAB AEBBA F
0 +----AB---AABABDACAAB-DA-DBECCHCGD-DABBBB--A---A--------------
| A AAAA AABCF ADBACEECDDDHACCCC AEAA A A
| A BA B ABA CAAAAABCA BB CAAA A
| A DA AA BBA AA
| A A
|
-20 +
---+-------------+-------------+-------------+-------------+--
40 50 60 70 80
予測値 taijyuu
2018年10月26日 金曜日 20時38分37秒 77
: resid1*shintyou. A=1, B=2, ...
40 +
|
|
|
|
| A A
残 20 + A
差 | B A
| A A A AAAA
| A A A A B AAB DA A A
| A A B ABA BC ABA ACB A AA A
| AA A A A CA AAAB AFE BAA EBBA F
0 +----------AB---A-AAB-BDAC-AAB-DA--DBECBAHCAFDCAABBB-B---A---A--------
| A AAA A B B DE ADB ACEE CDDADGD CBD AEA A A A
| A BA B ABA CAAAA AB CA BB C AAA A
| A DA A A B BA AA
| A A
|
-20 +
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2018年10月26日 金曜日 20時38分37秒 78
: resid1*taijyuu. A=1, B=2, ...
40 +
|
|
|
|
| A A
残 20 + A
差 | A A A
| A A AAC
| A A A B A AACBB A A
| A B AB AB FB DABA B
| AA AA AA C A B GDCAEACD F
0 +-------------AAAA-AC-DCC-DDA-FBDFBIEFEA-BCA--A-A---------------------
| A BAA BBABCCEDDE GHCCANBACC B B
| ABA CABC A DCA C BBACA A
| A AD B BB A AA
| A A
|
-20 +
--+----------+----------+----------+----------+----------+----------+-
30 40 50 60 70 80 90
taijyuu
/* Lesson 04-2 */
/* File Name = les0402.sas 10/29/18 */
options linesize=72 pagesize=20;
options nocenter linesize=78 pagesize=30;
proc printto log = 'Kougi/les0402_log.txt'
print = 'Kougi/les0402_Results.txt' new;
ods listing gpath='Kougi/SAS_ODS99';
data gakusei;
infile 'Kougi/all07au.txt'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete;
if shintyou=. | taijyuu=. then delete;
proc print data=gakusei(obs=10);
run;
proc reg data=gakusei; : 回帰分析
model taijyuu=shintyou kyoui; : 複数変量を指定
output out=outreg1 predicted=pred1 residual=resid1; : 結果項目の保存
run; :
proc print data=outreg1(obs=15);
run;
:
proc plot data=outreg1; : 散布図を描く
where shintyou^=. and taijyuu^=. and kyoui^=.; : 解析に使ったデータのみ
plot taijyuu*shintyou; :
plot taijyuu*kyoui; :
plot taijyuu*pred1; : 観測値と予測値
plot resid1*pred1 /vref=0; : 残差と予測値(残差解析)
plot resid1*shintyou/vref=0; : 残差と説明変量(残差解析)
plot resid1*kyoui /vref=0; : 残差と説明変量(残差解析)
plot resid1*taijyuu /vref=0; : 残差と目的変量(残差解析)
run; :
:
proc univariate data=outreg1 plot normal; : 残差を正規プロットして確かめる
var resid1; :
run; :
2018年10月26日 金曜日 08時39分18秒 2
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
読み込んだオブザベーション数 325
使用されたオブザベーション数 114
欠損値を含むオブザベーション数 211
分散分析
要因 自由度 平方和 平均平方 F 値 Pr > F
Model 2 8070.70705 4035.35353 85.10 <.0001
Error 111 5263.40733 47.41808
Corrected Total 113 13334
Root MSE 6.88608 R2 乗 0.6053
従属変数の平均 58.79298 調整済み R2 乗 0.5982
変動係数 11.71242
2018年10月26日 金曜日 08時39分18秒 3
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
パラメータの推定
パラメータ
変数 自由度 推定値 標準誤差 t 値 Pr > |t|
Intercept 1 -106.30023 12.75197 -8.34 <.0001
shintyou 1 0.80655 0.07854 10.27 <.0001
kyoui 1 0.34947 0.08192 4.27 <.0001
2018年10月26日 金曜日 08時39分24秒 4
OBS sex shintyou taijyuu kyoui jitaku kodukai carryer tsuuwa pred1 resid1
1 F 145.0 38.0 . J 10000 . . .
2 F 146.7 41.0 85 J 10000 Vodafone 6000 41.7256 -0.72559
3 F 148.0 42.0 . J 50000 . . .
4 F 148.0 43.0 80 J 50000 DoCoMo 4000 41.0267 1.97328
5 F 149.0 45.0 . G 60000 . . .
6 F 150.0 46.0 86 40000 . 44.7367 1.26333
7 F 151.0 45.0 . J 20000 docomo 5000 . .
8 F 151.0 50.0 . G 60000 J-PHONE . . .
9 F 151.7 41.5 80 J 35000 . 44.0109 -2.51095
10 F 152.0 35.0 77 J 60000 DoCoMo 2000 43.2045 -8.20449
2018年10月26日 金曜日 08時39分24秒 5
プロット : taijyuu*shintyou 凡例 : A = 1 obs, B = 2 obs, ...
100 + A
|
| A
| A
| A
| A A
75 + A A
| A A BAA A A A A
| BB A A BAAA A A A
taijyuu | A A A CA C AA B
| B A AAAA C AA AA A A A A
| A A AA A BABA AAA A
50 + AC B CD AAB B
| A A A B A A BA A
| AA A A
|
| A
|
25 +
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2018年10月26日 金曜日 08時39分24秒 6
プロット : taijyuu*kyoui 凡例 : A = 1 obs, B = 2 obs, ...
100 + A
|
| A
| A
| A
| A A
75 + A A
| BD AB A
| A A CAAAAB B A
taijyuu | A A AGA B A
| BB ADBDB A
| A A A AAA CC AB
50 + A A DD G B
| B DAA BA
| B B
|
| A
|
25 +
---+-------------+-------------+-------------+-------------+--
40 60 80 100 120
kyoui
2018年10月26日 金曜日 08時39分24秒 9
プロット : resid1*shintyou 凡例 : A = 1 obs, B = 2 obs, ...
40 +
|
| A
|
| A
| A
残 20 +
差 |
| A A
| A A A AA
| A A B A A A A
| A BA A A BA A BA AA A
0 +----------A---A---A-AAA-A--BA--A--AAAA-AEA-A--AA-A-A-----------------
| A B B DC AAB BA A B BAA A A B A A
| A A AA CB A A A ABA A
| A A A
| A
|
-20 +
--+------------+------------+------------+------------+------------+--
140 150 160 170 180 190
shintyou
2018年10月26日 金曜日 08時39分24秒 10
プロット : resid1*kyoui 凡例 : A = 1 obs, B = 2 obs, ...
40 +
|
| A
|
| A
| A
残 20 +
差 |
| A A
| A AA B
| A AA A BB
| A BAAAB AAA B B A
0 +-----------------------A---C--A-ABFBBE--AB-----A-------------
| EBCAGAEDA AB
| AAABBA D AC A
| BA
| A
|
-20 +
---+-------------+-------------+-------------+-------------+--
40 60 80 100 120
kyoui
2018年10月26日 金曜日 08時39分24秒 11
プロット : resid1*taijyuu 凡例 : A = 1 obs, B = 2 obs, ...
40 +
|
| A
|
| A
| A
残 20 +
差 |
| A A
| A A A AA
| A AA A BB
| A AA A A B CAABA A
0 +-----------------A-AAACA-B-C-ACBD-C---A----------------------
| A CADCD AB BCBA B AB
| A A ABB B A AC B A
| A A A
| A
|
-20 +
---+-------------+-------------+-------------+-------------+--
20 40 60 80 100
taijyuu
/* Lesson 04-3 */
/* File Name = les0403.sas 10/29/18 */
options linesize=72 pagesize=20;
options nocenter linesize=78 pagesize=30;
proc printto log = 'Kougi/les0403_log.txt'
print = 'Kougi/les0403_Results.txt' new;
ods listing gpath='Kougi/SAS_ODS99';
data gakusei;
infile 'Kougi/all07au.txt'
firstobs=2;
input sex $ shintyou taijyuu kyoui
jitaku $ kodukai carryer $ tsuuwa;
if sex^='M' & sex^='F' then delete; : 性別不明は除外
if shintyou=. | taijyuu=. | kyoui=. then delete; : 欠損のあるデータは除外
proc print data=gakusei(obs=10);
run;
proc corr data=gakusei; : 相関係数
where sex='M'; : 男性について
run; :
:
proc reg data=gakusei; : 回帰分析
model taijyuu=shintyou kyoui; :
where sex='M'; : 男性について
output out=outreg1 predicted=pred1 residual=resid1; :
run; :
proc print data=outreg1(obs=15);
run;
proc plot data=outreg1;
where sex='M'; : 対象データについて
plot taijyuu*shintyou;
plot taijyuu*kyoui;
plot taijyuu*pred1;
plot resid1*(pred1 shintyou kyoui taijyuu)/vref=0; : まとめて記述
/*
plot resid1*pred1 /vref=0;
plot resid1*shintyou/vref=0;
plot resid1*kyoui /vref=0;
plot resid1*taijyuu /vref=0;
*/
run;
proc univariate data=outreg1 plot normal;
var resid1;
run;
CORR プロシジャ
単純統計量
変数 N 平均 標準偏差 合計
taijyuu 242 62.23884 7.92774 15062
kyoui 71 88.09859 9.68527 6255
kodukai 229 48620 52677 11134000
tsuuwa 88 6422 4521 565098
単純統計量
変数 最小値 最大値
taijyuu 46.00000 100.00000
kyoui 46.00000 112.00000
kodukai 0 350000
tsuuwa 0 30000
2018年10月26日 金曜日 08時58分30秒 20
CORR プロシジャ
Pearson の相関係数
H0: Rho=0 に対する Prob > |r|
オブザベーション数
shintyou taijyuu kyoui kodukai tsuuwa
shintyou 1.00000 0.43758 0.15872 0.07647 -0.03430
<.0001 0.1862 0.2491 0.7510
242 242 71 229 88
taijyuu 0.43758 1.00000 0.40227 0.04119 -0.01583
<.0001 0.0005 0.5352 0.8836
242 242 71 229 88
kyoui 0.15872 0.40227 1.00000 -0.37945 -0.38661
0.1862 0.0005 0.0015 0.1721
71 71 71 67 14
kodukai 0.07647 0.04119 -0.37945 1.00000 0.24685
0.2491 0.5352 0.0015 0.0219
229 229 67 229 86
tsuuwa -0.03430 -0.01583 -0.38661 0.24685 1.00000
0.7510 0.8836 0.1721 0.0219
88 88 14 86 88
2018年10月26日 金曜日 08時58分30秒 23
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
読み込んだオブザベーション数 242
使用されたオブザベーション数 71
欠損値を含むオブザベーション数 171
2018年10月26日 金曜日 08時58分30秒 24
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
分散分析
要因 自由度 平方和 平均平方 F 値 Pr > F
Model 2 1596.38065 798.19033 13.06 <.0001
Error 68 4155.98301 61.11740
Corrected Total 70 5752.36366
Root MSE 7.81776 R2 乗 0.2775
従属変数の平均 64.72817 調整済み R2 乗 0.2563
変動係数 12.07784
2018年10月26日 金曜日 08時58分30秒 25
REG プロシジャ
モデル : MODEL1
従属変数 : taijyuu
パラメータの推定
パラメータ
変数 自由度 推定値 標準誤差 t 値 Pr > |t|
Intercept 1 -54.72134 27.50850 -1.99 0.0507
shintyou 1 0.52620 0.15946 3.30 0.0015
kyoui 1 0.32534 0.09772 3.33 0.0014
2018年10月26日 金曜日 08時58分32秒 27
プロット : taijyuu*shintyou 凡例 : A = 1 obs, B = 2 obs, ...
taijyuu |
100 + A
| A A A
| A A
75 + A B B A BAA C AAA B A A
| B B BC B HAC DF D G D DC C K A B B A
| A C BB C CAFGBD M JBKK FAE DBCC A BA AA
50 + A B A C A AACCAA A C C B C
|
|
25 +
---+--------+--------+--------+--------+--------+--------+--------+--
155 160 165 170 175 180 185 190
shintyou
2018年10月26日 金曜日 08時58分32秒 28
プロット : taijyuu*kyoui 凡例 : A = 1 obs, B = 2 obs, ...
(NOTE: 171 obs が欠損値です。)
taijyuu |
100 + A
| A A
| A
75 + AA C A A
| A A CABIBBAD A
| A A BCA ADBEF AA A
50 + A A AA
|
|
25 +
---+-------------+-------------+-------------+-------------+--
40 60 80 100 120
kyoui
2018年10月26日 金曜日 08時58分32秒 31
プロット : resid1*shintyou 凡例 : A = 1 obs, B = 2 obs, ...
(NOTE: 171 obs が欠損値です。)
|
50 +
残 |
差 | A
25 + A A
| A
| A A A A B B A
0 +---------------AA-----A-CD-A-G-A-BB-BAC-A-AB-A-B---A--A-------------
| A B A A A A A AA A A A A BAA A A
|
-25 +
---+--------+--------+--------+--------+--------+--------+--------+--
155 160 165 170 175 180 185 190
shintyou
2018年10月26日 金曜日 08時58分32秒 32
プロット : resid1*kyoui 凡例 : A = 1 obs, B = 2 obs, ...
(NOTE: 171 obs が欠損値です。)
|
50 +
残 |
差 | A
25 + A A
| A
| A BD B
0 +-------------A---------A---A-AB-AADACHBABE--B--A---A---------
| A ABB CBCD A A
|
-25 +
---+-------------+-------------+-------------+-------------+--
40 60 80 100 120
kyoui
2018年10月26日 金曜日 08時58分32秒 33
プロット : resid1*taijyuu 凡例 : A = 1 obs, B = 2 obs, ...
(NOTE: 171 obs が欠損値です。)
|
50 +
残 |
差 | A
25 + A A
| A
| A AAB A A AA
0 +----------------A-AA---FADE--GBAB-DB-------A-------------------------
| A A A CAABAE A B A
|
-25 +
--+----------+----------+----------+----------+----------+----------+-
40 50 60 70 80 90 100
taijyuu
where sex='M' and taijyuu<80;
[例1] 人間の成長曲線
[例2] 将来のプログラマ必要数予測 : 21世紀(?)には国民全員がプログラマ ('80s)
[例3] オリンピック 100m 走の男女記録 : 2156年には女性の方が速い (2004.09.30) :
Japan Journal LTD
の記事
, 朝日新聞
の記事
[究極の命題!] 100m に 0.00秒 要する(!?)ようになるのは何時?