グループ分け, if文, 平均値の比較(検定)

統計モデル解析特論I/II : 第12回 (01/15/19)

  今回は、グループ毎の集計方法について説明した後に、条件に依って操作をする方法と、 そして、グループごとの平均値に差があるかの比較方法(検定)について説明する。
  1. グループ分け : 調査対象の性質・特性によって分類

    1. プログラム : Lesson 12-01 : les1201.sas
       /* Lesson 12-01 */
       /*    File Name = les1201.sas  01/15/19   */
      
      options nocenter linesize=78 pagesize=30;
      proc printto print = 'Kougi/les1201_results.txt' new;
      
      data gakusei;
        infile 'Kougi/all08c_sjis.csv'
          firstobs=2 dlm=',' dsd missover
          encoding=sjis termstr=crlf;
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      proc print data=gakusei(obs=5);
      run;
      
      title '*** データ全体を対象に ***';        : 出力に説明を追記できる
      proc freq data=gakusei;
        table sex;
      run;
      
      proc means data=gakusei;
        var shintyou taijyuu; 
      run;
      proc univariate data=gakusei plot;
        var shintyou taijyuu; 
      run;
      
      /* 性別ごとに(方法1) */
      title '*** 性別ごとに平均値(方法1) ***';   : 出力に説明を追記できる
      proc means data=gakusei;                   : 平均を算出
        where sex="M";                           : 男について計算
        var shintyou taijyuu; 
      run;
      proc means data=gakusei;                   : 平均を算出
        where sex="F";                           : 女について計算
        var shintyou taijyuu; 
      run;
      
      /* 性別ごとに(方法2) */
      title '*** 性別ごとに平均値(方法2) ***';   : 出力に説明を追記できる
      proc sort data=gakusei;                    : 並べ替え(ソート)
        by sex;                                  : 性別ごとに
      run;
      
      proc means data=gakusei;                   : 平均の計算
        var shintyou taijyuu;                    : 身長と体重について
        by sex;                                  : 性別ごとに
      run;
      
      proc univariate data=gakusei plot;         : 基礎統計量の計算
        var shintyou taijyuu;                    : 身長と体重について
        by sex;                                  : 性別ごとに
      run;
      
      /* 性別ごとにヒストグラム(方法1) */
      title ' *** 性別ごとにヒストグラム(方法1) ***';
      proc chart data=gakusei;                   : ヒストグラム
        hbar shintyou taijyuu;                   : 指定した変量の水平棒グラフを表示
        by sex;
      run;
      
      /* 性別ごとにヒストグラム(方法2) */
      title '*** 性別ごとにヒストグラム(方法2) ***';
      proc chart data=gakusei;                   : ヒストグラム
        hbar shintyou taijyuu/group=sex;         : 性別ごとに併置して
      run;
      

    2. 出力
      • html 形式: les1201-results.html
      • pdf 形式: les1201-results.pdf
      • テキストファイル: les1201_results.txt

      • 性別で身長や体重の平均に違いがあることを確認せよ。
      • 各々の分布の特徴と違いを把握せよ。
      • ヒストグラムだけでなく、箱髭図や樹葉図からでも分布特性が把握できるようにせよ。(html 形式、pdf 形式)
      *** データ全体を対象に ***                                        237
                                         2019年 1月15日 火曜日 11時51分39秒
      FREQ プロシジャ
                                             累積         累積
      sex     度数     パーセント     度数     パーセント
      -----------------------------------------------------------------
      F           134         33.58              134         33.58     
      M           265         66.42              399        100.00     
                            Frequency Missing = 5
      
      *** データ全体を対象に ***                                        238
                                         2019年 1月15日 火曜日 11時51分39秒
      MEANS プロシジャ
      
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou   389    167.9092545      8.2673882    145.0000000    188.0000000
      taijyuu    350     58.9542857      9.3840395     35.0000000    100.0000000
      --------------------------------------------------------------------------
      
       <<< 中略 >>> 
      
      *** 性別ごとに平均値(方法1) ***                                  245
                                         2019年 1月15日 火曜日 11時51分40秒
      MEANS プロシジャ
      
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou   261    172.2528736      5.5465132    156.0000000    188.0000000
      taijyuu    261     62.3601533      8.0245310     46.0000000    100.0000000
      --------------------------------------------------------------------------
      
      *** 性別ごとに平均値(方法1) ***                                  246
                                         2019年 1月15日 火曜日 11時51分40秒
      MEANS プロシジャ
      
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou   127    158.9818898      5.2517332    145.0000000    171.0000000
      taijyuu     88     48.8409091      4.7482032     35.0000000     60.0000000
      --------------------------------------------------------------------------
      
      *** 性別ごとに平均値(方法2) ***                                  247
                                         2019年 1月15日 火曜日 11時51分40秒
      sex=' '
      MEANS プロシジャ
      
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou     1    168.0000000              .    168.0000000    168.0000000
      taijyuu      1     60.0000000              .     60.0000000     60.0000000
      --------------------------------------------------------------------------
      
      sex=F
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou   127    158.9818898      5.2517332    145.0000000    171.0000000
      taijyuu     88     48.8409091      4.7482032     35.0000000     60.0000000
      --------------------------------------------------------------------------
      
      *** 性別ごとに平均値(方法2) ***                                  248
                                         2019年 1月15日 火曜日 11時51分40秒
      sex=M
      MEANS プロシジャ
      
      変数       N         平均   標準偏差      最小値      最大値
      --------------------------------------------------------------------------
      shintyou   261    172.2528736      5.5465132    156.0000000    188.0000000
      taijyuu    261     62.3601533      8.0245310     46.0000000    100.0000000
      --------------------------------------------------------------------------
      
       <<< 中略 >>> 
      
       *** 性別ごとにヒストグラム(方法1) ***                        273
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=' '
      shintyou                        累積                            累積
      中間点               度数  度数  パーセント  パーセント
                 |
           168   |**********       1       1   100.00           100.00
                 |
                 ----------+
                           1
                    度数
      
       *** 性別ごとにヒストグラム(方法1) ***                        274
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=' '
      taijyuu                        累積                            累積
      中間点              度数  度数  パーセント  パーセント
                |
           60   |**********       1       1   100.00           100.00
                |
                ----------+
                          1
                   度数
      
       *** 性別ごとにヒストグラム(方法1) ***                        275
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=F
      shintyou                             累積                            累積
      中間点                    度数  度数  パーセント  パーセント
                 |
           144   |*                     1       1     0.79             0.79
           147   |**                    3       4     2.36             3.15
           150   |***                   6      10     4.72             7.87
           153   |*******              14      24    11.02            18.90
           156   |*************        25      49    19.69            38.58
           159   |***************      29      78    22.83            61.42
           162   |************         23     101    18.11            79.53
           165   |*********            18     119    14.17            93.70
           168   |***                   5     124     3.94            97.64
           171   |**                    3     127     2.36           100.00
                 |
                 -----+----+----+
                      10   20   30
                      度数
      
       *** 性別ごとにヒストグラム(方法1) ***                        276
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=F
      taijyuu                            累積                            累積
      中間点                  度数  度数  パーセント  パーセント
                |
           36   |*                    1       1     1.14             1.14
                |
           40   |**                   4       5     4.55             5.68
                |
           44   |********            16      21    18.18            23.86
                |
           48   |**************      27      48    30.68            54.55
                |
           52   |**************      28      76    31.82            86.36
                |
           56   |****                 8      84     9.09            95.45
                |
           60   |**                   4      88     4.55           100.00
                |
                -----+----+----
                     10   20
                     度数
      
       *** 性別ごとにヒストグラム(方法1) ***                        277
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=M
      shintyou                           累積                            累積
      中間点                  度数  度数  パーセント  パーセント
                 |
         157.5   |                    2       2     0.77             0.77
         160.5   |*                   7       9     2.68             3.45
         163.5   |**                 10      19     3.83             7.28
         166.5   |*****              25      44     9.58            16.86
         169.5   |***********        56     100    21.46            38.31
         172.5   |*************      65     165    24.90            63.22
         175.5   |********           41     206    15.71            78.93
         178.5   |*****              27     233    10.34            89.27
         181.5   |****               20     253     7.66            96.93
         184.5   |*                   5     258     1.92            98.85
         187.5   |*                   3     261     1.15           100.00
                 |
                 ----+---+---+-
                     20  40  60
                     度数
      
       *** 性別ごとにヒストグラム(方法1) ***                        278
                                         2019年 1月15日 火曜日 11時51分41秒
      sex=M
      taijyuu                            累積                            累積
      中間点                  度数  度数  パーセント  パーセント
                |
           45   |                     1       1     0.38             0.38
           51   |***                 24      25     9.20             9.58
           57   |*********           64      89    24.52            34.10
           63   |**************     105     194    40.23            74.33
           69   |*****               40     234    15.33            89.66
           75   |**                  14     248     5.36            95.02
           81   |*                    7     255     2.68            97.70
           87   |                     3     258     1.15            98.85
           93   |                     2     260     0.77            99.62
           99   |                     1     261     0.38           100.00
                |
                ----+---+---+--
                    30  60  90
                     度数
      
      *** 性別ごとにヒストグラム(方法2) ***                         279
                                         2019年 1月15日 火曜日 11時51分41秒
      sex   shintyou                       累積                            累積
            中間点              度数  度数  パーセント  パーセント
                       |
                 144   |                0       0     0.00             0.00
                 148   |                0       0     0.00             0.00
                 152   |                0       0     0.00             0.00
                 156   |                0       0     0.00             0.00
                 160   |                0       0     0.00             0.00
                 164   |                0       0     0.00             0.00
                 168   |                1       1     0.26             0.26
                 172   |                0       1     0.00             0.26
                 176   |                0       1     0.00             0.26
                 180   |                0       1     0.00             0.26
                 184   |                0       1     0.00             0.26
                 188   |                0       1     0.00             0.26
                       |
      F          144   |                1       2     0.26             0.51
                 148   |*               5       7     1.29             1.80
                 152   |**             16      23     4.11             5.91
                 156   |***            27      50     6.94            12.85
                 160   |****           36      86     9.25            22.11
                 164   |***            27     113     6.94            29.05
                 168   |*              13     126     3.34            32.39
                 172   |                2     128     0.51            32.90
                 176   |                0     128     0.00            32.90
                 180   |                0     128     0.00            32.90
                 184   |                0     128     0.00            32.90
                 188   |                0     128     0.00            32.90
                       |
      M          144   |                0     128     0.00            32.90
                 148   |                0     128     0.00            32.90
                 152   |                0     128     0.00            32.90
                 156   |                2     130     0.51            33.42
                 160   |*               7     137     1.80            35.22
                 164   |**             18     155     4.63            39.85
                 168   |*****          45     200    11.57            51.41
                 172   |*********      93     293    23.91            75.32
                 176   |*****          49     342    12.60            87.92
                 180   |****           35     377     9.00            96.92
                 184   |*               9     386     2.31            99.23
                 188   |                3     389     0.77           100.00
                       |
                       -----+----
                            50
                         度数
      
       <<< 中略 >>> 
      
      

    3. 結果の見方
      • 平均値や中央値、最頻値がヒストグラムや箱髭図中で とのような位置にあるか判断できるか?
      • 箱髭図が読めるようになったか? この図だけで分布形状がイメージできるようになったか?
      • 群毎に分けると特徴がより鮮明に判るようになる。
      • 比較する際には軸を揃えたい。揃えないと比較がし難い。
      • 欠損値は除外したい時もある。 ===> 第3節

    4. [テクニック] グループを分けて分析する場合は、事前に並べ替えが必要
    5. [演習1] 他の変数も調べてみよ。また、垂直棒グラフでも比較してみよ。
    6. [演習2] 自宅生/下宿生別に集計して両者の違いを明らかにせよ。

  2. 分布の把握について : 気をつける点

  3. if 文 : ある条件に合致した場合に、特定の処理を実行させる

  4. if 文の便利な使い方
    [例1] 目的のサンプルだけを抽出する : 条件を書き並べる
    [例2] 変量の値を割り当てなおす : 新しい値を右辺に書く
    [例3] 新しい変量を定義する : 新しい変量を左辺に書く

    [例4] 複数の処理をさせたい場合 : do 〜 end で囲む

  5. [演習3] ドラゴンズデータで、利き腕(投げる腕)ごとの平均値等を計算せよ。

  6. 平均値の比較(検定) : 2つのグループの「平均値」に統計的に差があると言えるのか?

  7. パラメトリック検定 : t 検定、Welch の検定
    1. プログラム : Lesson 12-04 : les1204.sas
       /* Lesson 12-04 */
       /*    File Name = les1204.sas  01/25/18   */
      
      options nocenter linesize=78 pagesize=30;
      proc printto print = 'Kougi/les1204_Results.txt' new;
      
      data gakusei;
        infile 'Kougi/all08c_sjis.csv'
          firstobs=2 dlm=',';
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex=" " or shintyou="." or taijyuu="." then delete; 
      
      proc print data=gakusei(obs=5);
      run;
      
      proc sort data=gakusei;
        by sex;
      run;
      proc univariate data=gakusei plot;
        var shintyou taijyuu kyoui kodukai; 
        by sex;
      run;
      
      proc ttest data=gakusei;
        class sex;
        var shintyou taijyuu kyoui kodukai; 
      run;
      
    2. 出力
      
                                     2019年 1月15日 火曜日 00時19分56秒 114
      TTEST プロシジャ
      変数 :  shintyou
      
      sex          手法             N         平均       標準偏差       標準誤差
      
      F                              88      158.6         5.3057         0.5656
      M                             261      172.3         5.5465         0.3433
      Diff (1-2)   Pooled                 -13.6801         5.4871         0.6764
      Diff (1-2)   Satterthwaite          -13.6801                        0.6616
      
      sex          手法               最小値       最大値
      
      F                                145.0        168.0
      M                                156.0        188.0
      Diff (1-2)   Pooled                                
      Diff (1-2)   Satterthwaite                         
      
                                     2019年 1月15日 火曜日 00時19分56秒 115
      TTEST プロシジャ
      変数 :  shintyou
                                                       平均の
      sex           手法                 平均       95% 信頼限界         標準偏差
      
      F                                 158.6       157.4    159.7          5.3057
      M                                 172.3       171.6    172.9          5.5465
      Diff (1-2)    Pooled           -13.6801    -15.0105 -12.3498          5.4871
      Diff (1-2)    Satterthwaite    -13.6801    -14.9871 -12.3732                
      
                                         標準偏差の
      sex           手法                95% 信頼限界
      
      F                                4.6210   6.2305
      M                                5.1080   6.0680
      Diff (1-2)    Pooled             5.1075   5.9282
      Diff (1-2)    Satterthwaite                     
      
      手法             分散          自由度      t 値    Pr > |t|
      
      Pooled           Equal            347     -20.23      <.0001
      Satterthwaite    Unequal       155.85     -20.68      <.0001
      
                                     2019年 1月15日 火曜日 00時19分56秒 116
      TTEST プロシジャ
      変数 :  shintyou
                                    等分散性
      手法              分子の自由度          分母の自由度       F 値    Pr > F
      
      Folded F                   260                    87       1.09    0.6361
      
      変数 :  taijyuu
      
      sex          手法             N         平均       標準偏差       標準誤差
      
      F                              88    48.8409         4.7482         0.5062
      M                             261    62.3602         8.0245         0.4967
      Diff (1-2)   Pooled                 -13.5192         7.3417         0.9050
      Diff (1-2)   Satterthwaite          -13.5192                        0.7092
      
      sex          手法               最小値       最大値
      
      F                              35.0000      60.0000
      M                              46.0000        100.0
      Diff (1-2)   Pooled                                
      Diff (1-2)   Satterthwaite                         
      
                                     2019年 1月15日 火曜日 00時19分57秒 117
      TTEST プロシジャ
      変数 :  taijyuu
                                                       平均の
      sex           手法                 平均       95% 信頼限界         標準偏差
      
      F                               48.8409     47.8349  49.8470          4.7482
      M                               62.3602     61.3821  63.3382          8.0245
      Diff (1-2)    Pooled           -13.5192    -15.2992 -11.7393          7.3417
      Diff (1-2)    Satterthwaite    -13.5192    -14.9158 -12.1227                
      
                                         標準偏差の
      sex           手法                95% 信頼限界
      
      F                                4.1354   5.5758
      M                                7.3901   8.7790
      Diff (1-2)    Pooled             6.8338   7.9319
      Diff (1-2)    Satterthwaite                     
      
      手法             分散          自由度      t 値    Pr > |t|
      
      Pooled           Equal            347     -14.94      <.0001
      Satterthwaite    Unequal       255.85     -19.06      <.0001
      
                                     2019年 1月15日 火曜日 00時19分57秒 118
      TTEST プロシジャ
      変数 :  taijyuu
                                    等分散性
      手法              分子の自由度          分母の自由度       F 値    Pr > F
      
      Folded F                   260                    87       2.86    <.0001
      
       <<< 中略 >>> 
      
      
      変数 :  kodukai
      
      sex          手法             N         平均       標準偏差       標準誤差
      
      F                              82    50567.1        48126.7         5314.7
      M                             247    49530.4        58902.5         3747.9
      Diff (1-2)   Pooled                   1036.7        56425.4         7191.5
      Diff (1-2)   Satterthwaite            1036.7                        6503.3
      
      sex          手法               最小値       最大値
      
      F                                    0       300000
      M                                    0       500000
      Diff (1-2)   Pooled                                
      Diff (1-2)   Satterthwaite                         
      
                                     2019年 1月15日 火曜日 00時19分58秒 121
      TTEST プロシジャ
      変数 :  kodukai
                                                       平均の
      sex           手法                 平均       95% 信頼限界         標準偏差
      
      F                               50567.1     39992.5  61141.7         48126.7
      M                               49530.4     42148.3  56912.4         58902.5
      Diff (1-2)    Pooled             1036.7    -13110.7  15184.1         56425.4
      Diff (1-2)    Satterthwaite      1036.7    -11802.0  13875.4                
      
                                         標準偏差の
      sex           手法                95% 信頼限界
      
      F                               41720.8  56874.9
      M                               54125.8  64611.2
      Diff (1-2)    Pooled            52412.5  61108.8
      Diff (1-2)    Satterthwaite                     
      
      手法             分散          自由度      t 値    Pr > |t|
      
      Pooled           Equal            327       0.14      0.8855
      Satterthwaite    Unequal       167.92       0.16      0.8735
      
                                     2019年 1月15日 火曜日 00時19分58秒 122
      TTEST プロシジャ
      変数 :  kodukai
                                    等分散性
      手法              分子の自由度          分母の自由度       F 値    Pr > F
      
      Folded F                   246                    81       1.50    0.0342
      
    3. 結果の見方 : 二段階、このデータでは?
      • html形式とpdf形式の出力には両群のヒストグラムや推定された分布形状が表示されていて視覚的にも理解しやすい。

      • 等分散と言えるか? : Prob> F' (Folded F と表示されている行)
        • 身長(63.6%)は等分散であると言える ===> t検定 : Equal の項
        • 体重(0.01%), 胸囲(0.01%)は等分散であると言えない ===> Welchの検定 : Unequal の項
        • 小遣い(3.42%)については、基準(1%, 5%)に依って等分散である(1%)とも等分散ではない(5%)とも言える ===> t検定 & Welchの検定

      • 平均に差があると言えるか? : Prob>|T|
        • 身長(0.00%, Equal の項)や体重(0.01%, Unequal の項)、胸囲(0.01%, Unequal の項)は性別によって平均に差があると言える。
        • 小遣い(88.6%, Equal の項)は性別によって平均に差があるとは言えない。
        • 小遣い(87.4%, Unequal の項)は性別によって平均に差があるとは言えない。
        • ただし、体重、胸囲、小遣い額の分布のどちらか一方、または両方が 正規分布とは言えないので、身長以外の結論は信憑性に欠ける。 よって、体重、胸囲、小遣い額については次節で説明するノンパラメトリック検定の結果を待つ必要がある。

      • 検定基準
        • どれくらいの割合(確率)でその仮説が発生するか?
        • 確率が小さい ==> 稀なこと(普通ではない) ==> 有意(分散が等しいとは言えない、平均に差がある)
        • 5% 有意、1% 有意 : 今までの慣習から

    4. [演習4] 上記の結果を、自宅生/下宿生間の差として 検定した場合、身長、体重、胸囲、小遣い額に差があると言えるか 各自で結論づけてみよ

  8. ノンパラメトリック検定 : Wilcoxon 検定
    1. プログラム : les1205.sas

       /* Lesson 12-05 */
       /*    File Name = les1205.sas  01/25/18   */
      
      options nocenter linesize=78 pagesize=30;
      proc printto print = 'Kougi/les1205_Results.txt' new;
      
      data gakusei;
        infile 'Kougi/all08c_sjis.csv'
          firstobs=2 dlm=',';
        input sex $ shintyou taijyuu kyoui 
              jitaku $ kodukai carryer $ tsuuwa;
      
      if sex=" " or shintyou="." or taijyuu="." then delete; 
      
      proc print data=gakusei(obs=5);
      run;
      
      proc npar1way data=gakusei wilcoxon;   : wilcoxon 検定
        class sex;                           : 分類したい特性変数の指定
        var shintyou taijyuu kyoui kodukai;  : 比較したい変量名
      run;                                   : 
      
    2. 出力
                                     2019年 1月15日 火曜日 11時58分24秒 287
      NPAR1WAY プロシジャ
              変数 shintyou に対する Wilcoxon スコア (順位和)
                                  分類変数 : sex
       
                     スコアの      H0 のもとでの       H0 のもとでの      平均
      sex     N         合計              期待値            標準偏差      スコア
      
      F      88        4654.0             15400.0          817.853055   52.886364
      M     261       56421.0             45675.0          817.853055  216.172414
      
                同順位には平均スコアを使用しました。
      
      Wilcoxon の順位和検定 (2 標本)
      
      統計量          4654.0000
                                  
      正規近似                
      Z                 -13.1387
      片側   Pr <  Z      <.0001
      両側   Pr > |Z|     <.0001
                                  
      t 分布で近似           
      片側   Pr <  Z      <.0001
      
      Z には 0.5 の連続性の補正が含まれています。
      
                                     2019年 1月15日 火曜日 11時58分24秒 288
      NPAR1WAY プロシジャ
      Wilcoxon の順位和検定 (2 標本)
      
      両側   Pr > |Z|     <.0001
      
      Z には 0.5 の連続性の補正が含まれています。
      
           Kruskal-Wallis 検定
      
      カイ 2 乗           172.6407
      自由度                     1
      Pr > Chi-Square       <.0001
      
                                     2019年 1月15日 火曜日 11時58分24秒 289
      NPAR1WAY プロシジャ
              変数 taijyuu に対する Wilcoxon スコア (順位和)
                                  分類変数 : sex
       
                     スコアの      H0 のもとでの       H0 のもとでの      平均
      sex     N         合計              期待値            標準偏差      スコア
      
      F      88        5044.0             15400.0          817.684297   57.318182
      M     261       56031.0             45675.0          817.684297  214.678161
      
                同順位には平均スコアを使用しました。
      
      Wilcoxon の順位和検定 (2 標本)
      
      統計量          5044.0000
                                  
      正規近似                
      Z                 -12.6644
      片側   Pr <  Z      <.0001
      両側   Pr > |Z|     <.0001
                                  
      t 分布で近似           
      片側   Pr <  Z      <.0001
      
      Z には 0.5 の連続性の補正が含まれています。
      
                                     2019年 1月15日 火曜日 11時58分24秒 290
      NPAR1WAY プロシジャ
      Wilcoxon の順位和検定 (2 標本)
      
      両側   Pr > |Z|     <.0001
      
      Z には 0.5 の連続性の補正が含まれています。
      
           Kruskal-Wallis 検定
      
      カイ 2 乗           160.4031
      自由度                     1
      Pr > Chi-Square       <.0001
      
       <<< 中略 >>> 
      
                                     2019年 1月15日 火曜日 11時58分24秒 293
      NPAR1WAY プロシジャ
              変数 kodukai に対する Wilcoxon スコア (順位和)
                                  分類変数 : sex
       
                     スコアの      H0 のもとでの       H0 のもとでの      平均
      sex     N         合計              期待値            標準偏差      スコア
      
      F      82      14523.50             13530.0          742.640535  177.115854
      M     247      39761.50             40755.0          742.640535  160.977733
      
                同順位には平均スコアを使用しました。
      
      Wilcoxon の順位和検定 (2 標本)
      
      統計量          14523.5000
                                   
      正規近似                 
      Z                    1.3371
      片側   Pr >  Z       0.0906
      両側   Pr > |Z|      0.1812
                                   
      t 分布で近似            
      片側   Pr >  Z       0.0911
      
      Z には 0.5 の連続性の補正が含まれています。
      
                                     2019年 1月15日 火曜日 11時58分24秒 294
      NPAR1WAY プロシジャ
      Wilcoxon の順位和検定 (2 標本)
      
      両側   Pr > |Z|      0.1821
      
      Z には 0.5 の連続性の補正が含まれています。
      
           Kruskal-Wallis 検定
      
      カイ 2 乗              1.7897
      自由度                      1
      Pr > Chi-Square        0.1810
      
    3. 結果の見方 : Prob>|Z|
      • 「Wilcoxon の順位和検定 (2 標本)」の「両側 Pr > |Z|」の項を見る。
      • この手法では身長/体重/胸囲/小遣いの検定結果はパラメトリック手法と同じであった。

      • 身長(0.01%)や体重(0.01%)、胸囲(0.01%)は性別によって平均に差があると言える。
      • 小遣い(18.2%)は性別によって平均に差があるとは言えない。

    4. [演習5] 上記の結果を、自宅生/下宿生間の差として 検定した場合、身長、体重、胸囲、小遣い額に差があると言えるか 各自で結論づけてみよ

  9. [レポート課題] : Q3, Q4(次回も含む) を通して講義で紹介した SAS の手法(プロシジャー)を利用して、 各自が収集したデータに対して統計解析を行ってみよ。 解析結果だけでなく、データ自身の説明や、 どういうところに興味を持って対象に選んだかの理由等も報告する事。
    1. 対象データ :
      • 各自で収集した興味あるデータ(個人ごとに異なる) : 複数でも可

    2. 作業内容 : 以下の点に注意しながらレポートを作成しよう。
      1. 解析対象とするデータの数に制限は設けない。いくつでも可。
      2. 解析結果だけでなく、データ自身の説明やどういうところに興味を持って 解析対象に選んだかの理由等も報告する事。 加えて、特に得られた知見からの考察は大事。
      3. レポートは他人への、もの事の説明のための文書である!!
      4. 手入力を少なくして SAS の出力を最大限有効利用せよ。 しかし、不要な部分はカットせよ。だらだらと引用しないこと。
      5. 興味を持つ点や得られた知見に対する考察は人によって個々異なるもので あるので、他人と相談することなく自分の力で解析しレポートを作成すること。

    3. 必要事項 : 以下に挙げるような項目を含めて作成すること。
      • 所属専攻名、学籍番号、氏名
      • 使ったデータ内容の説明
      • どのような点に興味を持ったか
      • 自分の解析目的
      • 何を知りたいためにどのような手法を使ったのか
      • 得られた知見と考察
      • その他、気付いたこと

      • (講義の進め方や内容等について、感想や意見も。)

    4. メールの題名(Subject)は「Report18Q4: Ukai」のように、 2018年度クオーター4のレポート提出であることと、 提出者名が判るようなタイトルを 付けるようにしてください。また学籍番号も記載して下さい。

    5. 提出期限は「02月12日(火)」とします。 「不達事故」を避けたいので、受け取ったら確認のために提出者の学籍番号は 連絡のページ に掲載します(受領後3日以内に)ので、確認下さい。 なお、期限までに提出しなかった者には単位の認定を行いませんので、ご了承下さい。

    6. メモ : 02月09日14時から 10日14時(JST)まで定期保守があるようです。ご注意ください。

  10. 次回は、... : 01月29日 16:20 (最終回)

  11. [おまけ] 単変量、二変量を視覚的に捉えると? by Mathematica
    1. 1 dim. Normal Distribution [式(a)] 1次元正規分布 N(0,1)
    2. 2 dim. Normal Distribution [式(b)] 2次元正規分布 N({0,0},{1,1}, ρ=0.0)
    3. 2 dim. Normal Distribution [式(c)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)
    4. 2 dim. Normal Distribution [式(d)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)、y=1 で切り出し
    5. 2 dim. Normal Distribution [式(e)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)、x+y=2 で切り出し
[DIR]講義のホームページへ戻ります