2つの変量の関係について考えてみよう

ジュニア・ゼミ : 第2回 (06/25/09)

 先週の「平均値」に続いて、 今週は複数の変量を取り扱う際の注意点を紹介する。
  1. 今週見つけた事例
    「...今夏のボーナスは回答した140社の平均で64万8149円。 前年より10万8927円減った。...」

  2. 参考図書: 読み物としても面白いであろう

  3. 身長と体重の関係 : どのように表現すれば良いのだろうか?

  4. 相関係数と散布図 : 6.2.1 節 (P112-)
     変数        N          平均      標準偏差        最小値        最大値
     ---------------------------------------------------------------------
     shintyou  345   168.6675362     8.1528345   145.0000000   188.0000000
     taijyuu   345    58.5463768     8.5671048    35.0000000    82.0000000
     kyoui     113    86.0849558     6.9650559    56.0000000   110.0000000
     kodukai   324      45121.91      41908.07             0     180000.00
     tsuuwa    159       6749.38       4391.08             0      30000.00
     ---------------------------------------------------------------------
    
          shintyou                              Cum.              Cum.
          Midpoint                        Freq  Freq  Percent  Percent
                     |
               144   |                       1     1     0.29     0.29
               148   |*                      4     5     1.16     1.45
               152   |***                   14    19     4.06     5.51
               156   |****                  21    40     6.09    11.59
               160   |******                30    70     8.70    20.29
               164   |*******               36   106    10.43    30.72
               168   |***********           53   159    15.36    46.09
               172   |******************    92   251    26.67    72.75
               176   |**********            50   301    14.49    87.25
               180   |******                32   333     9.28    96.52
               184   |**                    10   343     2.90    99.42
               188   |                       2   345     0.58   100.00
                     |
                     ----+---+---+---+--
                         20  40  60  80
                          Frequency
    
                               Pearson の相関係数
                         H0: Rho=0 に対する Prob > |r|
                               オブザベーション数
     
                  shintyou     taijyuu       kyoui     kodukai      tsuuwa
    
      shintyou     1.00000     0.73410     0.35209     0.02868     0.00631
                                <.0001      0.0001      0.6069      0.9370
                       345         345         113         324         159
    
      taijyuu      0.73410     1.00000     0.57012     0.03292     0.03654
                    <.0001                  <.0001      0.5549      0.6474
                       345         345         113         324         159
    
      kyoui        0.35209     0.57012     1.00000    -0.05167    -0.12631
                    0.0001      <.0001                  0.5953      0.4196
                       113         113         113         108          43
    
      kodukai      0.02868     0.03292    -0.05167     1.00000     0.26459
                    0.6069      0.5549      0.5953                  0.0009
                       324         324         108         324         153
    
      tsuuwa       0.00631     0.03654    -0.12631     0.26459     1.00000
                    0.9370      0.6474      0.4196      0.0009            
                       159         159          43         153         159
    
         プロット : taijyuu*shintyou   凡例 : A = 1 obs, B = 2 obs, ...
    taijyuu |
        100 +
            |
            |
            |
         80 +                               A     A     A B A        A
            |                                   B AAA A B A AA  A
            |                               A    AABE DBC A B H B  BB
            |                              BB B DAHBBABBDDC BCFAA  A
         60 +                    A   AAAB BAAAC DBKFK IFCDD C AAA A     A
            |                 A   B   FBA A ECH HDEGDABBDAA    A
            |              A  A CFA CDF D EBCDC B AAA   A
            |           AAAAC BB BB BAB C A  A
         40 +       A A A   A B  B
            |               A
            |
            |
         20 +
            |
            --+-----------+-----------+-----------+-----------+-----------+-
             140         150         160         170         180         190
                                        shintyou
    
         プロット : shintyou*taijyuu   凡例 : A = 1 obs, B = 2 obs, ...
         200 +
             |
             |
             |
             |                              A       A   A         A
             |                              AA  AA  A B A
         180 +                         A    AA DBCA A GA  AA
             |                    A  B AABBAGBBBACCDD A   AB ACA
             |                    A  BBBBACAHDHBBBA DACAB  A A
    shintyou |                    A BBCBGCDBIAFDBCB AAAA  AA  A
             |                 AF A DDEIBCD B BAAF    A   AA  A
             |                BA  AEEA A  A B BAA
         160 +               B BBCCAACAC A AB
             |            BAAAC DDDA A   A   A
             |     A     ABAB CA  A    A
             |               BA   A
             |        A  AAA
             |
         140 +
             -+---------+---------+---------+---------+---------+---------+-
             30        40        50        60        70        80        90
                                         taijyuu
    

  5. [参考] 単変量、二変量を視覚的に捉えると? by Mathematica
    1. 1 dim. Normal Distribution [式(a)] 1次元正規分布 N(0,1)
    2. 2 dim. Normal Distribution [式(b)] 2次元正規分布 N({0,0},{1,1}, ρ=0.0)
    3. 2 dim. Normal Distribution [式(c)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)
    4. 2 dim. Normal Distribution [式(d)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)、y=1 で切り出し
    5. 2 dim. Normal Distribution [式(e)] 2次元正規分布 N({0,0},{1,1}, ρ=0.7)、x+y=2 で切り出し

  6. 比例、反比例

  7. 回帰分析

  8. いくつかの例
    1. 朝食の摂取と学業成績の関係

    2. 就学援助率と学業成績
      • 記事 : 大阪市の就学援助
        「...就学援助の対象になるのは生活保護の受給世帯をはじめ、 経済的に苦しい家庭。大阪市の受給の目安では4人家族のケースで 収入454万円以下(21年度)となっている。目安は生活保護の受給基準などを もとに設定されている金額だが、16年度は478万円以下、 18年度は460万円以下で年々、支給基準は厳しくなっている。...」
      • 箱髭図(Box Plot, Box whisker)の活用
        • ばらつきを含めた分布形状を知ることができる。
        • 箱 : 下端、中央線、上端は、それぞれ 25%点(Q1)、 50%点(Q2、Median、中央値、中位数)、75%点(Q3)。
        • 髭 : 箱からの距離が、 1.5x[四分範囲] 内にあるサンプルまで伸ばされる。
        • 髭の外側にサンプルがある場合、異常値の可能性。

    3. 法科大学院適性試験の対応表: 二つの試験

    4. オリンピック100m走の記録: 年々の走行タイム

  9. [宿題(06/25/09)] 回帰直線の決定方法

  10. [宿題(06/18/09)](再掲) 新聞や雑誌、Web 等に公表されている数値の中から、 「怪しい数値の使い方(誤用)」を見つけてみよう。

  11. 次回は... : 07月02日 14:50
[DIR]講義のホームページへ戻ります