統計を使いこなすには

ジュニア・ゼミ : 第4回 (01/18/11)

 早いもので私の担当は今週で最終回である。 「平均値」、「相関」、「回帰」について紹介してきた。 そして、今後、統計とどのように接していけば良いかを考えてもらうことにする。
  1. 以前見つけた事例

  2. 単回帰分析 : 予測に使う (先週の復習)
     過去のデータからその構造を把握し、新規に測定されたデータに対する予測を 行ないたいと言うときに、回帰分析は有用である。

    1. 結果の見方
      • 回帰係数 : Parameter Estimate
          [この例] a=0.807, b=-77.4 ===> [体重]=0.807x[身長]-77.4
                 180cmの人の予想体重は、... 0.807x180-77.4=67.9kg

    2. どうやって直線を決める?
      • 予測誤差の2乗和を最小にする
      • 予測誤差って何? どこの大きさ? どこの長さ?
      • [重要] 誤差は「説明変量」の軸と垂直に取ることに注意せよ。
        • 誤差は測定時に混入していると考えてモデルが構築されているから。
        • 正規分布の登場!
      • 複数の説明変量 ===> 重回帰分析

    3. 解析する上での注意点
      • 回帰分析は回帰係数を求めることだけが目的ではない。 その成立要件を満たしているかを確認する必要がある。

      • 残差解析を行なう
      • 残差に傾向はないか? : ラッパ状、バナナカーブ状、...
      • 対象集団を単質のものに絞る : 男性だけ、20歳近傍だけ、...
      • 外れ値 を持つ個体を除外する : 標準体型の者だけ、...
      • ただし、恣意的な除外は謹むべきである
      • 上記以外に「多重共線性(multi-colinearity)」の問題もある。 逆行列が取れなくなる。不安定な解。

  3. 誤用?!  [例1] 人間の成長曲線
     [例2] 将来のプログラマ必要数予測 : 21世紀(?)には国民全員がプログラマ ('80s)
     [例3] オリンピック 100m 走の男女記録 : 2156年には女性の方が速い (2004.09.30) :
           Japan Journal LTD の記事 , Japan Journal LTD の記事 , 朝日新聞 の記事
         [究極の命題!] 100m に 0.00秒 要する(!?)ようになるのは何時?

  4. [発展] 他の基準 (今回は扱わない)

  5. 法科大学院適性試験 (大学入試センター) と 統一適性試験 (日弁連法務研究財団)

  6. 就学援助率と学業成績

  7. 偏差値

  8. [話題] 2つのタイプの試験 : 競争試験と資格試験
     受験者群を習得スキルに応じた複数の群に分類する技術として、 試験は広く利用されているが、通過者(合格者)の決定方法の観点から、 試験を二種類に大別する事ができる。
    1. 競争試験
       一つは入学試験や司法試験に代表される「競争(選抜)試験」であり、試験点数の 上位から予め決められた一定数を通過させるために用いられる。この使われ方では、 受験者は他者より僅かでも高点数を取る必要があるだけでなく、通過するには上位の 決められた人数や割合の中に位置する点数を獲得する必要がある。 その意味で相対的な位置関係のみが重要となる。

    2. 資格試験(達成度試験)
       もう一つのタイプは運転免許試験や医師国家試験に代表される「資格試験」であり、 この試験では、習得した知識やスキルがその分野で活動していく上で十分な水準に 達しているかどうかを判定することに重きが置かれている。同じ試験を受けた 受験者間の相対位置よりもむしろ絶対位置が重要視される。受験者が 最低基準をクリアしているかどうかが判断基準であり、受験者の多くが基準を クリアしていれば通過率は上昇し、悪ければ通過者なしでも問題視されることはない。 言い換えれば、通過者の質を保証するための試験である。
       資格試験を考えるとき、試験実施者は事前に通過水準を受験者に明確に示す必要があ り、そのためには習得しておくべき知識や技術、スキルを精査し、その「業界(分野)」 内で合意が得られている必要があるであろう。基礎的な試験問題(項目)については再使 用も認められるであろうから、不断にこの種の項目を作成してそれらを溜めたデータ ベース(項目プール、アイテム・バンク)を管理維持し、出題時にはその中から一部を選 択して利用することも一つの方法である。なお、項目プールを公開とするか非公開とす るかは意見が別れるところである。

    3. 競争試験なのに「資格試験」と呼ばれているものが散見される
      • 不合格者は資格を習得していないのか?
      • 司法試験、弁理士試験、公認会計士試験、税理士試験、司法書士試験、 土地家屋調査士試験、社会保険労務士試験、...

  9. [話題] 得点調整

  10. まとめ

  11. レポート課題
     他人と相談することなく、以下の事項について自分の技量でレポートを完成させ 提出ください。

  12. 最後に
     この4回の講義を通して、「統計」や「データ」と言う言葉に 多少なりとも親しみを持っていただけただろうか? 数式よりも数値に対する考え方に重点をおいて説明したつもりである。
     今後、実生活では勿論のこと、研究や仕事等 いろいろな場面で、種々の数値列に出会うことになると思うが、 提示された数値にはどの様な意味(と意図)があり、 どう理解して、個々人としてどうアクションを起すかの、 一つの判断手段として活用してもらえれば幸いである。

     今後、もし統計に関して何か疑問に出会い、 私に連絡・相談してみたいと思った時は、以下のアドレスを使ってください。

     皆さんの期待に応えられたか全く自信はありませんが、 4回の講義、お疲れ様でした。

[DIR]講義のホームページへ戻ります