新しいデータで演習
統計処理 01 クラス : 第20回(11/07/02)
ここまでに学んできた統計手法を、未知のいくつかのデータに適用することによって
興味深い知見を得る体験をしてもらう。
提供するデータについての説明を記述した資料は、
事務室に置いてもらっているので、各自取りに行って下さい。
- 提供されたデータで実践
- 提供データ :
- 配布資料は「A Handbook of Small Data Sets
(D.J.Hand, F.Daly, A.D.Lunn, K.J.McConway and E.Ostrowski, 1994,
Chapman & Hall)」に掲載されている 510 のデータの中から、
比較的解析しやすいであろうと判断した 24 のデータを集録したものである。
- 配布資料の第1ページ目には、どのようなデータが選ばれているかの一覧を
掲載しておいた。
左から「番号」、「表題」が、右端には「ファイル名」が表示されている。
第2ページ目からは、「番号」の順に、個々の「データの説明」と
「数値」、「出展」が列挙されている。
「番号」を頼りにそれぞれを参照することができるであろう。
- なお、データの「数値」をいちいち入力するのは大変であろうから、
C ルームの「J:\コンピュータによる統計処理1(林 篤裕)\small_data\」
というディレクトリにファイルを保存しておく。適宜転送して利用して
もかまわない。なお、その時の「ファイル名」は資料 1ページ目の一覧表の右端に
記載されているものが使われている。
- 作業内容 :
- 各自これらデータの説明を読んで、おもしろいと感じるデータを見つけよう。
- そのデータについて、SAS を使って解析し、興味深い知見を引き出そう。
- 利用する解析手法として「多変量解析の手法」を必ず1回は使うこと。
- 興味を持つ点や得られた知見に対する考察は人によって其々異なるもので
あるので、他人と相談することなく自分の力で
データを選択して解析せよ。
- 参考 :
- 計算機が使えるようになった現在、データのサイズ(数値の量)
は解析の難易度とは無関係である。このようなことに捕らわれずに自分の
興味に基づいて自由にデータを選択してほしい。
- また、多変量解析手法(重回帰分析、主成分分析等)の場合、
変量数やケース数が少ないと、興味ある知見が得られないことが多い。
- 提示されている変量全てを用いて解析するだけでなく、一部の変量だけを使って
解析してみるといった、工夫も考えられる。
- 今回の解析結果や知見・考察は近いうちにレポートにまとめて
提出してもらうので、その時になって焦らないように、
今から準備をしておくのが良いのではないかと思う。
- 次回は、... : 11月14日 14:45
講義のホームページへ戻ります