いくつかのデータで実践

情報処理H : 第8回目(12/06/96)

これまでに基本的な統計手法について学んできた。 そこで、今回はここまでに学んできた手法をいくつかのデータに適用してみて 興味深い知見を得る体験をしてもらう。
<お詫び> : 本日は都合で教室に行けません。 以下を読んで課題を行って下さい。

データ :

配布資料は「A Handbook of Small Data Sets (D.J.Hand, F.Daly, A.D.Lunn, K.J.McConway and E.Ostrowski, 1994, Chapman & Hall)」に掲載されている 510 のデータの中から、比較的解析しやすいであろうと判断した 16 のデータを 集録したものである。

データについての最初のページには、どのようなデータが選ばれているかの 一覧があり、左から「番号」、「表題」が、右端には「ファイル名」が表示されて いる。その次ページから、「番号」の順に、個々の「データの説明」と「数値」が 列挙されている。

なお、データの「数値」をいちいち入力するのは大変であろうから、 「第4回:データの転送」の時と同様に、「J:\センター設置科目\情報処理H\」 というディレクトリにファイルを保存しておいたので、適宜転送して利用して もかまわない。なお、その時の「ファイル名」は前述の最初のページの右端に 記載されているものが使われている。

<補足> : 「134. Crime in the USA: 1960」のデータについて、手違いで、データの 説明部分しか含まれていなかったので、最後のページに「データの説明」と 「数値」を集録してあります。

作業 :

本日は、以下のような手順で作業を行ってほしい。
  1. 各自でこれらデータの説明を読んで、おもしろいと感じる データを見つけよう。
  2. そのデータについて、SAS を使って解析し、 興味深い知見を引き出そう。
  3. 以下の点に注意しながらレポートを作成しよう。

  4. 解析対象とするデータの数は、最低2つとする(上限は設けない)。 1つだけではダメ。
  5. 興味を持つ点や得られた知見に対する考察は人によって個々異なるもので あるので、
    他人と相談することなく自分の力で解析しレポートを作成しよう。

<参考> 計算機が使えるようになった現在、データのサイズ(数値の数) は解析の難易度とは無関係である。このようなことに捕らわれずに自分の 興味に従って自由に選択してほしい。

レポート :

レポートには、以下に挙げるような項目を含めて作成すること。

提出期限 :

96年12月13日(金) 16:25 まで(講義が始まるまで)

  • 次回は、...
    • 多変量解析全般について
    • 主成分分析
  • [DIR]講義のホームページへ戻ります