回帰分析(前編)

データサイエンス : 第5回 (10/29/20)

 今回は、多変量解析の代表的な手法である回帰分析について解説する。
  工学系や農学系の実験等を行う領域では頻繁に使用される手法であるが、 日常的な話題の中でも概念は広く利用されているので、 取っ付き易い手法ではないだろうか。 過去のデータからその構造を把握し、新規に測定されたデータに対する予測を 行ないたいと言うときに、回帰分析は有用である。 構造のシンプルな単回帰分析でこの手法の原理を理解し、 複数の説明変量を用いた重回帰分析に拡張する。 残差の取り方や、その二乗和を最少にするという考えは同じである。
  1. 先週のショート課題から: 12名

  2. 回帰分析 : 別ページ に掲載

  3. 【敢えての注意喚起】データ収集について [再掲&最終]
     第1回(10月1日)の第6節でもお伝えしましたが、 各自で収集してきたデータに対して統計分析(多変量解析が好ましい)をして、 報告してもらうことを考えています。 よって、各自でデータを見つけてきてもらわないとレポートが書けません。
     これも既にお伝えしているように、この講義は前半と後半に分かれており、 前半部で1回評価が入ります。 課題を課す段階で提出期限を設けますが、 指定した期日を過ぎたものは評価対象としませんのでご注意下さい。
     参考までに「多変量解析に適用する」際には、 余りサンプル数が少ない(少数例)や変量数の少ないデータだと適用できなかったり、 適用しても興味深い知見が得られないことが多いので、収集する際に注意してください。 加えて、集約されたデータではなく、個票データでないと細かな分析できません。

     引用元に取り立てての制限はないので、身の回りにある新聞、雑誌、書籍、ご自身の調査等 いろいろなところから持ち込んでくれればと思いますが、 例えばWeb上にもデータを収録・掲載しているサイトがあり、 以下のようなものもその取っ掛かりになるのではないでしょうか。

  4. 次回は、... : 11月05日 リモート講義(10:30-12:00?)