実験計画法、その他の多変量解析手法、そして Q3のまとめ

統計モデル解析特論I/II : 第08回 (11/20/18)

 今回は実験計画法や、Q3 では取り上げられなかった多変量解析手法について 紹介する。また、Q3の最終回としてビッグデータ時代に向けて考えるべき事項について 私見を述べる。
  1. 実験計画法:
     製品開発や工程管理で種々の実験を行う。 その際に幾つか条件(因子)を変えて実験を行うことになるが、 全ての組み合わせの中で どの条件が一番目的に適している(収量が多い等)かを判断する手法として 実験計画法がある。 因子数や実験の手順等で幾つかのバリエーションがあるが、 ここではその基本となる1因子を取り扱うモデルを端緒として紹介する。

     実験計画法の基本的な考え方は、要因間のばらつきと、 外乱(誤差)のばらつきを比較して、要因間のばらつきが大きいければ 収量の違いには「要因による意味のある差(有意)」が存在すると判断することである。 その際に用いるアイディアとして、全体のばらつきを、 要因間のばらつきと外乱(誤差)のばらつきに算術的に分解出来ることである。 ST=SA+Se

     ばらつきの指標が分散なので、「分散分析」を行い判断することになる。 大きさの比較として比を用い、分散の比はF分布に従うことを利用して検定を行う。

    1. 一元配置(母数模型): 資料 p133-

    2. 一元配置(変量模型): 資料 p141-

    3. 二元配置(繰り返しなし): 資料 p146-
      • 表8.3.2

    4. 直行配列
       ここではもう取り扱わないが、 因子数が多くなり、また各因子の水準数が多くなると、実験回数は指数的に 多くなってしまう。これでは時間やコストがかさみ、 場合によっては均質な実験環境が保てないことも有り得るので、 実験回数を少なくしたい。 どの水準組み合わせが目的に適した組み合わせかを 効率的に探索する手法として直行配列がある。 因子数と水準数によってその組み合わせに対応した直交表を用いることになる。

  2. その他の多変量解析手法
     多変量解析の統計手法としては、これまで取り上げたもの以外にも幾つかあるが、 知っておくと良い物を列挙しておく。詳しくは各自で調べてほしい。

  3. ビッグデータ時代を生き抜くために
     Q3を終えるにあたって、これまでの経験から ビッグデータ時代 & データサイエンスに付いての若干の私見を述べる。

  4. 課題提出(レポート)
     前回の第4節を参照下さい。 提出期限は「12月17日(月)」です。 なお、「不達事故」を避けたいので、提出者の学籍番号は 連絡のページ に掲載します(3日程度の遅れはご容赦を)ので、確認下さい。

  5. Q3の講義を終えるにあたって
      薄氷を踏む思いでしたが、何とかシラバスに掲載した事項を 取り上げられたかなぁと思っています。 お付き合い下さり、どうもありがとうございました。
     この講義を通して、「データとの接し方」や「統計の考え方」が 多少なりとも理解できたであろうか? 大量の数値群からその中に内在する構造を見つけることが 「解析」であり「統計の面白味」でもあると思う。 そのためには、理論や目的を知っている必要があるのは勿論だが、 対象とするデータの背景を知っておくことや、 統計ソフトを"道具"として使いこなす必要もあろう。
     統計手法については、数式よりもその手法の考え方やアイディア、 利用目的に重点をおいて説明したつもりである。
     今後、新聞や雑誌と言った生活では勿論のこと、 研究やいろいろな場面で、種々のデータに出会うことになると思うが、 提示された数値にはどの様な意味(と意図)があり、 どう理解して、個々人としてどうアクションを起すかの、 一つの判断手段として活用してもらえれば幸いである。
     なお、今後、もし統計に関して何か疑問に出会い、私に相談してみたいと思った際は、 遠慮無くご連絡下さい。

     皆さんのご期待にどこまで応えられたか不明ですが 8回の講義、お疲れ様でした。

  6. Q4を迎えるにあたって
     以前からご紹介している通り、Q4では統計ソフトウェア「 SAS OnDemand for Academics 」を使った統計解析の実践を行おうと考えています。 これはSASのサーバーにインターネットを通じて接続し、 ご自身のパソコンを端末として機能させて利用するものです。 よって、手元のパソコンの能力にはそれほど依存せずに利用することができます。
     もしお持ちのパソコンを教室に持ってくることができない方がおられるような場合は どうしましょうね?
     それと、実習にはご自身が興味・関心をお持ちのデータを対象にすると、 統計手法の理解を助けることになると思っています。その意味で、 Q4 の期間は身の回りのデータを注意深く観察いただき、その中で興味深いものを 対象とした分析を各自で行なっていただこうと考えていますので、 「各自でデータを見つけてくること」もお願いしたいと思っています。
     以上のような状況ではありますが、ご希望や状況を把握したいと思います。 受講を希望される方は、名簿にマークを付けてくださいますか。

  7. 次回は、... : 12月04日 16:20-17:50
[DIR]講義のホームページへ戻ります