実験計画法、その他の多変量解析手法、そして Q3のまとめ

統計モデル解析特論I/II : 第08回 (11/26/19)

 今回は多くの因子がある実験を行う際に、どの因子が効いているかを 効率的に見つける手法としての実験計画法や、 Q3 では取り上げられなかった多変量解析手法について紹介する。 また、Q3の最終回としてビッグデータ時代に向けて考えるべき事項について 私見を述べる。
  1. 実験計画法:
     製品開発や工程管理ではより良い条件を探索するために種々の実験を行う。 その際に幾つか条件(因子)を変えて実験を行うことになるが、 全ての組み合わせの中で どの条件が一番目的に適している(収量が多い等)かを判断する手法として 実験計画法がある。 因子数や実験の手順等で幾つかのバリエーションがあるが、 ここではその基本となる1因子を取り扱うモデルを端緒として紹介する。

     実験計画法の基本的な考え方は、要因間のばらつきと、 外乱(誤差)のばらつきを比較して、要因間のばらつきが大きいければ 成果物(の量)の違いは「要因による意味のある差(有意)」が存在すると 判断することである。 その際に用いるアイディアとして、全体のばらつきを、 要因間のばらつきと外乱(誤差)のばらつきに算術的に分解出来ることである。 ST=SA+Se

     ばらつきの指標が分散なので、「分散分析」を行い判断することになる。 大きさの比較として比を用い、分散の比はF分布に従うことを利用して検定を行う。

    1. 一元配置(母数模型): 資料 p133-

    2. 一元配置(変量模型): 資料 p141-

    3. 二元配置(繰り返しなし): 資料 p146-
      • 表8.3.2

    4. 直行配列
       ここでは取り扱わないが、 因子数が多くなり、また各因子の水準数が多くなると、実験回数は指数的に 多くなってしまう。これでは時間やコストがかさみ、 場合によっては均質な実験環境が保てないことも有り得るので、 実験回数を少なくしたい。 どの水準組み合わせが目的に適した組み合わせかを 効率的に探索する手法として直行配列がある。 因子数と水準数によってその組み合わせに対応した直交表を用いることになる。

  2. その他の多変量解析手法
     多変量解析の統計手法としては、これまで取り上げたもの以外にも幾つかあるが、 知っておくと良い物を列挙しておく。詳しくは各自で調べてほしい。

  3. ビッグデータ時代を生き抜くために
     Q3を終えるにあたって、これまでの経験から ビッグデータ時代 & データサイエンスに付いての若干の私見を述べる。

  4. [蛇足]

  5. Q3の課題提出(レポート)
     以下の事項について、レポートを作成し、電子メールで提出下さい。
    1. [選択項目] : 以下の5つの項目から一つ以上について 自分の意見を論述せよ。
      1. 「データのあふれている社会」で生きていくための自身の心構えを論じよ。
      2. 「新テスト(大学入学共通テスト)」の必要性やあるべき理想像を論じよ。
      3. 「統計の教育」はどこで何時誰が行うべきなのかを論じよ。
      4. 「論理的思考力」を身に付ける方法や学校での教育方法を論じよ。
      5. (上記と同程度のテーマを自分で設定して論じてもかまわない)

    2. [必須項目]
      • 本講義を受講することによって「統計」に抱くイメージが 変化したかを述べよ。変化した場合 or しない場合の各々で、 現状でどのように感じているか、 また今後自分として統計に対してどのように取り組みたい/取り組みたくないかを説明せよ。

    3. [任意項目(コメントがあれば嬉しいな)] 講義方法、講義の進め方
      • 加えた方が良い or 取り上げる必要はない と思われる講義内容
      • 講義の感想

    4. メールの題名(Subject)は「Report19Q3: Ukai」のように、 2019年クオーター3のレポート提出であることと、 提出者名が判るようなタイトルを 付けるようにしてください。

    5. 提出期限は「12月17日(火)(講義時に相談)」とします。 「不達事故」を避けたいので、受け取ったら確認のために提出者の学籍番号は 連絡のページ に掲載します(受領後3日以内に)ので、確認下さい。 なお、期限までに提出しなかった者には単位の認定を行いませんので、ご了承下さい。

  6. Q3の講義を終えるにあたって
      何とかシラバスに掲載した事項を 取り上げられたかなぁと考えています。 まずはお付き合い下さり、どうもありがとうございました。
     この講義を通して、「データとの接し方」や「統計の考え方」が 多少なりとも理解できたであろうか? 大量の数値群から内在する構造を見つけることが 「解析」であり「統計の面白味」でもあると思う。 そのためには、理論や目的を知っている必要があるのは勿論だが、 対象とするデータの背景を知っておくことや、 統計ソフトを"道具"として使いこなす必要もあろう。
     統計手法については、その手法の背景にある考え方やアイディア、 利用目的に重点をおいて説明したが、今年については モデルの数式やその解法についても多少触れたつもりである。
     今後、新聞や雑誌と言った生活では勿論のこと、 研究やいろいろな場面で、種々のデータに出会うことになると思うが、 提示された数値にはどの様な意味(と意図)があり、 どう理解して、個々人としてどうアクションを起すかの、 一つの判断手段として活用してもらえれば幸いである。
     なお、今後、もし統計に関して何か疑問に出会い、私に相談してみたいと思った際は、 遠慮無くご連絡下さい。
     皆さんのご期待にどこまで応えられたか心許ないですが 8回の講義、お疲れ様でした。

  7. Q4を迎えるにあたって
     以前からご紹介している通り、Q4では統計ソフトウェア「 SAS OnDemand for Academics 」を使った統計解析の実践を行おうと考えています。 これはSAS(という名称の統計ソフトウェア)のサーバーにインターネットを通じて接続し、 ご自身のパソコンを端末として機能させて利用するものです。 よって、手元のパソコンの能力には依存せずに利用することができます。
     もしお持ちのパソコンを教室に持ってくることができない方がおられるような場合は どうしましょうね? 個人的にご相談下さい。
     それと、実習にはご自身が興味・関心をお持ちのデータを対象にすると、 統計手法の理解を助けることになると思っています。その意味で、 Q4 の期間は身の回りのデータを注意深く観察いただき、その中で興味深いものを 対象とした分析を各自で行なっていただこうと考えていますので、 「各自でデータを見つけてくること」もお願いしたいと思っています。
     以上のような状況ではありますが、受講希望人数 を把握したいと思いますので、 受講を希望される方は、名簿のお名前の直後にマークを付けてくださいますか。

  8. 次回は、... : 12月03日 16:20-17:50
[DIR]講義のホームページへ戻ります