実験計画法:
製品開発や工程管理ではより良い条件を探索するために種々の実験を行う。
その際に幾つか条件(因子)を変えて実験を行うことになるが、
全ての組み合わせの中で
どの条件が一番目的に適している(収量が多い等)かを判断する手法として
実験計画法がある。
因子数や実験の手順等で幾つかのバリエーションがあるが、
ここではその基本となる1因子を取り扱うモデルを端緒として紹介する。
実験計画法の基本的な考え方は、要因間のばらつきと、
外乱(誤差)のばらつきを比較して、要因間のばらつきが大きいければ
成果物(の量)の違いは「要因による意味のある差(有意)」が存在すると
判断することである。
その際に用いるアイディアとして、全体のばらつきを、
要因間のばらつきと外乱(誤差)のばらつきに算術的に分解出来ることである。
ST=SA+Se
ばらつきの指標が分散なので、「分散分析」を行い判断することになる。
大きさの比較として比を用い、分散の比はF分布に従うことを利用して検定を行う。
- 一元配置(母数模型): 資料 p133-
- 一元配置(変量模型): 資料 p141-
- 二元配置(繰り返しなし): 資料 p146-
- 直行配列
ここでは取り扱わないが、
因子数が多くなり、また各因子の水準数が多くなると、実験回数は指数的に
多くなってしまう。これでは時間やコストがかさみ、
場合によっては均質な実験環境が保てないことも有り得るので、
実験回数を少なくしたい。
どの水準組み合わせが目的に適した組み合わせかを
効率的に探索する手法として直行配列がある。
因子数と水準数によってその組み合わせに対応した直交表を用いることになる。
その他の多変量解析手法
多変量解析の統計手法としては、これまで取り上げたもの以外にも幾つかあるが、
知っておくと良い物を列挙しておく。詳しくは各自で調べてほしい。
- 判別分析: 線形判別、二次判別、非線形判別
- データの属するグループが予め判っているときに、
データに基づいて分類する関数を求める手法。
判別する関数が線形か、二次関数かで手法が細分化される。
教師あり学習の分類手法と言える。
新しいデータが得られた際にどのグループに属するかを判断することができる。
- クラスター分析: 階層クラスタリング、非階層クラスタリング
- 判別分析と異なり、得られているデータがどのグループに属するかが
判っていないデータに対して、似た特性(類似度)を持ったサンプルを集めて
集団(クラスター)を作り、データを分類する手法である。
「類似度」の意味付けから幾つか分類手法がある。
階層クラスタリングの場合はデンドログラム(樹形図)が得られ、
分割数を決定する際に有用である。
教師なし学習の分類手法と言える。
新しいデータが得られた際にどのグループに属するかを判断することができる。
- 数量化理論 第I類, 第II類, 第III類, 第IV類
- 一部変量に質的データ(参照:
第5回 第7節
)を含んだデータに対する分析手法。
データのタイプにより用いる手法が異なる。
- 林 知己夫が考案した日本独自の統計手法。
.
ビッグデータ時代を生き抜くために
Q3を終えるにあたって、これまでの経験から
ビッグデータ時代 & データサイエンスに付いての若干の私見を述べる。
- ビッグデータ: 明確な定義はない
- 3V: Volume(容量), Velocity(更新頻度), Variety(多様性)
- AIブーム: 過去の蓄積から似たデータを取り出して活用
- データストレージの発達
- センサーの充実、普及 ===> 大量データ の生成時代
- 「押し寄せてくるデータ」への対処
- 【これまで】 能動的なデータ採取 ===> 【これから】 受動的なデータ採取
- 初等中等教育にも「統計教育」が導入。大学入試には H27年度から。
- 思考力、判断力、表現力、読解力
- 「統計的なものの見方や考え方」を身に付けてもらう
- 知識暗記型の教育からの脱皮 ===> データに基づいた問題解決力の育成
- 社会を生き抜いていくための有用なスキル
- [懸念] 高校の教員が対応できるのだろうか?
- ビッグデータ時代のデータサイエンス
- 分析結果の質 <=== データの質に依存
- 「データの取り扱い」を中心に据えた分析姿勢
- 「膨大なデータを前にして本質を見抜く力」
- 重要: データ+教育+現場主義
[蛇足]
- 若者のテレビ離れはどの程度進んでいる?
.
.
- 自動車の「スロットルコントローラー」の特性グラフは、得点調整のグラフに似ている。
- 特性グラフ: pivot社, スロットルコントローラー 3-drive・EVO
.
- 得点の調整: 大学入試センター, 受験案内
.
Q3の課題提出(レポート)
以下の事項について、レポートを作成し、電子メールで提出下さい。
- [選択項目]
: 以下の5つの項目から一つ以上について
自分の意見を論述せよ。
- 「データのあふれている社会」で生きていくための自身の心構えを論じよ。
- 「新テスト(大学入学共通テスト)」の必要性やあるべき理想像を論じよ。
- 「統計の教育」はどこで何時誰が行うべきなのかを論じよ。
- 「論理的思考力」を身に付ける方法や学校での教育方法を論じよ。
- (上記と同程度のテーマを自分で設定して論じてもかまわない)
- [必須項目]
- 本講義を受講することによって「統計」に抱くイメージが
変化したかを述べよ。変化した場合 or しない場合の各々で、
現状でどのように感じているか、
また今後自分として統計に対してどのように取り組みたい/取り組みたくないかを説明せよ。
- [任意項目(コメントがあれば嬉しいな)] 講義方法、講義の進め方
- 加えた方が良い or 取り上げる必要はない と思われる講義内容
- 講義の感想
- メールの題名(Subject)は「Report19Q3: Ukai」のように、
2019年クオーター3のレポート提出であることと、
提出者名が判るようなタイトルを
付けるようにしてください。
- 提出期限は「12月17日(
月火)(講義時に相談)」とします。
「不達事故」を避けたいので、受け取ったら確認のために提出者の学籍番号は
連絡のページ
に掲載します(受領後3日以内に)ので、確認下さい。
なお、期限までに提出しなかった者には単位の認定を行いませんので、ご了承下さい。