データサイエンスとは? 身近な統計の話題から
データサイエンス : 第2回 (10/15/18)
今回は、先週のアンケート集計結果をお知らせすると共に、
改めてデータサイエンスとは何なのかや、
身近な統計の話題から統計の使われ方を紹介する。
- Webを開設しました
- 簡単な自己紹介、私の専門
- 計算機統計学: 統計学、プログラム、データ解析、統計教育
- 教育工学: 学習認知、学習診断
- 高等教育論: 大学教育、入試制度、入試方法
- 前回のアンケート: 提出者の学籍番号は
連絡ページに掲載
- 講義でPCを持参してもらえますか?
- PCにはお好みの統計ソフトをインストールください
- PCを設置してある教室での開講を模索中
- 「データサイエンス」に抱くイメージ
- ご質問、ご希望等
- 各自でデータを収集してきてくださいね。
- データサイエンス学部の創設
- 日本では長い間、統計学を主に置いた学部・学科が設置されてこなかった <===> アメリカ、韓国等
- これまでは、いろいろな学部・学科に細々と専門の教員が点在
- 数式で課題を定式化 = 数学
- 統計を取る必要性 = 経済学、政治学
- 応用科学 = 工学、農学、医学、薬学、文学、教育学等
- 「エビデンス ベイスド ○○(Evidence Based)」: 証拠・根拠に基づく論証が求められる時代に
- ビッグデータ時代の到来
- データサイエンティストの活躍場面が増加
- 滋賀大学 データサイエンス学部 : 2017年4月
- 横浜市立大学 データサイエンス学部 : 2018年4月
- 武蔵野大学 データサイエンス学部 : 2019年4月予定
- あらためて、データサイエンスとは?
- データサイエンスとは? : 滋賀大学
- データサイエンスとは、社会に溢れているデータから《価値》を引き出す学問です。ICT(情報通信技術)の進化した現代では、あらゆるビジネスや医療、教育、行政等においても、高度なデータ処理能力、データ分析力が必要となっています。データから有益なく《価値》を引き出すためには、これらの能力に加え、様々な分析経験を積むことが求められています。
- 学部長あいさつ
- データサイエンスとは? : 横浜市立大学
- LIFE ネットショップで、欲しいものを予測
- SPORTS 試合に勝つ戦術をつくりだす
- BUSINESS 混雑予測でレジ待ちをなくす
- HEALTH 一人ひとりに最適な治療法を割り出す
- データサイエンスとは? : 武蔵野大学
- 武蔵野大学の考えるデータサイエンスとは、データを統計的に処理するだけではなく、AI(人工知能)技術を用いて大量のデータを共有、検索、統合することにより、物事の本質を見抜き、新たな知識を発見し、独創的アイデアで新たな価値を創造する学問です。
- 新しい領域故なのか、統一的な概念がまだ固まっていない。
- データの中から価値を見つける。データに内在する構造を明確にする。
- 関連するキーワード: 統計、(ビッグ)データ、ネットワーク、AI(Artificial Intelligence)、深層学習(Deep Learning)、データ解析、情報検索、IoT(Internet of Things)、生活と密着、...
- ビッグデータとは?
- データの生成場面が格段に増えた: ケータイ、スマホ、レジ、センサー、...
- コンピュータの演算スピードが格段に向上した
- データストレージの容量が格段に増えた
- 3Vの性質を持つとも: Variety(種類)、Volume(容量)、Velocity(頻度)
- でも...
- データの多くのセルは疎
- ノイズやゴミが含まれている状態で利用してクリアーな結果が得られるのか
- 過度な期待は危ういのでは
- 統計学 : データサイエンスの基礎技術
- 確率論: 尤もらしさ
- 1変量データの記述と要約
- 平均、分散、標準偏差
- 統計的推定、統計的仮説検定
- ...
- 多変量データの記述と要約
- 回帰分析
- 主成分分析
- 因子分析
- クラスタリング
- ...
-
「平均」の意味するもの : 中間? 真ん中? 代表値? 大体の目安? ...
貯蓄現在高 階級別世帯分布 (二人以上の世帯)
分布形状と統計量
- 「平均値」の意味するもの : 期待値。一つの指標に過ぎない。
- 分布形状 : 対称分布の場合だけ「印象」と合致する。
- 非対称の場合は裾の長い方にずれ、特に外れ値があると間違った「印象」を与えかねない。
- 分布の偏り : 常にあると思っておいた方がよい。
- 非対称の場合には、最頻値や中央値(中位数)も吟味する必要がある。
- 少数例では、分布形状が明確にならない。
- (「平均値」の恣意的・意図的利用が目立つ。)
-
身近な統計の話題から: 教育関係
-
【問】回帰直線って何? ===> 来週
- 何に使う?
- どうやって決める?
- 何に使える?
- そもそも、どういう考えから導き出された?
- 回帰分析とは?
-
読み物
- 次回は、... : 10月22日 13:00-14:30
講義のホームページへ戻ります