先週の講義で課したアンケートで、 学生から寄せられたデータに対して、簡単な集計をしてみる。 少人数なので、あまり細かい分析を行うと個人が特定できてしまうので注意を要する。 なお、「cm, kg, 円」等の文字列は手動で削除した。
a. 所属、学年 b. 「データサイエンス」に抱くイメージや印象 c. 利用パソコンとして、ご自身の所有パソコンを利用するか、教育用端末を利用するかをお聞かせください。 d. 講義についての要望、取り上げて欲しい内容 e. [データ収集] 性別、身長、体重、胸囲、自宅生/下宿生の別、仕送り月額、スマホの月額通信料 f. 質問、その他お気づきの点があれば何なりとお聞かせください。
# ディレクトリの移動。必須ではない。個々人の設定に応じて。
setwd("D:/home_sub3/R_Dir") # ホームディレクトリに移動(Set Working Directory)
getwd() # 現在のディレクトリ位置を表示
## [1] "D:/home_sub3/R_Dir"
list.files() # ファイル・ディレクトリ一覧を表示
## [1] "DNC_Tsuiseki" "DNC21" "Dragons"
## [4] "Food" "grain" "JEES"
## [7] "KougiDS20" "KougiDS21" "KougiDS22"
## [10] "KougiDS23" "KougiDS24" "KougiDS24z"
## [13] "LibraryInstall2211a.R" "Misc" "NitechNSK21_R"
## [16] "NitechNSK22_R" "NitechNSK23_R" "plot1.png"
## [19] "PresentationSample.Rmd" "PresenTest.html" "PresenTest.Rmd"
## [22] "R_Dir_NKK20" "StatEdu24" "StatM20"
## [25] "StatM21" "StatM22" "StatM23"
## [28] "Terao.zip" "Terao_Lenovo" "Terao1"
## [31] "Terao2" "Unemployment" "確立楕円.R"
setwd("KougiDS24/")
list.files() # ファイル・ディレクトリ一覧を表示
## [1] "Dragons24.csv" "DS01_Questionnaire1.csv"
## [3] "DS01_Questionnaire2.csv" "DS01_Questionnaire3.csv"
## [5] "DS2402_1.pdf" "DS2402_1c.BAK"
## [7] "DS2402_1c.html" "DS2402_1c.Rmd"
## [9] "DS2402_2.pdf" "DS2402_2a.html"
## [11] "DS2402_2a.Rmd" "DS2402_3.pdf"
## [13] "DS2402_3a.html" "DS2402_3a.Rmd"
## [15] "ExcelStudent23b.jpg" "Exp"
## [17] "lec01" "NewsPaper"
## [19] "OldFiles" "RStudio_Display.jpg"
## [21] "RStudio_Icon.jpg" "StockFiles"
## [23] "StudAll23b.csv" "新聞記事"
## [25] "労働男女集約1_抽出2EUC.csv"
DS_Student24a<-read.csv("DS01_Questionnaire2.csv", skip=1, header=TRUE, na.strings="NULL")
# DS_Student24a$e2
# データの構造
dim(DS_Student24a)
## [1] 20 14
colnames(DS_Student24a)
## [1] "No" "Department" "Grade" "b" "c"
## [6] "d" "e1" "e2" "e3" "e4"
## [11] "e5" "e6" "e7" "f"
## str(DS_Student24a)
# 学科頻度
table(DS_Student24a$Department)
##
## ACm
## 1
## 経営システム
## 1
## 経営システム分野
## 3
## 社会工学科 経営システム分野
## 2
## 社会工学科経営システム分野
## 9
## 創造工学経営システム分野主軸
## 1
## 名古屋工業大学 工学部 社会工学科 経営システム分野
## 1
## 名古屋工業大学工学部社会工学科経営システム分野
## 1
## 名古屋工業大学社会工学科経営システム分野
## 1
# 学年頻度
table(DS_Student24a$Grade)
##
## 学部3年 学部4年
## 18 2
# 性別頻度
table(DS_Student24a$e1)
##
## 女 男
## 3 5 12
# 自宅生/下宿生の別
table(DS_Student24a$e5)
##
## 下宿生 自宅生
## 2 2 16
## # 性別頻度と自宅生/下宿生のクロス集計
## table(DS_Student24a$e1, DS_Student24a$e5)
# パソコンの利用
table(DS_Student24a$c)
##
## ご自身の所有パソコンを利用 両方とも利用
## 16 4
# 身長の五数要約
summary(DS_Student24a$e2)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 155.0 160.5 170.0 250.8 179.0 1730.0 1
# 身長の平均値と標準偏差
mean(DS_Student24a$e2, na.rm = T)
## [1] 250.7526
sd(DS_Student24a$e2, na.rm = T)
## [1] 358.3397
# 身長のヒストグラム
hist(DS_Student24a$e2, right=FALSE, breaks=seq(150,1900,10), main="Histgram of Shintyou")
abline(h=seq(0,8,2), lty=2)
# b. 「データサイエンス」に抱くイメージや印象
sort(DS_Student24a$b)
## [1] "これからの世の中で必要とされるスキル、学問 面白そうだけど難しそう プログラミングが必要"
## [2] "データサイエンスという言葉を聞くと、統計学やデータ分析がまず頭に浮かぶ。1年次後期に履修した数理情報概論で学んだことに近いのではないかと思う。身近なところで応用されており、文系理系問わず幅広い分野で必要な学問であるというイメージである。また、最近ではさまざまな大学がデータサイエンス学部を設立するなど注目されており、まさに現在のトレンドであるという印象を持っている。"
## [3] "データサイエンスは、大量のデータを分析して有益な洞察を導き出す学問で、今トレンドのイメージ。統計学や機械学習を活用し、データを一次、二次と下降していき目的の形にしたり、調べたいことに活用する印象。"
## [4] "データサイエンスは膨大なデータを分析する"
## [5] "データをこねくり回すことで世の中を解明してく学問というイメージ"
## [6] "データを使って分析を行い、問題解決方法を提示している。"
## [7] "データを分析して、データの傾向を見つける ビックデータを解析する"
## [8] "データ分析を様々な方法で行う。適切な解析方法を考え、データの取り扱いのレベルアップを目標とする学問。"
## [9] "ビッグデータの解析を行うイメージがあり,最近どの分野でも注目されているイメージがある"
## [10] "ビッグデータを解析して、金融、製造、マーケティングなどの幅広い分野に応用されているといった印象 専門的な知識が求められて、敷居が高い学問とも感じる"
## [11] "間違った解釈をしないように丁寧にデータを扱わなければならない、難しくとっつきにくい"
## [12] "企業が近年活用し始めている技術 主にマーケティングに利用されているイメージ"
## [13] "堅苦しいイメージ プログラミングなどができないと理解することができなさそう"
## [14] "今後、社会で必要とされるような知見であり、今ブームである科目であるイメージが強い。また、経営システム分野の研究に生かすことができそうと考える。"
## [15] "最近の一番セクシーな仕事だという記事、お金をいっぱい稼げるって話など好印象の話をいっぱい聞いて、興味ができた。"
## [16] "数字の羅列から意味あることを見つけ出すための方法であり、重要度が高いと考えている。"
## [17] "統計学、プログラミング等の幅広い知識と技術が求められる。 同じ問題に対処するための技術や手法が多くある。"
## [18] "難しそう"
## [19] "難しそうだが、おもしろそう 将来役に立ちそう"
## [20] "難しそうだが、スキルが身に付き自分のためになるのではないかと考えている。"
# d. 講義についての要望、取り上げて欲しい内容
sort(DS_Student24a$d)
## [1] ""
## [2] ""
## [3] ""
## [4] ""
## [5] ""
## [6] ""
## [7] ""
## [8] ""
## [9] ""
## [10] "データサイエンスと機械学習、AIとの関連など。"
## [11] "データ分析の仕方。データ解析方法の適切な選び方。様々なデータ解析方法、データ収集方法。信用できるデータをうまく見分ける方法。"
## [12] "なるべくわかりやすく説明してほしいです"
## [13] "プログラミングの知識がほぼ身についてないので初心者用にしていただけるとありがたい"
## [14] "ゆっくり講義していただけると助かります。"
## [15] "課題のフィードバックがほしい"
## [16] "具体的な事例等の手法の実践的な活用方法"
## [17] "授業の内容についていくことができるか不安なので、より詳しく教えてほしい"
## [18] "身近なデータについて取り上げていただけると授業への参加意欲が出る"
## [19] "統計検定やデータサイエンティスト検定等の問題を取り上げ紹介するなど、資格取得にも役立つような授業であれば嬉しいと感じます。"
## [20] "理解できるように丁寧に説明してほしい"
# f. 質問、その他お気づきの点があれば何なりとお聞かせください。
sort(DS_Student24a$f)
## logical(0)
# list.files() # ファイル・ディレクトリ一覧を表示
# # 異常値を加工したデータを読み込む
DS_Student24b<-read.csv("DS01_Questionnaire3.csv", skip=1, header=TRUE, na.strings="NULL")
# DS_Student24b$e2
# 身長の五数要約
summary(DS_Student24b$e2)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 155.0 160.5 170.0 168.8 176.0 185.0 1
# 身長の平均値と標準偏差
mean(DS_Student24b$e2, na.rm = T)
## [1] 168.8053
sd(DS_Student24b$e2, na.rm = T)
## [1] 9.465638
# 身長のヒストグラム
hist(DS_Student24b$e2, right=FALSE, breaks=seq(150,190,10), main="Histgram of Shintyou")
abline(h=seq(0,8,2), lty=2)
このページで取り扱ったプログラムだけを抜き出して以下に列挙しておく。
## 1. 前回のアンケートを振り返って
# ディレクトリの移動。必須ではない。個々人の設定に応じて。
setwd("D:/home_sub3/R_Dir") # ホームディレクトリに移動(Set Working Directory)
getwd() # 現在のディレクトリ位置を表示
list.files() # ファイル・ディレクトリ一覧を表示
setwd("KougiDS24/")
list.files() # ファイル・ディレクトリ一覧を表示
DS_Student24a<-read.csv("DS01_Questionnaire2.csv", skip=1, header=TRUE, na.strings="NA")
# DS_Student24a$e2
# データの構造
dim(DS_Student24a)
colnames(DS_Student24a)
## str(DS_Student24a)
# 学科頻度
table(DS_Student24a$Department)
# 学年頻度
table(DS_Student24a$Grade)
# 性別頻度
table(DS_Student24a$e1)
# 自宅生/下宿生の別
table(DS_Student24a$e5)
# 性別頻度と自宅生/下宿生のクロス集計
table(DS_Student24a$e1, DS_Student24a$e5)
# パソコンの利用
table(DS_Student24a$c)
# 身長の五数要約
summary(DS_Student24a$e2)
# 身長の平均値と標準偏差
mean(DS_Student24a$e2, na.rm = T)
sd(DS_Student24a$e2, na.rm = T)
# 身長のヒストグラム
hist(DS_Student24a$e2, right=FALSE, breaks=seq(150,1900,10), main="Histgram of Shintyou")
abline(h=seq(0,8,2), lty=2)
# b. 「データサイエンス」に抱くイメージや印象
sort(DS_Student24a$b)
# d. 講義についての要望、取り上げて欲しい内容
sort(DS_Student24a$d)
# f. 質問、その他お気づきの点があれば何なりとお聞かせください。
sort(DS_Student24a$f)
# list.files() # ファイル・ディレクトリ一覧を表示
# # 異常値を加工したデータを読み込む
DS_Student24b<-read.csv("DS01_Questionnaire3.csv", skip=1, header=TRUE, na.strings="NULL")
# DS_Student24b$e2
# 身長の五数要約
summary(DS_Student24b$e2)
# 身長の平均値と標準偏差
mean(DS_Student24b$e2, na.rm = T)
sd(DS_Student24b$e2, na.rm = T)
# 身長のヒストグラム
hist(DS_Student24b$e2, right=FALSE, breaks=seq(150,190,10), main="Histgram of Shintyou")
abline(h=seq(0,8,2), lty=2)