Rule Space Model とニューラルネットワークの比較 ○ 林 篤裕*、Kikumi K. Tatsuoka** * 大学入試センター 研究開発部、** Educational Testing Service 1. はじめに ニューラルネットワークモデルは、人間の脳における情報処理をモデル化することを目的に 1940年代に提案されたものである。ニューロン(神経細胞素子)を脳の最小構成単位としてとらえ、 これが有機的にかつ複雑に絡み合うことで、論理的に記述できる機能は全て有限の大きさのニュ ーラルネットワークモデルで表現できることを明らかにした。また、このモデルは過去の事例か らの学習により知識獲得が可能であり、AI システム構築の際のウイークポイントである知識獲 得というボトルネックを解決する有力な手段としても期待されている。 一方、Rule Space Model は、試験の回答パターンから受験者を学習進度に基づいてクラスタ リングする手法として近年注目されており、アメリカにおける大学受験用試験 SAT I/II を作成 している Educational Testing Service(ETS)においてもその利用方法を模索している最中である。 ところで、Rule Space Model の運用形態を吟味してみるとニューラルネットワークモデルの 中間層と共通した意味付けが見受けられ、また、補完的な特性があることも判ってきたので、本 研究では両者の比較についてモデルの構造方法を中心に論じる。 2. Rule Space Model Rule Space Model は、教育評価の領域から提案されてきた手法で、試験問題の個々の設問(項 目、Item と呼ぶ。以下同じ。)と、それらを構成する最小の単元セット(Attribute)の関係を示し た行列(Q-Matrix)を用いて、試験の回答パターンから個々の受験者の習得/未習得単元 (Knowledge State, KS)を把握することを可能とする手法である。 従来、試験成績は得点という数値としてフィードバックされることが一般的であったが、この 手法を用いれば、同じ得点であってもどの単元が未習得であるかということや、今後どの領域を 重点的に学習すべきかという指針を併せて受験者に通知することが可能となる。小子化時代を迎 えるにあたって、よりきめ細かい教育が求められ、また可能になってきている現在、このような 技術の探求と開発は是非とも必要である。 3. 階層型ニューラルネットワークモデル 階層型ニューラルネットワークモデルは、その数理的定式化がシンプルであるにもかかわらず、 層の数やユニットの連結関数を調整することにより表現能力の高い非線形関数を実現できるとい う特徴を持っている。また、既存データを用いた学習と言う過程を実行することにより、ユニッ ト間の結合強度を探索させることができる。 統計的モデルという観点から捉えると、ニューラルネットワークモデルは一種の非線型回帰モ デルと見なすことができる。一方、回帰モデルということは特に統計的な仮定を考慮しなければ 広くは関数近似である。本研究で取り扱う階層型ニューラルネットワークモデルは本質的には多 変数関数の近似問題を解くモデルと考えられる。 また、階層型ニューラルネットワークの学習アルゴリズムとしては、誤差逆伝搬学習(BP, Back Propagation)法が広く用いられている。これは最適化手法の一つである最急降下法をニューラル ネットワークモデルに適応したものである。このアルゴリズムには、局所解に収束してしまうと いう最急降下法の欠点を緩和する方策が組み込まれている。 4. 両者の比較 Q-Matrix から Knowledge State を導出する Rule Space Model を階層型ニューラルネット ワークモデルで表現するには、入力層に Item を、出力層に Attribute を割り当てた3層構造 のネットワークを考えればよい。前者の Knowledge State が後者における中間層に反映される と考えられ、実際、いくつかの数値実験を行ったところ、完全に一致しないまでも、類似した構 造が導出された。 一方、Rule Space Model において、Q-Matrix の構成、つまり具体的には Attribute の抽出 が、このモデルから導出されるクラスターの特性に影響することが知られている。この抽出の作 業には、当該の試験問題に精通した専門家(教員)が問題分析を行い、複数存在する項目の回答思 考パターンを丹念に洗い出す必要があり、大掛かりな作業となる。 過去の経験から受験者の習得段階(クラスター)が、ある程度判明しているのであれば、入力層 は Item のままで、出力層にこれらクラスターを割り当てたネットワークを構成することも可能 である。このような割り当てを行ったモデルから導出される中間層は、Attribute に対応したも のと予想されるので、この結果を Rule Space Model におけるQ-Matrix の構成支援に利用す ることも考えられる。 5. 今後の課題 今回我々はニューラルネットワークモデルにおける中間層の役割とRule Space Model におけ る Knowledge State の意味合いを通して、これらの共通性と補完性に注目し、その構成方法を 検討した。本報告ではモデルの提案が主であったが、今後、両者の違いをより子細に検討するた めに、これらを実際に計算機上に実現して数値実験を行い、モデルの有効性と実際の場面に応用 する際の問題点を明らかにしていきたいと考えている。 参考文献 [1] Mary F. Klein, Menucha Birenbaum, et al.(1981), Logocal Error Analysis and Construction of Tests to Diagnose Student "Bugs" in Addition and Subtraction of Fractions, University of Illinois, Computer-based Education Research Laboratory, Research Report 81-6. [2] 栗田 多喜夫、本村 陽一(1993)、階層型ニューラルネットワークとその周辺、応用統計学 Vol.22, No.3, PP99-114. [3] 臼井 支朗、岩田 彰、久間 和生、浅川 和雄編(1995)、基礎と実践 ニューラルネットワーク、 コロナ社. [4] Kikumi K. Tatsuoka(1995), Architecture of Knowledge Structures and Cognitive Diagnosis: A Statistical Pattern Recognition and Classification Approach, Paul D.Nichols et al. Ed., Cognitively Diagonostic Assesment, PP 327-359, Lawrence Erlbaum Associates. [5] 豊田 秀樹(1996)、非線形多変量解析 -- ニューラルネットワークによるアプローチ --、朝倉 書店. [6] 上坂 吉則(1997)、ニューロコンピューティングの基礎、近代科学社. [7] Atsuhiro Hayashi & Yasumasa Baba(1998), An Analysis of University Entrance Examination Data by using Neural Network Models, COMPSTAT 98, Short Communications, PP 45-46, Physica-Verlag Heidelberg. ===== [発表要旨] : 250字程度 1) 著者名 : 林 篤裕*、Kikumi K. Tatsuoka** 2) 所属 : * 大学入試センター 研究開発部、** Educational Testing Service 3) 発表演題名 : Rule Space Model とニューラルネットワークの比較 4) 発表要旨 : Rule Space Modelは教育評価の分野で注目されている手法で、試験成績を点数のみならず個々 の受験者の特性に合わせた助言を与えることを可能にする技術である。この手法の運用形態を吟 味してみると、その Knowledge State の捉え方が階層型ニューラルネットワークモデルにおけ る中間層の性質と共通しており、また、モデルの構成方法に依っては補完的な特性を持たせるこ とが可能であることも判ってきた。そこで本報告では両者の比較についてモデルの構造の観点か ら論じた。