诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响( 三 )



诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响
文章图片

图表 3:ECD 模型框架
3、情境信息建模
教育情境信息主要包括以下特点:内容复杂性 , 个体差异性 , 内在相关性 。 其中内容复杂性指教育情境信息输入包含丰富来源的内容 。 个体差异性则是指同一情境信息对学生的影响也会因人而异 。 例如情境信息「接受辅导」对于学生的影响虽然总体上是积极的 , 但是对于勤奋的学生的影响往往要比贪玩的学生更明显(因为贪玩的学生很可能不会认真学习 , 从而无法充分利用这一积极条件) 。 内在相关性则是指不同情境信息之间也可能存在相互影响 。 比如「家庭条件」也可能影响「接受辅导」的效果 。
针对上述特性 , 该研究首先根据内容将情境信息输入分成不同的分组 , 分别建模其影响 。 其次 , 该研究使用注意力机制计算学生特性与情境信息之间的相性 , 从而自适应学习不同情境信息对学生的影响权重 。 接着 , 该研究使用自注意力机制模块来模拟不同输入之间的相互影响情况 。

诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响
文章图片

图表 4:Embedding 层与 Context filtering 层
具体来说 , 情境建模网络包含四层网络结构:嵌入(embedding)层、过滤(context filtering)层、交互(context interaction)层、聚合(context aggregation)层 。 该研究在嵌入层将每个情境信息输入r_q映射为情境影响向量c^v与情境特性向量c^k , 将学生 id 输入t映射为个性向量x_t 。 在过滤层中 , 对于某一组情境信息的不同输入 , 该研究将学生个性表示x_t作为注意力机制中的查询 query , 将情境特性表示c^k与情境影响表示c^v分别作为注意力机制中的键 key 与值 value 。 通过计算学生个性表示x_t与情境特性表示c^k的余弦相似度作为学生与特定情境输入的相性 , 进而分配组内不同情境输入影响c^v , 以及该组情境特性c^k的权重 , 这样就能得到各组情境输入的影响表示v与特性表示k 。

诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响
文章图片

图表 5:Context interaction 层与 Context aggregation 层
在交互层中 , 类似的 , 该研究使用各组情境的影响表示v与特性k表示分别作为自注意力机制中的值 value 与键 key , 从而得到交互后的各组情境输入的影响表示v'与特性表示k' 。 最后 , 在聚合层中 , 该研究依然使用个性表示x_t作为注意力机制中的查询 query , 将各组情境输入的影响表示v'与特性表示k'分别作为自注意力机制中的值 value 与键 key , 从而聚合各组情境输入 , 得到情境输入对学生的最终的影响表示

诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响
文章图片


实验
实验使用的数据来自国际学生评估项目(Programme for International Student Assessment , PISA)2015 年的公开数据集(以下简称 PISA2015) , 包含来自 79 个国家与地区的学生的问卷数据与答题数据 。 PISA 项目是由世界经合组织(OECD)组织的国际学生评估项目 , 包含专家设计的与教育情境信息相关的学生问卷数据与学生在数学、科学、阅读等学科的测试作答数据 , PISA 2015 的主要测试科目是科学 , 因此实验中使用学生在科学测试中的作答数据 。 该研究根据区域 , 将 PISA2015 的科学作答数据中抽取了三个数据集 , 分别是 Asia、Europe 与 America , 具体的数据预处理可以参考论文内容 , 下表是数据集统计情况 。

诊断|中科大神经网络和端到端训练框架,探究教育情境对学生能力的影响

推荐阅读