英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
课程和学生特定模型的成绩预测
摘要:准确估算在未来课程中学生们的成绩尤为重要,因为它可以为下一学期课程的选择提供信息,并创建个性化的学习路线,以帮助学生成功、按时地毕业。本文提出了基于稀疏线性模型和课程或学生-课程元组的低秩矩阵分解的成绩预测方法。这些方法可以逐课程确定先前课程的预测子集,并更好地解决与学生-课程历史成绩数据的非随机缺失的问题。 在从明尼苏达大学获得的数据集上对这些方法进行了评估。评估发现:课程特定模型的性能优于其他方案并在不同课程中取得RMSE为0.632,优于其他方法的0.632。
1介绍
越来越多的数据挖掘和机器学习方法来分析教育、学习有关的数据集,以了解学生如何学习以及如何取得更好的学习成果。这带来了各种建模和预测学生在智能学习系统中完成特定任务的方法[9,12,15,16,18,19],建立了智能的“预警系统” 来监控学生在学习期间[1,3]的表现,通过使用学习管理系统(例如Moodle)分析他们的学习活动[8,11,17]并预测学生的表现与学期最终的GPA [2,13,14]。
我们的工作重点是利用历史学生课程成绩来开发相关模型,以准确地估计学生在尚未参加的课程中的表现(按其成绩衡量)。能够准确估计学生在尚未参加的课程中的成绩非常重要,因为学生个人或老师可以使用该方法来确定下一学期所要学习的课程,并创建个性化的学习路线以有效地获得所需知识,按时地完成学业。
现有的预测学生未来课程成绩的方法[4,6,7]依赖于有关邻域的协同过滤方法[10]。尽管它们比较简单,但是通过这些方法获得的估计值还是相当准确的,这表明历史学生课程成绩数据中存在足够的信息能让该问题得到解决。在本文中,我们提出的成绩预测方法能有效利用稀疏线性模型和低秩矩阵分解来改进现有方法,这些方法完全取决于学生在以前参加的课程中所取得的成绩。本文方法的一个特点是:它们的关联模型要么特定于每个课程,要么特定于每个学生-课程元组。这使他们能够识别和利用与每个课程成绩相关的先前课程的相关信息,并更好地解决与课程的历史成绩的随机性问题。我们利用从明尼苏达大学获得的数据集评估了我们方法的性能,该数据集包含12.5年间的学生成绩。我们的结果表明:特定与课程的模型性能优于各种竞争方案,特定于课程的回归(CSR)在不同课程中均获得了0.632的RMSE,而最优的竞争方法则获得了0.661的RMSE。
本文组织架构如下:第二节介绍了所使用的符号和定义。第三节描述了具体的模型,第四节提供了有关实验的信息。第五节对方法进行了广泛的实验评估,并将其与现有方法进行了比较。最后的第六节对本文进行总结。
2定义和符号
在整篇论文中,粗体小写字母表示列向量(例如),粗体大写字母表示矩阵(例如G)。 单个元素将使用下标表示(例如,对于向量和对于矩阵)。 矩阵上的单个下标将表示其对应的行。 这些集合将由书写体字母表示。
历史学生的课程成绩信息将由稀疏矩阵G isin; 表示,其中和分别是学生和课程的数量,并且是学生在课程中取得的成绩,范围在0~4之间。如果学生没有参加过该课程则没有相应的条目。需要预测成绩的课程和学生分别称为目标课程和目标学生。
3方法
在本节中,描述了为预测学生在他/她尚未参加的课程中的成绩而提出的各种方法。
3.1特定于课程的回归(CSR)
本科学位课程的构建方式是:学生修读的课程将为他们提供必要的知识和技能,使得在以后的课程中表现更出色。因此学生在较早的课程中获得的成绩可以用来预测其在以后的课程中的表现。我们提出一种成绩预测方法,称为特定与课程的回归(CSR),该方法将学生在特定课程中的成绩预测为该生在过去课程中成绩的稀疏线性组合。为了估算课程c的CSR模型,我们从整个学生-课程矩阵G中提取与参加课程c的学生相对应的行。对于这些学生(行),我们仅保留与课程c之前所修课程相对应的成绩。令GCisin; 代表提取的信息的矩阵,其中是参加课程的学生人数。另外,令yc isin; 为在课程c中Gc中的学生获得的成绩(是与Gc的第i行中的学生相对应的成绩)。针对c的CSR模型wc isin; 估计为:
(1)
其中是一个偏差项, isin; 是全1的向量,同时,是控制过拟合和保证稀疏性的正则化参数。该模型是非负的,因为我们假设以前的课程只能为以后的课程提供信息。的各个权重表示在评价模型的上下文中每个先前的课程对预测的贡献。使用该模型后,学生将在课程c中获得的等级估计为:
, (2)
其中 是该学生到目前为止所修课程成绩的向量。我们发现,通过将每个学生的成绩换算成GPA,可以得出更准确的预测(请参见第5.1节)。在使用等式(1)表示的模型之前,我们首先从每个中减去每个学生的GPA(GPA是根据Gc中的信息计算的)。这将以每个学生的数据为核心,并考虑到学生的差异,因为它可以预测学生当前状态的表现。值得注意的是,在以GPA为核心的数据中,我们删除了的非负约束。我们将此模型称为CSR-RC(以行为中心)模型。
3.2特定于学生的回归(SSR)
根据专业的不同,本科学位课程的结构也可能不同。某些学位课程的灵活性有限,例如学生必须参加的一系列固定的课程,以及规定了什么时候可以参加(即特定的学期)。其他学位课程的灵活性更高,并以较少的核心课程和大量的选修课程为基础。对于后一种学位课程,CSR方法的缺点是它要求将相同的线性回归模型应用于所有学生。但是,考虑到学生在此类灵活的课程体系中,先前所修过的课程可能完全不同,因此单个线性模型可能无法捕获各种先前所修课程的组合。实际上,在某些情况下,即使某些学生通过参加不同的课程而获得了必要的知识和技能,但有些学生却根本没有选择过CSR模型所确定的许多重要的课程。为了解决这一局限性,我们提出了另一种方法,称为特定于学生的回归(SSR),该方法可以估算针对每个学生的课程特定线性回归模型。
通过在CSR方法中使用的Gc矩阵为每个目标学生s和每个目标课程c创建一个学生特定于课程的等级矩阵Gs,c,进而可以得到特定于学生的模型。Gs,c分两个步骤创建。首先,我们从Gc中删除了目标学生未修课程的成绩。其次,我们从Gc还删除了没有与目标学生s修足够多数量的相同课程的学生所对应的行。具体来说,如果和分别是学生s和i的课程集合,我们将计算出重叠率。如果OR lt; t,则学生i不包含在Gs,c中。t的值是SSR方法的一个参数,该值较高时可以确保形成Gs,c的那组学生参加了许多与s相同的课程,并且遵循了相似的学位课程规划。给定Gs,c,SSR方法将继续使用等式(1),用Gs,c代替Gc来估计模型,并使用等式(2)进行预测。
3.3基于矩阵分解的方法
在推荐系统的背景下,低秩矩阵分解(MF)方法已被证明对于评级问题非常有效[10]。通过将学生-课程的等级矩阵G视为用户的项目评分矩阵,可以将这些方法直接应用于预测学生将在特定课程上取得的成绩的问题。
基于MF的方法能进行成绩预测,是基于假设:存在一个低维度的潜在特征空间,可以同时代表学生和课程。给定域的性质,该潜在空间可对应于知识组件的空间。每个课程向量都是与课程相关的一组组件,每个学生向量代表这些知识组件中学生的知识水平。
通过将基于MF的等级预测的通用方法应用于学生成绩预测问题,学生i在课程j上获得的等级估计为:
, (3)
其中是全局偏差项,和分别是学生偏差和课程偏差项,和分别是学生i和课程j的潜在表示。MF方法的参数(,,和)是根据矩阵完成的方法估算的,该方法仅将G中的观测项视为:
, (4)
其中是正则化参数,而l是潜在空间的维数,这是此方法的参数。从一组局部观测值中准确地恢复低秩模型(当存在这样的模型时)依赖于足够多数量的观测条目,并且取决于从目标矩阵G中随机采样的条目[5]。但是,在学生成绩的数据中,学生修读的课程集并不是所提供课程的随机子集,因为他们需要满足其学位课程要求。因此这种MF方法可能无法得到最优的预测性能。
为了解决这个问题,我们开发了一种特定与课程的矩阵分解(CSMF)方法,该方法利用更多的特定于课程的数据子集(根据观察到的条目的数量和维度的大小)来估算每个课程的MF模型。给定一门课程c和一组学生,我们需要为其估算c的成绩(即中的学生尚未修这门课程),CSMF利用的数据如下:(i)学生信息和CSR方法中Gc矩阵和向量的等级(第3.1节),(ii)中的学生及其等级。此数据用于形成矩阵,其中是Gc中学生的数量,,是在至少有一个等级的Gc或中不同课程的个数。保存的是Gc和中存在的等级。的最后一列是由Gc中的学生获得的课程c的等级。因此,包含与已经学习过课程c的学生,同时我们需要预测选课程c的学生的所有先前的成绩。然后使用矩阵代替等式(4)中的矩阵G来估计CSMF方法的参数,最后将其用于预测最后一列的缺失条目,这些条目就是需要预测的等级。
4实验设计
4.1数据集我们在实验中使用的学生课程成绩数据集来自明尼苏达大学,该大学拥有非常灵活的学位课程。
它包含了从2002年秋季到2014年春季参加计算机科学与工程(CSE)和电气与计算机工程(ECE)课程的学生。这两个学位课程体系都是属于科学与工程学院(CS&E),在此课程的前2至3个学期中,学生必须参加一套通用的核心课程。我们从数据集中删除了不属于CS&E部门开设的课程,因为这些课程只对应于较少的学生所修读的各种文科和体育课程,并且通常不计入学位要求。此外,我们消除了所有通过与不通过的课程。最初的等级为A–F等级,使用标准的字母等级向GPA的转换规则将其转换为4-0等级。最终数据集包含2,949名学生,2,556个不同的课程和76,748个课程的成绩。
我们使用此数据集来评估不同方法的效果,以预测学生在上学期(即我们拥有数据的最近学期)中所获得的成绩。因此,数据集被进一步分为两部分,一部分指仍在活动状态的学生,即在最后一学期仍然学习课程(),另一部分是指余下的学生()。包含876名学生,共有19,089个等级,其中3,427个等级是针对上学期的475个不同班级的。包含2,073名学生和57,659个等级。
这些数据集为本文提出的不同方法提供各种训练和测试数据集。具体来说,对于CSR方法,我们提取了特定于课程的训练和测试数据集如下所示。对于上学期开设的每门课程c,我们分别从和中选择参加过c课程的学生,分别提取了特定于课程的训练集和测试集(和)。在修读课程c之前,他们还至少修过k门其他课程。这些数据集相对于k进行参数化的原因是,我们想评估在不同数量的历史学生成绩下这些方法的性能。在我们的实验中,我们在集合{5,7,9}中使用了k。该信息将创建成绩矩阵Gc,其中来自训练集的第j个课程的第i个学生的成绩。表1显示了k的不同值的特定于课程的数据集的各类统计数据。
对于CSMF方法,在删除目标学生在课程c中取得的成绩后,将和合并到一个矩阵中,获得课程c的训练数据集。
对于MF方法,在删除要预测的课程中活跃状态下学生所取得的成绩后,矩阵将作为要预测的每个课程的集合和的并集。我们以这种方式构造了数据集,以便为所有模型提供相同的信息以进行训练和测试。
在SSR中,等级矩阵Gs,c是通过从中选择,由学生s参加的课程集合以及与s的OR值至少为t的学生的集合而创建的。图1显示了关于这些数据集的一些统计数据,这些统计数据是t的函数。
最后,我们不考虑那些数据集中包含少于20个学生的模型,因为我们认为他们的训练实例太少,无法进行可靠的估计。
4.2竞争方法
在我们的实验中,我们将我们的方法与以下竞争方法进行
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[235352],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。