机器学习与学习资源适配
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 国内外研究现状

学习资源适配算法是个性化学习系统中的核心模块,对学习者采用什么样的推荐算法直接决定了自适应学习系统提供智能化、个性化服务的能力。近年来,推荐系统逐渐成为一个研究热点,并被应用于许多领域,如电影、音乐、新闻、电商、在线学习系统等。本节从学习资源适配的阶段描述、国内应用现状、经典学习资源适配算法进展、学习资源适配中深度学习技术的发展4个方面对国内外研究现状进行综述,分析现有工作的局限性和未来的发展趋势。

1.2.1 阶段描述

随着人工智能与大数据技术的快速发展,如何将图像识别、计算机视觉、机器学习、深度学习等技术融入学习资源适配与精准教学中是教育信息化领域非常重要的研究课题之一。学习资源适配系统是教育数据挖掘领域的重要研究方向,并且被广泛应用于各类智能学习系统。在智能学习系统中,学习者加入教学活动并利用各类学习资源,具体包括课件、多媒体和模拟场景、练习题和测验,以及生动的话题讨论等。这些学习资源由于内在关系将组成一个复杂的结构,同类学习资源之间存在知识的前序、后继、同级的层次关系,这种层次关系可能存在于不同类的学习资源之间。而即使学习资源的种类不同,也可能具有相同知识、相同来源,属于相同课程,此外,它们之间还可能存在相互引用、扩展知识的关系。

学习者通过与学习资源的交互达到认知提升的目的,但由于学习资源的种类数量繁多且结构复杂,因此有必要在智能学习系统中嵌入个性化功能,以跟踪学习者的进展,并提供适合他们需要的学习资源。在线直播教学中,需要感知学习者的认知状态、情感投入、学习兴趣等。学习资源适配系统不是为了预测或迎合学习者的潜在行为,而应该通过适配的内容辅助学习者在合适的学习进程中以合理的方式发现与其个性化需求相匹配的学习资源,从而保持学习者的积极性,并支持他们有效地完成学习活动。因此,如何准确、有效地根据在线直播教学中学习者的各个表现模块来综合判断学习认知状态是实现学习资源精准适配的关键。

1.2.2 国内应用现状

随着在线教育和各类教育系统的普及,在线教育以各种形式出现在生活中。为了构建更好、更智能的学习体验,许多个性化技术被用于在线教育,而推荐算法就是其中最为广泛应用的技术。常见的使用推荐算法的学习场景有两类,一类是大规模在线课程系统中的课程或资源推荐系统;另一类是负责教学的学习系统,也称为自适应学习系统,有时也被称为电子导师。

在大规模在线课程系统中,一般有两类系统,第一类是学校内的混合式学习辅助系统,该系统可以帮助教师完成线上、线下教育的结合。它为教师提供了在线下课堂中使用的各类工具,也为学习者在课下提供了一个在线学习环境,同时具备一定的教学管理功能。第二类是比较常见的慕课(Massive Open Online Courses,MOOC)学习系统。MOOC将各种优质的学习资源进行汇总后提供给网络学习者。在这两类大规模在线课程系统中,推荐算法都能够为学习者提供一个个性化的智能推荐导学服务,通过分析学习者的各类学习行为为学习者推荐其可能需要的学习资源,使学习者的学习效率得到提高,增强学习者的使用黏性。在相关的研究中,针对在线课程系统的推荐算法与一般的资源推荐系统中的推荐算法并无本质上的不同,也有许多研究者结合学习的特点设计了针对在线课程系统的推荐算法。基于情景感知的学习资源推荐算法就是一类专门针对在线课程系统的推荐算法,这类算法假设学习者在不同学习环境下学习兴趣会发生改变。例如,学习者在自习室与寝室所学习的内容可能会有所不同,因此这类算法首先对学习者的学习环境进行感知,之后根据特定学习环境制定相关的资源推荐策略。基于知识图谱的学习资源推荐算法也是一类针对教学资源的推荐算法,这类算法首先将学习资源根据知识点所构成的知识图谱进行组织,之后根据组织的学习资源进行推荐,并且在构建的知识图谱上可以实现学习路径的规划与推荐。总体来说,在大规模在线课程系统中所使用的推荐算法与一般的推荐算法并没有本质的不同,因此大量研究人员也将目光聚集在构建更为先进的一般性推荐算法,并借此提高在线课程系统中推荐算法的性能。

自适应学习系统是指一类汇聚教学内容后能够为学习者提供学习服务的系统,相较于大规模在线课程系统,自适应学习系统具有更加复杂的功能,它要求系统能够为学习者提供全面的教学服务,包括学习资源组织、测试分析、知识点追踪、学习干预等。在某种程度上,自适应学习系统相当于一个在线学习导师,能够为学习者提供一切所需要的学习服务。推荐算法在自适应学习系统中往往被用于资源组织与学习干预。自适应学习系统利用推荐算法分析学习者的历史学习轨迹,利用协同思想为学习者进行学习规划和学习内容组织。在学习干预过程中,自适应学习系统往往利用推荐算法作为干预措施实现泛义资源推荐。泛义资源是指在学习过程中有可能接触到的所有资源,如教师指导、学习同伴、测试、学习资源等。当干预模块发现学习者的学习行为偏离轨道后,可以借助泛义资源推荐算法对学习者进行干预并给出建设性的意见。由于自适应学习系统的研究大多集中于理论模型的构建和功能设计上,因此很少有相关的实证研究。

1.2.3 经典学习资源适配算法进展

推荐算法是个性化学习资源适配服务技术中的核心部分,在很大程度上决定了个性化资源推荐服务技术的类型和性能的优劣。有大量的学者在推荐算法的构建上进行了研究,本节根据推荐算法的类型对国内外学者的相关工作进行综述,并简单介绍深度学习算法的发展及其在推荐算法中的应用。

主流的推荐算法的类型包括协同过滤算法、基于内容的推荐算法、基于知识的推荐算法和混合推荐算法。

(1)基于协同过滤算法的学习资源适配。协同过滤算法的主要思想是先在系统中找出与目标用户有相似历史行为的其他用户,再将这些用户感兴趣的内容推荐给目标用户。例如,Altered Vista System是早期的教育资源推荐服务系统,通过分析系统中学习者与学习资源的交互数据,结合协同过滤算法进行资源推荐;Liu等人提出了一种基于活动序列的在线课程推荐算法,该算法利用协同过滤思想分析学习者的活动行为序列,并结合文本挖掘技术找出资源关键字进行匹配推荐。协同过滤算法的主要优点是不需要对用户或对象的特征进行描述,可以作用于任意对象类型,如音乐、电影、新闻等,并且协同过滤算法可能会将部分冷门资源推荐给其需要的用户,为用户带来惊喜。但是该算法却严重受到“冷启动”问题的影响,即当系统中用户与对象直接的交互数据或评价数据较少时,算法性能会受到较大影响甚至失去作用。

(2)基于学习内容的学习资源适配。基于内容的推荐算法将推荐对象与用户分别进行兴趣特征建模,根据用户的兴趣特征匹配对应的推荐对象。例如,Lu等人提出的个性化学习推荐系统,通过对学习者的学习风格、需求和背景进行特征建模,并利用该模型对学习者进行对应的资源推荐服务;Reginaldo等人基于学习者的兴趣、偏好和资源的受欢迎程度3个指标构建了一个新型的推荐系统;北京师范大学的“学习元”平台从学习者的兴趣、偏好与知识模型3个角度对学习者进行特征建模,并对学习资源的语义描述、生成信息和学习活动等方面对学习资源进行特征建模,最终利用学习者特征模型与学习资源特征模型进行匹配推荐。在基于内容的推荐算法中,不需要用户的行为数据,并且能够根据推荐的内容特征详细描述其推荐理由,但基于内容的推荐算法的主要问题是特征提取的过程极为复杂,一般需要利用专家知识进行特征建模,如在第4章的文献[4-6]中,学习者与学习资源的特征模型均由专家人工标注,导致构建基于内容的推荐算法需要大量的人力资源。

(3)基于知识的学习资源适配。基于知识的推荐算法利用分析用户的各类交互数据得到对应的行为因果知识,并据此进行推荐。例如,Tang等人提出的一种新型的在线学习智能推荐系统,能够分析学习者与系统之间的各类交互行为,并从网络上获取相关资源信息生成行为因果知识,并据此进行推荐;余平等人提出一种基于情境感知的个性化资源推荐框架,通过对学习者的学习情景进行分析来提升算法的推荐效果;吴正洋等人构建的社交网络下的学习推荐算法在社交网络环境下利用多方数据(社交数据与学习数据)构建用户本体知识库,结合协同过滤算法进行学习资源推荐;刘志勇等人提出的基于语义网的个性化学习资源推荐算法通过分析学习者的评论和浏览数据构建学习者的兴趣模型,并结合领域本体知识库进行推荐;姜强等人提出的基于用户模型的本体学习资源推荐算法通过构建学习资源本体知识库对学习资源内容进行描述,并结合用户模型进行推荐。基于知识的推荐算法的主要优点是能够有效利用额外信息,如第4章的文献[10-13]分别利用了学习情境数据、本体知识库、社交网络数据来提升推荐效果,在原有的算法基础上,对“冷启动”问题与数据稀疏性问题的健壮性更高,但缺点在于需要人工标注大量额外的特征信息。

(4)混合推荐算法。由于每种推荐算法都有其优点和缺点与适用范围,因此混合推荐算法采用多种推荐算法同时工作,并对其结果进行融合的方式进行推荐。混合推荐算法中最常见的是基于内容的推荐算法与协同过滤算法的组合。例如,Mohamed等人提出的资源推荐算法是同时利用协同过滤算法与基于内容的推荐算法并将候选集进行融合来完成推荐的;杨丽娜等人在虚拟社区中的文献(第4章的文献[15])推荐中,组合基于内容的推荐算法与协同过滤算法设计了研究虚拟社区中显性与隐性知识的推荐过程,既能对研究者推荐相关论文,又能发现与研究者有相同研究兴趣的研究伙伴;华中师范大学的赵呈领等人提出的适应性学习路径推荐算法综合讨论了智能优化算法、数据挖掘算法与基于知识的推荐算法在学习路径推荐中的表现,并将其进行组合得到了适应性学习路径推荐算法。混合推荐算法最主要的一个优点是能够通过组合多种推荐算法来避免或弥补各种推荐算法的缺点,以达到更好的推荐效果,但是在算法组合的过程中会产生大量的超参数,因此对参数调整会变得更为复杂。

1.2.4 学习资源适配中深度学习技术的发展

随着深度学习算法在计算机视觉、语音识别等领域取得的巨大进展,深度学习正成为机器学习、人工智能领域的一个热门研究方向。在数字学习的个性化推荐方面,基于深度学习的推荐算法已成为近些年的研究热点。

Sun等人提出了一种基于协同过滤的抽样推荐算法(CFSR),该算法自动推荐具有缺陷数据的样本,将多准则推荐和深度学习协同过滤相结合以提高推荐性能。Nassar等人提出了一种新的基于深度学习的多准则协同过滤模型,对低维向量的用户和项目单独学习以获得用户-用户、项目-项目的信息,在预测时使用前馈神经网络模拟用户和项目之间的相互作用。Yu等人提出了一种基于上下文增强的深度神经协同过滤(CDNC)模型,该模型用于项目推荐,即用一种交互注意力机制来获取用户行为,并将用户评价和项目介绍的相互信息进行监督学习,利用获取的注意权值可以知道列表中历史项目的重要性。Xiong等人提出了一种基于深度学习的混合Web服务推荐算法,该算法将协同过滤和文本内容相结合,可推荐相关Web服务。Liu等人提出了一个混合神经网络推荐模型,该模型从评级和评论中学习用户和项目的深度关系。Wang等人提出了一种多形式类别特征组合的前馈深度推荐神经网络,即深度联盟神经网络。根据联盟方式的不同,可将其分为深度串联网络(DSN)、深度并行网络(DPN)和深度随机网络(DRN),分别用于解决隐式反馈推荐问题。同时他们提出了一种基于深度联盟神经网络和传统多层感知器(MLP)的融合模型SMLP,试图探索融合模型的性能。

与传统的推荐算法相比,基于深度学习的推荐算法在实际应用场景中获得了很好的效果,这得益于深度学习模型所带来的强大学习能力。