一种基于语义向量空间模型的作业查重算法
发布时间:2017-08-13 01:23
本文关键词:一种基于语义向量空间模型的作业查重算法
【摘要】:甄别作业重复和减少学术抄袭是教学实践中的难点之一,近年来出现了许多基于文本相似度计算的作业查重算法,而文本相似度计算的精确性是此类算法的核心。传统的基于向量空间模型的文本相似度算法只考虑文本中出现的词项,而没有利用词项的语义信息,针对上述不足,本文采用"删除去除词"、"合并近义词"、"以语义主题作为向量空间的维度"3种策略对该算法进行了改进。通过设计中文文本相似度计算组件将算法运用到作业查重中,并在真实数据中进行测试。测试结果表明,本文提出的算法相比传统的向量空间模型算法,其精确性有了进一步的提高。
【作者单位】: 南通科技职业学院;
【关键词】: 向量空间模型 文本相似度 语义分析
【基金】:江苏省大学生创新创业训练计划项目“微课移动学习平台的设计与实现”(201612684012Y)
【分类号】:TP391.1
【正文快照】: 引言 信息化时代各类学习网站、作业平台的大量涌现,在给教学带来方便的同时,也出现了一些问题。部分学生在提交电子作业时存在侥幸心理,抄袭或只对同学作业稍做修改,甚至出现抄袭往届学生作业的现象时有发生,完全靠教师人工检测难度较大。如何甄别作业重复和减少学术抄袭是,
本文编号:664681
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/664681.html