基于向量空间模型的毕业论文相似性辨识研究
本文选题:向量空间模型 + 相似性计算 ; 参考:《科学技术与工程》2007年09期
【摘要】:随着高校扩招以及互联网信息膨胀,高校毕业论文管理中排查论文抄袭的工作量越来越大。文中提出采用向量空间模型计算论文之间的相似度,通过相似度排序,找出“可疑”论文,然后再进行人工审核,从而加快了管理机构对论文排查的速度,减少了人工排查的工作量,增加了论文排查过程的公正性。
[Abstract]:With the expansion of college enrollment and the expansion of Internet information, the workload of investigating plagiarism in the management of graduation thesis is increasing. In this paper, a vector space model is proposed to calculate the similarity between papers. Through similarity ranking, we can find out the "suspicious" papers, and then carry out manual review, thus speeding up the speed of the management organization to search the papers. The workload of manual search is reduced, and the fairness of the process is increased.
【作者单位】: 湖南大学经济管理数据中心 长沙航空职业技术学院
【分类号】:TP391.1
【参考文献】
相关期刊论文 前2条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
2 吴栋,滕育平;中文信息检索引擎中的分词与检索技术[J];计算机应用;2004年07期
【共引文献】
相关期刊论文 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
3 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
4 邵晶,党海峰,白慧先,郑庆华;OPAC资源与网络教育资源共享集成关键技术研究[J];大学图书馆学报;2005年03期
5 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
6 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
7 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
8 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
9 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
10 朱培毅,黄敏;基于Boosting算法的文本自动分类器模型设计[J];高校图书馆工作;2004年05期
相关会议论文 前2条
1 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
相关博士学位论文 前10条
1 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
2 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
3 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
5 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
6 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
7 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
8 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
9 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
10 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
相关硕士学位论文 前10条
1 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
2 邱宇红;向量空间模型在医学文献相关性研究中的应用[D];中国医科大学;2006年
3 马安香;基于分类语义的Web信息抽取机制的研究与实现[D];东北大学;2005年
4 周钦强;基于人工智能技术Naive Bayes文本自动分类系统研究[D];广东工业大学;2005年
5 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
6 胡卓颖;专题型网页搜集器关键算法的研究及实现[D];江西师范大学;2005年
7 廖海波;基于投影寻踪回归的文本分类研究[D];江西师范大学;2005年
8 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年
9 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年
10 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
【二级参考文献】
相关期刊论文 前1条
1 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
【相似文献】
相关期刊论文 前10条
1 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
2 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
3 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
4 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
5 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
6 李志明;李善平;杨朝晖;林欣;;基于本体分割的本体映射算法[J];模式识别与人工智能;2011年02期
7 冷亚军;梁昌勇;张恩桥;戚筱雯;;基于项类偏好的协同过滤推荐算法[J];情报学报;2011年07期
8 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
9 李e,
本文编号:1842408
本文链接:https://www.wllwen.com/wenshubaike/caipu/1842408.html