基于Lucene的毕业论文相似性检测
本文关键词:基于Lucene的毕业论文相似性检测,由笔耕文化传播整理发布。
【摘要】:提出了基于Lucene的论文相似性检测系统,采用随机特征码算法构造特征向量。实验表明该算法与传统的文本聚类算法在查全率、查准率及时间消耗上具有优越性,呈线性结构的算法适合大规模论文的抄袭检测。
【作者单位】: 长春工业大学人文信息学院;
【关键词】: Lucene毕业论文 抄袭检测 随机特征码
【基金】:吉林省教育厅“十二五”科研课题(吉教科合字2011第353号)
【分类号】:TP391.1
【正文快照】: 0引言毕业论文是本科人才培养的重要实践性教学环节,也是学士学位评定的重要依据。但是随着互联网的普及,网络资源方便易得,毕业论文成段复制也给学生的抄袭带来了极大的方便。本文研究和分析了开源的搜索引擎工具Lucene的原理,将Lucene技术应用于毕业论文选题系统中,对上传论
【参考文献】
中国期刊全文数据库 前5条
1 冯汝伟;谢强;丁秋林;;基于文本聚类与分布式Lucene的知识检索[J];计算机应用;2013年01期
2 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
3 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期
4 周凤丽;林晓丽;;基于Lucene的Web搜索引擎的研究和实现[J];计算机技术与发展;2012年01期
5 秦颖;文秋芳;梁茂成;;应用随机特征码检测雷同译文[J];外语电化教学;2009年06期
【共引文献】
中国期刊全文数据库 前10条
1 朱学芳;冯曦曦;;面向农业主题搜索引擎设计与实现[J];安徽农业科学;2011年35期
2 李敏;黄凯;;一个多线程全文检索系统的构建[J];长江大学学报(自然科学版)理工卷;2010年03期
3 王军;张兴忠;;XML与全文检索在CMS数据归档中的应用[J];电脑开发与应用;2012年01期
4 刘敏娜;葛萌;陈娟;;基于Lucene的全文搜索引擎设计与实现[J];福建电脑;2009年05期
5 周文勤;;使用Heritrix和Lucence的全文检索解决方案[J];甘肃联合大学学报(自然科学版);2012年04期
6 李明宙;罗艳;王宗义;;Lucene全文检索引擎的结构机制与应用方式[J];广西科学院学报;2010年04期
7 陈晓丽;杨欣蓉;王作钊;周航;赵益;沈玲玲;;面向制造业的知识搜索引擎设计[J];电脑知识与技术;2013年16期
8 汪涛;;论基于Java的全文检索实现和索引性能提高[J];湖北民族学院学报(自然科学版);2009年01期
9 孙海东;张力;;基于Lucennee.t的医学教育视频垂直检索的设计与实现[J];开放教育研究;2011年02期
10 宋佳;诸云强;刘润达;;一种基于Lucene改进的全文检索工具包[J];计算机工程与应用;2008年04期
中国重要会议论文全文数据库 前1条
1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
2 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年
3 王兆宇;个性化站内搜索引擎的设计与应用[D];东华大学;2011年
4 马静;基于web的数字化资源全文检索系统的设计与实现[D];西安电子科技大学;2010年
5 吴代文;基于Lucene的二次全文检索系统设计与实现[D];西安电子科技大学;2009年
6 丁士敏;基于Ajax/Lucene的站内搜索技术研究与实现[D];西安电子科技大学;2008年
7 孙华昱;Lucene在医学影像资源检索平台中的应用[D];沈阳工业大学;2011年
8 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
9 陈刚;基于行为分析智能推荐购物搜索引擎的设计与实现[D];北京交通大学;2011年
10 迟名;烟草专卖网平台的设计与实现[D];吉林大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
2 蒋明原;孔令德;宁静静;;一种海量数据下的Lucene全文检索解决方案[J];电脑开发与应用;2011年04期
3 曹宇;尹刚;李翔;程荣斌;王怀民;;聚类搜索引擎研究进展浅析[J];电脑知识与技术;2011年22期
4 李振龙;;Web信息检索的技术分析与发展策略研究[J];计算机科学;2006年04期
5 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
6 郎小伟;王申康;;基于Lucene的全文检索系统研究与开发[J];计算机工程;2006年04期
7 张汛涞;搜索引擎的设计剖析[J];计算机工程与科学;2002年04期
8 赵恒永;沈坚;山岚;;基于专业信息深度挖掘的搜索引擎Spider的设计与实现[J];计算机工程与科学;2009年06期
9 王浩;姚长利;郭琳;艾国庆;;基于中文搜索引擎网络信息用户行为研究[J];计算机应用研究;2009年12期
10 朱学昊;王儒敬;余锋林;唐昱;;基于Lucene的站内搜索设计与实现[J];计算机应用与软件;2008年10期
中国硕士学位论文全文数据库 前1条
1 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 谢维信,刘健庄;视觉图形符号的频谱分析[J];航天医学与医学工程;1990年04期
2 董建萍;一般系统相似性讨论[J];桂林电子工业学院学报;1996年01期
3 陈兵,井元伟,张嗣瀛;经状态反馈确保非线性不确定相似组合系统终极一致有界[J];控制与决策;1998年05期
4 刘红冰;浅析计算机技术与社会现象的相似性[J];湖南财经高等专科学校学报;2000年06期
5 王秀平;刘家勇;李治柱;;个性化学习推荐系统的设计与实现[J];微型电脑应用;2005年11期
6 王小玲;胡平;;基于个人兴趣和反馈技术的Page Rank算法研究[J];合肥工业大学学报(自然科学版);2006年03期
7 朱俊武;王建东;李斌;;基于语义相似性的web服务选择(英文)[J];东南大学学报(英文版);2006年03期
8 乔园园;吴夏;杨玲;张明涛;;化学信息学开源软件的集成与复用[J];计算机与应用化学;2007年01期
9 吴春辉;钟宝荣;;基于内容的音频检索技术研究[J];科技情报开发与经济;2007年06期
10 张亚;王元庆;;一种有效的数字图像传感器彩色插值算法[J];计算机测量与控制;2008年04期
中国重要会议论文全文数据库 前10条
1 张恒超;阴国恩;;关系类别及其学习机制[A];第十二届全国心理学学术大会论文摘要集[C];2009年
2 赵春江;施文康;邓勇;;基于Wasserstein距离的目标识别中的研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 秦军刚;韩世辉;;不应效应和波形相异交迭——知觉组织神经基础的可能解释?[A];2005年中国神经心理学学术会议论文集[C];2005年
4 叶知新;莫雷;;基于相似性归类中的外显策略和内隐策略[A];第十一届全国心理学学术会议论文摘要集[C];2007年
5 范万春;邱宏茂;孙煜;施仁;李真富;;基于自相关函数的地震信号自适应端点检测[A];第十届全国核电子学与核探测技术学术年会论文集[C];2000年
6 彭丰平;鲍苏苏;;基于CT序列图像肝脏及其管道的分割[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 张元中;楚泽涵;;不同频率声衰减之间的相似性问题[A];1999年中国地球物理学会年刊——中国地球物理学会第十五届年会论文集[C];1999年
8 彭建武;;连通主义和认知语言学的对比研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 黎坚;张厚粲;;心理学常用计数数据相似性检验法[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
10 刘梦然;;材料力学学科特性与内在逻辑的分析[A];海峡两岸力学教学—教学经验与教学改革交流会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 赵军;相似性影响电影与观众的互动[N];中国电影报;2008年
2 本报记者 黄婉媛;探寻文化相似性有利化解纷争[N];中山日报;2010年
3 中国传媒大学计算机学院 朱立谷;重复数据删除技术解析[N];中国计算机报;2007年
4 赵晓;中国经济到了一个新十字路口[N];上海证券报;2008年
5 张田勘;最新破译狗的起源和进化[N];北京日报;2005年
6 沈晓强;伦铜合理底部在6400—6500美元[N];期货日报;2007年
7 康潜;前车后辙 安步当歌[N];证券日报;2007年
8 吴国平;缩量双星暗藏玄机?[N];上海证券报;2006年
9 路平;企业的责任意识需提升[N];中国劳动保障报;2009年
10 侯燕俐;伍德威:一路旅行一路收藏[N];中国乡镇企业报;2005年
中国博士学位论文全文数据库 前10条
1 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
2 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
3 黄樟灿;演化计算的搜索策略研究[D];武汉大学;2004年
4 李桂杰;固体“类流态”机理及其与地震孕震的相似性研究[D];天津大学;2004年
5 李俊奎;时间序列相似性问题研究[D];华中科技大学;2008年
6 黎荣;概念工艺规划原型系统关键技术研究[D];西南交通大学;2006年
7 翁延玲;RTL到门级设计的等价性验证的研究[D];浙江大学;2008年
8 曹顺良;生物学数据集成若干关键问题研究[D];复旦大学;2005年
9 黄章峰;超音速平板边界层从层流到湍流的转捩机理及湍流特性[D];天津大学;2006年
10 阮文善;类型学视野中的同一、差异与相似[D];华东师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 鲁华;中西当代广告作品比较研究[D];武汉大学;2005年
2 许瑞珍;结构对称蛋白质的序列分析[D];华中科技大学;2005年
3 别晨霞;基于中介语语料库的形容词产出偏误分析[D];上海师范大学;2009年
4 陆苏静;从相似性角度看中介语中的程度副词偏误现象[D];上海师范大学;2009年
5 钟亮;基于视频流的数字隐藏技术[D];华南师范大学;2005年
6 朱贤芳;生物序列的比对算法比较研究[D];南京理工大学;2005年
7 孙传波;认知风格、加工方式与汉语相似词学习的关系研究[D];曲阜师范大学;2006年
8 焉炳艳;一种新的基于相似性的多目标演化算法[D];武汉理工大学;2006年
9 张婷婷;归纳推理中的属性中心性效应及其心理过程初探[D];西南大学;2007年
10 万小梅;江西赣语词汇变音探究[D];华南师范大学;2007年
本文关键词:基于Lucene的毕业论文相似性检测,由笔耕文化传播整理发布。
,本文编号:357143
本文链接:https://www.wllwen.com/wenshubaike/caipu/357143.html