一种基于高频词和段落匹配的论文抄袭检测系统设计
本文关键词:一种基于高频词和段落匹配的论文抄袭检测系统设计
更多相关文章: 论文抄袭检测 高频词 二叉树 段落相似度 hash
【摘要】:本文在分析国内外相关研究的基础上,设计了一套具有二叉树结构数据库的论文抄袭检测系统,先后通过高频词模糊匹配和段落精细匹配,检测出全文抄袭和段落抄袭,从而较好地实现该系统的设计目的。
【作者单位】: 西南财经大学经济信息工程学院;
【关键词】: 论文抄袭检测 高频词 二叉树 段落相似度 hash
【分类号】:TP391.1
【正文快照】: 一、引言近年来,随着学术论文写作风潮盛行,论文剽窃抄袭现象也日益严重,成为困扰学术界的重大问题之一。而在论文抄袭的检测工作上,人工操作既耗时费力又有其局限性。因此开发一个具有较高效率和准确率的抄袭检测系统,在当前背景下有着重要的现实意义和应用价值。二、系统构
【相似文献】
中国期刊全文数据库 前10条
1 肖琳;梁军;钮文良;;基于Bloom过滤器的精确位图索引[J];计算机工程;2011年13期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘荣;王丽娟;张志平;刘健文;胡竟伟;;面向特定领域的多字词表达式的提取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 刮俊杰;吴树国;伊胜伟;;基于词效应的中文术语提取方法[A];第三届中国智能计算大会论文集[C];2009年
4 李彤;莫福源;李昌立;;基于单音节的汉语文语转换系统及其应用[A];第三届全国人机语音通讯学术会议论文集[C];1994年
5 刘东生;尹宝生;张桂平;徐立军;苗雪雷;;面向专利文献的中文分词技术的研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 董静;林鸿飞;杨志豪;;中文网页形式自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
7 沙芸;周俊武;张国英;;基于主题关键词的新闻去重算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 方莹;杨尔弘;;基于多特征的句子聚类方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前2条
1 余建斌;谁在悄悄复制你的隐私[N];人民日报;2010年
2 通讯员庞旭民、杨伟;“强国天颐维哈柯文智能输入软件”面世[N];新疆日报(汉);2009年
中国硕士学位论文全文数据库 前8条
1 徐传运;基于主题相关的P2P全文搜索引擎的研究[D];重庆大学;2006年
2 黄立冬;基础教育资源搜索引擎中的中文分词技术研究[D];南京师范大学;2006年
3 赵旭东;互联网舆情指数挖掘方法研究[D];哈尔滨工业大学;2007年
4 曾庆祥;移动终端本地资源搜索引擎的研究与设计[D];北京邮电大学;2009年
5 萨拉木·马合木提;维吾尔文词频统计系统的设计与实现[D];吉林大学;2012年
6 刘轶群;基于Maze用户行为分析的资源推荐系统设计与实现[D];北京大学;2007年
7 范小丽;文本分类中特征选择的研究与实现[D];西北大学;2011年
8 何凤远;基于词频统计的齐夫定律汉语适用性研究[D];安徽大学;2011年
,本文编号:994307
本文链接:https://www.wllwen.com/wenshubaike/gzzj/994307.html