当前位置:主页 > 论文百科 > 论文查重 >

基于文本结构树的论文复制检测算法

发布时间:2017-05-29 00:10

  本文关键词:基于文本结构树的论文复制检测算法,由笔耕文化传播整理发布。


【摘要】:针对目前学术界抄袭现象日趋严重的问题,提出基于文本结构树的论文复制检测算法。将一篇论文分为三层的结构树:最上层的根节点表示整篇论文,分支节点表示句子包,叶节点表示句子。根据一个函数和句子的综合相似度计算句子相似度,以最大句子相似度计算叶节点相似度,上层节点的相似度由相邻的下层节点相似度计算得到。选用中国期刊全文数据库中的论文进行测试,实验结果证明该算法是可行的、高效的。
【作者单位】: 大连理工大学管理学院;
【关键词】复制检测 句子相似度 句子包 结构树
【分类号】:TP391.1
【正文快照】: 1引言进入21世纪,知识已经成为主要的经济资源和占支配地位的、甚至可能是唯一的竞争优势的源泉。计算机、网络和通信技术的高速发展,给人们提供了大量的文档、图像、音频、视频等数字化信息。人们很容易访问这些资源,尤其是学生和学术研究人员能够轻松地找到课题研究的相关

【参考文献】

中国期刊全文数据库 前3条

1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期

2 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期

3 鲍军鹏,沈钧毅,刘晓东,宋擒豹;自然语言文档复制检测研究综述[J];软件学报;2003年10期

【共引文献】

中国期刊全文数据库 前10条

1 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报(自然科学版);2000年03期

2 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期

3 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期

4 金博;史彦军;滕弘飞;;基于篇章结构相似度的复制检测算法[J];大连理工大学学报;2007年01期

5 谭建龙,庄超,白硕;一种实用Internet内容版权保护系统的设计与实现[J];计算机研究与发展;2001年10期

6 王剑,周之英,肖慧勇;应用于结构化文本的检索系统的设计和实现[J];计算机工程与应用;2003年19期

7 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期

8 马兆丰,冯博琴,宋擒豹,刘丹莹;面向认证的传统商品数字化防伪机制研究[J];计算机工程;2003年01期

9 李军怀,张景,吕林涛,张志强;基于Internet的传统商品防伪系统[J];计算机工程;2004年19期

10 金博,史彦军,滕弘飞;中文文档复制检测系统研究[J];计算机工程;2005年19期

中国博士学位论文全文数据库 前5条

1 彭强;复杂系统远程智能故障诊断技术研究[D];南京理工大学;2004年

2 刘清堂;标准化教育资源版权保护机制研究[D];华中科技大学;2005年

3 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年

4 周四清;数字水印理论及应用研究[D];华南理工大学;2002年

5 于宝琴;成套电器企业异构数据整合及其物流系统的研究[D];天津大学;2006年

中国硕士学位论文全文数据库 前10条

1 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年

2 姜楠;可行的完备数字水印系统研究[D];山东师范大学;2003年

3 武琼;基于元数据的web信息提取方法研究[D];山西大学;2003年

4 赵倩;数字水印版权保护系统[D];首都经济贸易大学;2004年

5 蒋超;轨道交通自动门远程监控系统中的智能故障诊断技术研究[D];南京理工大学;2004年

6 杨聪;基于口语对话的电话自动转接与信息查询技术研究[D];国防科学技术大学;2004年

7 李剑;英汉机器翻译中的句型转换和译文生成[D];中国人民解放军信息工程大学;2005年

8 李旭;基于串匹配方法的文档复制检测系统研究[D];燕山大学;2006年

9 张艳;面向高校师生的应用文机辅写作关键技术研究[D];大连理工大学;2006年

10 连浩;基于布尔模型的网页查重算法研究[D];中国科学院研究生院(计算技术研究所);2006年

【二级参考文献】

中国期刊全文数据库 前10条

1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期

2 朱靖波,王宝库,姚天顺;一种规则描述语言NPRDL语言[J];东北大学学报(自然科学版);1996年06期

3 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期

4 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期

5 郑逢斌,陈志国,姜保庆,乔保军;语义校对系统中的句子语义骨架模糊匹配算法[J];电子学报;2003年08期

6 何明;胡彩霞;;一种文本相似性的度量方法和计算方法[J];黄山学院学报;2005年06期

7 马颖华,王永成,苏贵洋,张宇萌;一种基于字同现频率的汉语文本主题抽取方法[J];计算机研究与发展;2003年06期

8 林贤明,李堂秋,陈毅东;句子相似度的动态规划求解及改进[J];计算机工程与应用;2004年35期

9 王荣波,池哲儒,常宝宝,柏晓静;基于词串粒度及权值的汉语句子相似度衡量[J];计算机工程;2005年13期

10 宋擒豹,杨向荣,沈钧毅,齐勇;数字商品非法复制的检测算法[J];计算机学报;2002年11期

【相似文献】

中国期刊全文数据库 前10条

1 秦元巧;孙国强;;改进的句子相似度计算在问答系统中的应用[J];微计算机信息;2011年08期

2 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期

3 王宏生;张敏;;一种基于语义网的相似度计算模型[J];微计算机信息;2011年07期

4 郭扉扉;尹文生;;改进型单向贴近度主观题自动评分算法的研究[J];计算机工程与科学;2011年07期

5 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期

6 赵文娟;闫红梅;王蔚林;;基于汉语框架网的语义角色标注算法[J];图书情报工作;2011年06期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

中国重要会议论文全文数据库 前3条

1 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

2 张宇;刘挺;高立琦;车万翔;朱传靖;;基于常问问题集的在线客服实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

中国博士学位论文全文数据库 前3条

1 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年

2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年

3 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年

中国硕士学位论文全文数据库 前10条

1 孙伟;基于文档复制检测技术的研究与实现[D];辽宁工程技术大学;2010年

2 李婷婷;基于语义结构的学术论文复制检测技术研究与实现[D];北京邮电大学;2010年

3 刘双明;文档复制检测的应用研究[D];太原理工大学;2010年

4 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年

5 卢小康;中文文本复制检测技术研究[D];杭州电子科技大学;2009年

6 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年

7 杨茂;基于句子相似度的文本比对算法研究[D];电子科技大学;2010年

8 张振幸;基于知网的模块化的中文句子相似度计算研究[D];安徽工业大学;2010年

9 刘青磊;汉语词语及句子相似度算法研究与应用[D];电子科技大学;2011年

10 黄妮;网络学习平台中的分词与句子相似度算法研究[D];陕西师范大学;2012年


  本文关键词:基于文本结构树的论文复制检测算法,由笔耕文化传播整理发布。



本文编号:403757

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/gzzj/403757.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9a95e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com