一种基于段落词频统计的论文抄袭判定算法
本文关键词:一种基于段落词频统计的论文抄袭判定算法,,由笔耕文化传播整理发布。
【摘要】:解决论文抄袭的判定问题不但可以减轻审稿人员的工作负担,而且对于提高学术论文质量、净化学术领域、防止学术腐败都有很重要的意义。从抄袭的定义和法律规定出发,在分析比较国内外主要的论文抄袭判定方法基础上,提出存在的问题和改进策略,然后给出一种基于段落词频统计的论文抄袭判定算法。此算法不但可以检测出抄袭者成段抄袭的情况,而且可以检测出段落中语句顺序改变、段落内容压缩和扩充的情况,若疑似抄袭还可以将抄袭论文和被抄袭论文的相似内容输出,方便用户进一步审查。
【作者单位】: 合肥工业大学;安徽财经大学;
【关键词】: 抄袭判定 词频统计 段落相似度 中文分词 判定算法 英文论文 学术论文 语句顺序 抄袭者 分析比较
【基金】:教育部社科研究基金青年项目(07JC870006) 安徽财经大学教研重点项目(ACJYZD200914)
【分类号】:TP301.6
【正文快照】: 0引言近些年来论文抄袭成为困扰学术界的严重问题之一,抄袭剽窃之风在今天的学术界愈演愈烈几乎是不争的事实。“抄袭是指将他人作品或者作品的片段窃为己有。”更准确地说,抄袭是指将他人作品或者作品的片段窃为己有并公开发表。论文中可以适当地引用他人作品的部分内容,当
【参考文献】
中国期刊全文数据库 前4条
1 金博;史彦军;滕弘飞;;基于篇章结构相似度的复制检测算法[J];大连理工大学学报;2007年01期
2 金帛;剽窃、抄袭他人的作品是一种严重的侵权行为——兼谈对剽窃、抄袭行为的认定[J];晋图学刊;2001年04期
3 鲍军鹏,沈钧毅,刘晓东,宋擒豹;自然语言文档复制检测研究综述[J];软件学报;2003年10期
4 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 金博;史彦军;滕弘飞;;基于篇章结构相似度的复制检测算法[J];大连理工大学学报;2007年01期
2 谭建龙,庄超,白硕;一种实用Internet内容版权保护系统的设计与实现[J];计算机研究与发展;2001年10期
3 张剑,郭燕慧,钟义信;基于特征项的群组信息推荐算法[J];计算机工程与应用;2004年15期
4 马兆丰,冯博琴,宋擒豹,刘丹莹;面向认证的传统商品数字化防伪机制研究[J];计算机工程;2003年01期
5 李军怀,张景,吕林涛,张志强;基于Internet的传统商品防伪系统[J];计算机工程;2004年19期
6 金博,史彦军,滕弘飞;中文文档复制检测系统研究[J];计算机工程;2005年19期
7 宋擒豹,杨向荣,沈钧毅,齐勇;数字商品非法复制的检测算法[J];计算机学报;2002年11期
8 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
9 白广慧,连浩,刘悦,程学旗;网页查重技术在企业数据仓库中的应用[J];计算机应用;2005年07期
10 张蒲生,苏运霖,方德葵;一种嵌入机器指纹的版权控制方法[J];计算机应用研究;2004年07期
中国重要会议论文全文数据库 前2条
1 刘建毅;王菁华;王枞;;领域语义语法的统计生成[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 连浩;刘悦;许洪波;王斌;程学旗;;一种改进的基于内容的快速网页查重算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前6条
1 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
2 刘清堂;标准化教育资源版权保护机制研究[D];华中科技大学;2005年
3 周四清;数字水印理论及应用研究[D];华南理工大学;2002年
4 于宝琴;成套电器企业异构数据整合及其物流系统的研究[D];天津大学;2006年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 方淼;语义单元自动获取研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 姜楠;可行的完备数字水印系统研究[D];山东师范大学;2003年
2 于俊凤;语音信号的识别与转换研究[D];成都理工大学;2004年
3 赵倩;数字水印版权保护系统[D];首都经济贸易大学;2004年
4 刘亚清;基于词义的汉语排歧方法研究[D];南京理工大学;2004年
5 杜世平;隐马尔可夫模型的原理及其应用[D];四川大学;2004年
6 余贞斌;自然语言理解的研究[D];华东师范大学;2005年
7 朱磊;自然语言处理之汉语文本自动校对[D];电子科技大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 马晓娜;用于考古数字博物馆的受限自然语言查询系统[D];山东大学;2005年
10 柳培林;基于向量空间模型的中文文本分类技术研究[D];大庆石油学院;2006年
【二级参考文献】
中国期刊全文数据库 前7条
1 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期
2 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
3 卢汉清,孔维新,廖明,马颂德;基于内容的视频信号与图像库检索中的图像技术[J];自动化学报;2001年01期
4 张益民,陆汝占,沈李斌;一种混合型的汉语篇章结构自动分析方法[J];软件学报;2000年11期
5 鲍军鹏,沈钧毅,刘晓东,宋擒豹;自然语言文档复制检测研究综述[J];软件学报;2003年10期
6 宋擒豹,杨向荣,沈钧毅,齐勇;数字商品非法复制的检测算法[J];计算机学报;2002年11期
7 董振东,董强;面向信息处理的词汇语义研究中的若干问题[J];语言文字应用;2001年03期
【相似文献】
中国期刊全文数据库 前10条
1 朱丽娜;日本图书馆学情报学叙词表研究小组情况介绍[J];图书情报知识;1985年03期
2 阎久佐;;我校首创“计算机中文信息库”[J];北京师范大学学报(自然科学版);1985年04期
3 刘涌泉;谈谈词库问题[J];中文信息学报;1986年01期
4 刘源,梁南元;汉语处理的基础工程——现代汉语词频统计[J];中文信息学报;1986年01期
5 袁琦;我国语言工程研究取得丰硕成果——“现代汉语词频统计”工程通过国家级鉴定[J];中文信息学报;1986年01期
6 孔玉洁;;维、哈、柯、汉、英多种文字信息IBM/PC/XT微型计算机处理系统通过了鉴定[J];科技通报;1986年05期
7 王德进 ,张社英 ,刘源;汉语言的几个统计规律[J];中文信息学报;1987年04期
8 邓珞华;词频分析[J];武汉大学学报(人文科学版);1987年01期
9 刘涌泉;;中国计算机和自然语言处理的新进展[J];情报科学;1987年01期
10 沈关龙;齐普夫定律与专题文献标题词频的研究及应用[J];情报理论与实践;1988年02期
中国重要会议论文全文数据库 前10条
1 尹斌庸;方世增;;词频统计的新概念和新方法[A];语言文字应用研究论文集(Ⅰ)[C];1995年
2 潘雪莲;;词频统计在词典收词中的作用[A];中国辞书论集2001[C];2001年
3 陈一凡;朱亮;;二十一世纪初汉语字、词流通频度统计[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
4 万敏;罗振声;季Y
本文编号:426022
本文链接:https://www.wllwen.com/wenshubaike/gzzj/426022.html