当前位置:主页 > 论文百科 > 论文查重 >

基于情感语义特征的论文剽窃检查优化方法研究

发布时间:2017-10-24 14:34

  本文关键词:基于情感语义特征的论文剽窃检查优化方法研究


  更多相关文章: 情感语义特征 剽窃检查 语义词典


【摘要】:学术论文的剽窃现象屡见不鲜,如何通过有效的手段预防并遏制学术剽窃行为,已经成为各科研机构单位所关注的问题。作者所在课题组自2005起,在学术论文的剽窃检查与识别方面进行了大量研究和分析,并先后完成了基于词频统计的论文剽窃检查、基于相对单元密度的论文剽窃检查和基于写作风格特征的论文剽窃检查等版本的系统研发。前两者在大篇幅抄袭和部分文字抄袭的情况下,较好的完成了对剽窃现象的识别和剽窃文字的定位分析,并通过大量的实验证明检查识别结果具有较高的召回率。后者在前两个版本的基础上,引入了针对写作风格特征的检查和识别算法,进一步优化了原有的检查方法,并在检查精度和系统执行效率方面,取得了较好的进展。但是,上述检查方法未考虑学术论文的情感特征,针对情感倾向性不同但文字相似度较高的情况下检查方法具有一定局限性。因此,我们在基于写作风格特征的检查方法基础上,引入针对情感特征语义的考量,优化现有的剽窃检查方法。 本文的主要工作有如下五个方面: 1.研究比较国内外针对情感特征语义的识别和提取算法,分析本文作者所在课题组的前期工作,说明现有检查方法存在的局限性,论证在学术论文剽窃检查中引入情感语义特征的可行性。 2.在前期工作的基础上,结合国内外相关技术,提出基于语义情感特征的论文剽窃检查优化方法,建立情感语义特征词典和多种情感特征评价资源,设计并描述优化后的论文剽窃检查系统流程和检查算法。 3.说明了基于云计算平台进行剽窃检查原型系统的技术方案,描述了具体的实现方法。 4.通过论文宝剽窃检查系统的实证分析,阐述了基于情感语义特征的检查方法的优化效果,通过实验数据,验证算法的有效性。 本文所研究的基于情感语义特征的论文剽窃检查方法,是对本课题组前期工作的优化改进,对学术论文中所包含的情感特征进行识别分析,为剽窃检查课题引入新的考量,进一步完善剽窃检查算法,为打击学术腐败与学术剽窃行为起到有效的预防和打击作用。
【关键词】:情感语义特征 剽窃检查 语义词典
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.1
【目录】:
  • 摘要4-5
  • Abstract5-7
  • 第一章 绪论7-11
  • 1.1 研究背景与意义7-9
  • 1.1.1 社会背景7
  • 1.1.2 技术趋势7-8
  • 1.1.3 应用背景与问题描述8-9
  • 1.2 本文研究内容与目标9
  • 1.3 论文章节安排9-11
  • 第二章 相关技术研究综述11-16
  • 2.1 情感语义特征分析技术11-13
  • 2.1.1 基于语料库的情感语义特征分析11-12
  • 2.1.2 基于词典的情感语义特征分析12-13
  • 2.2 论文剽窃检查相关技术13-15
  • 2.3 本章小结15-16
  • 第三章 基于情感语义特征的论文剽窃检查优化16-24
  • 3.1 剽窃检查优化流程16-18
  • 3.2 论文结构预处理18-19
  • 3.3 特征候选集降维19-20
  • 3.4 文字相似度计算20-21
  • 3.5 情感语义特征值计算21-22
  • 3.6 剽窃嫌疑判别方法22-23
  • 3.7 本章小结23-24
  • 第四章 情感特征语义词典构建24-31
  • 4.1 面向不同专业领域的情感语义词典24-25
  • 4.2 基础情感特征词典的设计与构建25-29
  • 4.2.1 机器训练与人工反馈的情感特征值调整26-29
  • 4.3 程度副词词典与句法模板构建29-30
  • 4.4 本章小结30-31
  • 第五章 原型系统设计与开发31-41
  • 5.1 基于云平台的原型系统设计31-36
  • 5.2 原型系统软件实现36-40
  • 5.3 本章小结40-41
  • 第六章 实验设计与结果评价41-46
  • 6.1 情感语义识别准确度实验设计41-43
  • 6.2 原型系统性能实验与评价43-45
  • 6.3 本章小结45-46
  • 第七章 总结与展望46-48
  • 7.1 总结46
  • 7.2 展望46-48
  • 参考文献48-49
  • 致谢49-50

【参考文献】

中国期刊全文数据库 前8条

1 张靖;金浩;;汉语词语情感倾向自动判断研究[J];计算机工程;2010年23期

2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期

3 徐军;丁宇新;王晓龙;;使用机器学习方法进行新闻的情感自动分类[J];中文信息学报;2007年06期

4 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期

5 李钝;乔保军;曹元大;万月亮;;基于语义分析的词汇倾向识别研究[J];模式识别与人工智能;2008年04期

6 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期

7 刘连元;现代汉语语料库研制[J];语言文字应用;1996年03期

8 胡百华,李行德,汤志祥;香港的语料库和相关研究概况[J];语言文字应用;1997年02期

中国硕士学位论文全文数据库 前1条

1 宋光鹏;文本的情感倾向分析研究[D];北京邮电大学;2008年



本文编号:1089203

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/gzzj/1089203.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2fabc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com