论文抄袭检测中特征选择
本文关键词:论文抄袭检测中特征选择,,由笔耕文化传播整理发布。
【摘要】:选取多少个最佳特征以及采用什么评估函数,针对不同的问题选取策略也有所不同。针对论文抄袭检测问题,如何确定特征选择数量和选择评估函数是文章研究的目的。在分析论文抄袭的主要形式和手段基础上,针对文本内容抄袭,阐述了文本特征表示的主要方法和特征选择常用策略,最后对实验结果进行分析,得出基本结论。
【作者单位】: 安徽财经大学成人教育学院;
【关键词】: 抄袭检测 特征选择 文本表示 向量空间模型
【基金】:教育部社科研究基金青年项目(07JC870006) 安徽财经大学教研重点项目(ACJYZD200914)
【分类号】:TP391.43
【正文快照】: 1引言论文抄袭的形式和手段多种多样,具体包括抄袭观点、文字、图像、表格、数据、模型与公式等。在所曝光的案例中,文本抄袭的情况占大多数,因此本文主要研究论文抄袭中文本内容抄袭的检测问题。从一篇文档的语法层次来看,它是由词、短语、句子和段落所构成的。所以,这
【参考文献】
中国期刊全文数据库 前2条
1 程泽凯,陆小艺;文本分类中的特征选择方法[J];安徽工业大学学报(自然科学版);2004年03期
2 刘丽珍,宋瀚涛;文本分类中的特征选取[J];计算机工程;2004年04期
【共引文献】
中国期刊全文数据库 前10条
1 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
2 张脂平,林世平;Web文本挖掘中特征提取算法的分析及改进[J];福州大学学报(自然科学版);2004年S1期
3 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
4 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
5 程泽凯,陆小艺;文本分类中的特征选择方法[J];安徽工业大学学报(自然科学版);2004年03期
6 张玉叶;李连;刘海见;王春歆;;文本过滤中的特征抽取应用研究[J];海军航空工程学院学报;2005年01期
7 石敏;康耀红;;一种联合的文本分类特征抽取函数[J];海南大学学报(自然科学版);2005年04期
8 万乐;刘万春;;类别特征词权重加权文本分类方法[J];军民两用技术与产品;2006年03期
9 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
10 唐焕玲,孙建涛,陆玉昌;文本分类中结合评估函数的TEF-WA权值调整技术[J];计算机研究与发展;2005年01期
中国重要会议论文全文数据库 前1条
1 鲁明羽;孙建涛;陆玉昌;;一种基于联想的网页推荐方法[A];第五届全球智能控制与自动化大会会议论文集(4)[C];2004年
中国博士学位论文全文数据库 前4条
1 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 何尧;基于半监督学习的中文文档分类技术研究[D];中南大学;2005年
2 范彦彬;基础教育资源搜索引擎中自动文摘技术研究[D];南京师范大学;2006年
3 廖海波;基于投影寻踪回归的文本分类研究[D];江西师范大学;2005年
4 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年
5 朱玮;IRT和规则空间在文本分类中的应用研究[D];江西师范大学;2005年
6 刘建波;基于Agent的用户兴趣模型的研究[D];沈阳工业大学;2005年
7 王晓庆;基于RBF网络的文本自动分类的研究[D];江西师范大学;2003年
8 钟茂生;基于智能Agent的个性化Web浏览器研究与实现[D];江西师范大学;2003年
9 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
10 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
【二级参考文献】
中国期刊全文数据库 前4条
1 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
2 张宁,贾自艳,史忠植;使用KNN算法的文本分类[J];计算机工程;2005年08期
3 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
4 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
【相似文献】
中国期刊全文数据库 前10条
1 李正;倪远平;刘迪;王海鹏;;实蝇图像识别中的形态特征提取研究[J];机械与电子;2010年S1期
2 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
3 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
4 郑娅峰;张巧荣;肖会敏;;自动特征选择和加权的图像显著区域检测[J];计算机工程与应用;2011年24期
5 冷强奎;秦玉平;王春立;;基于句子相似度的论文抄袭检测模型研究[J];计算机工程与应用;2011年24期
6 王桂娟;印鉴;詹卫许;;基于类别信息的特征子图选择策略[J];计算机科学;2011年08期
7 杨经;林世平;;基于SVM的文本词句情感分析[J];计算机应用与软件;2011年09期
8 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
9 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
10 计智伟;胡珉;;一种双重过滤式特征选择算法[J];计算机工程与应用;2011年19期
中国重要会议论文全文数据库 前10条
1 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 刘怡;高s
本文编号:440803
本文链接:https://www.wllwen.com/wenshubaike/gzzj/440803.html