基于关键词的非法实验申请分类系统的设计与实现
本文关键词:基于XML的异构产品信息网上交换、检索技术研究与应用,由笔耕文化传播整理发布。
《西北农林科技大学》 2015年
基于关键词的非法实验申请分类系统的设计与实现
涂盛慧
【摘要】:“国家园艺实验教学示范中心”开设了本科教学实验课37门,实验项目168项,其中引入科研成果32项,每年承担了120000人学时的实验教学任务。所以中心需要一款“实验预约系统”来完成大量实验教学任务的管理。系统中的开放实验预约申请大部分是由学生提交的,所以存在大量的非法申请,系统需要对实验申请进行分类过滤以减轻实验管理员的工作量。本文研究的重点是设计“园艺教学示范中心实验预约系统”,并实现其非法实验申请的智能识别及分类,将不符合要求的非法实验申请过滤掉,减轻人工判别的工作量。对于非法实验申请训练样本少,且大部分为未标注样本;本研究通过关键词来扩充训练样本,进而达到只通过关键字和未标注样本即可构建非法申请智能识别及分类系统的目标;本文的主要的研究内容与成果:(1)获取已标注训练样本针对已标注训练样本缺乏的情况,本研究采用TF/IDF权重模型计算关键词与文档间的余弦相似度来抽取关键词相关文档,将其标为正例样本;然后通过迭代的方式从未标注样本中抽取更多的正例样本,并对其进行去除停用词和特征选择等预处理操作,将文档信息转化为计算机能够处理的结构化数据。(2)构建文本分类器针对大量的正例及未标注样本,本研究运用One-Class SVM及PU(Positive Unlableled)学习中的Spy-SVM、Roc-SVM及NB-SVM分类算法构造分类器,并对其分类性能进行对比,实验表明PU学习算法的1F值均在85%以上,明显优于One-Class SVM分类算法,故最后选择PU学习算法中表现最优的Spy-SVM算法构造分类器。(3)实现“园艺实验教学示范中心实验预约系统”针对训练得到的分类器,本研究将其运用于现实场景中,采用B/S架构开发一款“园艺教学示范中心实验预约系统”,针对不同的用户实现不同的功能,并利用分类器实现对非法的实验申请的过滤。
【关键词】:
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.52;S126
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前5条
1 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
2 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
3 李渝勤,孙丽华;基于规则的自动分类在文本分类中的应用[J];中文信息学报;2004年04期
4 奉国和;;文本分类性能评价研究[J];情报杂志;2011年08期
5 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
中国硕士学位论文全文数据库 前1条
1 胡颢继;基于数据分布和文本相似性的PU分类技术[D];华东师范大学;2014年
【共引文献】
中国期刊全文数据库 前10条
1 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
2 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
3 蔡华利;刘鲁;王理;;突发事件Web新闻多层次自动分类方法[J];北京工业大学学报;2011年06期
4 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
5 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
6 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
7 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
8 柯丽;王明文;何世柱;黎佳;罗远胜;;基于频率共现熵的跨语言网页自动分类研究[J];江西师范大学学报(自然科学版);2011年03期
9 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
10 曾立梅;;基于文本数据挖掘的硕士论文分类技术[J];重庆邮电大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
2 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 卢娇丽;郑家恒;;基于粗糙集的文本分类方法研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 孙丽华;肖诗斌;施水才;;基于向量空间模型的规则分类技术[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 王辉;左万利;;利用质心向量构建增量式分类器(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 孙雄勇;罗霄;;中图分类法体系下的自动分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 ;Text Feature Automatic Selection Algorithm Based on Cloud Model[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
8 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
9 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
10 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
5 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
6 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
7 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
8 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
9 钟冠群;聚类算法在B2M电子商务中的应用研究[D];长春工业大学;2010年
10 王雅菲;文本分类中特征降维方法的研究[D];长春工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张启蕊;董守斌;张凌;;文本分类的性能评估指标[J];广西师范大学学报(自然科学版);2007年02期
2 王小华,张国煊,陆蓓;文本分类系统的评价因素探讨[J];杭州电子工业学院学报;2002年03期
3 岳喜才,伍晓宇,郑崇勋,叶大田;一种大类别数分类的神经网络方法[J];计算机研究与发展;2000年03期
4 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
5 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
6 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
7 宋枫溪,高林;文本分类器性能评估指标[J];计算机工程;2004年13期
8 刁倩,王永成,张惠惠,何骥;文本自动分类中的词权重与分类算法[J];中文信息学报;2000年03期
9 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
10 李辉,史忠植,许卓群;运用文本领域的常识改善基于支撑向量机的文本分类器性能[J];中文信息学报;2002年02期
中国博士学位论文全文数据库 前1条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
【相似文献】
中国期刊全文数据库 前3条
1 杨晓勤;周伟;;基于遥感的塞罕坝机械林场树种分类研究[J];河北林果研究;2008年01期
2 黄儒乐;吴江;韩宁;;林火烟雾图像自动识别中的模式分类器选择[J];北京林业大学学报;2012年01期
3 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
4 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年
8 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 李兰春;王双成;杜瑞杰;;认知结构评估的动态贝叶斯网络分类器方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
10 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
中国重要报纸全文数据库 前1条
1 黄明;[N];广东科技报;2000年
中国博士学位论文全文数据库 前10条
1 张非;对抗逃避攻击的防守策略研究[D];华南理工大学;2015年
2 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年
3 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
4 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
5 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
6 陈燚;面向分类器的子空间分析方法研究与应用[D];南京理工大学;2012年
7 张屹;基于分类器的测前仿真诊断法研究[D];北京交通大学;2008年
8 孔志周;多分类器系统中信息融合方法研究[D];中南大学;2011年
9 罗大鹏;基于在线学习理论的目标检测技术[D];华中科技大学;2010年
10 毛莎莎;基于贪婪优化和投影变换的集成分类器算法研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 赵春(王莹);多分类器融合系统的研究[D];福建师范大学;2008年
2 杨程;对抗环境下的垃圾短信息过滤[D];华南理工大学;2015年
3 张富元;基于多分类器决策融合的故障检测与诊断及GUI平台设计[D];浙江大学;2015年
4 张智超;基于多分类器组合的塔河林区森林类型信息提取技术[D];东北林业大学;2015年
5 王震;基于OLI影像的多分类器组合方法研究[D];中国地质大学(北京);2015年
6 涂盛慧;基于关键词的非法实验申请分类系统的设计与实现[D];西北农林科技大学;2015年
7 钱秀娟;贝叶斯网络在老年人普适健康监测服务中的应用研究[D];南京理工大学;2015年
8 杨胜智;SAR图像自动分类器构造与算法的研究[D];天津理工大学;2015年
9 李莎莎;多级分类器构建及在不平衡数据的应用研究[D];闽南师范大学;2015年
10 张小龙;基于级联支持向量机融合多特征的人脸检测[D];上海交通大学;2015年
本文关键词:基于XML的异构产品信息网上交换、检索技术研究与应用,由笔耕文化传播整理发布。
,本文编号:174478
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/174478.html