基于文本数据挖掘的硕士论文分类技术
本文关键词:基于文本数据挖掘的硕士论文分类技术
【摘要】:针对硕士论文的摘要和关键词等数据进行数据挖掘,实现硕士论文自动分类。为此收集了2000余个相关数据,在对所研究的数据对象特点进行分析的基础上,确定了分类算法,详细分析了支持向量机分类方法;对收集的研究数据进行了仿真实验,并与其他常用分类器进行比较。实验表明,基于支持向量机的分类方法比其他常用分类器具有较高的准确率。对实验结果中得到的知识进行了分析,得出一系列可供科学研究者和管理者参考的结论。
【作者单位】: 重庆邮电大学计算机学院;
【关键词】: 数据挖掘 文本分类 支持向量机 研究方向
【基金】:重庆市教委基金(KJ080510)~~
【分类号】:TP391.1
【正文快照】: 0引言随着计算机技术突飞猛进的发展,研究领域的方向日益增多,各研究方向之间联系日益紧密,新技术层出不穷,造就了新的研究方向大量涌现。硕士论文的摘要和关键词是一篇论文的主题及主要内容的概括,对其进行分析基本就能确定其研究方向。本文通过对大量计算机专业硕士论文的
【参考文献】
中国期刊全文数据库 前8条
1 周玉敏;;基于Rough集的数据挖掘在教学评价中的应用[J];重庆邮电大学学报(自然科学版);2008年05期
2 王越;桂袁义;;基于关联分析的数据挖掘在体检CRM中的应用[J];重庆理工大学学报(自然科学版);2010年03期
3 何峰;;一种基于粗糙集理论的文本分类方法[J];自动化与信息工程;2006年03期
4 樊兴华;孙茂松;;一种高性能的两类中文文本分类方法[J];计算机学报;2006年01期
5 刘洋;;中文文本分类中特征选择方法的比较研究[J];科技信息;2007年03期
6 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
7 郝晓燕;常晓明;;中文文本分类研究[J];太原理工大学学报;2006年06期
8 龙军;王易;刘高嵩;;基于二叉树多类支持向量机的文本分类研究[J];计算机系统应用;2009年05期
【共引文献】
中国期刊全文数据库 前10条
1 刘秋生;吴小倩;;基于数据挖掘的固定资产投资效益评价[J];安徽农业科学;2011年11期
2 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
3 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
4 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
5 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
6 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
7 柯丽;王明文;何世柱;黎佳;罗远胜;;基于频率共现熵的跨语言网页自动分类研究[J];江西师范大学学报(自然科学版);2011年03期
8 赵军;胡栓柱;樊兴华;;一种新的词语相似度计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
9 王柯柯;崔贯勋;倪伟;苟光磊;;基于单元的快速的大数据集离群数据挖掘算法[J];重庆邮电大学学报(自然科学版);2010年05期
10 陈可华;;文本自动分类新探究[J];赤峰学院学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前10条
1 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
3 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 王辉;左万利;;利用质心向量构建增量式分类器(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 赵纪元;罗霄;;面向中图法的学术文献自动分类研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 ;Text Feature Automatic Selection Algorithm Based on Cloud Model[A];第五届全国信息检索学术会议论文集[C];2009年
9 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 朱振方;刘培玉;;求解中文文本信息过滤的自适应遗传算法及收敛性分析[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
8 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
9 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
10 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
4 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
5 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年
6 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
7 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
8 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年
9 李琼琼;网络文本自动分类器的设计与实现[D];电子科技大学;2010年
10 赵素娟;基于互联网的人物简历问答系统的研究与设计[D];东北财经大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱秋云;;一种关联规则挖掘筛选算法设计[J];重庆工学院学报(自然科学版);2008年06期
2 王仲君;程涤;;基于改进遗传算法的多维关联规则挖掘方法及应用[J];重庆工学院学报(自然科学版);2009年04期
3 陶志,许宝栋,汪定伟;基于决策属性支持度的知识约简方法[J];东北大学学报;2002年11期
4 安利平,仝凌云;粗糙集理论中一种属性离散化算法[J];河北工业大学学报;2002年03期
5 周水庚,关佶红,胡运发,周傲英;一个无需词典支持和切词处理的中文文档分类系统[J];计算机研究与发展;2001年07期
6 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
7 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
8 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
9 颜雪松,蔡之华;一种基于Apriori的高效关联规则挖掘算法的研究[J];计算机工程与应用;2002年10期
10 毛秉毅;一种新的关联规则发现算法及应用研究[J];计算机工程与应用;2002年22期
中国重要会议论文全文数据库 前1条
1 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
【相似文献】
中国期刊全文数据库 前10条
1 曾立梅;;基于文本数据挖掘的硕士论文分类技术[J];重庆邮电大学学报(自然科学版);2010年05期
2 赖敏;;支持向量机及其应用研究[J];成功(教育);2010年03期
3 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
4 张莹;李凡生;范富旺;;基于数据挖掘的支持向量机库存预测模型研究[J];中国市场;2009年09期
5 尚文倩;董红斌;;基于数据挖掘的传媒信息安全系统[J];北京交通大学学报;2009年05期
6 罗娜;;数据挖掘中的新方法——支持向量机[J];软件导刊;2008年10期
7 蒋波涛;赵福宇;;核工程中的数据挖掘[J];核动力工程;2009年04期
8 王强;贾银山;;支持向量机及其在邮件过滤中的应用[J];微处理机;2010年03期
9 卢祖友;桑永胜;;基于球向量机的中文文本分类[J];计算机工程与科学;2008年12期
10 郝海涛;;基于向量机的文本分类中词典结构研究[J];福建电脑;2009年03期
中国重要会议论文全文数据库 前10条
1 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
2 朱慕华;朱靖波;陈文亮;;面向支持向量机的降维方法比较分析[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
4 韩泉东;胡小平;李舟军;李京浩;;决策树和支持向量机在液体火箭发动机故障诊断中的应用[A];2006年全国理论计算机科学学术年会论文集[C];2006年
5 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
6 赵丽;杨利彬;;基于支持向量机的供应商合作伙伴选择[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
7 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
8 曲文龙;吴春尧;杨炳儒;张海军;;基于小波和支持向量机的多尺度时间序列预测[A];2005中国控制与决策学术年会论文集(下)[C];2005年
9 栾江;唐常杰;黄晓冬;阴小雄;廖勇;;一种增量式支持向量机文本分类模型[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 张英;基于支持向量机的过程工业数据挖掘技术研究[D];浙江大学;2005年
2 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
3 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
4 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
5 郑广勇;哺乳动物转录因子及其靶基因的挖掘分析[D];复旦大学;2009年
6 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
7 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年
8 田江;基于支持向量机的孤立点检测方法研究[D];大连理工大学;2009年
9 李智勇;电力系统运行信息的数据挖掘研究[D];浙江大学;2009年
10 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 周振龙;支持向量机理论在文本分类中的应用研究[D];兰州理工大学;2007年
2 王生新;基于支持向量机的文本分类研究[D];哈尔滨工程大学;2008年
3 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
4 张滨;中文文档分类技术研究[D];武汉大学;2004年
5 崔鹏;一种基于支持向量机的直推式WEB挖掘[D];大连海事大学;2006年
6 牛洪琦;空间数据挖掘分类算法的研究[D];大连海事大学;2006年
7 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
8 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
9 杜圣东;基于多类支持向量机的文本分类研究[D];重庆大学;2007年
10 李强;基于支持向量机的文本分类方法研究[D];西安科技大学;2009年
,本文编号:1102930
本文链接:https://www.wllwen.com/wenshubaike/kjzx/1102930.html