基于支持向量机的医学期刊文章自动分类研究
本文关键词:基于支持向量机的医学期刊文章自动分类研究,,由笔耕文化传播整理发布。
【摘要】:基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值4个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。
【作者单位】: 南京大学信息管理系信息技术开发研究所;方正集团技术研发部;
【关键词】: 支持向量机 期刊 自动分类
【基金】:教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”的研究成果之一,项目批准号:08JJD870225
【分类号】:G354
【正文快照】: 随着万方、中国知网和维普等数据资源的急速增加,如何使用文本挖掘的方法和技术从这些海量数据中获取或挖掘知识不仅具备了可能性而且变得日益迫切。文本挖掘又称为文本数据挖掘或文本知识发现[1],指从文本集中获取隐含的、以前未知的、潜在有用的知识,如关联知识、时间序列
【参考文献】
中国期刊全文数据库 前3条
1 翟林,刘亚军;支持向量机的中文文本分类研究[J];计算机与数字工程;2005年03期
2 马金娜;田大钢;;基于SVM的中文文本自动分类研究[J];计算机与现代化;2006年08期
3 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
2 刘万春,罗双华,朱玉文,谢世斌;基于聚类分析和支持向量机的布匹瑕疵分类方法[J];北京理工大学学报;2004年08期
3 李宁;孙铭;王磊;刘兴龙;童隆正;;基于支持向量机的肝纤维化CT图像分类[J];北京生物医学工程;2007年01期
4 徐红敏;杨天行;;基于支持向量机分类算法的湖泊水质评价研究[J];吉林大学学报(地球科学版);2006年04期
5 盛守照,王道波,黄向华,王志胜;新型前向神经网络设计方法在软测量中的应用[J];传感器技术;2004年04期
6 谭超;基于支持向量机的软测量技术及其应用[J];传感器技术;2005年08期
7 字正华;石庚辰;;基于自适应EIH模型的激波脉冲识别[J];测试技术学报;2006年01期
8 曾嵘,刘建成,蒋新华;一种基于支持向量机的增量学习算法[J];铁道科学与工程学报;2005年01期
9 沈明华;肖立;王飞行;;支持向量机在模式识别中的应用[J];电讯技术;2006年04期
10 王振雷,李鸿儒,顾树生;神经网络过学习问题的统计学分析及改进算法[J];东北大学学报(自然科学版);2001年04期
中国重要会议论文全文数据库 前10条
1 邵信光;杨慧中;石晨曦;;ε不敏感支持向量回归在化工数据建模中的应用[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
2 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
3 汤俊;肖健华;吴今培;;基于支持向量回归的商业银行信贷风险评估[A];中国运筹学会第八届学术交流会论文集[C];2006年
4 侯伟真;潘美芹;;高斯核支持向量机最优模型参数选择搜索算法[A];中国运筹学会第八届学术交流会论文集[C];2006年
5 李志明;孔令富;;用于回归估计的支持向量机[A];广西计算机学会2005年学术年会论文集[C];2005年
6 薛翠红;于明;;用于感兴趣区域图像编码的人脸特征的检测[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
7 王薇;李晓辉;;CDMA系统中基于SVM的多用户检测算法[A];第十九届电工理论学术年会论文集[C];2007年
8 曹健;林涛;;电力系统谐波/间谐波高精度测量方法的比较研究[A];中南七省(区)电力系统专业委员会第二十二届联合学术年会论文集[C];2007年
9 徐沧;鲍玉昆;张金隆;丛国栋;;基于SVM的项目评标决策模型[A];第10届计算机模拟与信息技术会议论文集[C];2005年
10 姚智胜;邵春福;;基于v-支持向量分类机的交通事件检测方法研究[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(上册)[C];2005年
中国博士学位论文全文数据库 前10条
1 曾雨辰;转向重复压裂技术研究与应用[D];西南石油学院;2005年
2 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
3 王亮;城市快速路交通流采集与控制相关问题研究[D];天津大学;2005年
4 陈世哲;微电子产品视觉检测中关键技术研究[D];哈尔滨工业大学;2006年
5 张文君;滑坡灾害遥感动态特征监测及其预测分析研究[D];西南交通大学;2007年
6 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
7 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
8 张持健;商空间下模糊系统与模糊控制的问题求解[D];安徽大学;2005年
9 张丽平;粒子群优化算法的理论及实践[D];浙江大学;2005年
10 盛守照;前向神经网络学习问题研究及其在转台控制中的应用[D];南京航空航天大学;2005年
中国硕士学位论文全文数据库 前10条
1 宋彦坡;数据挖掘技术及其在铜转炉吹炼过程优化中的应用[D];中南大学;2005年
2 杨东侯;建筑工程投资估算方法研究[D];中南大学;2005年
3 施健;工业过程统计建模与监控方法研究[D];浙江大学;2006年
4 管军;支持向量机在水质监测信息融合与评价中的应用研究[D];河海大学;2006年
5 刘冠晓;基于多种计算智能方法的辅助决策系统的研究与应用[D];云南师范大学;2006年
6 沈佳;混沌算法在短期电力负荷预测中的应用[D];河北农业大学;2007年
7 蔡巍伟;基于PCA的人脸识别算法研究[D];浙江工业大学;2005年
8 路志强;建筑施工安全评价体系及预警研究[D];河北农业大学;2005年
9 姜微;化学计量学在降水化学数据分析及建模中的应用[D];四川大学;2005年
10 李鹏;独立分量分析与支持向量机在人脸识别技术中的应用研究[D];青岛科技大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 方辉;王倩;;支持向量机的算法研究[J];长春师范学院学报;2007年06期
2 业宁;王迪;窦立君;;信息熵与支持向量的关系[J];广西师范大学学报(自然科学版);2006年04期
3 湛燕,陈昊,袁方,王丽娟;文本挖掘研究进展[J];河北大学学报(自然科学版);2003年02期
4 孙建涛 ,郭崇慧 ,陆玉昌 ,石纯一;多项式核支持向量机文本分类器泛化性能分析[J];计算机研究与发展;2004年08期
5 刘向东,陈兆乾;一种快速支持向量机分类算法的研究[J];计算机研究与发展;2004年08期
6 刘志刚,李德仁,秦前清,史文中;支持向量机在多类分类问题中的推广[J];计算机工程与应用;2004年07期
7 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
8 都云琪,肖诗斌;基于支持向量机的中文文本自动分类研究[J];计算机工程;2002年11期
9 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
10 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
中国博士学位论文全文数据库 前1条
1 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 赵天昀;;多分类SVM在企业竞争情报自动分类中的应用[J];现代情报;2008年10期
2 林丽莹;;期刊数据库收费比较[J];科教文汇(下旬刊);2009年05期
3 肖丽丹;;提高西部高校外文期刊数据库利用率的对策——EBSCO外文期刊数据库分析[J];凯里学院学报;2009年05期
4 华薇娜,许美琪;美国过刊数据库概况及对我国开发过刊数据库的思考[J];中国图书馆学报;2004年04期
5 刘云;;浅谈外文数据库的使用要领[J];科技情报开发与经济;2009年27期
6 周潇洒;;新版《中国生物医学文献服务系统(SinoMed)》的特点及存在的问题[J];现代情报;2010年06期
7 徐佳宁;;中外学术期刊数据库特点及其差异[J];图书馆杂志;2011年01期
8 薛凤;;建立期刊数据库的几点浅见[J];贵图学刊;2000年03期
9 卫世平;为什么期刊数据库建设不完善呢?[J];新世纪图书馆;2004年04期
10 林琳;图书馆期刊数据库的建设及维护[J];科技情报开发与经济;2005年16期
中国重要会议论文全文数据库 前5条
1 曹玉娟;牛振东;彭学平;江鹏;;一个基于特征向量的近似网页去重算法[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
2 李波;邱锡鹏;吴立德;;使用语法分析和统计方法构建问答系统的答案排序模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 胡竹萍;龚雪;王曙明;于松波;杨爱丽;;《暖通空调》杂志文献统计数据对分析受众群体需求的启示及思考[A];第11届中国科技期刊青年编辑学术研讨会暨科技期刊立体化出版模式论坛论文集[C];2011年
4 刘兵;徐华;钱龙华;周国栋;;依存信息在蛋白质关系抽取中的作用[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 章成志;;基于集成学习的自动标引方法研究[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
中国重要报纸全文数据库 前9条
1 王君君;路桥图书馆向市民免费开放数据库[N];台州日报;2010年
2 记者 庄初阳 通讯员 曹美娟;我市网络图书馆点击量突破500万次[N];丽水日报;2009年
3 本报记者 黄海华;“看”见更广阔的世界[N];解放日报;2011年
4 本报记者 程晓龙;“服务型”数字图书馆有何作为?[N];中国新闻出版报;2003年
5 国家科技图书文献中心供稿;共享为核心 创新促发展[N];科技日报;2010年
6 宋萌;苏州图书馆观前分馆开馆[N];苏州日报;2009年
7 本报记者 包建永;一个图书馆馆长六年办的六件事[N];台州日报;2010年
8 记者 韩士德;我购进200余种LWW外文医学期刊回溯数据[N];科技日报;2010年
9 本报驻柏林记者 柴野;图书数字化 爱上多媒体[N];光明日报;2011年
中国博士学位论文全文数据库 前1条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
中国硕士学位论文全文数据库 前9条
1 张超林;文本分类技术在数字图书馆中的应用与研究[D];首都师范大学;2007年
2 甘新玲;循证医学网络文献的分类方法及其应用研究[D];大连海事大学;2008年
3 郦芳;基于机器学习的生物多样性中文文档的信息抽取研究[D];华东师范大学;2011年
4 侯娜;基于条件随机场的元数据自动提取技术研究[D];燕山大学;2009年
5 刘欣;基于阅读价值的科技文献排序方法研究[D];大连理工大学;2010年
6 景向永;电子资源使用统计标准化研究[D];大连理工大学;2010年
7 王晖;高校图书馆电子期刊用户服务研究[D];郑州大学;2011年
8 苏光兵;天津市科技查新管理研究[D];天津大学;2011年
9 张涛;开放获取期刊资源长期保存的体系与实现研究[D];南京农业大学;2009年
本文关键词:基于支持向量机的医学期刊文章自动分类研究,由笔耕文化传播整理发布。
本文编号:404634
本文链接:https://www.wllwen.com/wenshubaike/arkj/404634.html