半监督的网络科技信息分类模型
本文选题:网络科技信息 + 网络科技信息分类模型 ; 参考:《现代图书情报技术》2014年11期
【摘要】:【目的】开放的网络科技信息网页内容之间区分度较小,传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求。【方法】通过深入分析网络科技信息主题网页的内容和结构,利用开放本体等资源实现领域特征的学习,构建半监督的网络科技信息分类模型。【结果】实验结果表明提出的方法在网络科技信息分类实验中的精度、召回率和F1值分别达到0.9016、0.8756和0.8884,相比贝叶斯方法具有明显优势。【局限】该方法在应用到其他类别的网络科技信息分类时,仍然需要领域专家提供相关领域的核心种子特征。【结论】该方法可以满足网络科技信息深度加工的需求,实现有效的网络科技信息网页分类。
[Abstract]:[objective] Open web science and technology information web pages have a relatively small degree of differentiation, The traditional rule-based and statistical learning methods can not meet the specific application needs of the classification of web pages of network science and technology information. [methods] through in-depth analysis of the content and structure of the subject pages of network science and technology information, Using open ontology and other resources to realize domain feature learning, a semi-supervised classification model of network science and technology information is constructed. [results] the experimental results show the accuracy of the proposed method in the network science and technology information classification experiment. The recall rate and F1 value are 0.9016, 0.8756 and 0.8884, respectively, which have obvious advantages over Bayes method. [limitation] this method is applied to other types of network scientific and technological information classification. It is still necessary for domain experts to provide the core seed features of related fields. [conclusion] this method can meet the needs of the advanced processing of network science and technology information and realize the effective classification of web pages of network science and technology information.
【作者单位】: 中国科学院文献情报中心;
【基金】:中国科学院文献情报能力建设专项“网络科技信息自动监测系统二期建设”项目(项目编号:院1306) 国家“十二五”科技支撑计划课题“科技知识组织体系共享服务平台建设”(项目编号:2011BAH10B03)的研究成果之一
【分类号】:TP393.0
【参考文献】
相关期刊论文 前3条
1 刘云;王小黎;樊威;;国际科技资源监测与服务体系构建[J];科学学与科学技术管理;2012年08期
2 陈旭玲;楼佩煌;;改进层次聚类算法在文献分析中的应用[J];数值计算与计算机应用;2009年04期
3 刘勘;周丽红;陈媈;;基于关键词的科技文献聚类研究[J];图书情报工作;2012年04期
【共引文献】
相关期刊论文 前10条
1 王飞跃;;国防装备与系统的未来变革:从3D打印到平行军事体系[J];国防科技;2013年03期
2 张倩;;大数据在突发事件政府决策中的应用[J];东北农业大学学报(社会科学版);2013年06期
3 高晓云;;试论基于大数据环境下的技术创新管理方法[J];中国管理信息化;2015年01期
4 李小培;张洪伟;邹书蓉;;一种改进的人工鱼群聚类算法[J];成都信息工程学院学报;2014年05期
5 刘勘;周丽红;陈媈;;基于关键词的科技文献聚类研究[J];图书情报工作;2012年04期
6 龚光明;王薇;蒋艳辉;周双文;;基于领域本体的文本资料聚类算法改进研究[J];情报科学;2013年06期
7 王飞跃;;社会信号处理与分析的基本框架:从社会传感网络到计算辩证解析方法[J];中国科学:信息科学;2013年12期
8 王方;阮梅花;朱海刚;熊燕;缪有刚;;基于向量空间模型的科技文献自动分类研究[J];情报探索;2013年12期
9 钟辉新;张兴旺;黄晓斌;;面向大数据的企业竞争情报动态运行模式MDD:监控、发现、决策的互动[J];情报理论与实践;2014年03期
10 王翠波;吴金红;;大数据环境下技术竞争情报分析的挑战及其应对策略[J];情报杂志;2014年03期
相关会议论文 前1条
1 吴楠;王红蕾;;大数据背景下管理科学发展前沿动态[A];系统工程理论与应用——贵州省系统工程学会第五届学术年会论文集[C];2014年
相关博士学位论文 前2条
1 杜晖;基于耦合关系的学术信息资源深度聚合研究[D];武汉大学;2013年
2 张兰廷;大数据的社会价值与战略选择[D];中共中央党校;2014年
【二级参考文献】
相关期刊论文 前5条
1 许厚金;刘永炎;邓成玉;刘永山;;基于相似中心的k-cmeans文本聚类算法[J];计算机工程与设计;2010年08期
2 陈旭玲;楼佩煌;;改进层次聚类算法在文献分析中的应用[J];数值计算与计算机应用;2009年04期
3 徐建锁,王正欧;基于LSI和自组织神经网络的高效文本聚类方法[J];天津大学学报;2004年11期
4 楚存坤;李韬;;模糊聚类技术在文献自动分类系统中的应用[J];现代情报;2009年09期
5 马楠;官建成;;利用引文分析方法识别研究前沿的进展与展望[J];中国科技论坛;2006年04期
【相似文献】
相关期刊论文 前10条
1 吕凤英;关于网络信息分类的一点思考[J];天中学刊;2002年05期
2 张s,
本文编号:2003849
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2003849.html