从数据挖掘偏差到文献计量偏差
本文选题:数据挖掘 切入点:数据挖掘偏差 出处:《情报理论与实践》2017年10期 论文类型:期刊论文
【摘要】:[目的/意义]互联网的迅猛发展使得信息量增速不断加快。作为从海量数据中发现有用知识的有力手段,数据挖掘成为近年的研究热点。然而在数据挖掘过程中,输出值和真实值之间往往存在着一定的差距,即数据挖掘偏差。[方法/过程]通过相关研究综述了数据挖掘偏差的概念、研究进展以及发展方向,并以数据挖掘的基本步骤类比文献计量的基本步骤,进而提出文献计量偏差的基本概念。从文献来源选取、文献数据预处理、文献计量方法选取和计量结果解读4个角度重点论述了文献计量偏差的主要表现方式和解决办法。[结果/结论]文章旨在呼吁未来该领域的相关研究关注文献计量偏差及其带来的负向影响,并期望相关研究能够通过科学方法避免文献计量偏差,从而得到更为准确和可靠的结论。
[Abstract]:[objective / significance] the rapid development of the Internet has accelerated the increase in the amount of information. As a powerful means of finding useful knowledge from massive data, data mining has become a research hotspot in recent years. However, in the process of data mining, There is often a gap between the output value and the real value, that is, the deviation of data mining. [method / process] the concept, research progress and development direction of data mining deviation are summarized through relevant studies. The basic steps of data mining are analogous to the basic steps of document metrology, and then the basic concept of document metrology deviation is put forward. This paper mainly discusses the main manifestation and solution of bibliometric deviation from four angles: the selection of bibliometric methods and the interpretation of measurement results. [results / conclusions] this paper aims to appeal to the related research in this field to pay attention to bibliometrics in the future. Volume deviation and its negative effects, It is expected that the relevant research can avoid the metrological deviation through scientific methods, and thus obtain more accurate and reliable conclusions.
【作者单位】: 北京大学信息管理系;印第安纳大学信息学与计算机学院;
【分类号】:G353.1
【相似文献】
相关期刊论文 前10条
1 杜慧敏;;基于数据挖掘的读者流量与图书馆开放能力分析系统[J];情报探索;2009年07期
2 高岩,胡静涛;Web数据挖掘的原理、方法及用途[J];现代图书情报技术;2002年03期
3 何少卓;浅谈数据挖掘及其在图书馆的应用[J];图书馆界;2004年03期
4 黄兰,孙林山,罗日辉;数据挖掘及其在图书馆管理中的应用[J];华南热带农业大学学报;2005年02期
5 陈亚东;;数据挖掘在图书馆中的应用[J];中华医学图书情报杂志;2006年05期
6 张莉萍;;论图书馆个性化服务中用户信息的Web数据挖掘[J];情报资料工作;2007年02期
7 张静;;论数据挖掘与数据挖掘服务的实现[J];湘潭师范学院学报(社会科学版);2008年01期
8 王玉珍;;Web数据挖掘在数字图书馆个性化服务中的应用[J];自动化与仪器仪表;2010年03期
9 玛依拉·再努拉;;浅谈数据挖掘在图书馆个性化服务中的应用[J];西域图书馆论坛;2010年04期
10 周文云;;数据挖掘在数字图书馆个性化服务中的研究与应用[J];电脑知识与技术;2011年28期
相关会议论文 前1条
1 雷三丫;刘庆敖;;数据挖掘在数字化图书馆个性化服务中的应用[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
相关硕士学位论文 前10条
1 黄超;基于数据挖掘的移动图书馆研究与实现[D];西安建筑科技大学;2015年
2 韩雅丽;中医药数据挖掘文献的信息计量学评价研究[D];山东中医药大学;2016年
3 姜云龙;基于数据挖掘的高校大学生读者阅读趋向研究[D];东北师范大学;2016年
4 李雅静;基于数据挖掘的图书馆长尾服务研究[D];北京交通大学;2017年
5 肖健;数据挖掘在农业数字图书馆中的应用[D];湖南农业大学;2012年
6 曹美琴;数据挖掘在图书馆个性化服务中的应用研究[D];西北大学;2008年
7 杨华;数据挖掘在高校图书馆个性化推荐中的应用研究[D];电子科技大学;2009年
8 刘昶;基于数据挖掘的J高校图书馆图书管理创新研究[D];南昌大学;2014年
9 王斌;数据挖掘在高校图书馆服务中的应用研究[D];西安理工大学;2010年
10 刘莹;基于XML的数字图书馆应用模型设计[D];山东大学;2007年
,本文编号:1624647
本文链接:https://www.wllwen.com/tushudanganlunwen/1624647.html