当前位置:主页 > 管理论文 > 科研管理论文 >

科学数据用户相关性线索、标准及相互关系研究

发布时间:2020-11-04 04:58
   科学数据资源是科研工作的基础。随着科技的发展,数据资源存储规模日益扩大,但科学数据获取的低效率现象却日益凸显。造成这种现象的直接原因是没有高效的检索工具,究其根本是对用户判定科学数据相关性的原理和机制理解不足,特别是更为基础的科学数据相关性判断线索、标准等概念的理解及线索与标准之间关系研究薄弱。本文以科学数据为目标信息类型,开展科学数据用户相关性线索、标准及其二者之间关系实证研究。旨在加深对科学数据用户相关性判断机制的理解,探索人脑对数据线索和标准的信息加工过程,以便于计算机模拟实现,为开发智能搜索引擎提供算法和理论基础。本研究综合采用文献调研、事前事后访谈、出声思考,扎根理论和问卷调查的方法开展研究。主要研究内容为:(1)科学数据用户相关性线索研究。通过对被试相关性判断行为的观察和解释,探索用户长时记忆中的科学数据特征与相关性判断之间的关系,建立线索集合。(2)科学数据用户相关性标准研究。通过比较研究探究不同目标信息类型差异与相关性标准差异的关系,进一步理解并修正科学数据相关性标准的内涵与分类,建立科学数据相关性标准集合。(3)科学数据用户相关性线索与标准之间关系。在识别线索集与标准集的基础上,对被试相关性判断过程中的刺激-反应行为进行观察研究,关注被试对自己思维过程的解释,在数据统计分析的基础上建立科学数据用户相关性线索与标准之间关系。论文的主要研究成果为:(1)科学数据用户主要根据5类线索要素进行相关性判断:内容线索、质量线索、数据获取线索、外部评价线索和专业线索。当用户专业领域发生改变时,专业线索变化较大。(2)用户相关性判断标准要素12个,可归为2类:数据本体性和数据可用性。数据本体性是用户对数据物理实体的评价标准,包括主题性、可获得性、规范性、质量、权威性、时效性和新颖性。数据可用性是用户评价数据是否能够使用的标准,包括专业需求、可理解性、可用性、便利性和全面性。用户进行相关性判断时,本体性和可用性同时发挥作用,但如果不能获取足够信息或想进行快速查找,只对数据本体性进行判断也能满足需求。单独进行数据可用性评价无法得到数据是否相关的判定结果。(3)线索与标准之间关系可以分为3类:一重刺激多重反应、多重刺激一重反应和多重刺激多重反应。回归分析发现线索与标准存在正向相关关系,但现有线索对标准回归系数较低。数据相关性判断中,用户需要对多个线索综合评估。现有的线索体系基本能够满足用户的检索需求,但距离达到用户精准化、个性化要求还有一定的差距。数据线索的优化设计,专业线索的合理使用,有利于提高数据检索效率。论文的创新点体现在:(1)论文将相关性判据概念切分为相关性线索和标准两个概念,并用信息加工理论中刺激-反应关系对线索与标准间关系进行解释,加深人们对科学数据用户相关性判定机制的理解。(2)提出了影响科学数据用户相关性判断的线索与标准要素集合,并建立了线索与标准之间关系。本研究为科学数据检索系统的分析、设计以及系统性能的优化提升提供用户了层面的理论依据。
【学位单位】:中国农业科学院
【学位级别】:博士
【学位年份】:2017
【中图分类】:G301
【部分图文】:

用户相关,线索,事物


中国农业科学院博士学位论文 第三章 概念模型及实验方案确定的事物做评估判断时,通过对该事物表现出的、决策者已知的线索体系对该事物进行判断。线索体系如同一面透镜,个人通过透镜观察未知事物。未知事物的特征信息只有经过透镜的过滤进入个人的认知框架才能被识别。消费者价值理常用于经济学领域,用于分析产品价值对消费者行为的影响。消费价值是消费者所能感知到的利得与其在获取产品或服务中所付出的成本进行权衡后对产品或服务效用的整体评价。将消费者价值理论引入相关性判断模型,用来解释用户通过标准对感知线索进行测量后的决策机制。用户会根据自身可能从数据中获得的价值与自身付出的努力进行权衡后作出整体的相关性评价,相关、部分相关或不相关。在相关性判断模型中,科学数据是要获取的远端对象,由系统提供的信息表达项表示。这些数据表达项就成为用户所能感知线索,线索加工后激活用户头脑中存储的标准,这些标准指导用户对数据的价值的测量,用户对数据价值的感知成为判定数据相关性的基础。因为这一过程,假设数据具有某些价值才会被判断相关。本文的研究是基于线索与标准展开的,数据价值假设将在以后的研究中进行验证。

年龄构成,科学数据


科学数据用户相关性判断时,受到线索刺激并调用相关标准的过程,是一个典型的刺激-反应过程。使用问卷调查的方法,对这一过程进行研究,通过定量分析反映科学数据用户相关性判断中线索与标准及其二者之间关系。6.1 科学数据用户认知背景6.1.1 用户基本情况调查问卷以科学数据用户为目标群体,问卷填写人员由 共享杯 参赛者、中国农业科学院、中国科学院、天津大学等单位学生、工作人员构成。将不合格问卷(问卷填写时间少于 500 秒)删除,剩余问卷 544 份。其中男生 269 名,女生 275 名,男女比例接近 1:1。年龄构成如图 6.1所示,23~26 岁用户最多。受教育程度如图 6.2 所示,以硕士生为主,百分比为 77.39%,其次为博士生,百分比为 18.2%,本科生和博士后也有参与。问卷填写人员如图 6.3 所示,以学生为主,百分比为 85.29%,科研助理/讲师、副研究员/副教授、研究员/教授也有参与。问卷填写人员 90%都参与了科研项目,具体构成如图 6.4 所示。科学数据检索比例如图 6.5 所示,只有 8.09%的用户科学数据检索比例在 20%以下,其余人员科学数据检索比例均在 20%以上,问卷填写者查询数据的经历丰富。本次问卷填写人员范围广,调查全面,符合数据要求。

受教育程度,科学数据


科学数据用户相关性判断时,受到线索刺激并调用相关标准的过程,是一个典型的刺激-反应过程。使用问卷调查的方法,对这一过程进行研究,通过定量分析反映科学数据用户相关性判断中线索与标准及其二者之间关系。6.1 科学数据用户认知背景6.1.1 用户基本情况调查问卷以科学数据用户为目标群体,问卷填写人员由 共享杯 参赛者、中国农业科学院、中国科学院、天津大学等单位学生、工作人员构成。将不合格问卷(问卷填写时间少于 500 秒)删除,剩余问卷 544 份。其中男生 269 名,女生 275 名,男女比例接近 1:1。年龄构成如图 6.1所示,23~26 岁用户最多。受教育程度如图 6.2 所示,以硕士生为主,百分比为 77.39%,其次为博士生,百分比为 18.2%,本科生和博士后也有参与。问卷填写人员如图 6.3 所示,以学生为主,百分比为 85.29%,科研助理/讲师、副研究员/副教授、研究员/教授也有参与。问卷填写人员 90%都参与了科研项目,具体构成如图 6.4 所示。科学数据检索比例如图 6.5 所示,只有 8.09%的用户科学数据检索比例在 20%以下,其余人员科学数据检索比例均在 20%以上,问卷填写者查询数据的经历丰富。本次问卷填写人员范围广,调查全面,符合数据要求。
【相似文献】

相关期刊论文 前10条

1 ;2004年无线数据用户将达13亿[J];移动通信;2000年06期

2 ;我国数据用户今年将再增150万[J];电子出版;1999年05期

3 高飞;石蕾;王健;张贵兰;刘建平;;科学数据用户相关性指标研究[J];数字图书馆论坛;2017年11期

4 于泽涵;;移动网络中的大数据用户行为研究与分析[J];信息通信;2014年01期

5 ;新闻出版大数据用户行为跟踪与分析实验室成立[J];新闻世界;2017年04期

6 ;我国VSAT小站用户数过两万[J];广播与电视技术;2001年05期

7 高飞;石蕾;王健;张贵兰;刘建平;;农业科学数据用户相关性线索与标准之间关系探索[J];图书情报工作;2017年15期

8 田卉;;基于三网融合的大数据用户研究[J];现代视听;2012年11期

9 鲍宁海;张治中;雒江涛;;数据用户在GPRS与TD-SCDMA系统间的切换过程[J];重庆邮电大学学报(自然科学版);2007年01期

10 尼松涛;;面向数据用户实时控制的3G分组域建设策略探讨[J];中国新通信;2007年03期


相关博士学位论文 前2条

1 高飞;科学数据用户相关性线索、标准及相互关系研究[D];中国农业科学院;2017年

2 李凌;云计算服务中数据安全的若干问题研究[D];中国科学技术大学;2013年


相关硕士学位论文 前4条

1 范昱;HSUPA系统中的准入控制算法研究[D];东南大学;2006年

2 孙月兰;WLAN网络优化方法研究[D];吉林大学;2014年

3 彭朝勇;基于下一代互联网的地震观测网络模型研究[D];中国地震局地震预测研究所;2007年

4 张扬;北电PCF扩容门限的研究[D];南京邮电大学;2011年



本文编号:2869650

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2869650.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a22d8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com