科研社交网络中的导师推荐研究
本文关键词:科研社交网络中的导师推荐研究
更多相关文章: 导师推荐 科研分析框架 个性匹配度 科研社交网络 推荐系统
【摘要】:由于信息技术的迅猛发展,人们在生活中可以轻易地获取海量的动态网络数据,但这也使得他们很难快速地寻找到能够解决棘手任务的最有用信息。在高等教育领域,导师选择是学生开启他/她的研究生学术生涯之前的首要任务。现有的相关研究表明,选择一个合适自己的导师对于这个学生未来的学术生涯是极其重要的。随着技术的改进,人们可以通过搜索引擎的方式来寻找自己需要的信息,但是,这种方式的有用性是基于用户很明确地知道自己所要搜索的信息的关键词这个假设前提的。在学生选择导师的情境中,大部分学生由于经验不足,是不确定应该要搜索怎样的信息的,是对信息没有明确方向感的。他们在做选择的过程中,主要面临着两大挑战:信息不完全和信息不对称。首先,传统的选择方式都是在信息不完全的情况下进行的,这样的选择结果可能并不是最优的选择:其次,学生通常都是利用搜索引擎找到潜在导师所在学校的个人主页,进而参考相关信息,但是,这种信息不对称的方式使得学生只能获取部分的信息,这些信息也并没有及时地更新,在这样的情况下会导致学生盲目的选择,产生不匹配现象,进而会影响学生的学术成就。因此,本研究旨在科研社交网络的平台基础上,从推荐的角度提出一套智能方法来解决这个具体问题,主动地为有需要的学生推荐符合其特征的潜在导师,起到辅助决策的作用。在已有的关于导师选择的研究中,主要提出的方法可以归结为三类:第一种是基于主题相关的方法,第二种是基于候选人质量的方法,第三种是融合了前两种的混合方法。Alarfaj, Kruschwitz et al. (2012)提出了一种基于信息检索技术的解决方案,利用从导师发表的论文成果中抽取的关键词来表征这个导师的学术特征。学生可以通过系统检索到感兴趣的导师,方法中主要通过计算学生所敲入的检索关键词和导师的特征关键词的相似度来进行结果排序。Mosharraf和Taghiyareh (2012)利用优化的传统方法,将学生导师选择的问题映射成为一个优化问题,进而,作者基于遗传算法提出了适用于解决学生导师选择这一问题的方法。后来,作者设计了一个名为ADAM的系统,它可以在一个学校范围内为学生提供潜在导师选择的服务。Ray和Marakas在他们的学术研究中,首先进行了问卷调查学生在考虑导师选择时比较注重的因素。进而,提出了一种基于AHP的方法,帮助学生在有限的集合里选择自己感兴趣的毕业论文指导教师。Momeni, Samimi et al. (2011)为了避免AHP方法中涉及到的辅助决策的指标必须互相独立的假设前提,提出了基于ANP的解决方案。通过让学生自己来比较指标之间的重要性的过程,最终确定在方案中的每一个指标的权重。Datta, Beriha et al. (2009)在MCDM方法的基础上提出了一个策略方案,考虑了待选择的导师所发表的论文、获得的项目以及导师信誉等,为了评估候选人的质量,作者采用了从灰色关联分析改编而来的COPRAS-G方法。通过文献综述可以发现,在已有的基于主题相关的方法中,采用的是直接的关键词字面匹配的方法,这会导致“匹配失衡”现象,本文采用考虑关键词的语义相似度的相关度分析方法。在已有的方法中,一些方法只局限于考虑待选择人选的单方面衡量指标,另一些方法融合考虑了关键词相关度和候选人质量度。但是现有的方法存在一定的不足,并没有一个体系的方法来全面考虑这个特定问题,比如忽略了两个个体之间个性匹配的重要性,研究表明性格的匹配会影响两个人的有效沟通和合作,学生导师关系并不是一段短暂的一次性合作机会,而是长期的至少三四年的相处关系,所以在本研究所提出的系统性方法中将会考虑这一点。其次,本文还加入了两个个体之间连接度的考虑,分别从机构层次连接度和个体层次连接度进行衡量。本文提出了一种个性化的导师智能推荐方法,用于在科研社交网络上为有需求的学生推荐适合自己个人特征的导师。总体上,本文提出的方法包含了两个主要阶段,分别为过滤阶段和排序阶段。首先,在过滤阶段中,利用相关度分析在初始阶段筛选排除研究领域等学术信息方面不相关的候选人。相关度分析主要是测量给定的学生和潜在的导师之间在学术信息方面的匹配度,这里的学术信息包括了研究兴趣、领域专长、以及知识背景等。本文利用基于学科监督的语义相关度匹配的方法来计算相关度分值。第二,在排序阶段中,由初始阶段产生的初步候选集合将在这一阶段基于科研分析框架来进行进一步的连接度分析和质量度分析,以及性格匹配度分析。连接度分析结合了个体层次的社交连接度分析和机构层次的合作连接度分析。质量度分析是以导师候选人为中心的,从他/她已发表的论文和已受资助的项目方面对导师进行产出度的数量和质量的衡量。除了传统的质量分析指标外,本文的质量度分析也融入了候选人在科研社交网络上的社交关注度衡量。此外,已有研究表明性格匹配程度会影响两个个体之间的有效沟通,所以,本文在排序阶段中,通过个性匹配的过程对候选人进行又一维度的分析。本文借鉴心理学方面已有研究成果中所提出的浓缩版的个性分析量表,通过问卷来获取学生和导师在各个性格维度的相关数据,进而根据距离公式(Deza,2009)来进行个性匹配度分析。最后,为了产生最后的候选人排序列表,需要融合分别从四个维度得到的不同分值。本研究采用基于分值的融合方法,即Comb-MNZ算法。针对每个给定的学生,通过这个过滤排序过程都会得到一系列的待推荐候选人。通常,在科研社交网络上,系统会给每个特定用户推荐排序前几名的科研人员。在具体算法上,在相关度分析方面,本文主要融合了两方面的信息。一方面,根据教育部学科分类体系标准,形成学科分类树,采用分类树方法(Li和Shiu,2002)计算学生所在的专业与导师所在的学院的匹配度。另一方面,基于每个人的科研相关信息,分别对学生和导师进行特征提取和建模,其中,导师的科研信息包括自填的研究领域、发表的论文信息(主要为题目、关键词和摘要信息)和教过的课程信息,同时,学生的科研信息包括自填的研究兴趣、发表或者感兴趣的论文信息以及通过的课程信息。通过特征提取过程,利用Quattrone, Capra等学者的研究成果,通过自然语言处理技术建立一个关键词-文本的矩阵,其中每个元素代表的是关键词在这个特定文本的词频,进而,利用迭代算法构建出关键词矩阵,在这个矩阵中每个元素代表了两两关键词之间的相似度。通过这样的过程来进行有学科监督下的语义相关度分析,从而在初始阶段就过滤掉不相关的候选人,产生初始候选集合。在连接度分析方面,主要考虑的是给定的学生和潜在待推荐的导师之间在个体层次和机构层次的连接值。首先,基于科研社交网络上的好友关系网络挖掘学生和导师之间的个体层次的社交连接度。一方面,考虑两个个体之间的共同好友数量;另一方面,挖掘连接这两个个体的最短路径,通过文中所给的综合考虑这两方面的算法计算个体层次的社交连接度分值。另外,基于论文成果的机构间合作网络,挖掘该学生所在的学校和导师所在学校的机构层次的合作连接度,通过计算两个机构之间合作的成果数量占两机构分别的成果数量总和的比例,来表示两个个体在机构层次的连接度。最后,线性融合这两方面的标准化分值来代表连接度维度最后的分值。在质量度分析方面,测量了待推荐导师的科研产出度。传统上,科研产出度一般考虑科研人员所发表的文章的数量和质量,以及受资助项目的数量和等级方面的信息。在论文方面,通过JCR的期刊分区情况,将论文期刊分为了四个区域等级,系统记录科研人员发表的论文所在的不同分区信息,通过AHP方法对不同区域等级赋予了相应的权重,最后得到候选人在论文方面的得分。在项目方面,通过以往研究,将项目分为了国家级、教育部、省级以及市级四个类别,同样通过AHP方法对不同类别赋予了相应的权重,最后得出该候选人在项目方面的分值。本文,在这两个传统指标的基础上,补充考虑了科研人员在科研社交网络中的社交关注度,通过挖掘科研社交网络中用户的相关社交活动,主要涉及了与所发表的论文以及所资助的项目相关的社交行为,比如在科研社交网络中用户的赞、分享、评论以及将感兴趣科研对象收藏起来的社交行为数量。在个性匹配分析方面,本文借鉴了心理学领域学者的研究成果,IPIP量表(International Personality Item Pool)是最典型的用于测量个性的量表(Goldberg,1999)。出于实际应用中的便利性考虑,Donnellan, Oswald et al. (2006)基于IPIP提出了一个简化的量表,称为Mini-IPIP,由20个简短的题项组成的。总共分为五个维度(extraversion, agreeableness, conscientiousness, neuroticism,和imagination)。因此,每个用户的个性方面都可以被表征为一个五维的数值向量。接着,通过距离公式计算两个个体之间的个性匹配程度。最后,在得到了四个维度的不同分值之后,本文采用一种基于分值的融合算法,即Comb-MNZ方法,来集成四个维度的分值,得到最终的推荐列表。每一个特定的学生都将得到排名前几名的个性化导师推荐服务。为了验证所提出的导师智能推荐方法,本研究进行了一个基于科研之友注册用户的在线调查实验。首先,根据在现有文献中已有的导师选择方法,定义了三种基准方法。对已有的导师选择方法进行归类后发现,现有的方法主要是基于关键词相关度的方法,基于候选人员的质量度的方法,或者混合前两者的方法。因此,我们设立了三种用于比较推荐结果的基准方法:第一种是基于相关度的推荐方法;第二种是基于相关度和传统质量度的推荐方法;第三种是基于三维科研分析框架的推荐方法,即融合了相关度分析、质量度分析和连接度分析。本研究的验证过程主要包括了两个阶段:信息收集阶段和推荐满意度反馈阶段。首先,在信息收集阶段,学生和导师的大部分科研信息都能够在科研之友上进行收集,比如用户的主页、“成果”文件夹、“文献”文件夹、智能简历、以及好友关系网等;同时,系统通过邮件发放问卷的方式补充收集了用户在性格方面的信息。其次,在推荐满意度阶段,基于特定用户的个性化特征,不同方法分别对用户进行智能导师推荐。每一种推荐方法(本文提出的方法和三种基准方法)均给用户推荐排名前三的候选人。每一个学生将收到最多12个推荐的导师(不排除重复的情况),进而将这12个推荐结果打乱顺序发送给这个学生,让其用1到7的分值区间对所推荐的人员进行满意度打分,分值越高表明这个学生用户对某个特定推荐结果越满意。在将反馈信息收集回来之后,我们会将结果分别对应到不同的推荐方法中去,进行下一步的满意度的结果比较。在本研究中,主要通过平均打分指标(AR指标)和标准化折算累计增益值指标(NDCG指标)来比较本文所提出的方法的推荐结果和三种不同基准方法所推荐的结果。结果显示,无论是基于AR指标还是NDCG指标,本文所提出的智能推荐方法都优于其他三种基准方法,它所推荐的结果能够得到参与实验的用户更高的满意度评价。基于AR指标,本研究提出的智能推荐方法比其他三种基准方法中得到最高用户满意度的方法(即基于科研分析框架的推荐方法)提升了15.21%的用户满意度评价:根据NDCG指标,本研究提出的推荐方法比最好的基准方法提升了10.74%的用户满意度。综上所述,本研究在学术贡献方面,提出了一种智能导师推荐方法,它融合了相关度分析、连接度分析、质量度分析、以及个性匹配度分析,有助于为有决策需求的学生提供导师选择支持。细化而言,在相关度方面,运用了基于学科的关键词语义分析方法来测量学生和导师的相似度。在连接度方面,融合了机构层次的合作连接度和个体层次的社交连接度。在质量度方面,除了传统的衡量指标外,补充加入了人员在科研社交网络上的社交关注度。另外,本研究强调并考虑了以往研究中被忽视的两个个体的性格匹配度在一段合作交流关系过程中的重要性。在实际贡献方面,本文提出的智能导师推荐方法已在科研之友平台上进行应用,注册用户如有需求,可以在相关应用中得到这一项个性化推荐服务。此外,以往研究表明导师被视为一种动态知识来源,学生接近导师更是获取知识的一种有效渠道,所以智能导师推荐服务也提升了学生进行社交学习的潜在机会。最后,本研究也存在一定的不足,同时基于现有研究的不足方面,探讨一些未来的潜在学术研究机会。首先,在验证本研究所提出的推荐方法的有效性方面,目前采用的是较为主观的用户满意度的方式,但是如果在未来深入研究中,能够进行纵向研究来跟踪评价推荐结果,采用真实的导师学生选择成功率来验证的话,结果将会更客观且更有说服力。其次,本文提出的方法是应用于具体的导师选择的教育领域场景中,方法的普适性并未得到检验,在将来的研究中,可以将所提出的方法应用于不同的类似推荐场景中,并对其进行不断修正,验证所提出的推荐方法的普适性。第三,在最后进行四个维度推荐排序列表融合的方式上,本文只采用了Comb-MNZ集成算法,在未来的研究中,可以尝试运用更多不同的融合方法,比较不同集成算法得出的推荐结果的差异,并得出一般集成规律,在具体场景下应采用的具体集成方法提出相关的建议。
【关键词】:导师推荐 科研分析框架 个性匹配度 科研社交网络 推荐系统
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:G252.7;G643
【目录】:
- 摘要5-10
- ABSTRACT10-14
- CHAPTER 1. INTRODUCTION14-24
- 1.1 Background14-17
- 1.2 Research Objectives17-18
- 1.3 Research Methodology18-21
- 1.4 Thesis Structure21-24
- CHAPTER 2. LITERATURE REVIEW24-40
- 2.1 Supervisor Selection24-31
- 2.1.1 Significance of Suitable Selection24-25
- 2.1.2 Current Methods for Supervisor Selection25-31
- 2.1.2.1 Relevance-quality Based Consideration26-29
- 2.1.2.2 Subjective Characteristic Based Consideration29-31
- 2.2 Academic Recommendation Systems31-36
- 2.2.1 Characteristics of a Researcher's Profile32
- 2.2.2 Expert Recommendation32-35
- 2.2.3 Collaborator Recommendation35-36
- 2.3 Summary and Research Gaps36-40
- CHAPTER 3. PROPOSED APPROACH40-62
- 3.1 Overview of the Proposed Approach41-42
- 3.2 RAF-supported Dimensions42-57
- 3.2.1 Relevance Dimension42-49
- 3.2.1.1 Respective Profiling of Supervisors and Students43
- 3.2.1.2 Discipline-supervised Semantic Relevance Analysis43-49
- 3.2.2 Connectivity Dimension49-53
- 3.2.2.1 Individual-level Social Connection49-50
- 3.2.2.2 Institutional-level Collaboration Connection50-53
- 3.2.3 Quality Dimension53-57
- 3.2.3.1 Published Papers53-55
- 3.2.3.2 Funded Projects55
- 3.2.3.3 Social Popularity55-57
- 3.3 Personality Matching Focused Dimension57-59
- 3.4 Aggregation Process for Final Ranking59-62
- CHAPTER 4.EXPERIMENTAL EVALUATIONS62-74
- 4.1 Experimental Design62-64
- 4.2 Baseline Methods64-65
- 4.3 Evaluation Metrics65-67
- 4.4 Results and Discussion67-71
- 4.5 System Implementation71-74
- CHAPTER 5.CONCLUSIONS AND FUTURE WORKS74-78
- 5.1 Summary of the Research Work74-75
- 5.2 Contributions of the Research Study75-76
- 5.3 Limitations and Future Works76-78
- REFERENCES78-86
- APPENDIX86-88
- ACKNOWLEDGEMENTS88-90
- 在读期间发表的学术论文与取得的其他研究成果90
【相似文献】
中国期刊全文数据库 前10条
1 吕寒;沈艳;;社交网络视角下创意产业价值链发展研究[J];学术评论;2012年Z1期
2 陈星汶;;发现社交网络的招聘魅力[J];人力资源管理;2013年04期
3 修春民;;德国限制社交网络在中小学校的使用[J];世界教育信息;2013年18期
4 张希平;;关于图书馆与社交网络的设想[J];普洱学院学报;2013年06期
5 周国健;刘璐;邵攸悠;;高校校园社交网络系统实现设计研究[J];电子技术与软件工程;2014年10期
6 武会;;浅谈社交网络对高校大学生的影响及若干建议[J];科技致富向导;2013年05期
7 钱炜;;人体的“社交网络”[J];教师博览;2013年04期
8 代安楠;;大学生校园社交网络的使用与建设[J];青年文学家;2013年24期
9 余剑来;;社交网络化的发展方向[J];世界科学;2011年01期
10 詹馥榕;;浅议俄罗斯网络发展现状及其社交网络语汇特征[J];西北民族大学学报(哲学社会科学版);2012年02期
中国重要会议论文全文数据库 前10条
1 赵云龙;李艳兵;;社交网络用户的人格预测与关系强度研究[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年
2 宫广宇;李开军;;对社交网络中信息传播的分析和思考——以人人网为例[A];首届华中地区新闻与传播学科研究生学术论坛获奖论文[C];2010年
3 杨子鹏;乔丽娟;王梦思;杨雪迎;孟子冰;张禹;;社交网络与大学生焦虑缓解[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 毕雪梅;;体育虚拟社区中的体育社交网络解析[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年
5 杜p,
本文编号:846520
本文链接:https://www.wllwen.com/jiaoyulunwen/yjsjy/846520.html