面向学术社区的专家推荐模型
本文选题:学术专家推荐 切入点:H参数 出处:《智能系统学报》2012年04期
【摘要】:在学术社区提供的服务中,对于研究者特别是青年研究者来说,专家推荐是一个必不可少的部分.目前提供学术信息服务的所有中文搜索引擎中,都没有提供用户感兴趣的专家推荐服务.因此,提出了一个面向学术社区的专家推荐模型.使用改进的H参数对学者n年时间内发表的论文成果进行量化,获取专家列表;使用概率主题模型从作者发表的论文中提取主题向量作为学者的研究方向;根据矩阵奇异值分解对构建的词项-文档矩阵进行降维,进而生成词项-词项关系矩阵,实现对搜索关键词的查询扩展,并计算查询扩展向量与作者主题向量之间的相关度,根据相关度大小进行排序推荐.在SCHOLAT(学者网)数据集上验证模型的有效性,实验结果表明提出的模型达到了预期的效果.
[Abstract]:Expert recommendation is an essential part of the services provided by the academic community, especially young researchers. Therefore, an expert recommendation model for the academic community is proposed. The improved H parameter is used to quantify the results of the papers published within a period of n years, and the list of experts is obtained. Using the probabilistic topic model to extract the topic vector from the paper published by the author as the research direction, according to the singular value decomposition of the matrix to reduce the dimension of the word-document matrix, and then to generate the word-to-word relationship matrix. The query expansion of search keywords is realized, and the correlation between the query expansion vector and the author topic vector is calculated, and the ranking recommendation is made according to the correlation degree. The validity of the model is verified on the Scholarnet data set. The experimental results show that the proposed model achieves the desired results.
【作者单位】: 肇庆学院计算机学院;华南师范大学计算机学院;广东技术师范学院计算机学院;
【基金】:国家自然科学基金资助项目(60970044) 广东省科技计划资助项目(2010B010600031) 广州市科技计划资助项目(2010J-D00511)
【分类号】:TP393.09
【参考文献】
相关期刊论文 前2条
1 陈国华;汤庸;彭泽武;李建国;;基于学术社区的学术搜索引擎设计[J];计算机科学;2011年08期
2 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期
【共引文献】
相关期刊论文 前10条
1 李杨;朱安;魏凤娟;张志转;朱永和;;国内外h指数研究综述[J];安徽农业科学;2010年26期
2 师丽娟;左文革;袁永翠;;基于科学计量的我国农业院校国际科技合作研究——以中国农业大学为例[J];安徽农业科学;2011年21期
3 叶鹰;;h指数和类h指数的机理分析与实证研究导引[J];大学图书馆学报;2007年05期
4 阳小兰;钱程;;基于主题提取和记忆模型的新闻推荐系统设计[J];计算机与数字工程;2012年06期
5 Ronald ROUSSEAU;Leo EGGHE;;The R-and AR-indices:Complementing the h-index[J];Chinese Science Bulletin;2007年06期
6 王梅英;刘雪立;;h-指数及其扩展指标的研究进展[J];中国科技期刊研究;2011年02期
7 金碧辉;Rousseau Ronald;;R指数、AR指数:h指数功能扩展的补充指标[J];科学观察;2007年03期
8 安静;夏旭;李海燕;王瑜;赵镇;;类h指数:K指数的修正机理及实证分析[J];科技管理研究;2009年06期
9 师丽娟;左文革;;中国农业大学国际科技合作论文的科学计量研究[J];科技管理研究;2011年18期
10 李建国;毛承洁;刘晓;梁茹;;学术信息服务平台的研究与设计[J];华南师范大学学报(自然科学版);2012年03期
相关博士学位论文 前3条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 张冬梅;文本情感分类及观点摘要关键问题研究[D];山东大学;2012年
3 贾冬梅;基于数据挖掘方法的聂莉芳教授治疗慢性肾小球肾炎经验研究[D];中国中医科学院;2012年
相关硕士学位论文 前10条
1 刘红艳;基于hLDA层次主题模型的多文档摘要技术研究[D];北京邮电大学;2012年
2 陈红光;h指数及其适用性研究[D];中国人民解放军军事医学科学院;2008年
3 周英博;国际基础科学领域核心期刊h指数分析研究[D];浙江大学;2008年
4 丁楠;基于CSSCI的文科学者h指数实证研究[D];浙江大学;2008年
5 次仁拉珍;专利权人h指数研究[D];浙江大学;2009年
6 安静;医学期刊质量评价指标体系的研究[D];南方医科大学;2009年
7 罗臻;基于影响因子与h系列指数的期刊学术水平综合评价指标研究[D];中南大学;2009年
8 张芳;AH指数的可行性及其应用研究[D];郑州大学;2009年
9 乐思诗;动态专利计量分析及企业竞争力测度研究[D];浙江大学;2010年
10 王华华;h指数的多因素分析模型及其在不同数据库中的差异分析及改进[D];上海交通大学;2009年
【二级参考文献】
相关期刊论文 前4条
1 李文波;孙乐;张大鲲;;基于Labeled-LDA模型的文本分类新算法[J];计算机学报;2008年04期
2 曹娟;张勇东;李锦涛;唐胜;;一种基于密度的自适应最优LDA模型选择方法[J];计算机学报;2008年10期
3 石晶;胡明;石鑫;戴国忠;;基于LDA模型的文本分割[J];计算机学报;2008年10期
4 寇月;申德荣;李冬;聂铁铮;;一种基于语义及统计分析的Deep Web实体识别机制[J];软件学报;2008年02期
【相似文献】
相关期刊论文 前10条
1 王明文,聂建云;基于Dempster-Shafer理论的查询扩展模型(英文)[J];江西师范大学学报(自然科学版);2005年03期
2 章旭;石进;谢立;;基于相似性叙词表的模糊集合模型[J];计算机科学;2008年09期
3 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
4 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
5 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
6 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
7 王会进,陈超华,李清;基于动态知识库搜索引擎的技术[J];暨南大学学报;2004年01期
8 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
9 陈晓金;王兵;;信息检索扩展技术研究[J];图书情报工作;2008年12期
10 李小琳;陆汝占;;基于日志挖掘的查询概念图扩展[J];计算机应用与软件;2010年03期
相关会议论文 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
8 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
相关重要报纸文章 前6条
1 上海 王光临;用nosplash参数加快软件启动速度[N];电脑报;2003年
2 牟缜;再绽活力[N];中国电脑教育报;2003年
3 痛饮狂歌;让Google成为站点的搜索引擎[N];电脑报;2004年
4 安徽 朱宝贵;学用CSS的滤镜功能[N];电脑报;2001年
5 糯米;用命令更改文件关联[N];电脑报;2003年
6 彭遂莅 李涛;成都公开保险营销员信用信息[N];中国保险报;2011年
相关博士学位论文 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
4 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
6 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
7 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
8 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
9 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
10 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
相关硕士学位论文 前10条
1 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
2 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
3 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
4 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
5 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
6 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
7 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
8 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
9 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
,本文编号:1691406
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1691406.html