基于海量搜索历史数据的用户兴趣模型
本文选题:向量空间模型 + TF-IDF ; 参考:《计算机应用》2014年S2期
【摘要】:针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型。该模型根据用户搜索的历史数据,结合向量空间模型(VSM)和TF-IDF算法,递归地回溯出用户兴趣权重列表。为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用Map Reduce分布式编程模型进行实现。实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50%,具有较好的可行性和可用性。
[Abstract]:To solve the problem of analyzing users' interest based on massive search history data in Internet search engine environment, an improved user interest model is proposed. Based on the historical data of user search and the combination of vector space model (VSM) and TF-IDF algorithm, the model recursively traces the list of user interest weights. In order to solve the problem of user interest change and time performance, the model introduces the time forgetting mechanism to update dynamically, and is implemented under Hadoop distributed system architecture using Map reduce distributed programming model. The experimental results show that the precision and recall rate of the improved user interest model can reach 50%, which has good feasibility and availability.
【作者单位】: 东华大学计算机科学与技术学院;
【基金】:东华大学励志计划项目(B201312)
【分类号】:TP391.3
【参考文献】
相关期刊论文 前5条
1 郝水龙;吴共庆;胡学钢;;基于层次向量空间模型的用户兴趣表示及更新[J];南京大学学报(自然科学版);2012年02期
2 宋艳娟;陈振标;;个性化检索系统中用户兴趣模型的研究[J];计算机与数字工程;2013年02期
3 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期
4 蒋萍,崔志明;智能搜索引擎中用户兴趣模型分析与研究[J];微电子学与计算机;2004年11期
5 刘忠宝;赵文娟;;个性化搜索引擎中用户兴趣模型的构建方法[J];计算机系统应用;2012年11期
【共引文献】
相关期刊论文 前10条
1 郭力军;朱群雄;;基于RSS数据源的用户兴趣模型改进及应用[J];北京化工大学学报(自然科学版);2011年01期
2 胡国忠;;对信息检索系统应用技术的数学表示模型的分析[J];长沙航空职业技术学院学报;2005年04期
3 徐麟军;吴飞;李伐;;学习资源个性化检索系统中用户兴趣建模研究[J];电脑知识与技术;2008年26期
4 范玉全;陈跃新;;基于本体的用户兴趣模型的更新方法[J];计算机光盘软件与应用;2013年07期
5 侯青;徐家喜;吉力;;基于Hadoop的校园教育资源管理系统[J];电脑知识与技术;2014年01期
6 吴飞;吴兵;申志斌;;新一代网络教学平台特征和技术难点的分析与探讨[J];开放教育研究;2009年01期
7 张坚;;Web挖掘个性化模型研究[J];计算机与信息技术;2006年Z1期
8 刘静;李华亮;;个性化搜索引擎中兴趣学习方法的研究[J];计算机时代;2009年11期
9 陈晨;李敏波;;基于本地插件的个性化搜索研究[J];计算机应用与软件;2011年05期
10 郭力军;;RSS个性化信息服务的用户兴趣模型实现与应用[J];计算机与现代化;2010年08期
相关会议论文 前2条
1 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年
2 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关博士学位论文 前3条
1 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
2 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
相关硕士学位论文 前10条
1 周志辉;基于用户兴趣模型的个性化搜索引擎研究与分析[D];江西理工大学;2010年
2 赵全东;农业智能问答系统中的用户偏好研究[D];河北农业大学;2011年
3 黄卫平;个性化搜索引擎的研究与实现[D];武汉理工大学;2011年
4 张艳;用户兴趣模型在RSS网络信息服务中的研究[D];南京航空航天大学;2011年
5 卢志翔;全文检索系统研究[D];广西大学;2011年
6 于宝福;个性化医疗信息推荐系统的研究与实现[D];浙江大学;2012年
7 蒋萍;基于用户兴趣挖掘的个性化模型研究与设计[D];苏州大学;2005年
8 霍长青;个性化元搜索引擎研究与设计[D];山东科技大学;2006年
9 魏芳;基于贝叶斯网络的用户兴趣发现[D];西安建筑科技大学;2007年
10 刘忠宝;个性化搜索引擎的研究与实现[D];北京工商大学;2007年
【二级参考文献】
相关期刊论文 前10条
1 刘永利;欧阳元新;闻佳;熊璋;;基于概念聚类的用户兴趣建模方法[J];北京航空航天大学学报;2010年02期
2 徐麟军;吴飞;李伐;;学习资源个性化检索系统中用户兴趣建模研究[J];电脑知识与技术;2008年26期
3 蒋,
本文编号:2083303
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2083303.html