基于用户偏好分析的个性化信息检索关键技术研究
本文关键词: 个性化信息检索 用户偏好 鼠标滑动 满意度 意图边界检测 社交网络 出处:《苏州大学》2016年硕士论文 论文类型:学位论文
【摘要】:个性化信息检索旨在根据用户不同的信息需求,结合主观价值倾向,给具有不同信息需求的用户返回符合其期望的检索结果。其核心内容在于分析不同用户的个性化特征,结合其自身价值倾向差异,建立个性化检索模型,从而更好的提升用户的检索体验。本文针对个性化信息检索中用户偏好分析任务开展了深入研究,文章的主要内容归纳为以下三个方面:基于“滑鼠行为”量化的检索满意度研究从用户信息检索行为特征入手,提出一种基于“滑鼠行为”能量消耗的满意度评价及量化模型。其中,“滑鼠行为”指用户在网页中的鼠标滑动轨迹以及点击等行为序列。首先,从用户端对信息检索质量评价的主观因素出发,引入“检索满意度”作为衡量信息检索质量的新特征;其次,通过计算用户“滑鼠”过程中的“能量消耗”,分析检索行为特征与用户满意度之间的关联性;最后,基于量化数据建立滑鼠的“能量消耗”对比模型,用于表征用户检索满意度的强弱。这一研究重点关注用户检索满意度的量化分析方法,为信息检索系统质量评价提供了一种新的特征。基于边界检测的查询意图切分技术研究通过分析用户连续查询日志,提出一种查询意图边界识别方法。用户完整查询意图中包含大量的检索习惯及个性化特征,识别查询意图发生改变或转移的临界位置,能够为从完整意图分析层面提取用户的个性化检索偏好提供有效的方法。首先,从大规模样本集中抽取并人工标注部分完整意图片段;其次,结合文本特征抽取方法构建自动化学习模型,包括分类及序列标注的方法,分别使用SVM和CRF模型;最后,通过开发及测试数据集优化学习算法,获得最优的意图切分性能。这一研究借助用户查询日志,通过自动化的意图片段切分技术,为抽取用户的个性化偏好特征提供研究基础和技术手段。用户社交媒体活动与信息检索关联性分析研究通过获取用户在一段时间内的网络活动内容,分析用户在不同时间段内进行信息检索与社交网络活动之间的关联性,建立基于个人文化背景及兴趣倾向的个性化检索模型,改善检索体验。首先,设计实验平台抓取用户在一段时间内的网络活动信息;其次,抽取其中社交网络内容及信息检索相关内容;最后,构建关联性分析模型,度量社交活动与检索行为之间的关联关系,以便利用社交网络信息构建个性化检索模型。这一工作侧重研究用户的文化背景及价值倾向对信息检索行为的影响,以便为利用社交网络信息构建个性化检索模型提供理论依据及研究基础。综上所述,本文针对个性化信息检索中用户偏好分析的任务,从三个方面开展相关工作,旨在为个性化信息检索中的用户偏好分析提供更加新颖、有效的研究思路及技术方法。
[Abstract]:The purpose of personalized information retrieval is to return the desired retrieval results to users with different information needs according to their different information needs and subjective value tendency. The core content of personalized information retrieval is to analyze the personalized characteristics of different users. According to the difference of their own value tendency, a personalized retrieval model is established so as to improve the retrieval experience of users. This paper has carried out a deep research on the task of user preference analysis in personalized information retrieval. The main contents of this paper are summarized as follows: the research of retrieval satisfaction based on "mouse behavior" quantification begins with the characteristics of user information retrieval behavior. This paper presents a satisfaction evaluation and quantification model based on "mouse behavior" energy consumption. Among them, "mouse behavior" refers to the user's mouse track and click behavior sequence in the web page. Starting from the subjective factors of the evaluation of information retrieval quality at the user side, this paper introduces "search satisfaction" as a new feature to measure the quality of information retrieval. By calculating the "energy consumption" of the user "mouse", the correlation between the retrieval behavior characteristics and the user satisfaction degree is analyzed. Finally, a comparative model of the "energy consumption" of the mouse is established based on the quantitative data. This research focuses on the quantitative analysis method of user search satisfaction. It provides a new feature for the quality evaluation of information retrieval system. The research on segmentation of query intention based on boundary detection is based on the analysis of users' continuous query logs. A method for identifying the boundary of query intention is proposed. The complete query intention contains a large number of retrieval habits and personalized features to identify the critical position where the query intention has changed or shifted. It can provide an effective method for extracting users' personalized retrieval preferences from the level of complete intention analysis. Firstly, part of the complete intention fragments are extracted from large scale sample sets and some complete intention fragments are annotated manually. Combining the text feature extraction method to construct the automated learning model, including classification and sequence tagging, using SVM and CRF model respectively. Finally, the learning algorithm is optimized by developing and testing the data set. To obtain optimal intent segmentation performance. This study uses automated intent fragment segmentation technology with the help of user query logs. In order to extract the personalized preference features of users, the research provides the research foundation and technical means. The relevance analysis of user social media activities and information retrieval through the acquisition of users in a period of time network activity content, This paper analyzes the relationship between users' information retrieval and social network activities in different time periods, establishes a personalized retrieval model based on personal cultural background and interest tendency, and improves the retrieval experience. The experiment platform is designed to capture the user's network activity information for a period of time. Secondly, the social network content and information retrieval are extracted. Finally, the relevance analysis model is constructed. The relationship between social activities and retrieval behaviors is measured in order to construct a personalized retrieval model using social network information. This work focuses on the impact of users' cultural background and value orientation on information retrieval behavior. In order to provide theoretical basis and research basis for constructing personalized retrieval model by using social network information. In summary, this paper, aiming at the task of user preference analysis in personalized information retrieval, carries out related work from three aspects. The purpose is to provide more novel and effective research ideas and technical methods for user preference analysis in personalized information retrieval.
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 李树青;;个性化信息检索技术综述[J];情报理论与实践;2009年05期
2 易明;操玉杰;毛进;;基于点击流的个性化信息检索研究[J];情报科学;2011年04期
3 杨林;;浅析个性化信息检索模型[J];兰台世界;2013年02期
4 杨涛;;个性化信息检索及其实现方式探析[J];图书情报论坛;2002年02期
5 陈小华;赵捧未;;基于关联规则的个性化信息检索系统研究[J];情报科学;2006年06期
6 郭新明;赵蔷;弋改珍;;基于相关反馈的个性化信息检索模型研究[J];咸阳师范学院学报;2008年06期
7 田晓珍;张敏;;基于元搜索引擎的个性化信息检索系统[J];科技情报开发与经济;2008年02期
8 朱晓斌;周源;;个性化信息检索在网络营销中的应用[J];科技信息(学术研究);2008年05期
9 徐险峰;;2001—2008年我国个性化信息检索研究综述[J];新世纪图书馆;2009年03期
10 张宁;赵德平;;基于领域本体的个性化信息检索研究与应用[J];科技传播;2010年12期
相关会议论文 前2条
1 邹博伟;张宇;范基礼;郑伟;刘挺;;基于改进的TextTiling方法的用户新兴趣发现的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
相关博士学位论文 前1条
1 王晓春;基于用户搜索历史的个性化信息检索研究[D];哈尔滨工业大学;2015年
相关硕士学位论文 前10条
1 王剑;基于用户偏好分析的个性化信息检索关键技术研究[D];苏州大学;2016年
2 刘宏;基于语义的个性化信息检索研究[D];华北电力大学(河北);2010年
3 余肖生;数字图书馆的个性化信息检索研究[D];华中师范大学;2004年
4 纪明奎;基于语义网的个性化信息检索模型研究[D];黑龙江大学;2007年
5 尹红丽;基于本体的个性化信息检索系统模型研究[D];山东大学;2006年
6 陈小华;数据挖掘技术在个性化信息检索系统中的应用研究[D];西安电子科技大学;2006年
7 万里;基于本体的个性化信息检索研究[D];兰州理工大学;2013年
8 林霞;个性化信息检索技术在勘探门户中的应用研究[D];西安石油大学;2011年
9 康杨杨;个性化信息检索中用户偏好分析技术研究[D];苏州大学;2014年
10 王威;基于上下文的个性化信息检索技术研究[D];厦门大学;2009年
,本文编号:1508636
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1508636.html