油田信息搜索引擎个性化排序方法研究
本文选题:个性化排序 切入点:用户兴趣模型 出处:《东北石油大学》2013年硕士论文 论文类型:学位论文
【摘要】:相对互联网搜索引擎,企业搜索引擎用户进行搜索的目的性更强,对搜索结果排序的期望值更高,对同一检索请求希望根据用户的职业背景、兴趣爱好等得到个性化的检索结果。因此,构建一种个性化的排序方法是当前油田领域信息搜索引擎最迫切的需求。 本文研究了个性化服务及搜索引擎排序的相关理论和技术,对油田领域多类型检索结果排序需求进行分析,提出了基于用户兴趣模型的个性化综合排序方法。 本文的主要研究内容如下: 1.面向个性化排序的油田信息搜索引擎架构的研究。从油田搜索引擎的工作原理入手,研究了搜索引擎个性化处理方面的技术,提出了面向用户兴趣进行个性化排序的油田信息搜索引擎的体系架构。 2.研究并建立了油田搜索引擎用户的用户兴趣模型。采用用户主动提交兴趣信息和系统自动提取用户搜索历史与浏览行为信息相结合的方法获取用户兴趣信息,并基于改进的TF-IDF算法计算关键词权重,建立了用户兴趣向量空间模型;考虑了用户对搜索结果反馈度的问题,阐述了基于用户浏览行为和内容动态更新模型的方法和流程。 3.提出了基于用户兴趣模型的查询优化方法。提出了根据兴趣模型中用户历史查询和浏览行为计算用户兴趣度,,并结合扩展用词在结果文档中权重因素合理选择扩展用词对初始查询进行优化的方法,使得用户查询更加全面和准确。 4.为油田信息搜索引擎设计了个性化综合排序方法。研究了通用搜索引擎排序算法,针对它们的缺点问题进行改进,设计了一种基于用户兴趣模型的排序算法;然后分析了油田企业领域多数据类型检索结果的排序需求,为油田信息搜索引擎提出了将数据表结果优先排序,其它文档结果根据用户兴趣模型计算相关度后再进行排序的个性化综合排序方法。 最后综合以上研究,阐述了面向个性化排序的油田信息搜索系统的设计和实现,以此验证了本研究能有效地提高油田企业搜索引擎查准率及满足用户的个性化检索需求,具有很大的现实意义和实用价值。
[Abstract]:Compared with the Internet search engine, enterprise search engine users have a stronger purpose of searching, and have higher expectations of ranking search results. For the same search request, they hope that according to the user's professional background, Therefore, constructing a personalized sorting method is the most urgent need of the oil field information search engine. In this paper, the relevant theories and technologies of personalized service and search engine sorting are studied, and the requirements of multi-type search results ranking in oil field are analyzed, and a personalized comprehensive sorting method based on user interest model is proposed. The main contents of this paper are as follows:. 1. The research on the structure of the oilfield information search engine oriented to the individualized sort. From the working principle of the oil field search engine, this paper studies the technology of the personalized processing of the search engine. The architecture of oilfield information search engine for personalized ranking of user interests is proposed. 2. The user interest model of the oil field search engine user is studied and established. The user's interest information is obtained by the combination of user's active submission of interest information and automatic extraction of user's search history and browsing behavior information. Based on the improved TF-IDF algorithm to calculate the keyword weight, the user interest vector space model is established, and the problem of user feedback to search results is considered, and the method and flow of dynamic updating model based on user browsing behavior and content are expounded. 3. A query optimization method based on user interest model is proposed, and the user interest degree is calculated according to user history query and browsing behavior in interest model. Combining the weight factor of extended words in the result document, the method of optimizing the initial query is chosen reasonably, which makes the user query more comprehensive and accurate. 4. The personalized comprehensive sorting method is designed for oilfield information search engine. The general search engine sorting algorithm is studied, and a sort algorithm based on user interest model is designed to solve their shortcomings. Then it analyzes the sorting requirements of multiple data types retrieval results in the field of oilfield enterprises, and puts forward the priority ranking of data table results for the oilfield information search engine. The personalized comprehensive sorting method based on the user interest model is used to calculate the relevance of other document results and then sort them. Finally, based on the above research, the design and implementation of the oilfield information search system oriented to individualized sorting are expounded, which verifies that the research can effectively improve the precision rate of the oil field enterprise search engine and meet the personalized retrieval needs of the users. It has great practical significance and practical value.
【学位授予单位】:东北石油大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 董妍汝;;中文分词技术在搜索引擎中的应用[J];办公自动化;2010年04期
2 王涛;徐洁;;搜索引擎排序技术研究[J];电脑知识与技术;2009年05期
3 林乐然;陈德龙;;基于云计算的分布式企业搜索引擎研究[J];电脑知识与技术;2009年33期
4 郭亚军;;个性化数字信息服务模式研究[J];情报理论与实践;2011年07期
5 孙丽,陈通宝,乔晓东;网上中文检索工具的比较研究[J];情报学报;1999年03期
6 卢增祥,public.bta.net.cn,关宏超,李衍达;利用Bookmark服务进行网络信息过滤[J];软件学报;2000年04期
7 刘景义;张晖;赵伟涛;雷颖华;王学军;;中国石油A1A2系统数据质量管理体系建设实践[J];信息技术与信息化;2011年03期
8 曹羽中;曹勇刚;金茂忠;刘超;;支持智能中文分词的互联网搜索引擎的构建[J];计算机工程与设计;2006年23期
9 申艳光;王敏;范永健;;面向隐私保护的个性化搜索结果排序方法研究[J];数学的实践与认识;2011年19期
10 马文峰;;数字图书馆个性化信息服务的探索[J];图书馆杂志;2003年05期
相关博士学位论文 前1条
1 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
相关硕士学位论文 前9条
1 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
2 冯子威;用户兴趣建模的研究[D];哈尔滨工业大学;2010年
3 蒋萍;基于用户兴趣挖掘的个性化模型研究与设计[D];苏州大学;2005年
4 杨献峰;搜索引擎个性化检索技术的研究[D];中国石油大学;2007年
5 苏雪峰;隐交互式个性化搜索引擎研究[D];太原理工大学;2007年
6 孙建光;面向数字油田的信息资源规划研究[D];东北财经大学;2007年
7 杨光伟;基于Lucene的个性化搜索引擎的研究与实现[D];内蒙古大学;2009年
8 杨诏钧;搜索引擎个性化查询扩展技术的研究与应用[D];国防科学技术大学;2010年
9 彭成晖;基于联邦模式的油田信息搜索引擎构建方法研究[D];东北石油大学;2012年
本文编号:1563614
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1563614.html