搜索引擎及其个性化
本文选题:搜索引擎 + 个性化 ; 参考:《复旦大学》2012年硕士论文
【摘要】:随着网络技术的飞速发展和电脑设备的普及,人们的生活、工作已经越来越不能离开网络,网络上的信息也是呈指数级的增多,为了帮助用户从海量的信息中到找到他们所需要的那部分信息,搜索引擎技术应运而生,并迅速成为人们不可或缺的信息查找工具,在短时间内风靡全球。搜索引擎技术的使用在很大程度上解决了人们查找信息的困难,但它也存在许多缺陷:搜索引擎反馈给用户的结果越来越多,而且对所有的用户一视同仁,没有针对性,其中的很多信息是用户并不需要的,这样的反馈结果使得用户耗费大量时间都可能找不到自己需要的信息,因此改善用户的查询体验以便于用户从海量的网络信息资源中得到自己所需的内容,必然会成为搜索引擎技术发展的一个重要方向,个性化搜索引擎的正是基于这一思想提出的。 本文围绕个性化搜索引擎的应用展开,从分析搜索引擎用户的角度入手,介绍了搜索引擎技术的发展,个性化搜索引擎技术的原理,研究的现状和存在的问题,并提出了个人认为的预期发展,对现有的应用提出了一些改进方法,研究工作具有一定的理论性和实用性。本文的研究重点为以下几个方面: 1.用户信息的收集和分析。要想达到“个性化搜索”的目的,必须能通过用户上网留下的痕迹来收集到用户的有效信息,并利用这些信息分析出用户的兴趣、上网习惯等,以用于与搜索结果匹配。 2.如何对现有的搜索引擎的进行改进以达到个性化搜索结果的目的。目前使用的主流搜索引擎如百度、谷歌等虽然有其不足之处,但从技术的实现等方面去考虑,个性化的过程不会马上能够实现,必然是在目前的基础上循序渐进的进行,那么对目前的搜索引擎的一些改进可以达到较好的效果。 3.研究开源全文检索工具Lucene,使用Lucene进行索引与检索。
[Abstract]:With the rapid development of network technology and the popularization of computer equipment, people's life and work have become more and more unable to leave the network, and the information on the network is also increasing exponentially. In order to help users from the mass of information to find the part of information they need, search engine technology emerged as the times require, and quickly become an indispensable information search tool, in a short period of time popular around the world. The use of search engine technology has largely solved the difficulty of finding information, but it also has many defects: search engine feedback to users more and more, and the same to all users, not targeted, Much of this information is not needed by the user, and such feedback results in the possibility that users will not be able to find the information they need for a great deal of time. Therefore, improving the user's query experience so that users can get the content they need from the massive network information resources will inevitably become an important direction in the development of search engine technology. Personalized search engine is based on this idea put forward. Based on the application of personalized search engine, this paper introduces the development of search engine technology, the principle of personalized search engine technology, the status quo of the research and the existing problems from the point of view of analyzing the users of the search engine. The author also puts forward the expected development of personal opinion, and puts forward some improved methods for the existing application. The research work has certain theory and practicability. This paper focuses on the following aspects: 1. Collection and analysis of user information. In order to achieve the goal of "personalized search", we must be able to collect the effective information of the user through the traces left by the user on the Internet, and use this information to analyze the interests and habits of the user, etc., in order to match the search results. 2. How to improve the existing search engine to achieve the goal of personalized search results. The mainstream search engines currently used, such as Baidu and Google, have their shortcomings, but considering the realization of technology and other aspects, the process of individuation will not be realized immediately. It is bound to be carried out step by step on the current basis. So some improvements to the current search engine can achieve better results. 3. This paper studies the open source full-text retrieval tool Lucene and uses Lucene for indexing and retrieval.
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 刘高原;张国平;;基于Nutch的搜索引擎技术[J];平顶山学院学报;2008年05期
2 胡长春;刘功申;;面向搜索引擎Lucene的中文分析器[J];计算机工程与应用;2009年12期
3 孙建;秦琪;袁方;;基于Lucene的知识搜索引擎的设计与实现[J];安徽电气工程职业技术学院学报;2011年01期
4 杨晶;吕天君;蒋占生;;Web搜索引擎原理及应用研究[J];软件导刊;2008年07期
5 王丰;戴兵;;国内中文搜索引擎研究[J];电脑知识与技术(学术交流);2007年08期
6 伍裕标;搜索无结果原因剖析[J];个人电脑;2004年03期
7 赵红梅;互联网实时信息搜索引擎[J];大众标准化;2004年12期
8 彭波;搜索引擎的混合索引技术[J];计算机工程与应用;2004年22期
9 翟晓玲;潘伟;王波;;基于Lucene的web站内搜索引擎的研究与实现[J];硅谷;2009年12期
10 余斯恒,郑扣根,陈丹;一种面向商业领域的搜索引擎索引结构设计及实现[J];计算机工程与科学;2005年12期
相关会议论文 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 谢丽星;孙茂松;佟子健;王灿辉;;基于用户查询日志和锚文字的汉语缩略语识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
相关重要报纸文章 前10条
1 章森 王伟;搜索引擎的工作机制[N];计算机世界;2006年
2 李一鑫;搜索排名的红与黑[N];财经时报;2007年
3 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
4 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
5 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
6 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
7 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
8 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
9 本报记者 赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
10 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
相关博士学位论文 前10条
1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 黄建年;农业古籍的计算机断句标点与分词标引研究[D];南京农业大学;2009年
6 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
7 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
8 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
9 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
相关硕士学位论文 前10条
1 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年
2 刘怀英;基于分布式并行计算的搜索引擎的研究与设计[D];武汉理工大学;2005年
3 孙晓峰;基于轻量级框架的互动问答平台的设计与实现[D];中国地质大学(北京);2008年
4 孙华昱;Lucene在医学影像资源检索平台中的应用[D];沈阳工业大学;2011年
5 陈焱R
本文编号:1791936
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1791936.html