当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Web挖掘的搜索关键词建议研究

发布时间:2018-12-13 17:50
【摘要】:随着信息爆炸时代的到来,海量的信息在满足人们对各种信息需求的同时,也造成了信息泛滥、信息迷航等问题。传统的搜索引擎利用查询扩展或关键词建议一定程度上解决了这个问题。但目前的关键词建议并不是面向用户兴趣推荐关键词,它推荐的关键词是大众关注的热点或者是与查询词有包含关系的词组,这一方面不能满足用户个性化需求,另一方面也间接的影响到了检索的查全率和准确率。基于此,本文深入开展了基于web挖掘的搜索关键词建议研究。 论文首先研究和分析了现有web挖掘技术和搜索引擎技术,对web挖掘与搜索引擎技术的结合做了可行性分析。在此基础上,本文提出了基于web挖掘的搜索关键词建议方法,并建立了系统模型,对实现系统的关键技术进行了深入研究。系统采用了基于同义词扩展的源数据获取方法,改进了TF×IDF权重公式,将web使用挖掘和web文本挖掘技术相结合分别应用于系统的源数据处理和特征词聚类阶段,论文完成了基于web挖掘的搜索关键词建议系统的设计与开发,通过对系统的测试分析,结果表明:该系统功能设计合理,在面向用户兴趣提供个性化关键词建议功能上有较好的改进作用。 最后,论文指出了在源数据获取、文本聚类算法和中文分词技术方面还有待进一步深入研究。
[Abstract]:With the arrival of the era of information explosion, mass information not only meets the needs of people for all kinds of information, but also causes information flooding, information confusion and other problems. Traditional search engines use query extensions or keyword suggestions to solve this problem to a certain extent. However, the current keyword recommendation is not oriented to user interest, but is a hot topic of public concern or a phrase with a relationship with query words, which can not meet the personalized needs of users. On the other hand, it also indirectly affects the recall and accuracy of retrieval. Based on this, this paper deeply develops the research of search keyword suggestion based on web mining. Firstly, this paper studies and analyzes the existing web mining technology and search engine technology, and makes a feasibility analysis on the combination of web mining and search engine technology. On this basis, this paper puts forward the method of search keyword suggestion based on web mining, establishes the system model, and deeply studies the key technology to realize the system. The system adopts the method of source data acquisition based on synonym extension, improves the weight formula of TF 脳 IDF, and applies web usage mining and web text mining to the source data processing and feature word clustering stage of the system, respectively. This paper has completed the design and development of the search keyword suggestion system based on web mining. The test and analysis of the system show that the system function design is reasonable. In the user-oriented interest to provide personalized keyword advice function has a better improvement. Finally, the paper points out that further research is needed in source data acquisition, text clustering algorithm and Chinese word segmentation technology.
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 魏桂英,郑玄轩;层次聚类方法的CURE算法研究[J];科技和产业;2005年11期

2 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期

3 吴强;梁继民;杨万海;;Web日志挖掘预处理中的用户识别技术[J];计算机科学;2002年04期

4 李大高;程显毅;张冬慧;;基于关联规则与聚类算法的查询扩展算法[J];计算机工程;2009年06期

5 王卫国;徐炜民;;基于潜在语义分析的个性化查询扩展模型[J];计算机工程;2010年21期

6 汪晴;庄卫华;;基于TF-IQF模型的查询建议[J];计算机工程;2010年21期

7 许芳芳;王新伟;;Web文本聚类算法的分析比较[J];计算机时代;2010年10期

8 孙琳;王忠民;李鑫;;一种用于Web检索交互的相关主题查询建议方法[J];计算机应用;2006年S2期

9 李亚楠;许晟;王斌;;基于加权SimRank的中文查询推荐研究[J];中文信息学报;2010年03期

10 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期

相关博士学位论文 前1条

1 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年

相关硕士学位论文 前10条

1 潘照明;智能中文搜索引擎若干关键技术的研究与实现[D];浙江大学;2006年

2 瞿国忠;查询扩展技术研究[D];华中师范大学;2007年

3 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年

4 杨春伟;Web挖掘及其在网络搜索引擎中的应用研究[D];中国石油大学;2007年

5 高珊;信息检索中的查询扩展及相关技术研究[D];华中师范大学;2008年

6 吴雯雯;基于Web的用户访问模式挖掘算法及其应用研究[D];合肥工业大学;2008年

7 王玉伟;面向用户兴趣的web文档聚类研究[D];中国石油大学;2008年

8 马春光;基于用户兴趣的查询扩展算法研究[D];哈尔滨工程大学;2009年

9 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年

10 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年



本文编号:2376960

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2376960.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9e87d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com