基于Web挖掘的搜索关键词建议研究
[Abstract]:With the arrival of the era of information explosion, mass information not only meets the needs of people for all kinds of information, but also causes information flooding, information confusion and other problems. Traditional search engines use query extensions or keyword suggestions to solve this problem to a certain extent. However, the current keyword recommendation is not oriented to user interest, but is a hot topic of public concern or a phrase with a relationship with query words, which can not meet the personalized needs of users. On the other hand, it also indirectly affects the recall and accuracy of retrieval. Based on this, this paper deeply develops the research of search keyword suggestion based on web mining. Firstly, this paper studies and analyzes the existing web mining technology and search engine technology, and makes a feasibility analysis on the combination of web mining and search engine technology. On this basis, this paper puts forward the method of search keyword suggestion based on web mining, establishes the system model, and deeply studies the key technology to realize the system. The system adopts the method of source data acquisition based on synonym extension, improves the weight formula of TF 脳 IDF, and applies web usage mining and web text mining to the source data processing and feature word clustering stage of the system, respectively. This paper has completed the design and development of the search keyword suggestion system based on web mining. The test and analysis of the system show that the system function design is reasonable. In the user-oriented interest to provide personalized keyword advice function has a better improvement. Finally, the paper points out that further research is needed in source data acquisition, text clustering algorithm and Chinese word segmentation technology.
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 魏桂英,郑玄轩;层次聚类方法的CURE算法研究[J];科技和产业;2005年11期
2 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
3 吴强;梁继民;杨万海;;Web日志挖掘预处理中的用户识别技术[J];计算机科学;2002年04期
4 李大高;程显毅;张冬慧;;基于关联规则与聚类算法的查询扩展算法[J];计算机工程;2009年06期
5 王卫国;徐炜民;;基于潜在语义分析的个性化查询扩展模型[J];计算机工程;2010年21期
6 汪晴;庄卫华;;基于TF-IQF模型的查询建议[J];计算机工程;2010年21期
7 许芳芳;王新伟;;Web文本聚类算法的分析比较[J];计算机时代;2010年10期
8 孙琳;王忠民;李鑫;;一种用于Web检索交互的相关主题查询建议方法[J];计算机应用;2006年S2期
9 李亚楠;许晟;王斌;;基于加权SimRank的中文查询推荐研究[J];中文信息学报;2010年03期
10 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
相关博士学位论文 前1条
1 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
相关硕士学位论文 前10条
1 潘照明;智能中文搜索引擎若干关键技术的研究与实现[D];浙江大学;2006年
2 瞿国忠;查询扩展技术研究[D];华中师范大学;2007年
3 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
4 杨春伟;Web挖掘及其在网络搜索引擎中的应用研究[D];中国石油大学;2007年
5 高珊;信息检索中的查询扩展及相关技术研究[D];华中师范大学;2008年
6 吴雯雯;基于Web的用户访问模式挖掘算法及其应用研究[D];合肥工业大学;2008年
7 王玉伟;面向用户兴趣的web文档聚类研究[D];中国石油大学;2008年
8 马春光;基于用户兴趣的查询扩展算法研究[D];哈尔滨工程大学;2009年
9 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
10 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
,本文编号:2376960
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2376960.html