政府网站搜索系统的日志挖掘、行为分析及改进
本文关键词: 政府网站 搜索系统 日志挖掘 行为分析 出处:《科技导报》2015年11期 论文类型:期刊论文
【摘要】:为提高政府网站的搜索质量并优化网站内容,对某政府网站现有搜索系统进行二次开发,增加了日志挖掘模块、行为分析模块、系统改进模块,实现了对搜索系统日志挖掘和用户行为的分析处理。日志挖掘模块负责收集、过滤和识别用户的搜索操作记录;在行为分析模块,根据操作记录从查询过程、聚类分析和查询热词3个角度,分析用户行为的特点和规律,得到了待调整权重的网页和热点查询词等分析结果;在系统改进模块,通过调整网页的权重使查询结果更加精准,改善了搜索系统,根据统计查询热词,既提供了搜索热点等新功能,又为用户提供了个性化网页并优化了政府网站的内容,实现了与舆情系统的数据交互。通过这些优化和改进,从多方面使搜索系统和政府网站能更好的为用户服务。
[Abstract]:In order to improve the search quality of the government website and optimize the content of the website, the existing search system of a government website is redeveloped, and the log mining module, the behavior analysis module and the system improvement module are added. The log mining module is responsible for collecting, filtering and identifying the user's search operation records. The characteristics and rules of user behavior are analyzed from three angles of clustering analysis and query hotwords, and the analysis results of web pages and hot query words to be adjusted are obtained. In the system improvement module, the query results are more accurate by adjusting the weight of web pages. Improved the search system, according to the statistics query hot words, not only provide new functions such as search hot spots, but also provide users with personalized web pages and optimize the content of government websites. Through these optimization and improvement, the search system and the government website can better serve the users.
【作者单位】: 中国科学技术信息研究所;北龙中网(北京)科技有限责任公司;
【分类号】:TP393.092;TP391.3
【参考文献】
相关期刊论文 前6条
1 陈红涛;杨放春;陈磊;;基于大规模中文搜索引擎的搜索日志挖掘[J];计算机应用研究;2008年06期
2 刘承启;邓庚盛;江婕;徐健锋;;基于用户行为分析的搜索引擎研究[J];计算机与现代化;2008年09期
3 张磊;李亚楠;王斌;李鹏;蒋在帆;;网页搜索引擎查询日志的Session划分研究[J];中文信息学报;2009年02期
4 岑荣伟;刘奕群;张敏;茹立云;马少平;;基于日志挖掘的搜索引擎用户行为分析[J];中文信息学报;2010年03期
5 乐嘉锦;姚岚;;基于Solr的体育视频信息全文搜索研究[J];计算机工程;2012年24期
6 叶小榕;邵晴;;政府网站移动搜索的日志挖掘和个性化改进[J];科技导报;2014年36期
【共引文献】
相关期刊论文 前10条
1 胡娟;白宇;蔡东风;;一种基于查询加权的用户建模方法[J];北京大学学报(自然科学版);2015年02期
2 马宏远;王斌;;基于日志分析的搜索引擎查询结果缓存研究[J];计算机研究与发展;2012年S1期
3 熊忠阳;向海燕;张玉芳;;结合用户日志的局部上下文分析方法[J];计算机工程与应用;2012年12期
4 王浩;姚长利;郭琳;艾国庆;;基于中文搜索引擎网络信息用户行为研究[J];计算机应用研究;2009年12期
5 李亚楠;许晟;王斌;;基于加权SimRank的中文查询推荐研究[J];中文信息学报;2010年03期
6 马宏远;王斌;;一种基于查询特性的查询结果缓存与预取方法[J];中文信息学报;2011年05期
7 马少平;刘奕群;刘健;张敏;祝建华;茹立云;;中文搜索引擎用户行为的演化分析[J];中文信息学报;2011年06期
8 邢玲;马强;余超;;基于数据包分析的流媒体多语义流行度模型[J];计算机应用研究;2012年09期
9 倪廓阔;吕学强;韩艳铧;王涛;;搜索引擎中“N1+N2”型短语查询优化研究[J];计算机应用与软件;2012年09期
10 马宏远;王斌;;基于用户特性的搜索引擎查询结果缓存与预取[J];中文信息学报;2012年06期
相关会议论文 前1条
1 许晟;李亚楠;王斌;吴丽辉;;基于加权SimRank的中文查询推荐研究[A];第五届全国信息检索学术会议论文集[C];2009年
相关博士学位论文 前4条
1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
2 孙叔琦;基于统计的词汇级语义相关计算研究[D];哈尔滨工业大学;2014年
3 何明贵;可视化搜索引擎模型与方法研究[D];武汉大学;2010年
4 张晓娟;查询意图自动分类与分析[D];武汉大学;2014年
相关硕士学位论文 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
3 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
4 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
5 冯东庆;基于链接分析的网页排序作弊检测方法研究[D];吉林大学;2011年
6 甘泉;网络检索过程及其心理[D];华中科技大学;2011年
7 王红;基于行为的协同检测与防护模型[D];燕山大学;2012年
8 董红臣;基于增量更新的交互式网页内容提取技术研究[D];哈尔滨工程大学;2011年
9 韩国兴;面向移动搜索的PUSH平台的设计与实现[D];哈尔滨工程大学;2011年
10 范桂群;论坛用户行为分析及文本表示模型研究[D];北京邮电大学;2012年
【二级参考文献】
相关期刊论文 前10条
1 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
2 王梅文;;本体在元搜索引擎查询结果自动分类中的应用[J];电脑知识与技术(学术交流);2007年08期
3 王继民,陈,
本文编号:1508926
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1508926.html