基于线性回归的相关查询推荐
本文选题:查询日志 切入点:查询会话 出处:《高技术通讯》2010年06期
【摘要】:在分析搜索引擎查询日志的基础上,提出了一种基于线性回归的相关查询推荐方法。该方法考虑了查询串之间的多种关联关系,包括查询串会话共现、点击页面共享和查询串文本相似性,以避免因直接应用查询串之间的部分关联关系造成易受查询日志中噪音的影响。相比以往的方法,采用线性回归的方法来识别相关查询推荐的有效特征,能更好地解决噪音问题和进行有效的相关查询推荐。实验证实,采用线性回归挖掘的识别中文相关查询串的特征非常有效,且所提出的回归模型的预测准确率优于现有的方法。
[Abstract]:Based on the analysis of search engine query log, this paper proposes a linear regression based recommendation method for related queries, which takes into account a variety of correlation relationships between query strings, including the co-occurrence of query string sessions. Click page sharing and query string text similarity, to avoid the direct application of query strings between some of the association relationship is vulnerable to the impact of noise in the query log. The linear regression method is used to identify the effective features of the related query recommendation, which can better solve the noise problem and make effective related query recommendation. The feature recognition of Chinese correlation query string by linear regression mining is very effective, and the prediction accuracy of the proposed regression model is better than that of the existing methods.
【作者单位】: 中国科学技术大学计算机科学与技术系;中国科学院计算技术研究所信息智能与信息安全研究中心;
【基金】:863计划(2006AA010105,2007AA01Z416)资助项目
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
【共引文献】
相关期刊论文 前10条
1 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
2 尚福华;韩开旭;;基于相关术语群和同义词的查询扩展研究[J];长江大学学报(自然科学版)理工卷;2010年03期
3 肖海鹏;邓晓衡;;基于Web挖掘的关键词建议模型研究[J];电脑知识与技术;2012年13期
4 霍林;王力;黄俊文;潘英花;;一种结合同义词典和词对共现距离的查询扩展方法[J];广西大学学报(自然科学版);2010年02期
5 何攀;刘露;陈荦;王祖文;;基于用户偏好的地理计算应用检索[J];兵工自动化;2012年10期
6 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[J];计算机研究与发展;2010年S1期
7 熊忠阳;向海燕;张玉芳;;结合用户日志的局部上下文分析方法[J];计算机工程与应用;2012年12期
8 郭岩;白硕;于满泉;;Web使用信息挖掘综述[J];计算机科学;2005年01期
9 李莉;高庆狮;;一种基于语义单元的查询扩展方法[J];计算机科学;2008年02期
10 田萱;李冬梅;;上下文信息检索研究综述[J];计算机科学;2011年09期
相关会议论文 前10条
1 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[A];第六届中国测试学术会议论文集[C];2010年
2 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
5 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
6 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
7 刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
相关博士学位论文 前10条
1 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
2 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
5 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
6 吴陈;粒和粗集研究及与证据理论相结合在不完备数据处理中的应用[D];南京理工大学;2007年
7 李粤;引文网络的可调优先粘贴模型及其应用[D];清华大学;2007年
8 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
9 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
10 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
相关硕士学位论文 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 杨海南;基于语义词典和局部分析的查询扩展研究[D];武汉理工大学;2010年
3 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
4 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
5 刘亚妮;搜索竞价广告关键词优化算法与实验[D];电子科技大学;2011年
6 王晶;基于领域本体扩展查询的文本信息检索研究[D];东北石油大学;2011年
7 韩开旭;基于查询扩展的油田网络舆情监控系统[D];东北石油大学;2011年
8 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
9 余强;基于语义的设计知识个性化检索技术研究及应用[D];南京航空航天大学;2010年
10 胡川洌;基于本体的教学资源语义检索研究[D];重庆大学;2011年
【相似文献】
相关期刊论文 前10条
1 马云龙;林原;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[J];中文信息学报;2011年01期
2 张磊;李亚楠;王斌;李鹏;蒋在帆;;网页搜索引擎查询日志的Session划分研究[J];中文信息学报;2009年02期
3 马嘉赛;张永军;;最小方方法的一种优化方法[J];山东大学学报(理学版);2006年03期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前5条
1 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 张磊;李亚楠;王斌;李鹏;蒋在帆;;网页搜索引擎查询日志的session划分研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 罗准辰;王挺;;搜索词同现网络研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
相关硕士学位论文 前3条
1 李东园;问答系统中相关文档检索技术的研究[D];沈阳航空工业学院;2009年
2 贺海波;基于日志挖掘的查询词推荐研究与实现[D];北京邮电大学;2010年
3 朱丹梅;搜索引擎作弊检测方法研究[D];南京邮电大学;2011年
,本文编号:1683297
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1683297.html