长尾查询搜索性能评价方法的研究
本文关键词:长尾查询搜索性能评价方法的研究
【摘要】:各大搜索引擎公司都致力于准确而快速的帮助用户找到信息目标,搜索性能评价变得非常重要,而目前尚无对长尾查询性能评价的方法。该文通过分析长尾查询结果数据,提取了长尾查询三种类型特征,并对特征进行叠加分析。进一步地针对数据集的严重不平衡问题提出两种数据平衡方法。最后提出并改进了长尾查询评价方法。在真实搜索引擎结果数据集上的实验验证了所提出的评价方法取得一定的评价效果,其中对不相关文档的评价取得较高的准确率。
【作者单位】: 智能技术与系统国家重点实验室;清华信息科学与技术国家实验室(筹);清华大学计算机系;
【关键词】: 长尾查询 搜索引擎性能评价 自动评价方法
【基金】:国家863高科技项目(2011AA01A205) 自然科学基金(60903107,61073071)
【分类号】:TP391.3
【正文快照】: 1引言1.1研究背景搜索引擎已经成为了人们获取信息的必不可少的工具。根据CNNIC发布的2011年年度报告,截至2011年底,中国网民规模已经达到了5.13亿人,其中搜索引擎的使用率达到了79.4%,在互联网应用中排名第二[1]。与此同时,网络资源也在迅速膨胀,如何准确理解用户的检索需求
【参考文献】
中国期刊全文数据库 前1条
1 刘奕群;岑荣伟;张敏;茹立云;马少平;;基于用户行为分析的搜索引擎自动性能评价[J];软件学报;2008年11期
【共引文献】
中国期刊全文数据库 前10条
1 李鹏;于晓洋;孙渤禹;;基于用户群组行为分析的视频推荐方法研究[J];电子与信息学报;2014年06期
2 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期
3 王倩;刘奕群;马少平;茹立云;;面向用户互联网访问日志的异常点击分析[J];中文信息学报;2010年03期
4 岑荣伟;刘奕群;张敏;茹立云;马少平;;基于日志挖掘的搜索引擎用户行为分析[J];中文信息学报;2010年03期
5 吴世勇;王明文;;基于聚类分析的搜索引擎自动性能评价[J];中文信息学报;2010年05期
6 朱彤;刘奕群;茹立云;马少平;;基于用户行为的长查询用户满意度分析[J];模式识别与人工智能;2012年03期
7 吴飞;金士尧;胡浩民;;基于用户属性的个性化教学智能辅助研究和设计[J];计算机工程与科学;2012年09期
8 倪廓阔;吕学强;韩艳铧;王涛;;搜索引擎中“N1+N2”型短语查询优化研究[J];计算机应用与软件;2012年09期
9 姚婷;张敏;刘奕群;马少平;茹立云;;低频查询的用户行为分析和类别研究[J];计算机研究与发展;2012年11期
10 陈东用;;基于用户行为分析的区域TD网络弱覆盖挖掘研究[J];信息通信;2014年02期
中国重要会议论文全文数据库 前2条
1 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 王倩;刘奕群;马少平;茹立云;;面向用户互联网访问日志的异常点击分析[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前3条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
3 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴世勇;基于聚类分析的搜索引擎自动性能评价研究[D];江西师范大学;2010年
2 朱培焱;汉英跨语言网址搜索引擎的设计与实现[D];西安电子科技大学;2010年
3 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
4 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
5 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年
6 蒋明原;云计算平台在搜索引擎中的关键技术研究[D];中北大学;2011年
7 胡阳;中文搜索引擎用户检索习惯问卷调查分析[D];河北大学;2011年
8 吕洋;基于用户行为数据分析的移动互联业务推荐模型[D];华中科技大学;2011年
9 刘峰;垂直搜索中的数据清洗和排序算法研究[D];中国科学技术大学;2009年
10 金祖旭;基于用户反馈的搜索引擎排名算法研究[D];复旦大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的搜索引擎用户行为分析[J];中文信息学报;2007年01期
【相似文献】
中国期刊全文数据库 前10条
1 Lee Gomes;;热门商品就是热门 哈佛挑战“长尾理论”:人是从众的[J];发现;2008年09期
2 孙烨;赵咏雪;;从“长尾”中透视电子商务[J];经营与管理;2008年10期
3 章丽芳;;Web2.0技术在电子商务中的应用[J];硅谷;2008年14期
4 吕剑;冷洪霞;;论长尾理论与基层档案工作[J];航空档案;2009年03期
5 张述冠;;“长尾”虽好 实践不易[J];中国计算机用户;2006年15期
6 周源;;企业IT的长尾[J];IT经理世界;2007年07期
7 邱诚;;数字图书馆的长尾建设[J];现代情报;2008年02期
8 廖丽星;;网络出版物:数字化出版的“长尾”和“蓝海”——以名人电子杂志为例[J];科技与出版;2008年09期
9 Michael Tiemann;;长尾、博弈与开源[J];软件世界;2007年21期
10 苗峰;;也谈中国信息化长尾市场[J];程序员;2009年01期
中国重要报纸全文数据库 前10条
1 本报记者 邱燕娜;信息化也存在长尾[N];中国计算机报;2008年
2 本报记者 邱燕娜;芮祥麟:争夺长尾理论的前端市场[N];中国计算机报;2008年
3 电脑商报记者 彭敏;用友“发现” 信息长尾[N];电脑商报;2008年
4 本报记者 毛江华;免费圈地 阿里软件会伤到谁?[N];计算机世界;2009年
5 电脑商报记者 彭敏;长尾计划进入第二阶段 微软造就渠道达人[N];电脑商报;2008年
6 ;微软“长尾计划”二期[N];电脑商报;2009年
7 微软(中国)有限公司大中华区副总裁 通用企业与渠道事业部总经理 佘永旭 北京亿飞成科技发展有限公司总监 韩冰 张戈;微软广域渠道长尾计划[N];电脑商报;2008年
8 本报记者 李晓辉;免费:数字化时代的商业未来[N];经济参考报;2009年
9 本报记者 李响;长尾进阶 微软推出渠道社区平台[N];计算机世界;2008年
10 本报记者董军;免费的逻辑[N];中国经营报;2009年
中国博士学位论文全文数据库 前1条
1 赵凌云;面向服务的消费者行为分析及推荐模型研究[D];山东师范大学;2014年
中国硕士学位论文全文数据库 前6条
1 胡小林;基于长尾理论的网络消费行为影响因素研究[D];中南民族大学;2013年
2 刘晨晨;改进的聚类挖掘算法对网络自助出版“长尾”文本的推荐应用[D];复旦大学;2011年
3 祝帅;基于可扩展分解机器的搜索广告点击率预估[D];浙江大学;2013年
4 谢志华;SD软件公司的web2.0营销策略研究[D];北京工业大学;2012年
5 潘伟;X公司网络投融资导航平台全程营销方案设计[D];北方工业大学;2013年
6 李方;基于SaaS的ERP与电子商务集成的研究[D];安徽农业大学;2011年
,本文编号:1028064
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1028064.html