当前位置:主页 > 文艺论文 > 广告艺术论文 >

广告搜索中的查询处理算法

发布时间:2018-04-27 16:40

  本文选题:广告搜索 + 查询处理 ; 参考:《上海交通大学》2011年硕士论文


【摘要】:文本广告搜索为搜索引擎的全网搜索提供相关的、有针对性的文本广告。要匹配查询最相关的广告,广告搜索引擎应用了很多查询处理的技术,其中包括布尔检索和对稀有广告查询短语进行扩展。 现有最好的广告查询短语扩展算法都是依赖于搜索引擎的检索结果,这样导致依赖性太强,不能形成一个独立的广告搜索系统。在寻找可靠的外部资源时,我们选择了维基百科。通过使用网页查询短语在已有的维基系统上进行检索top-检索,我们可以得到能够重新表达这个查询短语的信息。通过这些信息,我们可以重新构建广告查询短语,然后使用这个新的广告查询短语到现有的广告库中进行搜索。随后,我们也设计了一系列的实验来证明我们的方法是非常有效。 因为弱与关系能够控制检索的结果数量,所以在广告搜索的查询中我们使用弱与关系来解决经典关系带来的问题。但是因为现有的弱与关系处理速度不够快,我们将提出一个全新高效的弱与关系处理框架。这个框架有效的利用了弱与关系的两个属性特点:分词后的词权重和弱与关系特有的一个阈值参数。我们首先关注查询中的一种非常特别的词。在分词后,查询短语中有一部分词权重可能非常高,以至于这一部分词必须出现在结果文集中。这种词我们称之为“强制词”。如果有这种类型的词,我们就可以很容易的构造一种非常快速的基于强制词弱与关系高效算法。然而,并不是所有的查询短语都含有强制词,因此我们又构建一种基于败者树的算法。通过和最原始的弱与关系算法相结合,这三种算法构建了我们的弱与关系处理框架。实验证明我们的方法比之前的方法更加有效,并且也非常健壮。
[Abstract]:Text advertising search provides relevant, targeted text ads for search engines throughout the web. To match the most relevant advertisements of query search engines employ a number of query processing techniques including Boolean retrieval and the extension of rare ad query phrases. At present, the best algorithms are all dependent on the search results of search engine, which leads to the dependence too strong to form an independent advertising search system. In the search for reliable external resources, we chose Wikipedia. By using the web page query phrase to retrieve top-retrieval on the existing wiki system, we can get the information that can reexpress the query phrase. With this information, we can rebuild the ad query phrase, and then use the new ad query phrase to search the existing advertising library. Subsequently, we also designed a series of experiments to prove that our method is very effective. Because weak and relationship can control the number of retrieval results, we use weak and relationship to solve the problem caused by classical relationship in advertising search query. However, due to the existing weak and relational processing speed is not fast enough, we will propose a new and efficient weak and relational processing framework. This framework effectively utilizes the two attributes of weak and relation: word weight after word segmentation and a threshold parameter of weak and relation. We first look at a very special word in the query. After participle segmentation, some of the words in the query phrase may have a very high weight, so that the part of the word must appear in the result set. This kind of word we call "compulsive word". If we have this type of word, we can easily construct a very fast algorithm based on forced word weakness and relationship. However, not all query phrases contain mandatory words, so we construct an algorithm based on the loser tree. By combining with the most primitive weak and relational algorithms, these three algorithms construct our weak and relational processing framework. Experiments show that our method is more effective and robust than previous methods.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 黄名选;马瑞兴;兰慧红;;面向查询扩展的特征词频繁项集挖掘算法[J];现代图书情报技术;2011年04期

2 王水利;黄广君;霍亚格;;基于语义分析的查询扩展方法[J];计算机工程;2011年16期

3 黄名选;朱家安;陈燕红;;面向查询扩展的词间正负关联规则挖掘算法[J];计算机工程与应用;2011年26期

4 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期

5 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期

6 蔡娟;;基于SEP4020的多路语音处理算法的实现[J];软件导刊;2011年07期

7 刘亮;秦小麟;戴华;杨丰;;基于环扇区的无线传感器网络K近邻查询处理算法[J];小型微型计算机系统;2011年08期

8 张蔚;王洪强;;使用区间路径处理XML查询[J];信息技术;2011年06期

9 韩勇豪;王少云;;一种NAND Flash动态坏块管理算法的设计与实现[J];信息化研究;2011年03期

10 徐从安;何友;简涛;孙伟超;;空域CFAR处理方法综述[J];海军航空工程学院学报;2011年04期

相关会议论文 前10条

1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年

2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

3 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

4 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年

5 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年

6 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年

8 周军锋;李义国;郭景峰;;面向PSTP查询的高效处理算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

9 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年

10 李金泉;陈善本;吴林;;一种用于弧焊机器人视觉导引的图像底层处理算法[A];第十次全国焊接会议论文集(第2册)[C];2001年

相关重要报纸文章 前10条

1 南方;DVD火爆国际芯片巨头争春[N];中国企业报;2003年

2 彭;媒体处理“软”转移[N];中国计算机报;2005年

3 清华紫光数码影像事业部总经理 刘洪;贴近应用 高端低价[N];中国计算机报;2004年

4 本报通讯员 刘磊;观天测云 努力不止[N];中国气象报;2011年

5 记者 潘俊杰 通讯员 黄幸媛;2007年雷电轨道业务建设项目启动[N];中国气象报;2007年

6 德州仪器首席科学家 方进;数字视频的未来[N];计算机世界;2006年

7 ;普天NodeB:实力源自创新[N];通信产业报;2006年

8 凡妮;IBM BladeCenter QS22将高性能计算带到实验室之外[N];电脑商报;2008年

9 宋西林;星光中国芯走出中国路[N];中国企业报;2005年

10 魏景云 张海东 蔡淑英;风云三号成像光谱仪预研通过评估[N];中国气象报;2003年

相关博士学位论文 前10条

1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年

3 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年

4 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年

5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年

6 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年

7 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年

8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年

9 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

10 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年

相关硕士学位论文 前10条

1 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年

2 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年

3 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年

4 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年

5 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年

6 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年

7 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年

8 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年

9 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年

10 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年



本文编号:1811495

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1811495.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户beece***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com