基于递归自编码器的广告短语相关性
本文关键词:基于递归自编码器的广告短语相关性 出处:《计算机应用》2016年01期 论文类型:期刊论文
更多相关文章: 深度学习 递归自编码器 词向量 计算广告 搜索引擎
【摘要】:针对现有广告短语相关性研究成果多采用字面匹配,忽略了短语所包含的深层语义信息,限制了任务的性能等问题,提出了采用深度学习算法研究广告短语的相关性,采用递归自编码器(RAE)对短语进行深层结构分析,使得短语向量包含深层的语义信息,以此来构建广告语境下的短语相关性计算方法。具体地,给定一个包含若干词的序列,序列中所有相邻的两个元素尝试合并产生一个重构误差,遍历将重构误差最小的元素两两合并,形成类似哈夫曼树结构的短语树。采用梯度下降法最小化短语树的重构误差,采用余弦距离度量短语之间的相关性。实验结果显示,通过引入词语权重信息,加大了重要词语在最终短语向量表示中贡献的信息量,使得RAE更适合短语计算;比起传统LDA和BM25算法,在50%召回率的条件下,提出的算法的准确率分别提高了4.59个百分点和3.21个百分点,这证明了所提算法的有效性。
[Abstract]:In view of the existing research on the relevance of advertising phrases, most of them use literal matching, ignoring the deep semantic information contained in the phrase, limiting the performance of the task and so on. A depth learning algorithm is proposed to study the correlation of advertising phrases, and a recursive self-encoder is used to analyze the deep structure of phrases, which makes phrase vectors contain deep semantic information. Specifically, given a sequence containing a number of words, all the adjacent elements in the sequence try to merge to produce a reconstruction error. Traversing the elements with the minimum reconstruction error to form a phrase tree similar to the Huffman tree, the gradient descent method is used to minimize the reconstruction error of the phrase tree. CoSine distance is used to measure the correlation between phrases. The experimental results show that by introducing word weight information, the amount of information contributed by important words in the final phrase vector representation is increased. Make RAE more suitable for phrase calculation; Compared with the traditional LDA and BM25 algorithms, the accuracy of the proposed algorithm is increased by 4.59% and 3.21% respectively under the condition of 50% recall rate. This proves the validity of the proposed algorithm.
【作者单位】: 武汉大学计算机学院;桂林航天工业学院广西高校机器人与焊接技术重点实验室培育基地;
【基金】:国家自然科学基金资助项目(11301106) 广西自然科学基金资助项目(2014GXNSFAA1183105) 广西高校科研资助项目(ZD2014147,YB2014431)~~
【分类号】:TP18;TP391.3
【正文快照】: 0引言计算广告指的是基于用户给定的搜索信息,通过计算得到与之最匹配的广告,然后进行精准定向投放的广告机制。采用该机制可以大幅度提高广告主投放广告的点击率,加大广告投放所在网站的访问量,从而帮助用户获得优质的信息。计算广告是支撑互联网广告产业链发展的基础,其涉及
【参考文献】
相关硕士学位论文 前1条
1 张建梁;基于云计算的语义搜索引擎研究[D];复旦大学;2009年
【共引文献】
相关期刊论文 前4条
1 于志良;;云计算现状研究[J];电脑开发与应用;2010年10期
2 陆小丽;何加铭;;基于Map/Reduce的索引数据云存储模型研究[J];宁波大学学报(理工版);2011年03期
3 魏清凤;罗长寿;孙素芬;张峻峰;;云计算在我国农业信息服务中的研究现状与思考[J];中国农业科技导报;2013年04期
4 刘静;徐斌;;Kaas环境下的图书馆用户个性化信息服务研究[J];图书馆学研究;2014年22期
相关博士学位论文 前3条
1 方雷;基于云计算的土地资源服务高效处理平台关键技术探索与研究[D];浙江大学;2011年
2 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
3 张莉艳;基于云计算的铁路信息共享平台及关键技术研究[D];中国铁道科学研究院;2013年
相关硕士学位论文 前10条
1 申志强;基于云计算的IPv6协议应用研究[D];东北财经大学;2010年
2 郭雷风;农业科研云原型系统设计与应用理论研究[D];中国农业科学院;2011年
3 闫金刚;基于云计算的分布式智能语义搜索方法研究[D];电子科技大学;2011年
4 桂许军;基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现[D];西南交通大学;2011年
5 葛辉;基于Nimbus的云计算平台研究及应用[D];成都理工大学;2011年
6 宫彦磊;基于云计算的车载GPS导航终端的研究与设计[D];延边大学;2011年
7 胡晓岽;通信终端网络多媒体资源交互系统研究与实现[D];宁波大学;2010年
8 闻建芬;通信终端个人信息交互系统研究与应用[D];宁波大学;2011年
9 陈鹏飞;基于个性化本体的语义搜索引擎技术的研究与设计[D];河北工业大学;2011年
10 杨洁;云计算在权限管理中的应用研究[D];辽宁工程技术大学;2010年
,本文编号:1428847
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1428847.html