当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种融入用户点击模型Word2Vec查询词聚类

发布时间:2017-10-16 17:36

  本文关键词:一种融入用户点击模型Word2Vec查询词聚类


  更多相关文章: 查询词 聚类 WordVec 点击模型 CT-WordVec


【摘要】:用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CT-Word2Vec神经网络语言模型.CT-Word2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CT-Word2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升.
【作者单位】: 华东师范大学计算机应用研究所;华东师范大学上海市多维度信息处理重点实验室;
【关键词】查询词 聚类 WordVec 点击模型 CT-WordVec
【基金】:国家科技支撑项目(2012BAH93F03)资助 上海市科委项目(14511107000)资助
【分类号】:TP391.3
【正文快照】: 1引言随着信息技术的极速发展,互联网信息呈现了指数型增长,人们只能在搜索引擎的帮助下从海量的信息当中获得特定的信息.用户的搜索行为直接或间接地反应了用户的潜在兴趣及需求.用户提供的查询词是搜索行为当中最为重要的一部分.用户查询词聚类是用户查询词挖掘中最常用的方

本文编号:1044001

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1044001.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b10b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com