当前位置:主页 > 科技论文 > 软件论文 >

基于垂直搜索的查询需求识别系统的设计与实现

发布时间:2024-05-14 01:21
  该项目来源于百度垂直行业搜索产品线的实际项目。随着智能手机的普及,越来越多的用户开始使用手机端进行检索。由于手机大小的限制,一个屏幕可以呈现三条左右的返回结果,因此在前三条结果中返回用户需要的信息成为手机端检索的新挑战。当前的检索策略是由通用搜索对结果进行统一整合,信息划分粒度较粗,不能满足用户的垂类(某一特定行业、特定领域,例如汽车,医疗等垂类)细分需求。为了提升用户在手机端的检索体验,项目组决定开发一个用户需求识别的内部系统来对用户需求进行离线挖掘,方便产品人员和研发人员对垂类资源的管理和监控。本文首先阐述了项目的背景以及国内外现状,对整个系统进行功能性和非功能性需求分析。根据需求分析设计系统架构、划分系统功能模块、设计系统数据库。接着对系统进行详细设计与实现。作者独立完成了样本抽取和模型训练这两个底层模块,以及系统的用户管理、样本标注评估和需求泛化模块的开发工作,参与完成了资源管理模块的部分开发工作。在系统设计和实现过程中,调研分类模型、用户行为评估和数据融合三种技术方案对样本数据的提取率,从半结构化数据中提取用户需求样本;评估常用二分类算法在当前业务场景下的效果,选择xgboo...

【文章页数】:82 页

【学位级别】:硕士

【部分图文】:

图2-1?Hadoop系统架构图??Figure?2-1?System?architecture?diagram?of?Hadoop??

图2-1?Hadoop系统架构图??Figure?2-1?System?architecture?diagram?of?Hadoop??

python中的调参库hyper?opt。??2.1?Hadoop??Hadoop是一个由多组件构成,能够对大数据进行分布式处理的架构[1],图2-1??所示,Hadoop?的最底部组件是?HDFS?(Hadoop?Distributed?File?System,?Hadoop?....


图2-2?MapReduce运行原理??Figure?2-2?Operating?principle?of?MapReduce??

图2-2?MapReduce运行原理??Figure?2-2?Operating?principle?of?MapReduce??

python中的调参库hyper?opt。??2.1?Hadoop??Hadoop是一个由多组件构成,能够对大数据进行分布式处理的架构[1],图2-1??所示,Hadoop?的最底部组件是?HDFS?(Hadoop?Distributed?File?System,?Hadoop?....


图2-4?Skip-gram原理图??Fiure?2-4?Schematic?of?Ski-ram??

图2-4?Skip-gram原理图??Fiure?2-4?Schematic?of?Ski-ram??

Word2vec包含两种不同的算法,一个是CBOW:全称是Continuous?Bag?of??Words,另一个是?Skip-gram[7]。??图2-3所示,CBOW的原理是根据一个词的上下文来对当前词做预测,给定??一段文本,将“银行”去除,利用剩余的“政府”,“账户”等词....


图2-3?CBOW原理图??Figure?2-3?Schematic?of?CBOW??

图2-3?CBOW原理图??Figure?2-3?Schematic?of?CBOW??

Word2vec包含两种不同的算法,一个是CBOW:全称是Continuous?Bag?of??Words,另一个是?Skip-gram[7]。??图2-3所示,CBOW的原理是根据一个词的上下文来对当前词做预测,给定??一段文本,将“银行”去除,利用剩余的“政府”,“账户”等词....



本文编号:3972984

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3972984.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a731c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com