当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于改进贝叶斯的时效性实体词挖掘

发布时间:2017-09-27 07:09

  本文关键词:基于改进贝叶斯的时效性实体词挖掘


  更多相关文章: query 贝叶斯方法 特征词 分类算法 候选集 自然语言处理 朴素贝叶斯 加权平均值 句法分析 检索系统


【摘要】:本文研究了针对大规模查询日志进行时效性实体词挖掘技术,实体词挖掘在搜索引擎中应用广泛,而时效性实体词的识别,对于网络新增热门实体词的检索体验优化具有至关重要的作用。对此,本文通过query聚类、提取实体词上下文组成长文本的方式,提出了一种改进贝叶斯的分类算法进行时效性实体词的识别。实验结果证明本文方法在时效性实体词识别方面,达到了90%以上的准确率。
【作者单位】: 深圳市宜搜科技发展有限公司;
【关键词】query;贝叶斯方法;特征词;分类算法;候选集;自然语言处理;朴素贝叶斯;加权平均值;句法分析;检索系统;
【分类号】:TP18;TP391.3
【正文快照】: 命名实体词识别属于搜索引擎中一项核心的技术,不仅是自然语言处理领域中的分词、句法分析、机器翻译等技术的基础,还在用户意图理解、需求多样性展示中起到至关重要的作用。而近年来,社交网络的飞速发展,极大的加速了信息传递速度,各种新鲜词汇不断涌现,第一时间挖掘出这些突

【参考文献】

中国期刊全文数据库 前1条

1 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[J];中文信息学报;2010年01期

【共引文献】

中国期刊全文数据库 前8条

1 刘彤;倪维健;柳梅;;面向搜索引擎查询日志的领域术语自动识别方法[J];现代图书情报技术;2016年02期

2 任育伟;吕学强;李卓;徐丽萍;;基于查询热度和实体识别的查询推荐[J];计算机应用研究;2016年03期

3 任育伟;吕学强;李卓;徐丽萍;;搜索日志中命名实体识别[J];现代图书情报技术;2015年06期

4 李雪伟;吕学强;刘克会;;扩展搜索日志上下文的新词识别[J];现代图书情报技术;2014年11期

5 何峰;岳江浩;;基于改进贝叶斯的时效性实体词挖掘[J];信息与电脑(理论版);2014年06期

6 张梅;段建勇;徐骥超;;人名属性知识挖掘及其在查询分类中的应用[J];现代图书情报技术;2013年09期

7 曹雷;郭嘉丰;白露;程学旗;;基于半监督话题模型的用户查询日志命名实体挖掘[J];中文信息学报;2012年05期

8 曹雷;郭嘉丰;程学旗;;基于二部图半监督方法的查询日志实体挖掘[J];山东大学学报(理学版);2012年05期

【相似文献】

中国期刊全文数据库 前10条

1 ;An Ontology-Based Service Matching Strategy in Grid Environments[J];Wuhan University Journal of Natural Sciences;2004年05期

2 苏斐;慈林林;朱丽萍;赵欣欣;;Data Caching for XML Query[J];Journal of Beijing Institute of Technology(English Edition);2006年03期

3 ;Distributed GEP query optimization on grid service[J];The Journal of China Universities of Posts and Telecommunications;2010年03期

4 周傲英,施伯乐;Query Optimization for Deductive Databases[J];Journal of Computer Science and Technology;1995年02期

5 JEON Se gil ,LEE Chung woo ,NAH Yunmook ,KIM Moon hae ,HAN Ki joon;Distributed location-based query processing on large volumes of moving items[J];重庆邮电学院学报(自然科学版);2004年05期

6 ;A solution of spatial query processing and query optimization for spatial databases[J];重庆邮电学院学报(自然科学版);2004年05期

7 ;Implementation of an Autocorrelation Pitch Detector in Application to Query by Humming[J];Wuhan University Journal of Natural Sciences;2005年03期

8 ;GQL:Extending XQuery to Query GML Documents[J];Geo-Spatial Information Science;2006年02期

9 ;Processing Constrained K Closest Pairs Query in Spatial Databases[J];Wuhan University Journal of Natural Sciences;2006年03期

10 ;Bottom-up mining of XML query patterns to improve XML querying[J];Journal of Zhejiang University(Science A:An International Applied Physics & Engineering Journal);2008年06期

中国重要会议论文全文数据库 前10条

1 ;Fast Discovering Frequent Patterns for Incremental XML Queries[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年

2 ;Identifying Machine Query for an Intelligent Web Browser System[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

3 ;Design and Optimization of Query System Architecture based on Multi-tier Metadata[A];第二十七届中国控制会议论文集[C];2008年

4 ;Query Through Heterogeneous Ontologies Using Association Matrix[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年

5 ;Mining Synonymous Entities using Search Engine Query Logs[A];第四届全国信息检索与内容安全学术会议论文集(下)[C];2008年

6 Yongjian Fan;Xiaoying Zhang;Hong Chen;;Aggregation-Based Privacy-Preservation Approximate Query Protocol in Wireless Sensor Networks[A];2013年中国智能自动化学术会议论文集(第一分册)[C];2013年

7 Ce Fan;Xiaorong Wu;;An optimal Scheme Based on Local Query for Computer Graphics[A];proceedings of 2010 3rd International Conference on Computer and Electrical Engineering (ICCEE 2010 no.1)[C];2012年

8 Du Xuedong;Xie Tingting;;Based on the Half-space Pruning to Continuously Monitoring Reverse KNN[A];2012年计算机应用与系统建模国际会议论文集[C];2012年

9 ;The Semi-join Query Optimization in Distributed Database System[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年

10 ;Variable and Index Processing in XML-QL Join[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

中国重要报纸全文数据库 前2条

1 江苏 王鑫;Delphi控件使用点滴[N];电脑报;2002年

2 福建 曾晓萌;优化你的 Delphi 程序[N];电脑报;2001年

中国博士学位论文全文数据库 前1条

1 熊文新;信息检索Query语言分析[D];北京语言大学;2006年

中国硕士学位论文全文数据库 前5条

1 阚长城;Query Engine的设计与实现[D];电子科技大学;2012年

2 朱亮;基于马尔科夫随机游走模型的query-doc关联挖掘[D];吉林大学;2014年

3 唐国华;Query语义依存分析技术研究[D];哈尔滨工业大学;2012年

4 刘建柱;基于Query分析的中心词与需求词搭配关系的自动挖掘[D];东北大学;2008年

5 梁国蓉;一个基于Dataflow的大数据Query Engine系统的设计与实现[D];南京大学;2015年



本文编号:928294

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/928294.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12486***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com