当前位置:主页 > 科技论文 > 搜索引擎论文 >

新闻垂直搜索引擎中文分词网页去重应用及研究.pdf 免费在线阅读前50页

发布时间:2016-10-19 12:41

  本文关键词:新闻垂直搜索引擎中文分词与网页去重的应用与研究,由笔耕文化传播整理发布。


文档介绍:
分类号:TP3910710-2011124065硕士学位论文新闻垂直搜索引擎中文分词与网页去重的应用与研究李小三导师姓名职称王卫亚教授申请学位级别硕士学科专业名称信号与信息处理论文提交日期2014年6月2日论文答辩日期2014年6月9日学位授予单位长安大学TheApplicationandResearchofChineseWordSegmentationandWebDeduplicationinNewsVerticalSearchEngineADissertationSubmittedfortheDegreeofMasterCandidateLiXiaosanSupervisorProf.WangWeiyaChang’anUniversity,Xi’an,ChinaI摘要自互联网诞生以来,网络信息每年几乎都成指数量增长。搜索引擎是人们获得互联网信息的重要工具,但是传统的搜索引擎利用网络爬虫从互联网上大规模的搜集到的信息其中很多信息是完全重复或近似重复的,还有很多信息是用户不需要的,这样就加重了用户使用搜索引擎的负担。而垂直搜索引擎能够精确的获得用户关心的相关领域信息。垂直搜索引擎不像通用搜索引擎那样,它仅仅搜集某一特定领域相关的网页内容。本文首先描述了垂直搜索引擎的工作原理,并讨论了垂直搜索引擎的几个关键技术,主要技术包括:网络爬虫技术、中文分词技术、网页预处理技术、网页去重技术、索引和检索技术等。对包含这几项关键技术的功能模块进... 内容来自转载请标明出处.


  本文关键词:新闻垂直搜索引擎中文分词与网页去重的应用与研究,,由笔耕文化传播整理发布。



本文编号:145667

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/145667.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ad05***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com