当前位置:主页 > 管理论文 > 移动网络论文 >

基于特征模型的主题搜索引擎研究

发布时间:2021-10-27 13:10
  随着企业信息化建设的发展,企业信息资源日趋丰富,企业信息门户网站逐渐成为企业信息管理的重要平台,为了促进企业内部的信息共享和相互交流,我们针对油田企业信息开发了油田信息搜索引擎。然而,随着信息量的增大,企业内部不同单位信息门户网站网页在内容上有一定的相似性,当用户想查询某一特定主题的信息时,现有的油田信息搜索引擎搜索结果中包含有许多与目标主题无关的信息,导致搜索结果混乱、信息主题不明确,降低了用户的检索效率。因此,如何识别网页的特征,将网页与企业主题进行关联,提高检索的准确性,是目前油田信息搜索引擎急需解决的问题。针对上述问题,本文提出了一种基于特征模型的主题搜索引擎解决方案。具体研究内容如下:第一、对现有的油田信息搜索引擎进行了研究,提出了基于特征模型的主题搜索引擎的解决方案。对特征模型在主题搜索引擎中的作用进行了研究,提出将网页特征模型应用到主题搜索引擎的爬行器和搜索结果展示中,以提高用户对搜索结果的主题辨识度。第二、研究了企业信息门户网站的特点,提出了将网页特征分为内部特征和外部特征,根据网页特征的视觉和语义特性对网页特征进行了归纳。研究了网页特征对主题的作用,提出了将内部特征和... 

【文章来源】:东北石油大学黑龙江省

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于特征模型的主题搜索引擎研究


一基于特征模型的主题搜索引擎系统框架

网页,栏目,示例,外部特征


栏目型网页示例

特征模,XML模式,网页


特征模型标记详细介绍,如表3-1所示:??表3-1网页特征模耶标记的意义??标记?描述??表示特征模型的根标记,即代表一张JH文型网页,它包含特征集合、特??Page??征N的关系两个子标〖己:Features、Relation。??Features?表示特征的集合,它"J以包合?个或多个T标〖己Feature。??_表示一个特征,它包含特征的标识、类型、名称、描述、特征提取规则、??Feature?权重,标记?Feature?有七个子标记:Identification、Type、Choose、Name、??Description、Rule、Weight。??Identification表示特征的唯一标识,用于标识特征。??Type?表示特征的类型,值为INTERNAL(内部特征)或EXTERNAL(外部特征)。??Choose?表示特征的可选性,true为选择,false为不选择。??Name?表示特征的名称。??Description?表示特征的语义描述,可以根据特征的实际语义进行修改。??Rule?表示特征的提取规则,是可选的。??

【参考文献】:
期刊论文
[1]企业信息门户的建设与应用[J]. 刘占庆.  信息系统工程. 2011(06)
[2]基于超链接引导和链接图分析的主题搜索引擎[J]. 唐苏,刘循.  计算机技术与发展. 2011(02)
[3]探讨油田信息化项目建设思路[J]. 于海燕.  数字石油和化工. 2008(09)
[4]向量空间模型中特征加权的研究[J]. 林永民,吕震宇,赵爽,朱卫东.  情报杂志. 2008(03)
[5]基于语义的企业搜索引擎的研究与实现[J]. 李武装.  电脑知识与技术(学术交流). 2007(08)
[6]综合搜索引擎与垂直搜索引擎的比较研究[J]. 刘畅.  情报科学. 2007(01)
[7]利用分块重要度进行中文网页分类的研究[J]. 段昕,马军,宋玲.  山东大学学报(理学版). 2006(03)
[8]DF还是IDF?主特征模型在Web信息检索中的使用[J]. 张敏,马少平,宋睿华.  软件学报. 2005(05)
[9]主题爬虫的解决方案[J]. 刘林,汪涛,樊孝忠.  华南理工大学学报(自然科学版). 2004(S1)
[10]基于概念分析的主题爬虫设计[J]. 汪涛,樊孝忠,顾益军,刘林.  北京理工大学学报. 2004(10)

硕士论文
[1]基于联邦模式的油田信息搜索引擎构建方法研究[D]. 彭成晖.东北石油大学 2012
[2]基于DOM树信息抽取的移动网站开发研究[D]. 李景.中国海洋大学 2011
[3]基于网页结构的信息抽取关键技术研究[D]. 王海潮.华南理工大学 2011
[4]基于页面结构分析的网页信息抽取方法研究[D]. 董娟.中国石油大学 2010
[5]基于标签分析的网页正文提取技术研究[D]. 常红要.重庆大学 2010
[6]基于Agent的专业搜索引擎及在管道信息检索中的应用研究[D]. 胡春娜.大庆石油学院 2010
[7]主题网络爬虫关键技术研究[D]. 王桂梅.哈尔滨工业大学 2009
[8]油田企业信息门户平台构建技术研究与应用[D]. 李勃.大庆石油学院 2009
[9]基于DOM的Web信息抽取技术的研究与实现[D]. 李猛.大连理工大学 2008
[10]面向石油的主题搜索引擎研究[D]. 李晗.中国石油大学 2008



本文编号:3461668

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3461668.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e174***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com