基于组合条件的Web信息搜索方法
本文关键词:基于组合条件的Web信息搜索方法
【摘要】:随着互联网技术的迅猛发展,Web信息呈现了爆发式的增长。面对海量的Web信息,用户主动获取信息的方式通常为提交关键词句到搜索引擎,从搜索引擎返回的网页集合中获取信息。这种方式通常可以满足当搜索词句较为简单(仅包含关键字或短语)时的搜索需求。然而当搜索请求包含多个条件以及复杂的语法时搜索引擎所返回的结果常常是不准确和不全面的。其原因除了用户对搜索引擎的使用不熟练,无法准确的描述其所需要搜索获得的信息外,还包含(1)部分搜索语句包含了多个修饰条件,搜索引擎无法准确解析用户的真正查询意图;(2)用户的搜索目标需要从多个网页中综合分析才可以得到最终结果,而目前搜索引擎返回的搜索结果是单个网页的集合。此外,当用户提交的搜索语句包含多个搜索条件时,其期望搜索结果往往是一个实体集合,而现阶段,用户为了得到该实体集合,通常的做法是逐页浏览,并分析判断某个实体是否符合搜索条件,浪费了大量的时间和精力。针对以上问题,本文提出了解决方案。本文主要贡献如下:(1)研究了基于组合条件Web搜索语句和搜索结果中实体之间的上下位关系,对组合条件搜索语句中的各个要素进行了分析、总结、抽象。定义了基于组合条件Web搜索语句的概念模型,对基于组合条件的Web搜索语句的语义进行了结构化描述,并对搜索过程和结果集进行了阐释。(2)提出了基于组合条件Web搜索策略:将组合条件Web搜索语句分割为一个中心语和多个修饰语,利用分割后的中心语和修饰语将搜索语句重写为多个子搜索语句。基于重写后的子搜索语句,利用搜索引擎找到子搜索语句对应的网页。研究并归纳了网页中实体的存在形式,以此为依据,从页面中初步提取实体并获取实体的百科页面,从中定位实体的属性。根据修饰语,中心语,结合每个实体对应的百科页面,对实体进行筛选,过滤,得到最终的搜索结果(实体集合)。(3)基于所提出的基于组合条件Web搜索策略实现了原型系统。由于没有发现相关的数据集,本文分别基于中文和英文创建了测试数据集,根据数据集对原型系统进行了功能测试和性能测试,证明了所提出方法的有效性。
【学位授予单位】:天津理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.09;TP391.3
【相似文献】
中国期刊全文数据库 前10条
1 ;多媒体互联网信息搜索技术[J];电脑与电信;2012年Z1期
2 李琳;;多媒体互联网信息搜索技术探析[J];电脑开发与应用;2013年06期
3 倪元;;中英文图片及信息搜索技巧[J];专用汽车;2014年04期
4 刘宏;黄世祥;;移动互联网下信息搜索趋势及问题的研究[J];长春理工大学学报(社会科学版);2014年05期
5 王钦国;;基于榜样的学习方式在《信息搜索与分析》教学中的应用[J];中国信息技术教育;2009年24期
6 郭庆琳,樊孝忠;知识信息搜索和获取技术的研究[J];北京工业大学学报;2003年04期
7 李俊慧;个人信息搜索会否陷入隐私困境[J];电脑知识与技术;2004年36期
8 王晓丹;孙娇梅;;浅议互联网信息搜索技术的发展[J];应用能源技术;2008年05期
9 郭从颖;;企业信息搜索方案初探[J];信息技术与标准化;2010年08期
10 王剑;王健;高秉博;;基于时空感知能力的农业信息搜索技术研究[J];南方农业学报;2013年01期
中国重要会议论文全文数据库 前9条
1 王智斌;许俭;周皓峰;汪卫;施伯乐;;基于作者权威度分析的网络社区信息搜索方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 吴颖华;周皓峰;王晨;汪卫;施伯乐;;有效提取Web权威资源[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 张宜;靳桂明;;突发公共卫生事件中互联网医药信息搜索与启示[A];中华医院管理学会第十届全国医院感染管理学术年会论文汇编[C];2003年
4 董红斌;苏中滨;;基于Mobile Agent的信息搜索技术[A];全国计算机网络应用年会论文集(2001)[C];2001年
5 朴秀峰;李凌霞;;移动Agent技术在电子商务中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
6 罗英伟;汪小林;张颖;丁力;曲磊;丛升日;许卓群;;基于Agent的WebGIS信息搜索与分布计算模型[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
7 孙庆洲;刘永芳;韩仁生;;建议成本对决策者决策信息加工方式的影响及其作用机制[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
8 刘鹏元;;询问式搜索请求的模式分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 封红莲;顾惠忠;;人机界面中的信息设计研究[A];第十四届全国图象图形学学术会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 郑杏果;Pocaca:垂直商务搜索异军突起[N];中国计算机报;2006年
2 王新禧;没有网络就没有生活[N];中国电脑教育报;2005年
3 王金元;Google搜索业务延伸 主宰图书信息搜索[N];市场报;2004年
4 鲲;电子商务有我精彩[N];中国财经报;2000年
5 山东高密一中 张铁龙;信息搜索大提速[N];中国电脑教育报;2004年
6 ;企业信息搜索无用?[N];网络世界;2007年
7 曾娅;日本“信息大航海计划”开始征集参与企业[N];人民邮电;2007年
8 本报实习记者 陈张杰;电话搜索开辟信息搜索新领域[N];通信信息报;2005年
9 本报记者 杨春晖;搜索返现金能让用户上瘾?[N];中国计算机报;2008年
10 博士 刘保华;一切皆“智能”[N];中国计算机报;2010年
中国博士学位论文全文数据库 前3条
1 张星;市场机遇信息搜索的社会网络模式及其系统的研究[D];华中科技大学;2009年
2 舒永钢;WebGIS旅游信息搜索功用研究及应用[D];浙江工商大学;2012年
3 王炼;网络环境下基于消费者搜索的市场预测研究[D];西南交通大学;2014年
中国硕士学位论文全文数据库 前10条
1 汪丽芳;容迟网络中一种基于平稳分布的信息搜索方法的研究[D];合肥工业大学;2016年
2 雷鹏飞;基于组合条件的Web信息搜索方法[D];天津理工大学;2016年
3 王彦杰;手机生活信息搜索系统设计与实现[D];北京邮电大学;2011年
4 赵喜燕;基于不确定信息的个人信息搜索方法研究[D];天津理工大学;2014年
5 肖洁;基于移动agent的web信息搜索的研究[D];大连海事大学;2006年
6 郭杨;移动Agent技术在Web信息搜索上的研究[D];大连海事大学;2008年
7 尹鹏;一种基于XML的信息搜索技术[D];东北师范大学;2006年
8 李静;数字图书馆中信息搜索关键技术研究[D];复旦大学;2010年
9 冯思平;Web招标信息搜索及管理系统的设计[D];电子科技大学;2009年
10 李贤兵;图纸信息搜索及BOM表建立技术的研究[D];大连理工大学;2004年
,本文编号:1140045
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1140045.html