云计算环境下可视化探索式搜索引擎的研究
【图文】:
时提交一个查询至多个搜索引擎自动完成这一过程,从而减轻了用户的负担[3].元搜索为探索性搜索提供足够丰富的信息资源.在其搜索框架中,本文使用谷歌、百度和一个专用搜索引擎作为元搜索引擎的底层搜索引擎,称为成员搜索引擎,见图1.在所有的成员搜索引擎获得了返回结果之后,元搜索引擎将结果合并为一个有序列表.目前大多数搜索引擎将其检索结果表示为信息检索记录集(SRR)呈现给用户.一个典型的SRR由URL、标题和检索文献的摘要组成[4].因此,与SRR有关的内容可以用于对来自不同搜索引擎的检索结果进行合并和排序.图1元搜索引擎在元搜索引擎中,选择排在列表前列的SRR,并计算搜索引擎评分的算法称为TopSRR[4].当查询Q被提交给搜索引擎j时,那么搜索引擎返回动态生成的结果页面,页面上包括一定数目的SRR,在TopSRR算法中,从每个搜索引擎返回的不是前n个文档,而是前n个文档的SRR,其用于估算搜索引擎的得分.直观地说,这是合理的,因为对于一个给定的查询,更好的搜索引擎易于获取更好的结果,,结果的优劣通常是反映在其SRR之上.具体而言,来自搜索引擎j的前n个SRR的标题合并在一起,形成一个标题向量TVj,所有的片段也被合并成一个片段向量SVj.分别计算查询Q和TVj之间的相似度,以及Q和SVj之间的相似度,然后汇总到搜索引擎的j的评分之上.算法可以描述为Sj=c1×Similarity(Q,TVj)+(1-c1)×Similarity(Q,SVj),在本文定义的框架中,c1=0.5.1.2探索性搜索近年来,出现了一种被称为探索性搜索[1]的新的搜索方法,探索性搜索是一种特定的信息搜索行为,其搜索者具有以下特征:不熟悉其目标领域;实现目标的方法?
相同,所以将服务器置于云计算平台中,称之为云服务器.从云服务器中获得的搜索结果在被传递到终端之前,需要进一步的后期处理,语义关系图的预处理和后期处理步骤需要耗费大量的计算资源,终端的计算能力目前无法处理这些计算密集型的步骤.因此,将这些计算过程提交至云服务器,凭借其强大的计算能力和云计算服务的高可扩展性,搜索引擎框架将实现实时处理.2框架搜索引擎框架的基础架构如图2所示.客户端使得用户以直观交互的方式探索和发现针对特定起始关键词的信息,云服务器通过元搜索和知识集成来构造并返回关系图.该框架由3个主要部分组成:基于元搜索的语义关系图的推理和表示、对基于查询和浏览策略形成的关系图的可视化探索性搜索,以及人机交互.图2框架的基础架构2.1构造语义关系图语义关系图的构造包括3个主要步骤:(i)输入关键词;(ii)在主流搜索引擎上进行元搜索;(iii)对返回的网页和网站的内在关系进行推理.在(i)中,用户输入待查找的关键词;在(ii)中,关键词会被发送到一个内部元搜索引擎,该引擎与包括百度和谷歌在内的成员搜索引擎进行交互,如图1所示,成员搜索引擎接受关键词并返回检索的链接和网页结果列表.具体来说,元搜索引擎调用成员搜索引擎的应用程序接口(API);在(iii)中,对返回的网页和网站进行有效的自然语言处理和统计,并构建语义关系图.尤为重要的是,对于所有从元搜索返回的结果,测量其语义相似度,为可视化探索性搜索做好准备.在所建立的关系图中,各节点表示为关键词,弧被定义为语义关系的长度.特别的是,返回的结果列表按照图中的弧进行索引.2.2计算语义相似度开发网络搜索机制需要解决两个核心问题:(i)如何找到相关的网页,(ii)给定一组潜在的相关网页,如何根据?
【参考文献】
相关期刊论文 前2条
1 李蕾,王楠,钟义信,郭祥昊,韩鹏,贾自燕,高清霞;基于语义网络的概念检索研究与实现[J];情报学报;2000年05期
2 钟伟金;;基于概念关联的词汇语义关系识别研究[J];情报杂志;2014年01期
【共引文献】
相关期刊论文 前10条
1 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
2 李志辉;智能答疑系统中概念词典的设计与应用[J];重庆科技学院学报;2005年02期
3 王理达;电子政务中中文文本分类技术的应用[J];大众科技;2005年01期
4 柳晓春,左少凝;知识组织与网络资源分类的现状与展望[J];高校图书馆工作;2001年04期
5 吕元智;;数字档案资源跨媒体语义关联聚合实现策略研究[J];档案学研究;2015年05期
6 路杨;宋亚林;顾景文;;基于语义网络的古建筑图像数据库的查询策略[J];河南大学学报(自然科学版);2007年01期
7 运乃东;网络环境下情报检索语言的存废问题[J];河南图书馆学刊;2001年01期
8 左颖萍;周扬;;基于本体的故障维修案例知识建模和语义检索方法研究[J];军民两用技术与产品;2009年10期
9 刘钢,赵爱华,王婕,丘大谋,谢友柏;基于语义分析的设计实体智能搜索[J];机床与液压;2003年03期
10 孙霞,郑庆华;教育资源元数据语义扩展查找方法的研究[J];计算机研究与发展;2004年12期
相关会议论文 前1条
1 汪明;熊璋;吴晶;;基于LDAP的多语言概念检索模型的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
相关博士学位论文 前10条
1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
2 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 黄亦潇;客户知识获取的理论与应用研究[D];电子科技大学;2006年
5 席运江;组织知识的网络表示模型及分析方法[D];大连理工大学;2007年
6 刘建国;复杂网络模型构建及其在知识系统中的应用[D];大连理工大学;2007年
7 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
8 丘宏俊;基于知识的飞机装配工艺设计关键技术研究[D];西北工业大学;2006年
9 伍淳华;智能旅游目的地信息服务中效用的产生和体现机制研究[D];北京邮电大学;2008年
10 李卫;领域知识的获取[D];北京邮电大学;2008年
相关硕士学位论文 前10条
1 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
2 刘晓英;知识关联及其应用研究[D];湘潭大学;2010年
3 董锦霞;基于菱形思维的概念检索模型研究[D];大连理工大学;2011年
4 杨剑军;制造企业的知识管理及其模块化研究[D];宁波大学;2009年
5 俞方河;制造企业的知识资源配置方法研究[D];宁波大学;2011年
6 王振佶;面向销售服务的自动问答系统的设计与实现[D];电子科技大学;2011年
7 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
8 余媛芳;面向产品创新设计的知识获取研究[D];西北工业大学;2004年
9 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
10 刘柏青浙江大学计算机科学与技术系韩惠琴宁波大学图书 馆 (出处)=大学图书馆学报2002(2)一10一11 http:刀~.istis.sh.en/istis/dlib/;基于知识的数字图书馆[D];华中师范大学;2004年
【二级参考文献】
相关期刊论文 前4条
1 侯跃芳;崔雷;朱利娜;;应用主题词/副主题词关联规则对专题知识的挖掘分析及评价[J];情报理论与实践;2008年02期
2 张晗;任志国;张健;崔雷;;基于主题词关联规则的医学文本数据库数据挖掘的尝试[J];医学信息学杂志;2008年01期
3 孙海霞;李军莲;李丹亚;李芳;冀玉静;;MTI副主题词自动组配标引机制解析[J];医学信息学杂志;2011年05期
4 李军莲;李丹亚;孙海霞;冀玉静;李芳;;中文生物医学文献主题标引中副主题词自动组配机制探讨[J];现代图书情报技术;2012年06期
【相似文献】
相关期刊论文 前6条
1 张云秋;安文秀;于双成;;探索式搜索中用户认知的实验研究[J];情报理论与实践;2013年06期
2 张云秋;李玉玲;王洪媛;;基于日志与认知分析的探索式医学搜索行为研究[J];图书情报工作;2014年11期
3 张云秋;;专题:探索式搜索行为研究 序[J];图书情报工作;2014年11期
4 冯佳;张云秋;;基于浏览器日志分析的探索式搜索行为研究[J];图书情报工作;2014年11期
5 张建映;;构建思想政治理论课的探索式教学内容体系[J];河北软件职业技术学院学报;2008年01期
6 ;[J];;年期
相关重要报纸文章 前2条
1 中山大学管理学院 唐清泉 李海威 周熠蒙;企业创新模式路径选择[N];首都建设报;2011年
2 刘国;国际商务谈判“问”的技巧[N];公共商务信息导报;2006年
相关博士学位论文 前1条
1 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
相关硕士学位论文 前5条
1 安文秀;基于日志与认知分析的探索式医学搜索行为研究[D];吉林大学;2014年
2 陈冬;基于相关性的海量图像的可视化探索式搜索研究[D];湘潭大学;2014年
3 郑浩;基于语义关系图的小视窗智能机上可视化探索式搜索研究[D];湘潭大学;2014年
4 魏勇;基于功能点度量的探索式测试研究[D];天津大学;2013年
5 张俊忠;初中数学探索式教学模式的理论与实践[D];华中师范大学;2005年
本文编号:2577296
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2577296.html