一种快速的XML语义检索算法
本文选题:XML文档 + 语义检索 ; 参考:《电子学报》2007年11期
【摘要】:传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性.
[Abstract]:Traditional search engines based on keywords can not make full use of the structural information of XML documents, and the search results are often imprecise. However, the XML search technology based on structural information and keywords is not suitable for ordinary users.Keyword-based XML semantic retrieval overcomes the above shortcomings, but it needs to improve the retrieval efficiency.This paper analyzes the hidden semantics of XML document structure, proposes a new index structure and a two-node semantic correlation judgment function, and proposes a fast XML semantic retrieval algorithm.The algorithm greatly reduces the number of semantic correlation judgment.The experimental results on the actual data sets show the effectiveness of the new algorithm.
【作者单位】: 华北电力大学电子与通信工程系 华北电力大学电子与通信工程系
【分类号】:TP312.2
【参考文献】
相关博士学位论文 前1条
1 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
相关硕士学位论文 前1条
1 郭永明;XML文档检索技术研究[D];太原理工大学;2003年
【共引文献】
相关期刊论文 前1条
1 邹正宸;左春;;基于XML的客户服务中心通用知识库系统研究[J];计算机工程与设计;2006年20期
相关博士学位论文 前1条
1 张晓琳;面向对象的XML数据管理技术研究[D];东北大学;2006年
相关硕士学位论文 前8条
1 柴变芳;基于贝叶斯网络的XML文档检索[D];河北大学;2006年
2 何东彬;基于RDBMS的XML文档检索技术研究与实现[D];内蒙古大学;2006年
3 王晓燕;面向特定领域的需求获取与分析技术研究[D];山东大学;2006年
4 江腾蛟;XML文本文档检索技术研究[D];江西财经大学;2006年
5 田叶;基于XML文档的语义检索[D];华北电力大学(河北);2007年
6 宋春芳;基于缓冲的XML语义检索系统研究与设计[D];山东大学;2007年
7 陈金森;XML搜索引擎中索引技术的研究[D];燕山大学;2006年
8 刘菁菁;基于结构和主题的Web信息检索研究[D];大连理工大学;2007年
【二级参考文献】
相关期刊论文 前1条
1 曲卫民,孙乐,孙玉芳;半结构化中文信息检索中查询结果相关度算法的研究[J];中文信息学报;2004年04期
【相似文献】
相关期刊论文 前10条
1 林联合,吴杰,吴亮;以成语为范围的词汇支援系统[J];中文信息学报;1993年01期
2 朱强;数字图书馆:21世纪图书馆的原型──美国“数字图书馆创始”计划简介[J];大学图书馆学报;1995年04期
3 刘细文;美实施数字图书馆(DL)研究计划[J];情报理论与实践;1995年03期
4 任公志;工智校对通(WIC)V2.0辅助功能介绍[J];科技与出版;1996年06期
5 叶文川;构造未来Web页面的工具语言──XML[J];电脑技术;1998年08期
6 ;XML:Web标记的第二次机会[J];个人电脑;1998年01期
7 ;用XML组织数据[J];个人电脑;1998年07期
8 张;W3C推出XQL[J];中国计算机用户;1998年48期
9 好兵;利用最新的XML语言制作CD目录管理器[J];电脑;1999年12期
10 杰诗;电子商务看好XML语言[J];中文信息;1999年Z1期
相关会议论文 前10条
1 谌志群;张国煊;;一个基于内容的Web信息抽取方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 薛志军;周学功;周湘;彭澄廉;;基于XML可配置IP库的构建[A];全国第13届计算机辅助设计与图形学(CAD/CG)学术会议论文集[C];2004年
3 高勇;荀恩东;宋柔;;构造自然语言问答系统平台[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 张硕;姚志洪;;XML应用于电子病案[A];第13届全国病案管理学术会论文汇编[C];2004年
5 赵姗;李宏伟;蓝士斌;;VC环境下利用DOM存取WebGIS中XML格式地图数据[A];中国地理信息系统协会第八届年会论文集[C];2004年
6 周骏;陈鸣;;在Matlab下实现SAX处理器[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 朱忠池;洪晓光;;利用DTD优化XML递归查询技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
8 崔巍;;基于XML的统一数据库平台的研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
9 付新;朱庆生;;动态工作流系统结构与应用初探[A];’2004计算机应用技术交流会议论文集[C];2004年
10 杨彬;洪晓光;;基于XML大文档的动态索引[A];’2004计算机应用技术交流会议论文集[C];2004年
相关重要报纸文章 前10条
1 陈维义;HTML如何向XML迁移[N];中国计算机报;2000年
2 笑;使XML程序编写更快[N];中国计算机报;2000年
3 本报记者 龚杰;DB2通用数据库奠基电子商务[N];计算机世界;2000年
4 四川大学计算机学院 陈华英;组建基于 Web 方式的数据仓库[N];网络世界;2000年
5 方正技术研究院XML中国论坛网(www.xml.net.cn 董欣;XML的语法[N];网络世界;2000年
6 ;WebGain整合Java开发[N];中国计算机报;2001年
7 北京邮电大学 张剑;XML技术入门[N];计算机世界;2001年
8 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
9 北京邮电大学 张剑;XML的显示——XSL样式单(上)[N];计算机世界;2001年
10 李磊 孙文兵;电子政务规范语言cngXML[N];计算机世界;2001年
相关博士学位论文 前10条
1 徐海渊;基于XML的动态信息触发机制的研究[D];中国人民解放军国防科学技术大学;2002年
2 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
3 胡勤友;Web上的多主体系统若干关键技术研究[D];复旦大学;2003年
4 胥正川;基于关系数据库的XML数据存储、更新和检索[D];复旦大学;2003年
5 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年
6 路燕;基于多DTD的XML查询技术研究[D];复旦大学;2003年
7 李斓;面向XML文档的访问控制研究[D];中国科学院研究生院(软件研究所);2004年
8 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
9 杨红丽;XML家族语言语义研究[D];西北大学;2003年
10 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
相关硕士学位论文 前10条
1 罗思群;基于XML技术的数据转换[D];中国科学院软件研究所;2001年
2 张晋;基于XML的动态站点应用研究[D];华北工学院;2001年
3 余露;科技论文DTD的设计及其XML文档生成[D];苏州大学;2001年
4 刘宝;基于Web Services的动态电子商务模型的研究[D];浙江大学;2002年
5 刘靖侨;XML文档对象模型持久化在OSCAR中的实现及查询转换[D];浙江大学;2002年
6 王照岳;XML查询处理技术研究与实现[D];浙江大学;2002年
7 岳桦;OFFICE软件网络考试系统[D];北方工业大学;2002年
8 刘雅丽;基于XML的通用商业单据数据转换系统[D];北京工业大学;2002年
9 康玲;基于.NET组件技术的远程教学系统的设计及实现[D];新疆大学;2002年
10 苗军;Unicode/XML在电子出版物中的实现[D];河北工业大学;2002年
,本文编号:1774219
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1774219.html