基于RDF句子的语义网文档搜索
本文选题:语义网 + 搜索引擎 ; 参考:《计算机研究与发展》2010年02期
【摘要】:语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升.
[Abstract]:Semantic Web document search is an important means to discover semantic Web data. Aiming at the deficiency of traditional information retrieval method, a method of constructing document word vector based on RDF sentence is proposed. First, documents are regarded as a collection of RDF sentences, so that the structural information based on RDF sentences can be preserved in the analysis and indexing of documents. Secondly, the definition of authoritative description of resources is introduced to search the interlinked data in the semantic web across document boundaries. In addition, the traditional inverted index structure is extended so that the system can extract fragments that are easier to read and understand. Experiments on large scale real data sets show that this method can significantly improve the efficiency of document retrieval and improve the availability of documents.
【作者单位】: 东南大学计算机科学与工程学院;
【基金】:国家自然科学基金项目(60773106) 江苏省自然科学基金项目(BK2008290)~~
【分类号】:TP391.3
【参考文献】
相关期刊论文 前2条
1 陈端兵;黄文奇;;一种求解集合覆盖问题的启发式算法[J];计算机科学;2007年04期
2 吴刚,唐杰,李涓子,王克宏;细粒度语义网检索[J];清华大学学报(自然科学版);2005年S1期
【共引文献】
相关期刊论文 前9条
1 陈荣光;李春升;陈杰;于泽;;基于贪婪算法的近空间平台区域覆盖优化设计[J];北京航空航天大学学报;2009年05期
2 李慧颖;瞿裕忠;;基于关键词的RDF数据查询方法[J];东南大学学报(自然科学版);2010年02期
3 刘敏;段富;刘超慧;;基于最小集合覆盖的属性约简算法[J];电脑开发与应用;2008年08期
4 方丽英;史斌;闫健卓;王普;;PS-Tree:一种基于路径的语义文档索引[J];北京工业大学学报;2012年09期
5 张文鹏;李红婵;王兴;;结合类内集中度和最小集合覆盖的特征选择[J];计算机工程与应用;2011年28期
6 文坤梅;卢正鼎;孙小林;李瑞轩;;语义搜索研究综述[J];计算机科学;2008年05期
7 李慧颖;瞿裕忠;;基于关键词的语义网数据查询研究综述[J];计算机科学;2011年07期
8 李慧颖;瞿裕忠;;KREAG:基于实体三元组关联图的RDF数据关键词查询方法[J];计算机学报;2011年05期
9 宁爱兵;刘艳芳;王英磊;;集合覆盖问题降阶算法[J];上海理工大学学报;2012年04期
相关会议论文 前1条
1 谭涛;宋雁翔;;一种有效的测试用例集约简方法[A];2008年航空试验测试技术峰会论文集[C];2008年
相关博士学位论文 前4条
1 乐小虬;非结构化网络空间信息智能搜索与服务研究[D];中国科学院研究生院(遥感应用研究所);2006年
2 孙小林;2-型模糊描述逻辑及其在本体进化中的应用研究[D];华中科技大学;2007年
3 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
4 方巍;基于本体的Deep Web信息集成关键技术研究[D];苏州大学;2009年
相关硕士学位论文 前10条
1 石飞燕;数据密集型计算中副本优化机制研究[D];武汉理工大学;2011年
2 肖竹军;基于RDF的语义节点间关系路径的检索[D];武汉理工大学;2011年
3 闫文;基于杂合粗糙集的一品红阻抗谱研究[D];北京林业大学;2011年
4 颜婷;基于本体的语义搜索技术研究与实现[D];杭州师范大学;2011年
5 张仲祥;基于领域本体的Deep Web数据源聚焦技术研究[D];广西师范大学;2011年
6 张功亮;基于领域本体的Web语义信息检索研究[D];广西师范大学;2011年
7 阚述贤;基于本体及概念模式的Deep Web查询结果处理技术[D];广西师范大学;2011年
8 李日晖;语义Web搜索中的本体映射研究[D];华中科技大学;2006年
9 刘敏;基于请求分类的Web QoS控制策略模型研究[D];太原理工大学;2008年
10 顾峰;连锁经营企业配送中心选址研究[D];合肥工业大学;2008年
【二级参考文献】
相关期刊论文 前1条
1 陈亮;任世军;;一种遗传算法在集合覆盖问题中的应用研究[J];哈尔滨商业大学学报(自然科学版);2006年02期
【相似文献】
相关期刊论文 前10条
1 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期
2 ;关键词搜索[J];每周电脑报;2000年38期
3 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期
4 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期
5 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期
6 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期
7 林燕;Google搜索引擎的搜索功能与使用技巧[J];河北科技图苑;2003年05期
8 林中;GOOGLE搜索引擎的关键词检索[J];中国信息导报;2003年03期
9 封剑待封喉;吸星大法“搜”天下 笑傲网络任我行——搜索引擎绝对专题[J];网络与信息;2003年07期
10 闫凡蕾;建设站内搜索的好帮手——Search Engine Maker[J];少年电世界;2003年08期
相关会议论文 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
8 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
9 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
10 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
相关重要报纸文章 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
8 本报记者 赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
相关硕士学位论文 前10条
1 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
2 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
3 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
4 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
5 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
6 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
8 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
9 田生伟;基于涉农词典的搜索引擎的研究与实践[D];新疆大学;2004年
10 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
本文编号:1838996
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1838996.html