当前位置:主页 > 社科论文 > 图书档案论文 >

基于语义网的博客搜索引擎的研究

发布时间:2020-11-21 05:16
   2005、2006年博客在中国迅猛发展,博客已经成为继电子邮件、BBS和ICQ之后的第四种互联网沟通工具。随着博客页面的数量呈指数级的上升,国外已经出现了如Technorati等顶级的博客搜索引擎。而国内的博客搜索引擎只是将传统的搜索引擎技术应用于博客页面之上,查询效率低下。如何设计一个合理的博客搜索引擎系统,使其能在语义层次上收集、组织和检索博客资源,提高信息的利用率,成为了一个很有挑战性的研究内容。 本文首先对传统搜索引擎技术和语义网技术分别做了深入的研究。通过比较传统搜索引擎和博客搜索引擎的区别,融合传统搜索引擎的体系结构和语义网中的本体知识,提出了一种基于语义网的博客搜索引擎模型,并对其体系结构和功能模块做了详尽的阐述。该模型根据博客网页的特点规范了博客信息资源的抓取,并将语义网研究中的本体知识应用到博客搜索引擎中,利用本体对概念间的各种语义关系指导博客搜索引擎的检索过程,使用户能够快速、准确的找到所需的博客资源,提升博客搜索引擎的查准率和查全率。模型的核心在于对博客网页资源的规范化抓取,以及在本体支持下的资源语义标注和索引、用户查询词的语义扩展。 最后对文中涉及的关键技术进行了深入的分析和研究。提出了一种规范的本体构建方法——闭环本体构建法;研究了一种基于本体的信息检索模型,重点对描述逻辑的推理理论以及检索过程中基于本体的语义扩展机制做了深入的研究。对关键技术的研究为研究和完善基于语义网的博客搜索引擎奠定了良好的理论基础。
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2007
【中图分类】:G354
【部分图文】:

体系结构图,搜索引擎,体系结构,域名


图 2.1 搜索引擎的体系结构图索器的功能是在互联网中发现和搜索信息。它要尽可能快、的信息,同时还要定期更新己有信息,避免死连接和无效两种搜集信息的策略:个起始 URL 集合开始,顺着这些 URL 指向网页),以宽度优先、深度优先或启发式方式循环地在互联网RL 可以是任意的 URL ,但常常是一些非常流行、包含 Yahoo、Sohu、Sina 等)。eb 空间按照域名、IP 地址或国家域名划分,每个搜索器索。搜集的信息类型多种多样,包括 HTML 文档、XML 文档文件、字处理文档以及多媒体信息等等。

语义网,体系机构,词汇层,元数据


第三章 语义网技术15构(如图 3 . 1 所示)[16]。其中,Unicode 和 URI 代表了编码层;XML、NameSpace和 XML Schema 代表了语法层;RDF 和 RDF Schema 代表了元数据层;Ontologyvocabulary 代表了词汇层;Logic、Proof 和 Trust 代表了逻辑层。现阶段学术界研究的重点主要集中在RDF和RDF Schema代表的元数据层以及Ontology vocabulary代表的词汇层。

实例图,资源描述框架,网页,三元组


18图 3.2 一个资源描述框架的实例图3.2中描述了一个URI为http://www.example.org/index.html的网页资源的相关信息,图中的资源陈述通过三元组描述后得到:图中的每一段弧均对应于一个资源陈述(即三元组描述),其中弧的起始节点和终止节点分别对应于三元组中的主体和客体。为了描述的方便,在上述三元组中采用了前缀表示法,其中 example 代表了 http://www.example.org/terms/,而 dc则代表了 http://purl.org/dc/elements/1.1/。为了数据描述和程序处理的规范性,RDF 通常采用一种名为 RDF/ XML 的XML 语法来书写和交换 RDF 陈述,与 RDF 的简略记法——三元组(triples)所不同的是
【相似文献】

相关期刊论文 前10条

1 冯达盛;石振国;;智能通信网推理机制的研究[J];南通大学学报(自然科学版);2011年02期

2 刘治纲;叶水生;;基于多本体的搜索引擎框架设计[J];南昌航空大学学报(自然科学版);2011年02期

3 孙玉娣;裴勇;;专业教学资源库本体模型构建[J];软件;2011年04期

4 吴芳;;基于用户情境及语义网技术的个性化搜索引擎[J];江西图书馆学刊;2011年04期

5 宋亚楠;仲茜;钟远;;基于多属性的本体实例匹配算法[J];计算机工程;2011年13期

6 李静;;社会化标注的语义聚类[J];情报科学;2011年07期

7 罗泰晔;;浅论Web3.0下的信息服务[J];情报探索;2011年06期

8 李慧颖;瞿裕忠;;基于关键词的语义网数据查询研究综述[J];计算机科学;2011年07期

9 卢文兴;陈黎;朱洪波;王亚强;韩国辉;于中华;;基于本体翻译的领域本体自动构建[J];计算机工程与设计;2011年09期

10 李亚子;彭希珺;钱庆;侯丽;王军辉;;语义环境下电子期刊出版标准探讨[J];医学信息学杂志;2011年06期


相关博士学位论文 前10条

1 肖怀志;基于本体的历史年代知识元应用研究[D];武汉大学;2005年

2 穆肃;语义网技术支持的远程教育机构知识管理系统概念建模的研究[D];华南师范大学;2007年

3 刘勇军;基于语义Web服务的供应链知识协同模式研究[D];武汉理工大学;2006年

4 李明泉;模糊描述逻辑F-SHIQ公理体系及其推理机制的研究[D];天津大学;2008年

5 万毅;循证医学证据评价的语义模型与应用研究[D];第四军医大学;2009年

6 叶艳兵;广义质量驱动的工程项目定义系统研究[D];华中科技大学;2006年

7 李勇;分布式Web服务发现机制研究[D];北京邮电大学;2008年

8 许庆炜;基因本体及其注释数据语义网模型[D];华中科技大学;2008年

9 陈冰;基于Web服务的动态虚拟企业(WSDVE)及其关键技术研究[D];西北工业大学;2003年

10 崔运鹏;基于本体论的农业知识管理关键技术研究[D];中国农业科学院;2007年


相关硕士学位论文 前10条

1 封硕;基于语义网的博客搜索引擎的研究[D];西安电子科技大学;2007年

2 林斐斐;基于语义网的信息分析平台[D];汕头大学;2008年

3 纪明奎;基于语义网的个性化信息检索模型研究[D];黑龙江大学;2007年

4 万红波;语义网环境下本体映射的研究[D];重庆大学;2008年

5 杜鹃;面向长春市地理信息系统的语义网模型研究[D];吉林大学;2005年

6 李勇;关于本体整合的研究及其在供应链管理中的应用[D];天津大学;2005年

7 王翠波;基于语义网的智能导航研究[D];武汉大学;2005年

8 王炫召;Web Services合成中若干关键问题的研究[D];同济大学;2006年

9 武强;智能文档主体技术及其在知识管理中的应用[D];国防科学技术大学;2003年

10 庞美玉;基于TAP的上下文知晓框架研究[D];太原理工大学;2006年



本文编号:2892580

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2892580.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f0b4e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com