当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于微数据的物联网实体表示与搜索

发布时间:2019-07-23 10:05
【摘要】:当前,硬件设备成本的降低,嵌入式技术的发展和全球性网络的兴起有效地推动了物联网的发展。未来物联网将在社会各领域和生活各方面发挥重要作用。目前,各个国家政府、企业机构和研究机构等都大力发展物联网。物联网发展和应用中的一个重要环节是提供针对物理实体的搜索服务,帮助用户可以从海量的动态的物理实体中有效地搜索满足需求的信息并加以利用。为了解决物联网物理实体搜索问题,本文研究基于Web的物联网实体搜索。基于Web的物联网重用了Web技术,在Web层面整合现实和信息世界信息,解决实际事物之间无缝的数据共享的问题。 本文首先分析了物联网实体的组成结构,介绍了基于微数据的信息描述方式和现代搜索引擎的相关技术。指出物联网实体是物理实体在信息世界的抽象。微数据的描述方式使对信息的描述富有语义,有助提高识别和管理信息的能力。 其次,提出了一种物联网实体描述框架,基于该框架使用微数据对物联网实体信息进行描述,建立网站存储物联网实体描述网页,设计并实现了物联网实体搜索引擎,用于对微数据描述的实体信息进行搜索。物联网实体描述框架主要由实体模型、资源模型和服务模型构成。对物联网实体属性的详细描述通过使用微数据完成。物联网实体搜索引擎,实现对描述物联网实体网页及其属性信息的获取、解析、索引和检索,提出了预测实体动态属性值的方法。 最后,使用现有搜索引擎结构化工具,识别和解析微数据描述的物联网实体网站中实体内容信息,对实体搜索引擎进行测试。对网站中实体描述网页建立索引,通过搜索引擎搜索关键词相关的物联网实体信息,查看搜索引擎检索结果是否准确,动态属性预测的实现状况。与通用搜索引擎在索引建立和关键字检索方面做比较。
【图文】:

Google站长工具结构化数据测试输入截图


使用 Google 网站站长工具的结构化数据测试工具进行测试,测试输入和输出截图如图 5-1 和图 5-2 所示。在页面内输入位置填入 room1 的描述信息。在下面输出中有测试工具对 room1 的解析结果。结果显示,定义的实体的属性的“名称-值”对被完好的提取出来,对于本域特性、时间属性和空间属性的结构也被解析出来。Google 支持对微数据的识别,因而实体描述可以被完整解读。由结果可以看出 room1 实体的主要信息被提取出来,在主体属性中表明了实体的自然属性,包括 id、name、type、ismobile,其属性名和值一一对应。实体的本域特性 domainattribute、时间属性 temporalfeature 和空间属性 location 则被识别为新的 item,属性名对应的值分别对应不同 item,不同的 item 中有描述这些特性和属性的详细属性名称-值对。本域特性对应了 item 1,包含了开关状态的属性对,和属性类型的说明,开关状态是动态属性,因而使用 URL 链接到存储开关状态的文档的位置,以便掌握房间的开关状态。空间属性对应 item 2,包含三个维度的信息和地理实体和位置实体两个实体的 URL,,用于详细描述地理信息。时间属性对应 item 3,拥有描述时间信息的 URL。

访问实体网站查看实体描述访问实体网站查看实体描述结果图5-3所示


图 5-3 访问实体网站查看实体描述访问实体网站查看实体描述结果图 5-3 所示。使用 IE 浏览器,访问实体网站,查看实体网站中实体描述网页,由结果可出,访问网站成功,查看的网页中显示了实体属性值的全部正确信息,并没性信息。网页中有 room1 实体的属性“名称-值”对,属性名称使用 itemprop 定义,在ML 的标签中,因而在使用 IE 浏览器打开文件时,标签的内容不显示,实体称没有显示出来,只显示了属性值,IE 浏览器不支持微数据的语义显示。以上实验证明实体描述可以被 Google 结构化工具解析,实体描述网页中不语法和语义错误,基于微数据的物联网实体描述可以被浏览器识别属性值,不能被识别属性。.2 搜索引擎测试实体搜索引擎和全文搜索引擎索引和检索时间记录如表 5-1 所示。表5-1 实体搜索引擎和全文搜索引擎索引和检索时间记录
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.44;TN929.5;TP391.3

【相似文献】

相关期刊论文 前10条

1 马向玲,马向阳,李伟;用Dreamweaver制作博士招生网站[J];教育信息化;2001年08期

2 小贝壳;保存网页的利器——网文快捕信息管理速战[J];电脑应用文萃;2004年03期

3 ;剖析恶意网页修改注册表[J];电脑数码采购周刊;2005年02期

4 戴明星;杜彦辉;;基于WebLech的内容搜索引擎设计[J];计算机工程;2008年09期

5 miniworm;;圆角的革命[J];电脑爱好者;2007年07期

6 张启宇;朱玲;车忠志;;网页文件元数据的自动提取[J];电脑与电信;2008年04期

7 陈宁江;杜凡远;;网页防篡改应用技术分析[J];现代机械;2009年03期

8 中英;;神奇的Internet临时文件夹[J];网络科技时代(数字冲浪);2002年01期

9 李佩华;制作网络版课件的快捷途径[J];教育信息化;2004年06期

10 于艳杰;网页文件上传方法分析与研究[J];哈尔滨学院学报;2005年05期

相关会议论文 前10条

1 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

5 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

6 张星星;穗志方;;基于网页中深度并列结构的实例提取算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

7 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

8 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

9 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

10 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

相关重要报纸文章 前10条

1 陶秋丰;万事俱备,只欠东风[N];电脑报;2007年

2 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年

3 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年

4 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年

5 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

6 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年

7 李一鑫;搜索排名的红与黑[N];财经时报;2007年

8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年

9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年

10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年

相关博士学位论文 前10条

1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

5 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

6 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

7 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年

8 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

9 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

10 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年

相关硕士学位论文 前10条

1 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年

2 史晶晶;基于CRF的Web机构实体信息抽取系统[D];吉林大学;2011年

3 陈瑜芳;主题爬虫系统的研究[D];武汉理工大学;2010年

4 黄伟光;网页木马的防御与检测技术研究[D];北京交通大学;2011年

5 易方昶;基于网页后门木马监测系统的研究和设计[D];北京化工大学;2010年

6 王征;基于布隆过滤器算法的网页消重技术的实现与应用[D];北京交通大学;2010年

7 尹力;网页防篡改系统在校园网中的应用研究[D];河北科技大学;2011年

8 魏欣;基于微数据的物联网实体表示与搜索[D];哈尔滨工业大学;2013年

9 卢承山;基于领域的主题信息采集技术研究[D];武汉理工大学;2011年

10 孔辉;一种网页防篡改系统的设计与实现[D];北京邮电大学;2011年



本文编号:2518081

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2518081.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户220ef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com