基于知识图谱的电网信息搜索引擎的设计与实现
发布时间:2021-04-14 10:48
着眼于中国的电力发展,从解放初期的蜡烛和煤油灯,到七十年代电灯泡的流行,到现在电视、冰箱、洗衣机的等家用电器的普及,国家飞速发展给我们带来了高质量的物质文化生活,推动了中国电力的快速发展,同时也带来了更多的挑战和考验。如今,随着大数据技术、物联网技术、智能化技术的不断发展,电力行业每天产生的数以亿计的数据量,但并没有得到充分的利用;各地区的电力数据分散管理,电网数据的断层现象也造成数据间的关联性缺失,在进行跨区域电网调度的时候,工作人员无法实时的、准确的获取各地区的电网数据,从而影响下一步的电网调度决策;在调度过程中,电网调度人员如果想获得所需要的信息,需要做多次检索查询人工筛查后才能找到最初想要查询的内容,对工作人员的技能知识要求高。因此,为整体的电网数据搭建一个统一的数据访问平台是提高电网数据利用率和电网调度工作效率的关键一环。针对电网调度全业务数据管理平台的建设这一目标,首先完成数据梳理的工作;其次,将梳理好的数据整合后存入关系数据库中,同时设计电网领域知识图谱,并实现数据转存,生成可视化知识图谱;最后,项目应用落脚于基于电网领域数据知识图谱的搜索引擎设计与实现上,从而完成电网调...
【文章来源】:中国科学院大学(中国科学院沈阳计算技术研究所)辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
各类型数据库所占市场比例图
基于知识图谱的电网信息搜索引擎的设计与实现14数据库的运行只会受到计算机硬件性能的影响,并不会受到业务本身的影响,而且这种易于扩展的图形存储模式还可以非常便捷地集成到任何一个项目中,因此,随着项目的不断推进,Neo4j数据库存储和操作的优势也会愈发明显。2.4大数据技术近年来,计算机领域最热门的关键词要数大数据和人工智能了,随着科技的不断进步,计算机的不断发展,可获取的数据量也越来越多,随之而来的海量数据处理问题也成了大数据环境下一热门课题。图2.2Hadoop生态圈Figure2.2HadoopEcosphere提及大数据,不得不说的就是Hadoop,Hadoop是一个框架,允许在集群中使用简单的编程模型对大规模数据集进行分布式计算。Hadoop框架是由多个模块联合构成的,如图2.2所示,不同模块负责不同的职责。其中,HDFS分布式文件系统是Hadoop的基石,具有高容错性的同时还可以提供高吞吐量的数据访问,对于大数据文件管理非常适用。Hive是一个数据仓库工具,可以完成结构化数据向表的映射,并有和SQL语句相似的数据查询语言,对开发人员友好,入手较容易。为了更方便的将关系型数据库的数据与Hadoop中HDFS中的数据交互,Sqoop应运而生,Sqoop可以将关系型数据库的数据导入到HDFS中,也可以将HDFS中的数据导出到关系型数据库中,Sqoop在工作过程中用到的平行处理计算框架就是Hadoop的另一个重点核心——MapReduce,MapReduce的工作原理就是分治原理,将一个数据的处理过程分成两步:Map函数和Reduce函
第2章相关技术综述15数,Map函数会通过键值为分组参考,完成并行的Map操作,整个过程充分利用了Hadoop中的MapReduce计算框架,实现了并行工作。2.5知识图谱知识图谱最初是由Google公司提出的,简单来说,就是以图形的方式来展现实体、实体属性以及实体之间的关系,是一种基于图的知识库。不同于同样是反应实体和实体关系的最经典的概念模型——ER图的是,知识图谱不仅仅显示的刻画出实体和实体之间的关系,不再单单只是能让人理解,而是定义了一种计算机能理解的数据模型——RDF三元组数据模型。RDF的基本数据模型包括三个对象类型,分别是资源、谓词和陈述:所有能用RDF表示的对象都成为资源,不同的资源拥有不同的URL;谓词用来描述资源的特征或资源间的关系,陈述则是主体、谓词和宾语的组合。Google的知识图谱最早的应用方式就是搜索结果中提供“知识卡片”,在传统的搜索引擎中,检索的结果通常是与查询关键字相关的链接按相关度计算结果排名先后显示给查询者,而在使用以知识图谱为技术支持的搜索引擎中检索时,如果用户查询输入的关键词能匹配到知识图谱中的某个实体,搜索引擎在返回查询结果时,不再单单返回与查询结果匹配相关度高的链接,还会返回一个知识卡片,集中展示与该实体相关的实体属性,如图2.3所示:在Google中检索科比布莱恩特。图2.3在Google中搜索科比布莱恩特Figure2.3SearchforKobeBryantinGoogle
【参考文献】:
期刊论文
[1]基于趋势变化分段的电力负荷组合预测方法[J]. 谭风雷,张军,马宏忠. 华北电力大学学报(自然科学版). 2020(02)
[2]一种基于LSTM模型的日销售额预测方法[J]. 吴娟娟,任帅,张卫钢,伍菁,李香云. 计算机技术与发展. 2020(02)
[3]基于图数据库和知识图谱的电力设备质量综合管理系统研究[J]. 汤亚宸,方定江,韩海韵,贾嵘,张华敏,刘婷婷,刘广一. 供用电. 2019(11)
[4]基于LSTM算法的电力谐波监测数据预测[J]. 刘启斌,尹温硕,胡卫华,陶顺. 电力电容器与无功补偿. 2019(05)
[5]基于图数据库的电网拓扑搜索引擎研究[J]. 李广野,李伟,王丽霞,温鑫. 信息技术. 2019(05)
[6]基于NoSQL的路网最短路径查询及优化[J]. 殷鹏. 电子技术与软件工程. 2018(22)
[7]ARIMA模型与指数平滑法预测门诊量效果比较[J]. 王晨,郭倩,周罗晶. 预防医学. 2018(11)
[8]国外搜索引擎知识图谱构建研究[J]. 梁晓婷. 科学技术创新. 2018(21)
[9]一种基于Neo4j图数据库的模糊查询研究与实现[J]. 李雪. 计算机技术与发展. 2018(11)
[10]基于知识图谱技术的电力设备缺陷记录检索方法[J]. 刘梓权,王慧芳. 电力系统自动化. 2018(14)
硕士论文
[1]基于NOSQL数据库的路网最短路径查询及优化研究[D]. 于海鹏.北京工业大学 2016
[2]数据缺失条件下的电力负荷预测算法研究[D]. 丁峰.华中科技大学 2016
[3]基于知识图谱的搜索引擎技术研究与应用[D]. 邵领.电子科技大学 2016
[4]基于Neo4j的大数据组织检索研究与应用[D]. 陆鹏.东南大学 2015
[5]智能电网时代电力信息通信技术的应用和研究[D]. 苏斌.华北电力大学 2015
本文编号:3137182
【文章来源】:中国科学院大学(中国科学院沈阳计算技术研究所)辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
各类型数据库所占市场比例图
基于知识图谱的电网信息搜索引擎的设计与实现14数据库的运行只会受到计算机硬件性能的影响,并不会受到业务本身的影响,而且这种易于扩展的图形存储模式还可以非常便捷地集成到任何一个项目中,因此,随着项目的不断推进,Neo4j数据库存储和操作的优势也会愈发明显。2.4大数据技术近年来,计算机领域最热门的关键词要数大数据和人工智能了,随着科技的不断进步,计算机的不断发展,可获取的数据量也越来越多,随之而来的海量数据处理问题也成了大数据环境下一热门课题。图2.2Hadoop生态圈Figure2.2HadoopEcosphere提及大数据,不得不说的就是Hadoop,Hadoop是一个框架,允许在集群中使用简单的编程模型对大规模数据集进行分布式计算。Hadoop框架是由多个模块联合构成的,如图2.2所示,不同模块负责不同的职责。其中,HDFS分布式文件系统是Hadoop的基石,具有高容错性的同时还可以提供高吞吐量的数据访问,对于大数据文件管理非常适用。Hive是一个数据仓库工具,可以完成结构化数据向表的映射,并有和SQL语句相似的数据查询语言,对开发人员友好,入手较容易。为了更方便的将关系型数据库的数据与Hadoop中HDFS中的数据交互,Sqoop应运而生,Sqoop可以将关系型数据库的数据导入到HDFS中,也可以将HDFS中的数据导出到关系型数据库中,Sqoop在工作过程中用到的平行处理计算框架就是Hadoop的另一个重点核心——MapReduce,MapReduce的工作原理就是分治原理,将一个数据的处理过程分成两步:Map函数和Reduce函
第2章相关技术综述15数,Map函数会通过键值为分组参考,完成并行的Map操作,整个过程充分利用了Hadoop中的MapReduce计算框架,实现了并行工作。2.5知识图谱知识图谱最初是由Google公司提出的,简单来说,就是以图形的方式来展现实体、实体属性以及实体之间的关系,是一种基于图的知识库。不同于同样是反应实体和实体关系的最经典的概念模型——ER图的是,知识图谱不仅仅显示的刻画出实体和实体之间的关系,不再单单只是能让人理解,而是定义了一种计算机能理解的数据模型——RDF三元组数据模型。RDF的基本数据模型包括三个对象类型,分别是资源、谓词和陈述:所有能用RDF表示的对象都成为资源,不同的资源拥有不同的URL;谓词用来描述资源的特征或资源间的关系,陈述则是主体、谓词和宾语的组合。Google的知识图谱最早的应用方式就是搜索结果中提供“知识卡片”,在传统的搜索引擎中,检索的结果通常是与查询关键字相关的链接按相关度计算结果排名先后显示给查询者,而在使用以知识图谱为技术支持的搜索引擎中检索时,如果用户查询输入的关键词能匹配到知识图谱中的某个实体,搜索引擎在返回查询结果时,不再单单返回与查询结果匹配相关度高的链接,还会返回一个知识卡片,集中展示与该实体相关的实体属性,如图2.3所示:在Google中检索科比布莱恩特。图2.3在Google中搜索科比布莱恩特Figure2.3SearchforKobeBryantinGoogle
【参考文献】:
期刊论文
[1]基于趋势变化分段的电力负荷组合预测方法[J]. 谭风雷,张军,马宏忠. 华北电力大学学报(自然科学版). 2020(02)
[2]一种基于LSTM模型的日销售额预测方法[J]. 吴娟娟,任帅,张卫钢,伍菁,李香云. 计算机技术与发展. 2020(02)
[3]基于图数据库和知识图谱的电力设备质量综合管理系统研究[J]. 汤亚宸,方定江,韩海韵,贾嵘,张华敏,刘婷婷,刘广一. 供用电. 2019(11)
[4]基于LSTM算法的电力谐波监测数据预测[J]. 刘启斌,尹温硕,胡卫华,陶顺. 电力电容器与无功补偿. 2019(05)
[5]基于图数据库的电网拓扑搜索引擎研究[J]. 李广野,李伟,王丽霞,温鑫. 信息技术. 2019(05)
[6]基于NoSQL的路网最短路径查询及优化[J]. 殷鹏. 电子技术与软件工程. 2018(22)
[7]ARIMA模型与指数平滑法预测门诊量效果比较[J]. 王晨,郭倩,周罗晶. 预防医学. 2018(11)
[8]国外搜索引擎知识图谱构建研究[J]. 梁晓婷. 科学技术创新. 2018(21)
[9]一种基于Neo4j图数据库的模糊查询研究与实现[J]. 李雪. 计算机技术与发展. 2018(11)
[10]基于知识图谱技术的电力设备缺陷记录检索方法[J]. 刘梓权,王慧芳. 电力系统自动化. 2018(14)
硕士论文
[1]基于NOSQL数据库的路网最短路径查询及优化研究[D]. 于海鹏.北京工业大学 2016
[2]数据缺失条件下的电力负荷预测算法研究[D]. 丁峰.华中科技大学 2016
[3]基于知识图谱的搜索引擎技术研究与应用[D]. 邵领.电子科技大学 2016
[4]基于Neo4j的大数据组织检索研究与应用[D]. 陆鹏.东南大学 2015
[5]智能电网时代电力信息通信技术的应用和研究[D]. 苏斌.华北电力大学 2015
本文编号:3137182
本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/3137182.html