基于枸杞病虫害知识图谱的问答系统研究与实现

发布时间:2021-03-08 01:05
  “互联网+农业”凭借大数据、人工智能等前沿技术推动农业生产、病害防治及销售等方面的发展取得了重要成果。“智慧农业”已成为科技辅助农业的重要举措,不仅辅助农业增产、农业病害防治,且借用智能信息化来提升农业生产效率和水平。枸杞产业链作为宁夏地区特色产业,随着枸杞的种植规模提升、品种创新、销售方式转变等因素影响,必将推动枸杞种植、病害防治、专家咨询及销售的智能化平台的大力发展。知识图谱从早期Google用来增强搜索引擎效果的信息表示形式,逐渐发展成为一种新型的知识管理与知识创造技术,是提升语义检索、智能问答等智能化应用的重要基础。通过调研和分析,本文首先对枸杞病虫害非结构化文本数据进行预处理,抽取枸杞病虫害知识存入Neo4j数据库中作为数据层,为枸杞知识可视化检索和智能问答做数据基础。其次,知识抽取是构建知识图谱过程中最基础和关键的步骤,本文依据宁夏本地的枸杞病虫害数据的特点确定实体分类,针对病虫害领域提出了一种考虑实体边界划分问题的标注规则,并利用该规则对病害名称、症状、农药品进行实体标注。另外考虑到病虫害实体边界模糊的特点,本文分析与设计了基于ALBERT模型的病虫害实体识别模型,使用A... 

【文章来源】:宁夏大学宁夏回族自治区 211工程院校

【文章页数】:57 页

【学位级别】:硕士

【部分图文】:

基于枸杞病虫害知识图谱的问答系统研究与实现


图1-1研究框架图??

知识图,构建过程,实体


程上,Cobo等[8]对数据进行采集与检索,经过数据清洗与处理达到数据标??准化从而构建知识图谱,并进行可视化展示:杨思洛等[9]认为知识图谱的构建过程可由数据获娶??实体与关系的构建、数据标准化和知识图谱可视化4部分构成:Bomei?等M认为知识图谱构建由??数据获娶实体关系概念定义、方法选择、知识融合以及知识图谱可视化5部分构成。虽然这些??过程都各有差异,但都存在着共同点,即知识抽娶知识融合、知识处理。因此本文将知识图谱??的构建过程分为知识抽娶知识融合、知识处理三个主要部分,如图2-1所示。知识图谱中知识??抽取主要是指抽取文本中的实体信息、关系信息、属性信息来构成〈实体-关系-实体〉、〈实体-关??系-属性〉等三元组信息;知识融合中的实体对齐则针对同一实体的表示方式不同来进行匹配,实??体消歧则针对同一实体在不同上下文表达语义不同来进行区分:知识推理则是以现有的知识图谱??通过各种方法去推理获取潜在的知识。??I?1?.?I?1?I?1??I?(?|?取?I?|?I??结构化娜V-I?i—i ̄f数据整合i丨丨娜壤示??II?j]?1???1?*?^???^1??I?i?1?丨?I?丨?丨?c—^??I?rr?N?|?i?I?|?,丄?'?I?^??I?^^?|?j?[实咖取?j?J?|?^?〕|?|?^?)?I?图谙??3?链舰挪)I?1?r?^?i?|?v?J?I?|?U?v.?J??|?UJ?i ̄^?l絲臟JI」i?丄?i?i?丄?i??I?(?v?I???,?|?["实体消歧?1 ̄I?l—l?[iRfiSte]?I??織4?I?[??議]|?I

流程图,流程,方法,机器学习


将数据转换为结构化形式。非结构化数据主??要以文本文档为主,通常采用基于规则或神经网络的方法从中抽取实体、关系、属性等信息。本??文针对枸杞病虫害非结构化文本数据进行抽取,对命名实体识别方法进行了研宂。??命名实体识别(Named?Entity?Recognition,NER)作为知识图谱构建过程中重要的基础工作,主??要任务是识别出文本中的人名、地名等表示命名实体的部分并加以归类M。主要以基于规则和词??典的方法、基于统计机器学习的方法以及基于神经网络的方法为主。命名实体识别流程图如图2-2??所示:??_?_?mmm?__?_??|7?-T?l?h?,l?|T?,l??I?雜驗?|?|?基?w?|?|??ti^?|??,雜?'?I,?,l?I?I?I?I??'?^?i?觸?i?i?1?i?ii?n?r??總构化抹—?!?]?|?^基于习|?^?召酵?|???睹果??\?I?ii?II?|?U?L??数据标注?|?J墓于神经网结J?J?F1???图2-2命名实体识别流程??基于规则和词典的方法:基于规则的方法以人工构建规则模板,通过关键字词、标点符号等??字符串匹配为主。国外最早研宄了英文命名实体识别的方法,Rau:15]采用了规则的方法首次识别??了公司名称,但中文命名实体的词性特征较英文有很大不同,因此中文实体识别的难度较英文大。??张小衡M等基于采用规则的方法对高校等中文机构名称进行了实验研究。这类方法大多依赖于知??识库和词典的建立,但知识库与词典系统建设周期长,可移植性较差。??基于统计机器学习的方法:基相较于基于规则的方法,基于统计机器学习的方法不依赖于知??


本文编号:3070134

资料下载
论文发表

本文链接:https://www.wllwen.com/nykjlw/dzwbhlw/3070134.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e3380***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com