面向制造领域的知识融合与推理技术研究
发布时间:2022-01-15 20:02
随着物联网、数字化技术、人工智能的蓬勃发展,知识融合与推理技术在知识工程应用中也越来越重要。在知识处理过程中,较高的词向量维度导致运算成本较高;在知识建模过程中,提高效率的多人协同建模使得模型碎片化严重,缺乏有效的融合方法;在对知识推理过程中,基于构建的本体模型准确根据信息展开知识推理,提供准确的知识结果是知识应用任务中的重要环节。针对以上所述问题,本论文开展如下研究工作:为提高算法运算效率、降低训练成本、保证下游任务高效进行,本文研究制造领域知识语义词向量降维方法。基于爬取的制造领域知识语料,通过对词向量的准确性与训练成本进行分析研究对词向量进行二次降维的必要性;采用改进的栈式自编码器以及PCA两种降维方式对高维向量降维,利用对同一词语相同维度的语义相关性与训练成本的对比实验,证明该方法对词向量降维的有效性与合理性。为解决多人协同建模过程中本体模型的碎片化、歧义化以及冗余程度较高的问题,本文研究制造知识本体全局相似度及其融合方法。构建实体相似度模型,从实体角度研究节点间的相似关系;提出最大路径子图模型,从路径结构角度研究碎片本体基于路径结构方面的相似;基于上述两个模型定义碎片本体全局...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
知识推送技术路线图
哈尔滨工业大学工学硕士学位论文-13-图2-6所示,同一词汇的两种语言表现形式在向量空间中相对位置接近。利用词向量这个线性计算的特征可以通过向量的计算来对词语的的含义信息进行比较。图2-5词语在空间中的展示图2-6语义关系展示2.3.1基于Word2Vec词向量训练过程分析采用连续词袋模型(CBOW),将其在Word2Vec工具进行训练的执行,介绍微观角度的词向量究竟在网络中历经如何的计算过程得到向量结果。预先将获取到的中文语料库进行停用词去除、分词等处理,依次选取语料库中的词汇作为目标词汇,将所确定的上下文词汇作为神经网络的输入。为清晰描述训练过程,简单组建语料库由四个词语组成:{数控机床润滑装置}为例,以“机床”为中心词,设置窗口大小window_size为2。换言之,此训练过程为:根据语料库中的上下词“数控”、“润滑”、“装置”来预测训练目标,即中心词“机床”。详细训练过程如下所示:(1)预处理数据。将所有后续需要展开训练的词汇以独热式进行表示;该过程实质为所训练的词进行逐一编号处理。如表2-1所示,将所有词语表示为独热式编码;如图2-7所示,将独热式表示的词语作为神经网路的输入。
哈尔滨工业大学工学硕士学位论文-13-图2-6所示,同一词汇的两种语言表现形式在向量空间中相对位置接近。利用词向量这个线性计算的特征可以通过向量的计算来对词语的的含义信息进行比较。图2-5词语在空间中的展示图2-6语义关系展示2.3.1基于Word2Vec词向量训练过程分析采用连续词袋模型(CBOW),将其在Word2Vec工具进行训练的执行,介绍微观角度的词向量究竟在网络中历经如何的计算过程得到向量结果。预先将获取到的中文语料库进行停用词去除、分词等处理,依次选取语料库中的词汇作为目标词汇,将所确定的上下文词汇作为神经网络的输入。为清晰描述训练过程,简单组建语料库由四个词语组成:{数控机床润滑装置}为例,以“机床”为中心词,设置窗口大小window_size为2。换言之,此训练过程为:根据语料库中的上下词“数控”、“润滑”、“装置”来预测训练目标,即中心词“机床”。详细训练过程如下所示:(1)预处理数据。将所有后续需要展开训练的词汇以独热式进行表示;该过程实质为所训练的词进行逐一编号处理。如表2-1所示,将所有词语表示为独热式编码;如图2-7所示,将独热式表示的词语作为神经网路的输入。
【参考文献】:
期刊论文
[1]飞机结构件智能生产线管理系统研究[J]. 刘葳,陈云雷,池力. 中国设备工程. 2020(11)
[2]基于Protégé的交通地理本体构建方法[J]. 马苗苗,陈春辉. 北京测绘. 2019(12)
[3]基于分布式内存计算的三元N-gram算法的并行化研究[J]. 龚永罡,田润琳,廉小亲,吴萌. 计算机产品与流通. 2019(03)
[4]词向量发展综述[J]. 严红. 现代计算机(专业版). 2019(08)
[5]基于词向量技术与主题词特征的微博立场检测[J]. 郑海洋,高俊波,邱杰,焦凤. 计算机系统应用. 2018(09)
[6]基于词向量特征扩展的中文短文本分类研究[J]. 雷朔,刘旭敏,徐维祥. 计算机应用与软件. 2018(08)
[7]基于OWL的本体建模与推理研究[J]. 徐享忠,杨建东,汤再江. 装甲兵工程学院学报. 2017(05)
[8]网络大数据中的知识融合框架研究[J]. 周利琴,范昊,潘建鹏. 情报杂志. 2018(01)
[9]大数据环境下知识融合的关键问题研究综述[J]. 唐晓波,朱娟. 图书馆杂志. 2017(07)
[10]深度学习降维过程中的信息损失度量研究[J]. 石志国,杨志勇. 小型微型计算机系统. 2017(07)
硕士论文
[1]基于模糊本体融合与推理的知识发现研究[D]. 张良韬.武汉大学 2019
[2]基于GloVe的文本聚类研究与改进[D]. 徐露.华南理工大学 2019
[3]基于中心点选取与深度表示学习的文本聚类研究[D]. 王彬宇.战略支援部队信息工程大学 2018
[4]基于word2vec和卷积神经网络的文本分类研究[D]. 李林.西南大学 2018
[5]基于神经网络和决策树的文本分类及其应用研究[D]. 雷飞.电子科技大学 2018
[6]使用本体推理技术获取ER模型[D]. 许晓星.吉林大学 2017
[7]基于word2vec词向量的文本分类研究[D]. 朱磊.西南大学 2017
[8]本体推理中组合推理机制的研究[D]. 侯天祝.西南交通大学 2016
[9]文本分类停用词处理和特征选择技术研究[D]. 马治涛.西安电子科技大学 2014
[10]基于不一致本体非修正的知识推理方法[D]. 王省思.大连海事大学 2014
本文编号:3591238
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
知识推送技术路线图
哈尔滨工业大学工学硕士学位论文-13-图2-6所示,同一词汇的两种语言表现形式在向量空间中相对位置接近。利用词向量这个线性计算的特征可以通过向量的计算来对词语的的含义信息进行比较。图2-5词语在空间中的展示图2-6语义关系展示2.3.1基于Word2Vec词向量训练过程分析采用连续词袋模型(CBOW),将其在Word2Vec工具进行训练的执行,介绍微观角度的词向量究竟在网络中历经如何的计算过程得到向量结果。预先将获取到的中文语料库进行停用词去除、分词等处理,依次选取语料库中的词汇作为目标词汇,将所确定的上下文词汇作为神经网络的输入。为清晰描述训练过程,简单组建语料库由四个词语组成:{数控机床润滑装置}为例,以“机床”为中心词,设置窗口大小window_size为2。换言之,此训练过程为:根据语料库中的上下词“数控”、“润滑”、“装置”来预测训练目标,即中心词“机床”。详细训练过程如下所示:(1)预处理数据。将所有后续需要展开训练的词汇以独热式进行表示;该过程实质为所训练的词进行逐一编号处理。如表2-1所示,将所有词语表示为独热式编码;如图2-7所示,将独热式表示的词语作为神经网路的输入。
哈尔滨工业大学工学硕士学位论文-13-图2-6所示,同一词汇的两种语言表现形式在向量空间中相对位置接近。利用词向量这个线性计算的特征可以通过向量的计算来对词语的的含义信息进行比较。图2-5词语在空间中的展示图2-6语义关系展示2.3.1基于Word2Vec词向量训练过程分析采用连续词袋模型(CBOW),将其在Word2Vec工具进行训练的执行,介绍微观角度的词向量究竟在网络中历经如何的计算过程得到向量结果。预先将获取到的中文语料库进行停用词去除、分词等处理,依次选取语料库中的词汇作为目标词汇,将所确定的上下文词汇作为神经网络的输入。为清晰描述训练过程,简单组建语料库由四个词语组成:{数控机床润滑装置}为例,以“机床”为中心词,设置窗口大小window_size为2。换言之,此训练过程为:根据语料库中的上下词“数控”、“润滑”、“装置”来预测训练目标,即中心词“机床”。详细训练过程如下所示:(1)预处理数据。将所有后续需要展开训练的词汇以独热式进行表示;该过程实质为所训练的词进行逐一编号处理。如表2-1所示,将所有词语表示为独热式编码;如图2-7所示,将独热式表示的词语作为神经网路的输入。
【参考文献】:
期刊论文
[1]飞机结构件智能生产线管理系统研究[J]. 刘葳,陈云雷,池力. 中国设备工程. 2020(11)
[2]基于Protégé的交通地理本体构建方法[J]. 马苗苗,陈春辉. 北京测绘. 2019(12)
[3]基于分布式内存计算的三元N-gram算法的并行化研究[J]. 龚永罡,田润琳,廉小亲,吴萌. 计算机产品与流通. 2019(03)
[4]词向量发展综述[J]. 严红. 现代计算机(专业版). 2019(08)
[5]基于词向量技术与主题词特征的微博立场检测[J]. 郑海洋,高俊波,邱杰,焦凤. 计算机系统应用. 2018(09)
[6]基于词向量特征扩展的中文短文本分类研究[J]. 雷朔,刘旭敏,徐维祥. 计算机应用与软件. 2018(08)
[7]基于OWL的本体建模与推理研究[J]. 徐享忠,杨建东,汤再江. 装甲兵工程学院学报. 2017(05)
[8]网络大数据中的知识融合框架研究[J]. 周利琴,范昊,潘建鹏. 情报杂志. 2018(01)
[9]大数据环境下知识融合的关键问题研究综述[J]. 唐晓波,朱娟. 图书馆杂志. 2017(07)
[10]深度学习降维过程中的信息损失度量研究[J]. 石志国,杨志勇. 小型微型计算机系统. 2017(07)
硕士论文
[1]基于模糊本体融合与推理的知识发现研究[D]. 张良韬.武汉大学 2019
[2]基于GloVe的文本聚类研究与改进[D]. 徐露.华南理工大学 2019
[3]基于中心点选取与深度表示学习的文本聚类研究[D]. 王彬宇.战略支援部队信息工程大学 2018
[4]基于word2vec和卷积神经网络的文本分类研究[D]. 李林.西南大学 2018
[5]基于神经网络和决策树的文本分类及其应用研究[D]. 雷飞.电子科技大学 2018
[6]使用本体推理技术获取ER模型[D]. 许晓星.吉林大学 2017
[7]基于word2vec词向量的文本分类研究[D]. 朱磊.西南大学 2017
[8]本体推理中组合推理机制的研究[D]. 侯天祝.西南交通大学 2016
[9]文本分类停用词处理和特征选择技术研究[D]. 马治涛.西安电子科技大学 2014
[10]基于不一致本体非修正的知识推理方法[D]. 王省思.大连海事大学 2014
本文编号:3591238
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3591238.html
最近更新
教材专著