基于树形分类的知识构建和查询应用
发布时间:2021-10-17 14:27
基于树形分类的数据广泛存在于人们的生产生活中,其具有内在的逻辑性与科学性,可以更好地表现现实事物中的包含关系。但是受限于本身的划分规则,其存在一定的局限性。主要表现在当新的划分需求出现时,会在原有树形分类下会产生一些跨越多个子类的新类,这个新类所包含的数据可能分布在原有树形分类的各个分支中。因此需要对树形分类数据进行知识构建,提取这些分支以满足新的划分需求。同时,本文根据提取的新类信息设计并实现分类查询的功能。在根据树形分类数据进行知识构建过程中,本文从树形分类的结构特点出发,将数据的位置信息作为构建的依据。当需要根据新类名进行知识构建时,将与新类名相匹配的结点信息进行剪枝,并将这些结点信息再次在树形分类的数据中进行匹配剪枝操作,重复这一部分直到无结点匹配成功时,结束知识构建。通过多次对子结点的提取,能够将不含有新类名但与之语义相关的结点提取出来,避免了仅仅基于新类名进行字符串匹配而造成构建结果不全面的问题,实现了基于剪枝的知识构建方法。在分类查询的过程中,首先需要对数据进行预处理,将其转化为分类查询算法可以处理的向量形式。然后需要对于常用的分类算法进行实验比较,选取适合本文的分类查询...
【文章来源】:北京林业大学北京市 211工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图3.5?HTML页面的树形结构表示??
作为知识构建的数据准备。??本文所采用的数据,其结点信息W<key,value>形式的表示。其中key值表示了信??息的标签,value表示了信息的内容。本文所采取数据标签中存在的条目如图3.6所??不。??MeSH?Heading??Tree?Number(s)??Unique?ID??Annotation??Scope?Note??Entry?Version??Entry?Term(s)??Previous?Indexing??Public?MeSH?Note??History?Note??Date?Established??Date?of?Entry??Revision?Date??图3.6本文所釆用数据信息??Figure?3.6?Data?information?used?in?this?paper??由图3.6所示,本文所采取的数据其结点信息不仅包含了对于结点描述如MeSH??Heading、Scope?Note,还存在一些其它信息,如?Date?Established、Revision?Date、History??Note等。这些信息是对结点的一个补充说明,但并不能代表结点的特征。因此应当??去除这些信息,避免其对知识构建造成影响。??最后将树中所有结点的数据信息创建索引并存储到本地,索引记录了数据信息在??结点中出现的位置,查询结点信息时,不需要在树形分类数据中进行遍历,只需根据??其下标进行查找,可以节省查找时间。当树形数据不出现变动的时候,索引不需要调??整
基于树形分类的知识构建和查询应用??研究对象为基于树形分类的数据,因此要选择合适的数据示,尽可能得保存原树形分类数据中的信息。??数据的特点??的数据并不是脱离彼此独立存在的,在数据之间常常存在16)。每一个数据都对应树形结构中的一个结点;数据之兄弟关系等。因此,基于树形分类的数据不仅包含结点间的关系信息。若实现基于新类名的知识构建,需要同时结点之间关系信息,从而最大程度上保证知识构建结果准据如图3.7所示。??
【参考文献】:
期刊论文
[1]WordNG-Vec:一种应用于CNN文本分类的词向量模型[J]. 王勇,何养明,邹辉,黎春,陈荟西. 小型微型计算机系统. 2019(03)
[2]一种改进的类别区分词特征选择算法[J]. 李富星,蒙祖强. 计算机与现代化. 2019(03)
[3]基于SA-SVM的中文文本分类研究[J]. 郭超磊,陈军华. 计算机应用与软件. 2019(03)
[4]基于最大匹配算法的似然导向中文分词方法[J]. 杨贵军,徐雪,凤丽洲,徐玉慧. 统计与信息论坛. 2019(03)
[5]基于词向量的文本分类研究[J]. 马力,李沙沙. 计算机与数字工程. 2019(02)
[6]中文文本分类方法研究[J]. 李凯. 电脑知识与技术. 2019(04)
[7]基于支持向量机的不均衡文本分类方法[J]. 高超,许翰林. 现代电子技术. 2018(15)
[8]基于Doc2Vec与SVM的聊天内容过滤[J]. 岳文应. 计算机系统应用. 2018(07)
[9]树形层次结构的非平衡SVM分类方法[J]. 邓曦辉,赵丽. 计算机工程与设计. 2017(08)
[10]一种基于改进的TF-IDF和支持向量机的中文文本分类研究[J]. 郭太勇. 软件. 2016(12)
硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于word2vec和SVM的文本内容监测分析应用研究[D]. 王庆龙.南昌大学 2018
[3]基于最小二乘支持向量机的软件系统老化预测研究[D]. 陈珂.西安建筑科技大学 2018
[4]基于混合核函数MAPSO-SVR的边坡位移预测研究[D]. 于良.江西理工大学 2018
[5]闭合频繁子树挖掘算法研究[D]. 唐知毅.吉林大学 2016
[6]基于GPU的树形结构数据处理[D]. 陆易凡.东南大学 2016
[7]基于模型空间的树形数据分类和回归[D]. 董亚东.中国科学技术大学 2016
[8]基于树形关键词集合的中文文本分类方法研究与实现[D]. 连惠琼.华南理工大学 2015
本文编号:3441917
【文章来源】:北京林业大学北京市 211工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图3.5?HTML页面的树形结构表示??
作为知识构建的数据准备。??本文所采用的数据,其结点信息W<key,value>形式的表示。其中key值表示了信??息的标签,value表示了信息的内容。本文所采取数据标签中存在的条目如图3.6所??不。??MeSH?Heading??Tree?Number(s)??Unique?ID??Annotation??Scope?Note??Entry?Version??Entry?Term(s)??Previous?Indexing??Public?MeSH?Note??History?Note??Date?Established??Date?of?Entry??Revision?Date??图3.6本文所釆用数据信息??Figure?3.6?Data?information?used?in?this?paper??由图3.6所示,本文所采取的数据其结点信息不仅包含了对于结点描述如MeSH??Heading、Scope?Note,还存在一些其它信息,如?Date?Established、Revision?Date、History??Note等。这些信息是对结点的一个补充说明,但并不能代表结点的特征。因此应当??去除这些信息,避免其对知识构建造成影响。??最后将树中所有结点的数据信息创建索引并存储到本地,索引记录了数据信息在??结点中出现的位置,查询结点信息时,不需要在树形分类数据中进行遍历,只需根据??其下标进行查找,可以节省查找时间。当树形数据不出现变动的时候,索引不需要调??整
基于树形分类的知识构建和查询应用??研究对象为基于树形分类的数据,因此要选择合适的数据示,尽可能得保存原树形分类数据中的信息。??数据的特点??的数据并不是脱离彼此独立存在的,在数据之间常常存在16)。每一个数据都对应树形结构中的一个结点;数据之兄弟关系等。因此,基于树形分类的数据不仅包含结点间的关系信息。若实现基于新类名的知识构建,需要同时结点之间关系信息,从而最大程度上保证知识构建结果准据如图3.7所示。??
【参考文献】:
期刊论文
[1]WordNG-Vec:一种应用于CNN文本分类的词向量模型[J]. 王勇,何养明,邹辉,黎春,陈荟西. 小型微型计算机系统. 2019(03)
[2]一种改进的类别区分词特征选择算法[J]. 李富星,蒙祖强. 计算机与现代化. 2019(03)
[3]基于SA-SVM的中文文本分类研究[J]. 郭超磊,陈军华. 计算机应用与软件. 2019(03)
[4]基于最大匹配算法的似然导向中文分词方法[J]. 杨贵军,徐雪,凤丽洲,徐玉慧. 统计与信息论坛. 2019(03)
[5]基于词向量的文本分类研究[J]. 马力,李沙沙. 计算机与数字工程. 2019(02)
[6]中文文本分类方法研究[J]. 李凯. 电脑知识与技术. 2019(04)
[7]基于支持向量机的不均衡文本分类方法[J]. 高超,许翰林. 现代电子技术. 2018(15)
[8]基于Doc2Vec与SVM的聊天内容过滤[J]. 岳文应. 计算机系统应用. 2018(07)
[9]树形层次结构的非平衡SVM分类方法[J]. 邓曦辉,赵丽. 计算机工程与设计. 2017(08)
[10]一种基于改进的TF-IDF和支持向量机的中文文本分类研究[J]. 郭太勇. 软件. 2016(12)
硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于word2vec和SVM的文本内容监测分析应用研究[D]. 王庆龙.南昌大学 2018
[3]基于最小二乘支持向量机的软件系统老化预测研究[D]. 陈珂.西安建筑科技大学 2018
[4]基于混合核函数MAPSO-SVR的边坡位移预测研究[D]. 于良.江西理工大学 2018
[5]闭合频繁子树挖掘算法研究[D]. 唐知毅.吉林大学 2016
[6]基于GPU的树形结构数据处理[D]. 陆易凡.东南大学 2016
[7]基于模型空间的树形数据分类和回归[D]. 董亚东.中国科学技术大学 2016
[8]基于树形关键词集合的中文文本分类方法研究与实现[D]. 连惠琼.华南理工大学 2015
本文编号:3441917
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3441917.html