基于领域知识图谱的网络信息可信度测度
【图文】:
图 3.1 模型构建框架图Fig.3.1 Model building frame diagram3.1.1 文本预处理由于文本聚类或者分类处理的是大量非结构化的利用自然语言描述的非统一结构的文本数据,因此对文本进行特征提取前,需要先对这些文本数据进行预处理,这会影响文本聚类或者分类的准确率、效率以及最终模式的有效性。由于中文文本的词语之间没有空格,那么分词就是一个必须要处理的问题。本文基于医疗词典利用爬虫软件对获取的文本进行分词。中文分词后文本就变成了单个的词语,这些词语就是文本的特征项,如果直接用分词后的词语集合进行建模的话,一来词语空间比较大,导致性能比较低;二来词语集合中有很多低频词、无意义词等噪音,也会降低聚类和分类的效果,,所以要通过特征项提取选出最能代表文本的特征项和最能区分文本的特征项。本文建立在 TF-IDF 计算简洁、速度快的基础上,采用 TF-IDF 值来度量每个词语的重要程度,通过 TF-IDF 值排序及语义分析选取特征词语。
高血压症状和高血压治疗方案的专家性经验内容并整合成文本集然。先分别对高血压症状及治疗方案分别进行同质网络聚类,以此构将症状词频矩阵和治疗词频矩阵个相乘得到症状-治疗方案 2-mode质网络聚类并构建知识图谱,将症状-治疗方案之间的关联关系可同质网络聚类知识图谱构建可视化血压症状样本数据知识图谱方便分析与观测,本文从实验数据中选取 80 个对于症状判断重要程样本数据进行分析。首先用 R 画出这个样本的碎石图[73],可以确定可以方便提取出其中的几个小类具体展示。
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G353.1
【参考文献】
相关期刊论文 前10条
1 李保珍;王亚;;社交媒体环境下网络信息可信度评估研究综述[J];情报学报;2015年12期
2 钱扬;张金波;吴一阳;;大型无线网络入侵安全风险等级评估[J];计算机仿真;2015年12期
3 曹倩;赵一鸣;;知识图谱的技术实现流程及相关应用[J];情报理论与实践;2015年12期
4 刘春年;陈通;;基于共词聚类的我国档案信息化研究结构、趋势分析[J];档案管理;2015年06期
5 王艳博;;图书馆学知识图谱分析[J];科技情报开发与经济;2015年21期
6 彭云;万常选;江腾蛟;刘德喜;刘喜平;;一种词聚类LDA的商品特征提取算法[J];小型微型计算机系统;2015年07期
7 冯伟伟;秦长江;;国内机构知识库研究现状分析——基于知识图谱的视角[J];现代情报;2015年06期
8 高学东;黄月;;异质对象协同实体解析的联合聚类算法[J];系统工程理论与实践;2015年04期
9 贾红雨;赵雪燕;邱晨子;;基于复杂网络的微博网络舆情图谱分析方法研究[J];现代情报;2015年03期
10 许德山;张运良;李芳;;中文本体三元组的单字索引与更新方法研究[J];图书情报工作;2014年22期
相关硕士学位论文 前4条
1 付茜;维基百科知识的层次化体系构建[D];华中科技大学;2016年
2 刘彦含;语义物联网中基于统一知识图谱的语义协同方法[D];大连海事大学;2016年
3 范永东;模型选择中的交叉验证方法综述[D];山西大学;2013年
4 吴启南;一种改进的基于层次的聚类和异常检测算法及其在数据挖掘平台上的应用[D];新疆大学;2002年
本文编号:2668140
本文链接:https://www.wllwen.com/tushudanganlunwen/2668140.html