基于复杂网络的报告文本可视化模型研究
发布时间:2017-04-24 07:15
本文关键词:基于复杂网络的报告文本可视化模型研究,由笔耕文化传播整理发布。
【摘要】:随着现代社会信息化的不断加深,工作和学习过程中涌现出大量的文本信息,尤其是包含信息内容较为丰富的调查报告文本,一方面给人们带来了大量的有用信息,另一方面也给人们在阅读和掌握大量的信息带来了挑战。通过对报告文本建立文本可视化模型,用图的形式展示报告文本信息,在缩短读者阅读时间的同时,还能发现文本潜在的信息关联,促进信息的有效利用。 通过对调查报告文本的内容结构进行分析,并结合概念分层理论,完成了实体类型以及实体粒度特征的界定;结合复杂网络理论以及实体粒度特征,对实体类内部和外部关系进行界定;在自动分词的前提下,基于词典和规则的方法完成实体的抽取;并采用以模式匹配的关系抽取Ontology的关系抽取模型为主体的混合模型完成实体关系的抽取,形成信息实体关系矩阵,完成将非结构化的文本信息转化为结构化信息。借鉴Card提出的信息可视化参考模型,依据不同类型的信息实体关系矩阵,构建了调查报告文本的可视化模型,并利用复杂网络中的度分布理论对文本信息进行统计分析。最后,以国土资源大调查报告为例进行实证分析,对该调查报告内容进行不同层次的信息可视化,并对报告文本信息内容进行统计分析,挖掘出报告中的关键信息及信息之间的关联,,验证了该文本可视化模型的可行性。 本文的研究将复杂网络理论应用于报告文本的可视化中,通过分析调查报告文本特征,建立报告文本可视化模型,最终的可视化结果不仅能直观的显现文本信息,同时还能有效的利用复杂网络的统计指标去挖掘文本中的潜在信息关联,在丰富报告文本可视化理论的同时,也使复杂网络在研究文本内容和潜在信息关联上有一定的扩展。
【关键词】:调查报告 信息可视化 复杂网络 信息实体 实体关联
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:C931.6
【目录】:
- 摘要5-6
- Abstract6-9
- 1 绪论9-19
- 1.1 研究背景、目的与意义9-10
- 1.2 国内外研究现状10-16
- 1.2.1 信息服务相关理论10-11
- 1.2.2 复杂网络相关理论11-13
- 1.2.3 信息抽取相关理论13-14
- 1.2.4 文本信息可视化相关理论14-15
- 1.2.5 研究现状分析15-16
- 1.3 主要研究内容16-17
- 1.4 技术路线17-19
- 2 信息实体和实体关系的界定19-26
- 2.1 文本及报告文本内容分析19-20
- 2.2 调查报告文本的信息实体20-23
- 2.2.1 信息实体的概念20
- 2.2.2 信息实体的特征20-21
- 2.2.3 信息实体的建立21-23
- 2.3 调查报告文本的信息实体关系23-25
- 2.3.1 信息实体关系的定义23-24
- 2.3.2 信息实体关系的分类24-25
- 2.4 本章小结25-26
- 3 信息实体和实体关系的抽取26-31
- 3.1 文本预处理26
- 3.2 信息实体的抽取26-28
- 3.2.1 信息实体抽取概述26-27
- 3.2.2 信息实体抽取方法27-28
- 3.3 信息实体关系的抽取28-30
- 3.3.1 信息实体关系抽取概述28-29
- 3.3.2 信息实体关系抽取方法29-30
- 3.4 本章小结30-31
- 4 调查报告文本可视化模型建立与分析31-38
- 4.1 调查报告文本可视化概念模型31-34
- 4.1.1 调查报告文本可视化模型的要素32-33
- 4.1.2 调查报告文本可视化模型的转换过程33-34
- 4.2 调查报告文本可视化模型各要素的实现34-35
- 4.3 调查报告文本可视化模型结果分析35-36
- 4.3.1 调查报告文本的粒度层次分析35-36
- 4.3.2 文本信息统计分析方法36
- 4.4 本章小结36-38
- 5 实证分析38-52
- 5.1 调查报告文本信息来源38
- 5.2 国土资源大调查报告实体和实体关系的抽取38-41
- 5.2.1 报告实体的提取38-41
- 5.2.2 报告实体关系的提取41
- 5.3 国土资源大调查报告可视化结果与分析41-51
- 5.3.1 总体可视化41-43
- 5.3.2 各实体类可视化43-46
- 5.3.3 两两实体可视化46-49
- 5.3.4 实体粒度层次可视化49-51
- 5.4 本章小结51-52
- 6 结论与展望52-54
- 6.1 结论52-53
- 6.2 展望53-54
- 致谢54-55
- 参考文献55-59
- 附录59
【引证文献】
中国硕士学位论文全文数据库 前1条
1 王凯;新闻文本集可视化模型研究[D];中国地质大学(北京);2013年
本文关键词:基于复杂网络的报告文本可视化模型研究,由笔耕文化传播整理发布。
本文编号:323797
本文链接:https://www.wllwen.com/guanlilunwen/glzh/323797.html