当前位置:主页 > 社科论文 > 图书档案论文 >

基于多维尺度分析的潜在主题可视化研究

发布时间:2021-03-29 16:04
  本文的研究目标是“使用可视化方法表示、挖掘、早现和解释文本集包含的潜在主题,展示不同层次和观测水平上的潜在主题、发现主题之间的关联,将潜在主题可视化方法应用于特定领域的文本知识发现”。论证了使用词条集合表示潜在主题的原理、在转置向量空间中词的邻近关系表示集聚关系的原理、用多维尺度分析(MDS)将邻近关系投影到低维空间的原理,构建了使用MDS可视化方法挖掘并展示潜在主题的基本流程。本文认为可以找到一组在文本集中具有集聚关系的词条集合来表示潜在主题,将这种集聚关系抽象出来,就能得到从属于同一个主题的词条集合。为了将集聚关系抽象出来,使用词条在转置向量空间中的邻近关系表示词条在原始文本集中的集聚特性,有集聚关系的词条会在高维转置向量空间中相互邻近。由于高维空间不具有可以观测的儿何结构,选择了MDS可视化的方法将词条在高维空间中的邻近关系投影到人们可视的低维MDS空间图中,使用低维的空间对象结构来映射高维空间中的对象之间的关系和结构。由于保持了高维空间中的拓扑结构,从属于同一个主题的词条在低维可视空间中仍然相互邻近,在MD5空间图中形成一个个类团,每一个类团就是一个潜在主题。这个方法流程克服了... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:163 页

【学位级别】:博士

【文章目录】:
中文摘要
Abstract
目录
图目录
表目录
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基于文本单元聚类的主题发现
        1.2.2 基于共词分析的主题发现
        1.2.3 基于数据库内容结构分析的主题发现
        1.2.4 基于概率主题模型的潜在主题发现
        1.2.5 小结与评述
    1.3 研究目的与研究问题
    1.4 研究方法与技术路线
        1.4.1 研究方法
        1.4.2 技术路线
    1.5 特色与创新点
    1.6 论文的组织结构
2 文本主题发现的理论基础
    2.1 文本挖掘
        2.1.1 文本挖掘概述
        2.1.2 文本的向量空间表示
        2.1.3 文本特征选择与提取
    2.2 知识发现
        2.2.1 知识发现概述
        2.2.2 聚类知识发现
3 潜在主题可视化的基本原理和流程
    3.1 词汇集聚与潜在主题的表示
        3.1.1 基于文本单元集聚的主题发现
        3.1.2 词汇集聚与潜在主题的发现和表示
        3.1.3 潜在主题的定义
        3.1.4 潜在主题与相关概念辨析
    3.2 MDS可视化与潜在主题的挖掘和展示
        3.2.1 MDS用于潜在主题可视化的可行性
        3.2.2 MDS用于潜在主题可视化的优势
    3.3 潜在主题可视化的基本流程
        3.3.1 潜在主题可视化的总体思路
        3.3.2 文本分词和预处理
        3.3.3 词条在转置向量空间中的表示
        3.3.4 邻近关系的计算与提取
        3.3.5 MDS降维和投影
        3.3.6 潜在主题的表示
        3.3.7 潜在主题可视化的效果评价
    3.4 小结与讨论
4 潜在主题可视化的方法
    4.1 扎根理论与潜在主题可视化的融合
        4.1.1 潜在主题可视化中的难点
        4.1.2 扎根理论概述
        4.1.3 开放式编码技术的引入
        4.1.4 扎根性思想的启示
        4.1.5 融入扎根思想和方法的可行性
        4.1.6 扎根理论的融入与潜在主题可视化的流程再造
        4.1.7 潜在主题可视化对扎根理论的流程再造
    4.2 潜在主题可视化中的情景模型
        4.2.1 潜在主题及其词条的情景依赖特性
        4.2.2 潜在主题可视化中的情景模型
        4.2.3 情景模型的启示
    4.3 潜在主题可视化的方法设计
        4.3.1 邻近矩阵的定义及其在潜在主题可视化中的分析方法
        4.3.2 质心邻近矩阵的定义及其在潜在主题可视化中的分析方法
        4.3.3 属性叠加邻近矩阵的定义及其在潜在主题可视化中的分析方法
        4.3.4 潜在主题可视化的流程优化
        4.3.5 潜在主题可视化方法在不同性质文本集中的应用策略
    4.4 小结与讨论
5 潜在主题可视化在上市公司风险识别中的应用
    5.1 引言
        5.1.1 研究目的
        5.1.2 研究意义
        5.1.3 上市公司知识发现的研究现状
    5.2 数据来源与处理
        5.2.1 数据来源
        5.2.2 章节标题的开放式编码
        5.2.3 编码后数据的特征分析
        5.2.4 文本分词和预处理
        5.2.5 特征选择与提取
        5.2.6 构造输入矩阵
    5.3 基于邻近矩阵的潜在主题可视化
    5.4 基于质心邻近矩阵的潜在主题可视化
    5.5 基于属性叠加邻近矩阵的潜在主题可视化
    5.6 结果评价
    5.7 小结与讨论
6 总结与展望
    6.1 本文的主要工作
    6.2 研究的不足和局限性
    6.3 下一步的工作
参考文献
附录
研究成果
致谢


【参考文献】:
期刊论文
[1]基于文献的语义资源库建设及其在NSTL中的应用[J]. 张铧予,李广建.  图书情报工作. 2012(09)
[2]基于电子政务平台查询关键词共现多维可视化聚类分析研究[J]. 夏立新,程秀峰,桂思思.  情报学报. 2012 (04)
[3]知识管理学科体系研究(下)——聚类分析和多维尺度分析[J]. 储节旺,闫士涛.  情报理论与实践. 2012(03)
[4]客观知识体系中语义关系的分析分类研究[J]. 裘江南,张彬.  情报学报. 2012 (03)
[5]基于跨语言广义向量空间模型的跨语言文档聚类方法[J]. 唐国瑜,夏云庆,张民,郑方.  中文信息学报. 2012(02)
[6]知识管理学科体系研究(上)——因子分析[J]. 储节旺,闫士涛.  情报理论与实践. 2012(02)
[7]基于词共现的社会化标签研究热点可视化分析[J]. 卢小宾,孟玺,张进.  情报学报. 2012 (02)
[8]共现聚类分析的新方法:最大频繁项集挖掘[J]. 徐硕,乔晓东,朱礼军,张运良,薛春香.  情报学报. 2012 (02)
[9]科技文献全文主题识别方法实证研究[J]. 叶春蕾,冷伏海.  现代图书情报技术. 2012(01)
[10]国内外共词分析研究综述[J]. 李颖,贾二鹏,马力.  新世纪图书馆. 2012(01)

博士论文
[1]基于软件人的情境主题分析及应用研究[D]. 周亦鹏.北京科技大学 2012
[2]主题模型及其在中医临床诊疗中的应用研究[D]. 张小平.北京交通大学 2011
[3]基于潜在语义分析的社会化标注系统标签语义检索研究[D]. 宣云干.南京大学 2011
[4]大规模文档聚类中若干关键问题的研究[D]. 刘铭.哈尔滨工业大学 2010
[5]基于自组织映射的期刊主题研究[D]. 安璐.武汉大学 2009
[6]文本分割关键技术及其在多文档摘要中的应用研究[D]. 叶娜.东北大学 2008
[7]多文档自动文摘关键技术研究[D]. 徐永东.哈尔滨工业大学 2007
[8]文本聚类分析若干问题研究[D]. 高茂庭.天津大学 2007
[9]基于潜在语义分析的中文概念检索研究[D]. 刘云峰.华中科技大学 2005

硕士论文
[1]概率主题模型及其在关联文本分类中的应用研究[D]. 梁鹏鹏.郑州大学 2011
[2]概率主题模型在文本分类中的应用研究[D]. 林洋港.中国科学技术大学 2009
[3]基于语义相似度的文本聚类算法的研究[D]. 孙爽.南京航空航天大学 2007



本文编号:3107805

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3107805.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户23899***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com