当前位置:主页 > 管理论文 > 管理理论论文 >

基于文本挖掘的管理科学热点识别与演化分析

发布时间:2021-05-18 05:46
  计算机科学已经进入了跨时代发展的阶段,人工智能和文本挖掘技术的成熟为深入分析挖掘科研文献的摘要长文本提供了新的手段和方法。目前,LDA主题模型在微博话题识别、新闻主题识别等领域表现出了优异的性能,但针对科研文献等领域的应用较少,已经有部分学者应用LDA主题模型对情报学、计算机科学等领域的学术期刊进行主题分析。在我国应用深层语义挖掘模型对管理科学领域的科学文献研究仍处于起步状态。本文率先将LDA主题模型应用于管理科学领域学术文献的主题挖掘中,进而探索我国管理科学领域主题的演化与发展。本文分析数据选取期刊中的摘要部分,摘要是学者对其论文的高度概括和总结,涵盖了文献的整体信息。与一般关键词共现分析方法相比,对摘要长文本进行主题提取可以在更大的程度上保留了文献原始信息,可以在一定程度上解决关键词无法很好的概括文献信息的问题。本文创新性的提出基于一阶差分的概率阈值设定和基于滑动时间窗口的数据切分方法。差分概率阈值设定有效的改善了主题筛选困难的问题,有效的识别相近概率的主题群,完善主题识别过程。本文提出的滑动时间窗口的数据切分,克服了不同时间区域内主题对齐困难,改善了主题断层问题。本文通过LDA主... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:57 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景与研究意义
        1.1.1 课题背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 管理科学研究现状
        1.2.2 文本挖掘研究现状
        1.2.3 研究现状综述
    1.3 论文研究结构与方法
        1.3.1 论文研究结构
        1.3.2 论文研究方法
第2章 文本挖掘理论基础
    2.1 文本预处理
        2.1.1 中文文本分词
        2.1.2 词性标注
        2.1.3 停用词过滤
        2.1.4 特征选择
    2.2 主题模型
        2.2.1 主题模型介绍
        2.2.2 模型求解
        2.2.3 评价体系
    2.3 本章小结
第3章 热点主题识别与演化建模
    3.1 数据选择与预处理
        3.1.1 数据选择
        3.1.2 数据预处理
    3.2 热点主题识别建模
        3.2.1 主题模型训练与调参
        3.2.2 文档-主题矩阵与主题-词矩阵
        3.2.3 一阶差分阈值设定法
    3.3 主题演化建模
        3.3.1 基于时间滑动窗口的子话题获取
        3.3.2 子话题强度计算
        3.3.3 子话题相似度计算
    3.4 主题对齐与演化分析
    3.5 本章小结
第4章 实验与结果评价
    4.1 热点主题识别实验
        4.1.1 超参数与主题数选取
        4.1.2 基于概率值一阶差分的阈值设定
        4.1.3 热点主题TOP-N排序
    4.2 热点主题演化分析实验
        4.2.1 基于滑动时间窗的数据切分
        4.2.2 热点主题强度演化分析
        4.2.3 热点主题内容演化分析
    4.3 基于共词分析的对比分析
        4.3.1 高频词抽取
        4.3.2 共词分析
        4.3.3 对比分析
    4.4 本章小结
结论
参考文献
致谢


【参考文献】:
期刊论文
[1]2013—2017年国际上管理学创新研究热点、前沿及其演进探析[J]. 房宏君,陈静,刘凤霞,王亚林.  科技管理研究. 2019(02)
[2]基于关键词的国内管理科学与工程领域研究热点透析[J]. 周润泽.  全国流通经济. 2019(02)
[3]基于LDA的大V与草根用户微博主题模型构建[J]. 张钰莎,罗莉霞.  现代计算机(专业版). 2019(02)
[4]基于话题标签的微博热点话题演化研究[J]. 李慧,王丽婷.  情报科学. 2019(01)
[5]一种基于词加权LDA模型的专利文献分类方法[J]. 孙伟,刘文静,葛丽阁,余璇.  计算机技术与发展. 2019(03)
[6]文本分类中卡方统计特征选择算法的改进[J]. 陈伟鸿,林伟.  有线电视技术. 2018(12)
[7]基于辅助集的专利主题分析领域停用词选取[J]. 俞琰,赵乃瑄.  数据分析与知识发现. 2018(11)
[8]2006—2016年管理科学与工程研究热点主题研究——基于LDA概率主题模型分析[J]. 陈植元,杨海霞,王先甲.  珞珈管理评论. 2018(04)
[9]管理学科体系的网络分析[J]. 郑腾豪,王凤彬,王璁.  管理评论. 2018(10)
[10]基于变分贝叶斯推断的字典学习算法[J]. 刘连,王孝通.  控制与决策. 2020(02)

博士论文
[1]我国管理科学学科演进的知识图谱研究[D]. 何超.湖南大学 2012
[2]工商管理学科演进与前沿热点的可视化分析[D]. 侯剑华.大连理工大学 2009

硕士论文
[1]基于主题特征和深度学习的情感分析算法研究[D]. 郑灶旭.华南理工大学 2018
[2]基于股吧文本的主题挖掘及其股票投资应用[D]. 张惠玲.华南理工大学 2018
[3]经济学与商学学科文献计量与可视化分析[D]. 万姗姗.中国科学技术大学 2017



本文编号:3193233

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/glzh/3193233.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户46f44***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com