当前位置:主页 > 科技论文 > 软件论文 >

基于文本挖掘技术的建筑节能领域主题网络模型研究

发布时间:2022-02-16 17:15
  建筑节能是应对气候变化和能源紧缺最重要的领域之一,与建筑节能相关的在线资源和文献数量呈指数性增长,海量文献数据为研究者和从业者及时准确地掌握领域研究主题和发展趋势带来挑战,现有文献分析研究中以文献综述和文献计量法为主,分析内容和形式存在明显局限性。因此,通过文本挖掘技术对建筑节能领域文献进行系统分析,对促进建筑节能研究发展具有重要的理论和实践价值。本文以web of science数据库中5712篇建筑节能相关的文献为数据对象开展研究。首先,根据建筑能耗和气候变化之间的关系,将数据划分为5个阶段并分别进行数据清洗和数据结构化,构建建筑节能领域文献数据语料库。其次,对不同阶段建筑节能文献进行关键词分析和LDA主题模型建模,系统分析建筑节能的主要研究主题。然后,基于LDA主题模型的不足,利用word2vec词向量模型优化LDA主题模型,完善研究主题的语义关系,并结合社交网络模型构建主题间关联,依托Gephi网络模型可视化平台,提出一种新的建筑节能文献数据主题网络模型。最后,通过不同阶段主题网络模型结果分析,阐明1973-2018年间建筑节能领域的研究主题,揭示主题间关联性及主题演化。经过建... 

【文章来源】:深圳大学广东省

【文章页数】:112 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 研究目标与意义
        1.2.1 研究目的
        1.2.2 研究意义
    1.3 论文框架
第2章 建筑节能文献分析与文本挖掘技术研究综述
    2.1 国内外研究现状
        2.1.1 建筑节能文献分析
        2.1.2 文本挖掘技术发展研究
        2.1.3 LDA主题模型改进研究
    2.2 研究问题提炼
    2.3 研究内容
        2.3.1 建筑节能文献数据采集及分析
        2.3.2 构建筑节能主题网络模型
    2.4 技术路线
第3章 研究理论基础及方法
    3.1 LDA(Latent Dirichlet Allocation)主题模型
        3.1.1 LDA主题模型理论介绍
        3.1.2 LDA主题模型实现步骤
        3.1.3 LDA模型可视化
    3.2 Word2vec词向量模型
        3.2.1 Word2vec词向量概念
        3.2.2 Word2vec词向量实现
    3.3 社交网络模型
        3.3.1 社区检测算法
        3.3.2 Gephi可视化平台
第4章 建筑节能文献数据语料库搭建
    4.1 数据采集
        4.1.1 数据采集范围
        4.1.2 数据采集来源
    4.2 数据预处理
        4.2.1 数据清洗
        4.2.2 文本数据结构化
        4.2.3 数据再清洗
第5章 建筑节能领域主题网络模型构建及分析
    5.1 研究问题
    5.2 基于特征提取的建筑节能研究热点
        5.2.1 不同阶段建筑节能研究热点对比
        5.2.2 不同阶段建筑节能研究热点变化趋势
    5.3 基于LDA主题模型的建筑节能研究主题
        5.3.1 构建LDA模型并可视化
        5.3.2 不同阶段建筑节能研究主题对比
        5.3.3 不同阶段建筑节能研究主题变化趋势
    5.4 建筑节能领域主题网络模型构建
        5.4.1 基于word2vec的主题模型优化
        5.4.2 结合社交网络模型构建主题网络模型
        5.4.3 不同阶段建筑节能主题网络结果分析
        5.4.4 基于主题网络模型的建筑节能领域研究主题变化分析
    5.5 模型应用
第6章 结论及建议
    6.1 结论
    6.2 本文创新点
    6.3 后续研究建议
参考文献
附录
致谢
攻读硕士学位期间的研究成果


【参考文献】:
期刊论文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陈磊,李俊.  电子技术. 2017(07)
[2]共词网络LDA模型的中文文本主题分析:以交通法学文献(2000-2016)为例[J]. 马红,蔡永明.  现代图书情报技术. 2016(12)
[3]融合Word2vec与TextRank的关键词抽取研究[J]. 宁建飞,刘降珍.  现代图书情报技术. 2016(06)
[4]国内基于主题模型的科技文献主题发现及演化研究进展[J]. 王燕鹏.  图书情报工作. 2016(03)
[5]基于LDA主题模型的专利内容分析方法[J]. 王博,刘盛博,丁堃,刘则渊.  科研管理. 2015(03)
[6]基于LDA模型的文本聚类研究[J]. 王鹏,高铖,陈晓美.  情报科学. 2015(01)
[7]基于Gephi的可视分析方法研究与应用[J]. 关迎晖,向勇,陈康.  电信科学. 2013(S1)
[8]基于概率模型的主题识别方法实证研究[J]. 叶春蕾,冷伏海.  情报科学. 2013(02)
[9]词形还原方法及实现工具比较分析[J]. 吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.  现代图书情报技术. 2012(03)
[10]文本挖掘技术在科研信息自动建议中的应用[J]. 李芳,朱群雄.  计算机工程与应用. 2011(10)

硕士论文
[1]时间序列的复杂网络转换策略研究[D]. 兰鑫.西南大学 2015
[2]中文文本挖掘基本理论与应用[D]. 康东.苏州大学 2014
[3]社会网络分析在学科热点分析中的实证研究[D]. 王慧.江苏大学 2010



本文编号:3628345

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3628345.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1c302***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com