基于LSTM网络的政策挖掘研究与应用
发布时间:2022-02-18 22:25
随着大数据、云计算、人工智能等新一代信息技术的快速发展和政府信息化水平的提升,政府的治理范畴、内容和手段也受到了不可忽视的影响,近年来政府大数据也逐渐成为政务管理者和研究者关注的焦点。通过对海量政策文本的挖掘,在定性研究的基础上,借助信息技术等计量化手段对政策文本进行科学化的分析,找出政策文本的个性与共性规律,辅助政策研究者更好地进行量化研究,并为政策挖掘研究提供理论与技术支撑。同时,政策文本大数据挖掘会对政府治理产生深刻变革和影响,利用政务大数据提升政府决策水平和治理能力,对政府管理创新乃至智慧决策来说是一场新的机遇和挑战。本文首先对政策挖掘的现状和相关文献进行分析,结合实践及相关理论与技术提出采用深度学习中LSTM网络模型对政策文本进行挖掘研究,并对LSTM算法模型进行改进,提出了 SimHash-LSTM算法,提高了政策挖掘中文本分类的精度。本研究借助网络爬虫技术从互联网上获取中央及各个地方的百万份政策文本,并对文本进行清洗处理,构建了一个相对全面的政策文本数据库,进而基于改进的LSTM神经网络模型,实现对政策文本的分类、政策扩散等深入挖掘,并提供了智慧城市领域的政策文本分类以及...
【文章来源】:北京交通大学北京市211工程院校教育部直属院校
【文章页数】:107 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 深度学习研究现状
1.2.2 文本挖掘相关研究
1.2.3 政策挖掘研究现状
1.3 研究内容
1.4 研究方法和创新点
1.4.1 研究方法
1.4.2 创新点
1.5 论文结构
2 相关理论与技术基础
2.1 文本挖掘
2.2 自然语言处理
2.3 深度学习
2.4 政策挖掘
2.4.1 政策扩散
2.4.2 主题模型
2.4.3 相似度计算
2.5 本章小结
3 系统数据采集与处理
3.1 数据采集
3.1.1 网络爬虫
3.1.2 解析规则
3.1.3 数据存储
3.1.4 全文实时索引
3.2 数据处理
3.2.1 数据清洗
3.2.2 中文分词
3.2.3 词性标注
3.2.4 文本表达
3.2.5 特征提取和特征选择
3.3 本章小结
4 政策挖掘算法及改进研究
4.1 传统政策挖掘算法
4.1.1 LDA算法
4.1.2 相似度计算算法
4.1.3 TextRank算法
4.2 基于深度学习的挖掘算法
4.2.1 RNN
4.2.2 LSTM网络算法
4.3 算法比较与改进
4.3.1 算法比较
4.3.2 LSTM算法改进
4.4 本章小结
5 LSTM网络建模与算例分析
5.1 LSTM网络建模
5.1.1 实验设计
5.1.2 实验数据集
5.1.3 参数设置
5.1.4 模型性能评价指标
5.1.5 实验对比及分析
5.2 LSTM计算案例分析
5.2.1 政策统计分类
5.2.2 政策地图
5.2.3 政策相似度计算
5.2.4 政策扩散网络
5.3 本章小结
6 基于LSTM网络政策挖掘系统设计与实现
6.1 系统分析
6.1.1 需求分析
6.1.2 功能分析
6.2 系统设计
6.2.1 架构设计
6.2.2 数据库设计
6.3 系统实现
6.3.1 工具与环境
6.3.2 主要功能模块实现
6.4 本章小结
7 总结与展望
7.1 工作总结
7.2 展望
参考文献
附录A
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集
【参考文献】:
期刊论文
[1]基于MAC-LSTM的问题分类研究[J]. 余本功,许庆堂,张培行. 计算机应用研究. 2020(01)
[2]基于注意力长短时记忆网络的中文词性标注模型[J]. 司念文,王衡军,李伟,单义栋,谢鹏程. 计算机科学. 2018(04)
[3]基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究[J]. 张景,朱国宾. 计算机科学. 2018(04)
[4]基于文本挖掘和自动分类的法院裁判决策支持系统设计[J]. 朱青,卫柯臻,丁兰琳,黎建强. 中国管理科学. 2018(01)
[5]中央政府推进政策扩散的方式研究——以廉租房政策为例[J]. 朱多刚,胡振吉. 东北大学学报(社会科学版). 2017(04)
[6]基于CNN和LSTM混合模型的中文词性标注[J]. 谢逸,饶文碧,段鹏飞,陈振东. 武汉大学学报(理学版). 2017(03)
[7]统计模型在中文文本挖掘中的应用[J]. 王健,张俊妮. 数理统计与管理. 2017(04)
[8]国际文本挖掘研究主题群识别与演化趋势分析[J]. 张敏,罗梅芬,张艳. 图书馆学研究. 2017(02)
[9]基于文本挖掘的专业人才技能需求分析——以电子商务专业为例[J]. 詹川. 图书馆论坛. 2017(05)
[10]政策扩散视角下的省直管县财政改革——基于20个省份数据的探索性分析[J]. 张克. 北京行政学院学报. 2017(01)
硕士论文
[1]基于深度学习的中文文本情感分类及其在舆情分析中的应用研究[D]. 吴俊江.湘潭大学 2017
[2]基于多元特征融合和LSTM神经网络的中文评论情感分析[D]. 李科.太原理工大学 2017
[3]政策扩散视角下中国公共自行车政策的时空演进及其机制分析[D]. 矫大海.南京大学 2017
[4]基于深度学习的农业信息分类方法研究[D]. 张晓静.西北农林科技大学 2017
[5]基于深度学习的短文本分类及信息抽取研究[D]. 李超.郑州大学 2017
[6]基于深度学习的主题建模方法研究[D]. 朱佳晖.武汉大学 2017
[7]基于机器学习的文本分类算法研究[D]. 邓攀晓.北京邮电大学 2017
[8]基于长短时记忆网络的多标签文本分类[D]. 熊涛.浙江大学 2017
[9]基于多标签学习框架的微博文本分类研究[D]. 高鹏杨.东南大学 2016
[10]海量短文本的主题挖掘及其可视化[D]. 胡浩.西南石油大学 2016
本文编号:3631662
【文章来源】:北京交通大学北京市211工程院校教育部直属院校
【文章页数】:107 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 深度学习研究现状
1.2.2 文本挖掘相关研究
1.2.3 政策挖掘研究现状
1.3 研究内容
1.4 研究方法和创新点
1.4.1 研究方法
1.4.2 创新点
1.5 论文结构
2 相关理论与技术基础
2.1 文本挖掘
2.2 自然语言处理
2.3 深度学习
2.4 政策挖掘
2.4.1 政策扩散
2.4.2 主题模型
2.4.3 相似度计算
2.5 本章小结
3 系统数据采集与处理
3.1 数据采集
3.1.1 网络爬虫
3.1.2 解析规则
3.1.3 数据存储
3.1.4 全文实时索引
3.2 数据处理
3.2.1 数据清洗
3.2.2 中文分词
3.2.3 词性标注
3.2.4 文本表达
3.2.5 特征提取和特征选择
3.3 本章小结
4 政策挖掘算法及改进研究
4.1 传统政策挖掘算法
4.1.1 LDA算法
4.1.2 相似度计算算法
4.1.3 TextRank算法
4.2 基于深度学习的挖掘算法
4.2.1 RNN
4.2.2 LSTM网络算法
4.3 算法比较与改进
4.3.1 算法比较
4.3.2 LSTM算法改进
4.4 本章小结
5 LSTM网络建模与算例分析
5.1 LSTM网络建模
5.1.1 实验设计
5.1.2 实验数据集
5.1.3 参数设置
5.1.4 模型性能评价指标
5.1.5 实验对比及分析
5.2 LSTM计算案例分析
5.2.1 政策统计分类
5.2.2 政策地图
5.2.3 政策相似度计算
5.2.4 政策扩散网络
5.3 本章小结
6 基于LSTM网络政策挖掘系统设计与实现
6.1 系统分析
6.1.1 需求分析
6.1.2 功能分析
6.2 系统设计
6.2.1 架构设计
6.2.2 数据库设计
6.3 系统实现
6.3.1 工具与环境
6.3.2 主要功能模块实现
6.4 本章小结
7 总结与展望
7.1 工作总结
7.2 展望
参考文献
附录A
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集
【参考文献】:
期刊论文
[1]基于MAC-LSTM的问题分类研究[J]. 余本功,许庆堂,张培行. 计算机应用研究. 2020(01)
[2]基于注意力长短时记忆网络的中文词性标注模型[J]. 司念文,王衡军,李伟,单义栋,谢鹏程. 计算机科学. 2018(04)
[3]基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究[J]. 张景,朱国宾. 计算机科学. 2018(04)
[4]基于文本挖掘和自动分类的法院裁判决策支持系统设计[J]. 朱青,卫柯臻,丁兰琳,黎建强. 中国管理科学. 2018(01)
[5]中央政府推进政策扩散的方式研究——以廉租房政策为例[J]. 朱多刚,胡振吉. 东北大学学报(社会科学版). 2017(04)
[6]基于CNN和LSTM混合模型的中文词性标注[J]. 谢逸,饶文碧,段鹏飞,陈振东. 武汉大学学报(理学版). 2017(03)
[7]统计模型在中文文本挖掘中的应用[J]. 王健,张俊妮. 数理统计与管理. 2017(04)
[8]国际文本挖掘研究主题群识别与演化趋势分析[J]. 张敏,罗梅芬,张艳. 图书馆学研究. 2017(02)
[9]基于文本挖掘的专业人才技能需求分析——以电子商务专业为例[J]. 詹川. 图书馆论坛. 2017(05)
[10]政策扩散视角下的省直管县财政改革——基于20个省份数据的探索性分析[J]. 张克. 北京行政学院学报. 2017(01)
硕士论文
[1]基于深度学习的中文文本情感分类及其在舆情分析中的应用研究[D]. 吴俊江.湘潭大学 2017
[2]基于多元特征融合和LSTM神经网络的中文评论情感分析[D]. 李科.太原理工大学 2017
[3]政策扩散视角下中国公共自行车政策的时空演进及其机制分析[D]. 矫大海.南京大学 2017
[4]基于深度学习的农业信息分类方法研究[D]. 张晓静.西北农林科技大学 2017
[5]基于深度学习的短文本分类及信息抽取研究[D]. 李超.郑州大学 2017
[6]基于深度学习的主题建模方法研究[D]. 朱佳晖.武汉大学 2017
[7]基于机器学习的文本分类算法研究[D]. 邓攀晓.北京邮电大学 2017
[8]基于长短时记忆网络的多标签文本分类[D]. 熊涛.浙江大学 2017
[9]基于多标签学习框架的微博文本分类研究[D]. 高鹏杨.东南大学 2016
[10]海量短文本的主题挖掘及其可视化[D]. 胡浩.西南石油大学 2016
本文编号:3631662
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3631662.html