基于深度学习的“教育公平”网络舆情分析
发布时间:2021-07-02 20:45
[目的/意义]旨在构建一个网络舆情系统,及时准确地挖掘海量网络数据,分析社会热点事件的网络舆情。[方法/过程]结合深度学习技术,构建了一个基于内容与结构的舆情分析模型,其中利用Bi LSTM-CNN深度模型对舆情内容进行情感分析,利用社会网络分析法对舆情网络进行结构分析。[结果/结论]实证分析表明了该模型在公共事件舆情分析上的有效性和优越性。从结构和内容两方面分析,能为公共事件网络舆情分析提供新思路。
【文章来源】:情报探索. 2020,(06)
【文章页数】:8 页
【部分图文】:
舆情信息分析模型思路图
本文利用网络爬虫技术[6]进行舆情信息的爬取解析,使用爬虫程序或现有爬虫工具自动爬取互联网上舆情信息源(天涯论坛)的网页信息,基本流程(见图2)是从某一网页开始,遍历该网页中的全部URL放入URL集中,然后按照URL集中的顺序读取每个网页中的内容,直到将所有网页抓取完为止。本文爬取两个数据库表:数据源表(存储文本数据情况,包括URL、标题、内容、作者、时间)、评论表(存储帖子的跟评情况,包括评论者、评论内容、评论时间)。
(1)文本预处理。由于中文文本对象为不能被计算机所识别的非结构化信息,因此需对文本进行预处理(见图3),将非结构化文本转换为能被计算机所识别的结构化信息。(1)文本分词。文本分词是将文档中的句子按照一定规则拆分转换为词,是语义理解的基础和关键,其处理效果直接影响后续步骤。以分词的速度和准确性为标准,选择python的开源分词库Jieba[7]工具进行中文分词,得到分词后的数据集。
【参考文献】:
期刊论文
[1]浅谈Python爬虫技术的网页数据抓取与分析[J]. 吴永聪. 计算机时代. 2019(08)
[2]21世纪以来我国教育公平研究的热点与未来趋势——基于共词矩阵的知识图谱分析[J]. 丁雪阳,程天君. 中国远程教育. 2019(01)
[3]重大公共热点事件中媒体微信公众号的舆情传播研究[J]. 翟欣. 出版广角. 2018(08)
[4]基于社会网络分析的新媒体网络舆情传播监管研究[J]. 李菲,柯平,高海涛,张丹红,宋佳. 情报科学. 2017(10)
本文编号:3261197
【文章来源】:情报探索. 2020,(06)
【文章页数】:8 页
【部分图文】:
舆情信息分析模型思路图
本文利用网络爬虫技术[6]进行舆情信息的爬取解析,使用爬虫程序或现有爬虫工具自动爬取互联网上舆情信息源(天涯论坛)的网页信息,基本流程(见图2)是从某一网页开始,遍历该网页中的全部URL放入URL集中,然后按照URL集中的顺序读取每个网页中的内容,直到将所有网页抓取完为止。本文爬取两个数据库表:数据源表(存储文本数据情况,包括URL、标题、内容、作者、时间)、评论表(存储帖子的跟评情况,包括评论者、评论内容、评论时间)。
(1)文本预处理。由于中文文本对象为不能被计算机所识别的非结构化信息,因此需对文本进行预处理(见图3),将非结构化文本转换为能被计算机所识别的结构化信息。(1)文本分词。文本分词是将文档中的句子按照一定规则拆分转换为词,是语义理解的基础和关键,其处理效果直接影响后续步骤。以分词的速度和准确性为标准,选择python的开源分词库Jieba[7]工具进行中文分词,得到分词后的数据集。
【参考文献】:
期刊论文
[1]浅谈Python爬虫技术的网页数据抓取与分析[J]. 吴永聪. 计算机时代. 2019(08)
[2]21世纪以来我国教育公平研究的热点与未来趋势——基于共词矩阵的知识图谱分析[J]. 丁雪阳,程天君. 中国远程教育. 2019(01)
[3]重大公共热点事件中媒体微信公众号的舆情传播研究[J]. 翟欣. 出版广角. 2018(08)
[4]基于社会网络分析的新媒体网络舆情传播监管研究[J]. 李菲,柯平,高海涛,张丹红,宋佳. 情报科学. 2017(10)
本文编号:3261197
本文链接:https://www.wllwen.com/tushudanganlunwen/3261197.html