当前位置:主页 > 社科论文 > 社会学论文 >

基于商业知识图谱的新闻舆情系统设计与实现

发布时间:2021-01-11 09:09
  在当今信息化社会,舆情分析的主战场从传统媒体转移到了以论坛、网络新闻、微博等为代表的网络媒体。这些网络媒体主要以文本形式存在,具有信息突发性强、传播速度快、片面性强、报道存在偏差等特点,在商业领域有举足轻重的影响,尤其是权威媒体发布的新闻,往往对商业领域的企业或个人决策造成影响。基于商业领域的需要,本文提出了一个基于商业领域知识图谱的新闻舆情系统。系统组成部分有爬虫系统、知识图谱、数据挖掘模块,其中数据挖掘模块由实体链接和情感分析模块组成。本文的主要贡献和创新如下:(1)为了保证商业舆情分析从文本识别实体的准确性,并解决传统基于支持向量机SVM或PageRank的方法需要手工提取特征、构建周期长、人力成本高的问题,本文提出了结合知识图谱的实体链接方法。方法首先对知识图谱进行需求分析,对知识图谱的概念、实体、准则(Schema)进行定义,并构建商业领域的知识图谱,其中包含实体的称呼、属性以及实体之间的关系;接着基于实体的信息,使用神经网络模型,实现文本到知识图谱的链接。(2)为了保证舆情系统正确识别新闻等长文本对实体造成的影响,并解决传统基于支持向量机SVM、逻辑回归等对于特定实体情感分... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:70 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
    1.2 研究现状
    1.3 主要研究内容
    1.4 论文章节安排
第二章 数据挖掘相关技术及理论
    2.1 中文分词技术
    2.2 文本表示
        2.2.1 词袋模型
        2.2.2 词的分布式表示法
    2.3 实体链接
        2.3.1 指称识别
        2.3.2 实体消歧
    2.4 情感分析
        2.4.1 文本整体情感分析
        2.4.2 特定目标情感分析
        2.4.3 基于方面情感分析
    2.5 神经网络模型
        2.5.1 卷积神经网络
        2.5.2 循环神经网络
        2.5.3 Transformer中的self-attention
第三章 基于神经网络的实体链接模型
    3.1 商业知识图谱构建
        3.1.1 需求分析
        3.1.2 数据采集
    3.2 实体链接模型
        3.2.1 基于词典的指称识别
        3.2.2 文本预处理
        3.2.3 实体消歧GBLL模型
        3.2.4 实验结果及分析
    3.3 实体链接模块测试
    3.4 本章小结
第四章 基于神经网络的情感分析模型
    4.1 特定实体相关内容提取
    4.2 文本预处理
    4.3 基于神经网络的情感分析模型
        4.3.1 情感分析模型结构
        4.3.2 情感编码器
        4.3.3 损失函数
    4.4 实验结果分析
        4.4.1 实验语料数据
        4.4.2 情感分析评价指标
        4.4.3 模型参数与对比实验设计
        4.4.4 对比实验结果和分析
    4.5 情感分析模块测试
    4.6 本章小结
第五章 系统实现
    5.1 系统架构设计与实现
    5.2 知识图谱存储和维护
        5.2.1 数据的存储
        5.2.2 知识图谱维护
    5.3 爬虫系统
        5.3.1 服务器组件
        5.3.2 客户机组件
    5.4 数据挖掘模块
        5.4.1 实体链接模块
        5.4.2 情感分析模块
    5.5 系统测试
        5.5.1 爬虫系统测试
        5.5.2 用户页面测试
第六章 总结和展望
参考文献
致谢


【参考文献】:
期刊论文
[1]汉语词语情感倾向自动判断研究[J]. 张靖,金浩.  计算机工程. 2010(23)
[2]中文基础情感词词典构建方法研究[J]. 柳位平,朱艳辉,栗春亮,向华政,文志强.  计算机应用. 2009(10)
[3]面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄.  信息系统学报. 2007(01)
[4]基于HowNet的词汇语义倾向计算[J]. 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.  中文信息学报. 2006(01)

硕士论文
[1]基于深度学习的短文本分类研究[D]. 胡可奇.电子科技大学 2018
[2]网络舆情分析关键技术研究与实现[D]. 吴娱.电子科技大学 2011



本文编号:2970494

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/2970494.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2bd66***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com