当前位置:主页 > 管理论文 > 货币论文 >

面向金融舆情分析技术的研究与应用

发布时间:2025-02-23 09:35
  随着互联网技术的飞速发展与金融行业的不断发展,网络舆情已逐渐成为影响我国企业稳定发展的一个重要因素。网络舆情的社会影响力极强、传播速度极快,对金融类的舆情报道进行舆情分析,有利于相关机构便捷地了解事件的舆情并做出正确的引导和管控,也有助于金融市场的可持续发展。本文利用主题模型,情感词典构建,舆情分析等技术,对金融相关的网络舆情进行详细研究,设计了一个金融舆情分析系统。该系统从改进的主题模型中有效地识别出文本中的情感词,并将情感词与更全面、更完善的金融领域情感词典相匹配,计算该情感词的情感倾向值,以更准确地对金融文本进行舆情分类。本文研究的内容具体如下:1.改进的WHDP模型。传统HDP主题模型基于“词袋”假设造成了文本语义上的混淆,针对此问题本文提出基于窗口的层次狄利克雷过程(Window-based hierarchical Dirichlet process,WHDP)主题模型,即在HDP模型中引入窗口机制,利用窗口把文档划分为较小的片段,通过移动窗口保证词与词之间的顺序关系,减少文本语义上的混淆。实验表明,WHDP模型有混淆度更小、泛化能力更强的优势。2.改进的CHDP模型。HDP...

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

图2-1jieba分词结果

图2-1jieba分词结果

第二章相关原理与技术13(3)基于理解的方法,这种方法在词典的基础上考虑了词之间的语义关系,利用语义信息消除歧义问题。但是,计算机不能学习到这些信息,需要大量的语言信息作为支撑。近年来,众多学者在中文分词的研究上取得了一定的成果。现常用的中文分词工具有:“结巴”分词、THULAC....


图3-4混淆度随窗口大小变化的情况

图3-4混淆度随窗口大小变化的情况

电子科技大学硕士学位论文28大,混淆度就越小,表明该模型在未知数据集上的建模能力越好。当接近于的大小时,混淆度的值也趋于收敛。从图3-3中还可以看出,当为的1/2左右时,混淆度的变化逐步趋于平缓。图3-3混淆度随窗口移动而变化的情况图3-4是WHDP在两种数据集上随着窗口变化的情....


图3-6WHDP模型500次实验的主题数分布

图3-6WHDP模型500次实验的主题数分布

电子科技大学硕士学位论文30图3-6WHDP模型500次实验的主题数分布②收敛性分析图3-7是WHDP模型与采样HDP模型、LDA模型、SWTM模型在不同数据集上的收敛性对比分析。收敛性是一个衡量模型训练速度的评价标准,在实验中,LDA和SWTM模型的主题数设为50,WHDP的两....


图5-6金融数据对比结果

图5-6金融数据对比结果

电子科技大学硕士学位论文50图5-5酒店评论对比结果图5-6金融数据对比结果



本文编号:4034298

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/huobilw/4034298.html

上一篇:鹏华前海万科REITs投资价值分析  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e7ccc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com