基于PSP_HDP主题模型的非结构化经济指标挖掘
发布时间:2021-10-07 20:34
随着经济活动数据的不断丰富,互联网平台上产生了大量的财经文本,其中蕴含了经济领域发展状况的影响因素.如何从这些财经文本中有效地挖掘与经济有关的经济要素,是实现非结构化数据在经济研究中应用的关键.根据人工构建非结构化经济指标的局限性,以及主题模型在非结构化经济指标挖掘中存在的问题,结合已有经济领域分类标准、词语之间的语义关系和词语对主题的代表性,定义了文档的领域隶属度、词语与主题的语义相关度和词语对主题的贡献度,用于分别描述CRF(Chinese restaurant franchise)中餐厅的菜肴风格、顾客之间对菜肴要求的一致程度和顾客对菜肴的专一程度;结合文档领域属性、词语语义和词语在主题中的出现情况,提出了PSPHDP(combining documents’ domain properties,word semantics and words’ presences in topics with HDP)主题模型.由于PSPHDP主题模型改进了文档-主题与主题-词语的分配过程,从而提高了经济主题的区分度和辨识度,可以更有效地挖掘与经济有...
【文章来源】:软件学报. 2020,31(03)北大核心EICSCD
【文章页数】:21 页
【参考文献】:
期刊论文
[1]百度搜索、风险感知与金融风险预测——基于行为金融学的视角[J]. 罗鹏,陈义国,许传华. 金融论坛. 2018(01)
[2]基于MRT-LDA模型的微博文本分类[J]. 庞雄文,万本帅,王盼. 计算机科学. 2017(08)
[3]互联网搜索行为能帮助我们预测宏观经济吗?[J]. 刘涛雄,徐晓飞. 经济研究. 2015(12)
[4]基于MB-HDP模型的微博主题挖掘[J]. 刘少鹏,印鉴,欧阳佳,黄云,杨晓颖. 计算机学报. 2015(07)
[5]基于MB-LDA模型的微博主题挖掘[J]. 张晨逸,孙建伶,丁轶群. 计算机研究与发展. 2011(10)
[6]分层Dirichlet过程及其应用综述[J]. 周建英,王飞跃,曾大军. 自动化学报. 2011(04)
本文编号:3422724
【文章来源】:软件学报. 2020,31(03)北大核心EICSCD
【文章页数】:21 页
【参考文献】:
期刊论文
[1]百度搜索、风险感知与金融风险预测——基于行为金融学的视角[J]. 罗鹏,陈义国,许传华. 金融论坛. 2018(01)
[2]基于MRT-LDA模型的微博文本分类[J]. 庞雄文,万本帅,王盼. 计算机科学. 2017(08)
[3]互联网搜索行为能帮助我们预测宏观经济吗?[J]. 刘涛雄,徐晓飞. 经济研究. 2015(12)
[4]基于MB-HDP模型的微博主题挖掘[J]. 刘少鹏,印鉴,欧阳佳,黄云,杨晓颖. 计算机学报. 2015(07)
[5]基于MB-LDA模型的微博主题挖掘[J]. 张晨逸,孙建伶,丁轶群. 计算机研究与发展. 2011(10)
[6]分层Dirichlet过程及其应用综述[J]. 周建英,王飞跃,曾大军. 自动化学报. 2011(04)
本文编号:3422724
本文链接:https://www.wllwen.com/jingjilunwen/jingjililun/3422724.html