基于中文社会媒体分析的股票行为预测
发布时间:2021-08-10 00:42
随着Web2.0的普及与应用,各种新兴的社会化媒体如微博、论坛等开始出现和发展。社会媒体作为一种新型的网络信息资源组织模式,其中蕴含着大量的对股票预测有重要参考价值的信息。因此,基于社会媒体的股票行为预测已经成为目前金融和知识管理等领域的研究热点。现有的研究认为分析社会媒体的信息活动强度和情感倾向有利于预测股票行为,然而其研究主要从整体层面上挖掘社会媒体的信息。事实上,社会媒体中用户的讨论内容都是以不同主题呈现的,不同主题所蕴含的信息与股票行为的相关性存在明显差异。因此,若要更加精确的反映股票行为的变化,必须进一步对社会媒体中的不同主题加以分类,细粒度的分析每类主题下各种信息(如情感倾向、信息量等)与股票行为的相关性。本文以中文社会媒体为背景,通过挖掘社会媒体下潜在主题和情感倾向等信息,预测与之相关的股票行为。主要完成以下工作:(1)基于中文社会媒体环境的潜在主题发现。分析中文社会媒体环境下主题特征,构建潜在主题发现框架,利用潜在语义分析方法和EM聚类等文本分析技术完成潜在主题识别。该方法使得无分类的社会媒体信息转变为按不同主题加以区分的有分类信息。(2)基于主题分类的中文社会媒体情感...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
些优势特点的存在,社会媒体应用研究依然面临挑战。享信息的平台,社会媒体是一种新兴的网络信息资源组用户生成内容(UGC)具有海量异构、多源异质、动态,这些特征给基于社会媒体信息挖掘的研究带来困难。义分析理论分析 LSA(Latent Semantic Analysis)是一种用于知识获方法[36]。目前被广泛应用于主题发现、文本分类/聚类、多领域。它使用统计分析的方法对所要研究的文本集进与词之间潜在的语义结构。这种词语词之间的潜在的语的原来文本所拥有的全部信息的总和。通过这种方法可相关性,从而实现对文本向量降维的目的[37]。潜在语义本中的词与词之间存在一定的相互关系,也就是有某种存在。这种潜在的语义结构隐含在文本中词语的上下文量文本的统计计算,可以挖掘出这种潜在语义。用语义以消除词之间的相关性,简化文本向量的目的[38]。下图间示例图。
图 2-3 基于中文社会媒体的股票行为预测研究框架框架有三个层面构成,基础数据源层、社会媒体分析层、股票预实验论证层。础数据源层社会媒体作为股票预测研究的主要基础数据来源,这些数据源具息、博客、微博、金融网站等,我们将通过爬虫程序从这些数据社会媒体上的信息具有交互性、及时性、海量和开放性,从中可票市场相关的有用信息,为股票行为预测提供了良好的数据来源会媒体分析层媒体上的信息具有海量异构、多源异质、动态冗余和价值稀疏等从中甄别并提取有价值的信息,还需要利用科学的社会媒体分析特征提取构建社会媒体文本的潜在语义向量空间,利用潜在语义析等技术识别社会媒体中与股票相关主题,通过情感分析技术挖不同主题的情感信息。社会媒体分析层是为股票预测建模提供模数据。
本文编号:3333103
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
些优势特点的存在,社会媒体应用研究依然面临挑战。享信息的平台,社会媒体是一种新兴的网络信息资源组用户生成内容(UGC)具有海量异构、多源异质、动态,这些特征给基于社会媒体信息挖掘的研究带来困难。义分析理论分析 LSA(Latent Semantic Analysis)是一种用于知识获方法[36]。目前被广泛应用于主题发现、文本分类/聚类、多领域。它使用统计分析的方法对所要研究的文本集进与词之间潜在的语义结构。这种词语词之间的潜在的语的原来文本所拥有的全部信息的总和。通过这种方法可相关性,从而实现对文本向量降维的目的[37]。潜在语义本中的词与词之间存在一定的相互关系,也就是有某种存在。这种潜在的语义结构隐含在文本中词语的上下文量文本的统计计算,可以挖掘出这种潜在语义。用语义以消除词之间的相关性,简化文本向量的目的[38]。下图间示例图。
图 2-3 基于中文社会媒体的股票行为预测研究框架框架有三个层面构成,基础数据源层、社会媒体分析层、股票预实验论证层。础数据源层社会媒体作为股票预测研究的主要基础数据来源,这些数据源具息、博客、微博、金融网站等,我们将通过爬虫程序从这些数据社会媒体上的信息具有交互性、及时性、海量和开放性,从中可票市场相关的有用信息,为股票行为预测提供了良好的数据来源会媒体分析层媒体上的信息具有海量异构、多源异质、动态冗余和价值稀疏等从中甄别并提取有价值的信息,还需要利用科学的社会媒体分析特征提取构建社会媒体文本的潜在语义向量空间,利用潜在语义析等技术识别社会媒体中与股票相关主题,通过情感分析技术挖不同主题的情感信息。社会媒体分析层是为股票预测建模提供模数据。
本文编号:3333103
本文链接:https://www.wllwen.com/tushudanganlunwen/3333103.html