基于社会媒体的市场行情预测方法研究
本文关键词:基于社会媒体的市场行情预测方法研究
更多相关文章: 市场行情预测 社会媒体 消费意图挖掘 开放式事件抽取 电影票房预测 股市涨跌预测
【摘要】:以Facebook、Twitter、新浪微博为代表的社会媒体的迅猛发展,为观察大众的主观世界提供了空前的数据支持,从而也为预测大众的行为提供了新的手段。基于社会媒体的预测技术是指通过对社会媒体数据的挖掘与分析,看清事实真相,聚集大众的群体智慧,运用科学的知识、方法和手段,对事物未来发展趋势和状态做出科学的估计和评价。准确的预测结果对于人类生活中的趋利避害,工作中的计划决策起着至关重要的作用。一项决策的结果与该决策本身之间有着时间上的滞后关系,“利”与“害”总是存在于未来的时间与空间之中,任何决策都不可避免地要依赖预测。通过对未来趋势做出提前判断,有利于适时地调整计划,以及采取措施实施调控。然而,基于社会媒体的预测研究面临着各种挑战,这其中包括了缺乏清晰的问题定义和界限划分的挑战;社会媒体中群体智慧的挖掘以及文本语义理解不够深入的挑战以及预测模型较为简单,主要依靠线性回归模型,对非线性系统预测能力有限的挑战。本文主要针对这三个挑战进行了研究,并对市场行情预测中的电影票房预测和股市涨跌预测进行探索,分别从社会媒体文本中抽取用户消费意图信息和客观的事件报道作为特征进行预测。具体而言,本文的主要研究内容可概括为以下几个方面:1.本文提出了隐式消费意图挖掘任务,并构造基于领域自适应的卷积神经网络模型自动识别社会媒体中的隐式消费意图,在此识别结果基础上推荐用户意图相关产品以期满足其消费需求。具体而言,给定一条微博文本,首先基于领域自适应的卷积神经网络模型做二元分类,判断其是否含有用户消费意图;随后,对于有消费意图的微博文本再抽取其中的需求词,最后,根据该需求词去事先构造好的消费意图事理图谱中检索可以满足消费意图的产品推荐给用户。本文构建了母婴领域和电影票房领域的语料,实验结果表明:(1)本文提出的领域自适应方法可以有效克服训练语料少带来的消费意图识别效果不理想的问题;(2)推荐给用户的意图相关全部产品中有60%左右的产品可以满足用户的消费需求。2.本文提出基于消费意图的电影票房预测模型。基于消费意图理解的电影票房预测相对于传统的电影票房预测而言,可以说是站在一个全新的角度进行研究,为此能够给预测工作带来两方面的优势:(1)电影上映前就可以采集到大量的民众反馈数据;(2)可以大规模的获取与电影票房高低最相关的影响因素:大众是否愿意观看某部电影。在此特征基础上,本文提出了高斯连接函数回归模型作为预测方法,该方法不需要对输入数据进行任何独立同分布假设,且能够分析输入数据之间的相互作用关系。本文在中国电影市场和美国电影市场均做了实验对比分析,结果表明本文提出的方法与传统的基于线性回归模型和支持向量回归模型的方法相比都取得了更加优异的表现。3.本文提出一套面向预测的事件定义,事件抽取和事件表示学习方法。该方法既克服了特定域事件抽取需要预先指定事件类型和标注大量训练语料的费时费力的问题,又解决了开放域事件抽取很难进行事件归一化,判断事件类型的问题。本文提出的方法利用张量神经网络模型以开放式事件抽取结果作为输入,通过张量对事件元组之间的关系进行建模学习并最终输出低维、稠密、实数值的事件向量。对于相似的事件,其在同一向量空间上距离也相近。实验结果表明,本文提出的事件抽取和表示方法与基线方法相比能够更加准确地表示客观事件。4.本文提出了基于卷积神经网络的预测模型,该模型利用开放式事件抽取并泛化得到的事件向量作为输入特征。该模型将输入事件划分成长期事件,中长期事件和短期事件,并利用卷积层神经结点将长期和中长期事件进行建模学习,抽取其中最重要的事件特征并分别表示合成一个向量。随后,卷积神经网络中的隐含层结点建模学习事件特征向量与股市涨跌之间的隐含复杂关系,最终输出股市涨跌的预测结果。实验结果表明,本文提出的方法比当前最好的股市涨跌预测方法在准确率指标上能够提升4个百分点。总之,本文一方面致力于解决基于社会媒体的信息抽取相关问题,另一方面致力于预测模型的构建工作,以期能够充分利用好抽取到的有用信息,将其最终应用到以电影票房和股市涨跌为代表的市场行情预测任务上。本研究取得了一些初步的成果,期待这些成果能为本领域的其他研究者提供参考借鉴。随着基于社会媒体的预测技术的不断完善以及大数据语料的不断开放,相信基于社会媒体的市场行情预测研究在未来会取得更大的突破。同时,基于社会媒体的预测技术的成熟也将促进其他相关研究的发展。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
中国期刊全文数据库 前10条
1 贾茜;陈晓丹;;社会媒体研究评述[J];情报科学;2013年08期
2 李会会;;新规则——用社会媒体做营销[J];中国商贸;2013年19期
3 Jennifer Woodard Maderazo;姜明媚;;社会媒体是否让我们共享了过多的信息?[J];互联网周刊;2007年10期
4 铁铮;;积极应对危机新闻事件[J];红旗文稿;2007年11期
5 王飞跃;;万维社会媒体在防灾应急中的作用[J];科技导报;2008年10期
6 王志安;;积极的中国社会媒体角色[J];青年记者;2008年13期
7 王飞跃;曾大军;曹志冬;;应急2.0:万维社会媒体及群体态势建模与分析[J];中国应急管理;2009年01期
8 徐桂权;;社会媒体触发公众风潮[J];中国报道;2010年03期
9 李芳;;新闻援助:和谐社会媒体的新职能[J];采写编;2010年06期
10 缪琦;;解析传统媒体与社会媒体的融合趋势——以《新周刊》新浪微博为例[J];电视研究;2011年02期
中国重要会议论文全文数据库 前3条
1 申玉;;大学生对社会媒体价值观教育功能的认知[A];第十一届全国心理学学术会议论文摘要集[C];2007年
2 黄清源;;微博控制的维系与消解——传播政治经济学视野中的微博研究[A];首届华中地区新闻与传播学科研究生学术论坛获奖论文[C];2010年
3 雷群明;;编辑与名家书稿[A];多出精品 多出人才——中国编辑学会第八届年会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 朱冰;万维社会媒体大灾时方显神通[N];中国高新技术产业导报;2008年
2 姜永育;社会媒体报道亟待疏导[N];中国气象报;2005年
3 张荣忠;美国警察重视与社会媒体合作互动[N];人民公安报;2011年
4 特约评论员 安替;十年反恐战争 进入社交媒体阶段[N];21世纪经济报道;2011年
5 陈恩涛;社会媒体广泛宣传安徽邮政发展成就[N];中国邮政报;2008年
6 Ben Adams 编译 胡德良;FDA发布制药界利用社会媒体的新意见[N];医药经济报;2014年
7 王琳 本报记者 张梦颖;增进交流、消除疑虑和隔阂是社会媒体的职责所在[N];中国社会科学报;2012年
8 哈佛尼曼学者、专栏作家 安替;以开放来回应暴力[N];21世纪经济报道;2011年
9 记者 苏军;过度依赖读图 思维能力降低[N];文汇报;2009年
10 记者 李双双;昆明“微政务”发挥“政能量”[N];昆明日报;2014年
中国博士学位论文全文数据库 前6条
1 杜建光;面向社会媒体的文本和属性分析技术研究[D];北京理工大学;2015年
2 丁效;基于社会媒体的市场行情预测方法研究[D];哈尔滨工业大学;2016年
3 付博;面向社会媒体的用户消费意图分析关键技术研究[D];哈尔滨工业大学;2015年
4 沈钧戈;基于社会媒体的旅游数据挖掘与个性化推荐[D];西安电子科技大学;2016年
5 郭亮;基于社会媒体挖掘的社会化搜索研究[D];北京邮电大学;2014年
6 韩晓晖;Web社会媒体中信息的质量评价及应用研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前9条
1 戚凤国;信息社会媒体播放产品生命周期的转变[D];南京艺术学院;2009年
2 叶尔郎·马季耶夫;论社会媒体对中国治理的影响[D];复旦大学;2013年
3 董瑜;社会媒体实体关联网络的复杂性研究[D];杭州电子科技大学;2015年
4 袁多利;基于中文社会媒体分析的股票行为预测[D];合肥工业大学;2013年
5 丁绪武;基于兴趣图谱的社会化电子商务社区发现研究[D];上海工程技术大学;2015年
6 张鑫;面向社会媒体的中文文本校对方法研究与实现[D];黑龙江大学;2015年
7 张一博;基于社会媒体的社交圈识别研究[D];哈尔滨工业大学;2012年
8 朴雅宁;社会媒体病毒营销的信息转发与跟踪统计模式[D];吉林大学;2014年
9 李翔;微博中影响力的研究[D];中国科学技术大学;2014年
,本文编号:1277258
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1277258.html