当前位置:主页 > 经济论文 > 股票论文 >

基于字符串核的股吧文本情感分类

发布时间:2022-09-21 20:15
  传统的金融学理论是在股民满足理性假设的基础上提出的,此理论只适用于比较成熟的股票市场,要求股民可以理智地对股票市场进行判断,对于所得到的市场信息可以进行正确地解读。很显然对于尚不成熟的中国股市而言,这种要求有些苛刻。中国股市现在仍处于不断发展的阶段,而且还会呈现暴涨暴跌的状况,行为金融学家对此进行了相关研究。研究结果表明,股票市场中非理性股民的投资行为会对股票涨跌造成一定的影响,股民投资情绪是否高涨也和股市有着密切的关系,所以分析股民的情绪变化对于最终分析股票的涨跌情况,有着至关重要的作用。在如今互联网时代,大部分股民可以在网上进行交流和获取信息。股吧就是一个股票交流平台,参与对象主要是股民,股民通过股吧可以分享投资经验、表达自我观点,同时也为分析股民当下的情感倾向提供了平台。本文以股吧(东方财富网股吧)评论文本作为研究对象,对其进行情感倾向分类研究。首先通过Scrapy爬虫技术抓取股吧评论的文本,进行文本筛选以及词汇过滤,而后应用提出的基于LSA和PageRank的同义词识别算法,对文本进行同义词替换,最终在支撑向量机(Support Vector Machine,SVM)的基础上,... 

【文章页数】:70 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 研究现状
        1.3.1 基于词表的情感分类方法
        1.3.2 基于机器学习的情感分类方法
    1.4 本文的主要工作
    1.5 本文的章节结构
第2章 文本情感分类的相关知识
    2.1 支撑向量机的相关知识
        2.1.1 SVM的统计学理论基础
        2.1.2 SVM的数据分类问题
        2.1.3 SVM的优化算法
        2.1.4 SVM的文本表示
    2.2 核函数的相关知识
        2.2.1 核函数的定义
        2.2.2 核函数的性质
        2.2.3 常用核函数
        2.2.4 核函数的算法应用
    2.3 字符串核的相关知识
        2.3.1 结构化核函数
        2.3.2 字符串核的理论介绍
    2.4 本章小结
第3章 基于LSA和PageRank的同义词识别
    3.1 基于LSA的同义词识别
        3.1.1 基于信息增益的词汇权重计算
        3.1.2 文本矩阵的形成
        3.1.3 奇异值分解
        3.1.4 基于LSA的词汇相似度
    3.2 基于PageRank的同义词识别
        3.2.1 依存句法分析
        3.2.2 基于句法分析的PageRank算法
    3.3 基于LSA和PageRank的词汇相似度
    3.4 实验流程及结果分析
        3.4.1 实验流程
        3.4.2 实验结果及分析
    3.5 本章小结
第4章 基于MSK字符串核的股吧文本情感分类
    4.1 MSK字符串核函数
        4.1.1 子序列权重
        4.1.2 基于子序列权重的MSK核函数
    4.2 实验流程及结果分析
        4.2.1 实验流程
        4.2.2 实验结果及分析
    4.3 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢


【参考文献】:
期刊论文
[1]基于PageRank的新闻关键词提取算法[J]. 顾亦然,许梦馨.  电子科技大学学报. 2017(05)
[2]基于依存句法分析的多特征词义消歧[J]. 史兆鹏,邹徐熹,向润昭.  计算机工程. 2017(09)
[3]基于高维k-近邻互信息的特征选择方法[J]. 周红标,乔俊飞.  智能系统学报. 2017(05)
[4]图核函数研究现状与进展[J]. 白璐,徐立祥,崔丽欣,焦宇航,吴宇帆,潘云逸.  安徽大学学报(自然科学版). 2017(01)
[5]基于双语词典的微博多类情感分析方法[J]. 栗雨晴,礼欣,韩煦,宋丹丹,廖乐健.  电子学报. 2016(09)
[6]基于词加权LDA算法的无监督情感分类[J]. 郝洁,谢珺,苏婧琼,续欣莹,韩晓霞.  智能系统学报. 2016(04)
[7]基于SVM的在线商品评论的情感倾向性分析[J]. 肖江,王晓进.  信息技术. 2016(07)
[8]组合核函数SVM在特定领域文本分类中的应用[J]. 吕洪艳,刘芳.  计算机系统应用. 2016(05)
[9]基于谱特征和图分割的图聚类算法[J]. 高阳,李昌华,李智杰,崔欢欢.  计算机工程与应用. 2017(15)
[10]面向脑网络的新型图核及其在MCI分类上的应用[J]. 接标,张道强.  计算机学报. 2016(08)

博士论文
[1]基于核函数的目标跟踪算法研究[D]. 田浩.长安大学 2016
[2]投资者情绪对中国股市收益影响的实证研究[D]. 王镇.东北财经大学 2015
[3]中国股票市场与宏观经济相关性研究[D]. 张培源.中共中央党校 2013
[4]汉语依存句法分析关键技术研究[D]. 李正华.哈尔滨工业大学 2013

硕士论文
[1]中国股市是国家宏观经济的晴雨表吗?[D]. 金芳.山西财经大学 2017
[2]文本表示模型和特征选择算法研究[D]. 陈磊.中国科学技术大学 2017
[3]宏观经济与股票市场波动内在关联性研究[D]. 王艳歌.武汉大学 2017
[4]基于支持向量机的不平衡数据分类算法研究[D]. 刘东启.浙江大学 2017
[5]支持向量机核函数及关键参数选择研究[D]. 尹嘉鹏.哈尔滨工业大学 2016
[6]基于半监督学习的餐厅评论情感分析技术[D]. 冯佳.华中科技大学 2016
[7]基于混合核函数的SVM及其应用研究[D]. 王立达.大连海事大学 2016
[8]基于半监督机器学习的文本情感分析技术[D]. 王成.南京理工大学 2015
[9]基于大规模语料库的中文同义词抽取方法研究[D]. 马海昌.西北师范大学 2014
[10]投资者情绪对股票收益的影响[D]. 宋艳西.西南财经大学 2014



本文编号:3680592

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3680592.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7eee1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com