基于网络异构信息挖掘的新股知识服务研究
本文关键词:基于网络异构信息挖掘的新股知识服务研究
更多相关文章: 知识服务 信息抽取 弹性网 逻辑回归 支持向量机
【摘要】:互联网技术飞速进步,已渗透和影响到人们生活的方方面面,“互联网+”话题的热议更是带动了一系列行业的发展。在金融知识服务方面,互联网信息平台因其数据的实时性、访问的便捷性以及友好的可视化效果成为最主要的信息服务载体。2014年国内A股市场IPO重启,新股市场重新成为炙手可热的焦点,并在现有市场规则下新股表现出了不同于过去的新特点。本课题针对新股领域,将网络中的可靠信息作为信息源,对多元异构信息进行处理,并针对用户最为关心的新股相关问题进行分析与预测,构建了基于网络异构信息挖掘的新股知识服务平台,为用户提供新股基本信息及一字板相关问题的预测结果,将股票之间的相似关系进行图形化展示,为投资者提供便捷、全面的投资参考。本文主要研究内容包括以下几方面:新股的信息获取与预处理。信息是知识服务平台的根基,信息获取是构建知识服务系统的最基本的环节。本课题使用到的异构数据包括结构化的行情数据、web表格数据和非结构化的公告数据,针对不同的数据形式采用不同的方法进行处理,对公告中的数据进行抽取后检查抽取的准确性。新股一字板预测问题。对一字板现象进行定义及形式化描述,分别通过线性模型和集成学习方法对新股的一字板持续天数进行预测,精度达到2.7天,对同一批次的新股开板顺序预测精度达到91%。建立了基于滑动时间窗口的数据集构造方法,分别采用回归评价与排序评价两种评价方法对预测结果进行评价。新股开板后趋势预测。通过总结股票开板后的走势,将趋势预测问题定义为二分类问题,并讨论了分类的界定依据,采用多种分类算法对开板后五个交易日的趋势进行预测,分类准确率达到81%,并通过实验对比分析了各算法的性能。新股知识服务系统的构建。经过信息获取与预处理,对新股一字板持续时间及开板后趋势的预测,得到了用于构建知识服务系统的关键数据信息,构建基于网络异构信息挖掘的知识服务平台。对用户广为关注的行业信息进行关系定义及相似度计算,挖掘出所属相似行业、板块间的股票隐含关系,首次以关系网络的形式对股票所属的行业、板块关系进行展示,通过可视化的形式,简洁、直观的展示投资者最为关注的新股信息。
【关键词】:知识服务 信息抽取 弹性网 逻辑回归 支持向量机
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F832.51;TP311.13
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 绪论9-16
- 1.1 课题研究背景及意义9-10
- 1.2 国内外研究现状及相关技术介绍10-14
- 1.2.1 信息抽取的发展介绍10-11
- 1.2.2 金融数据分析研究现状11-13
- 1.2.3 知识服务系统发展现状13-14
- 1.3 主要研究内容与章节内容组织14-16
- 第2章 异构信息获取和新股知识服务总体设计16-23
- 2.1 引言16
- 2.2 异构信息获取16-21
- 2.2.1 行情数据获取17-18
- 2.2.2 WEB信息获取18-19
- 2.2.3 公告信息抽取19-21
- 2.3 新股知识服务系统整体框架21-22
- 2.4 本章小结22-23
- 第3章 一字板预测回归问题研究23-30
- 3.1 一字板预测问题的定义与评价规则23-26
- 3.1.1 一字板预测问题的定义23-24
- 3.1.2 评价指标24-26
- 3.2 基于线性模型的一字板预测26-28
- 3.3 基于Bagging的一字板预测28-29
- 3.4 本章小结29-30
- 第4章 新股趋势预测分类问题研究30-36
- 4.1 新股趋势问题定义与评价指标30-34
- 4.1.1 新股趋势问题分析与定义30-33
- 4.1.2 评价指标33-34
- 4.2 基于逻辑回归的趋势预测34-35
- 4.3 基于SVM的趋势预测35
- 4.4 本章小结35-36
- 第5章 实验平台与新股知识服务的实现36-57
- 5.1 实验环境与实验数据36
- 5.2 公告信息抽取实验结果与分析36-38
- 5.3 一字板预测实验结果分析38-45
- 5.3.1 基本线性模型39-44
- 5.3.2 Bagging方法的实验结果分析44-45
- 5.4 新股趋势预测实验分析45-50
- 5.4.1 逻辑回归预测结果与分析45-48
- 5.4.2 支持向量机预测结果与分析48-50
- 5.5 股票关系发现与展示50-54
- 5.5.1 相似关系定义与相似度计算50-53
- 5.5.2 行业关系展示53-54
- 5.6 新股知识服务平台的实现54-56
- 5.7 本章小结56-57
- 结论57-59
- 参考文献59-65
- 致谢65
【相似文献】
中国期刊全文数据库 前10条
1 魏震方;宋正德;;云计算环境下异构信息的发现机制与管理方法研究[J];商场现代化;2011年23期
2 王乐,强晓远,孙莉;基于本体模型异构信息交互的研究[J];微型机与应用;2005年01期
3 董明哲,张同军;基于信息语义的异构信息集成方法[J];计算机工程;2005年02期
4 李艾丹;薛中玉;李春梅;;异构信息知识挖掘与可视化分析系统架构模型解析[J];中国科技论坛;2012年10期
5 李剑;宋靖宇;钟华;;基于本体的异构信息集成查询划分及转换[J];软件学报;2007年10期
6 李艾丹;薛中玉;李春梅;;异构信息知识挖掘与可视化系统处理流程解析[J];图书馆学研究;2012年14期
7 康文杰;郑倩冰;陈侃;;基于社会网络分析的学术合作关系研究[J];计算机技术与发展;2014年05期
8 史达;杨洋;;一种面向多层次异构信息平台的数据访问链路识别算法[J];信息与控制;2014年01期
9 刘钰峰;李仁发;;基于查询—文档异构信息网络的半监督学习[J];通信学报;2014年08期
10 徐寿芳;嵇美华;曾益坤;;基于本体的异构电子商务信息集成探析[J];绍兴文理学院学报(自然科学版);2008年01期
中国重要报纸全文数据库 前2条
1 陈友梅;DB2信息集成提速异构信息管理[N];中国计算机报;2003年
2 齐向真;我市两项目获科技部863计划批复[N];太原日报;2012年
中国博士学位论文全文数据库 前4条
1 黄冬;面向网络金融知识服务的模型与方法研究[D];哈尔滨工业大学;2015年
2 刘钰峰;异构信息网络检索技术研究[D];湖南大学;2014年
3 李朋;异构信息网络分析模型及其应用研究[D];重庆大学;2013年
4 王小刚;异构信息集成环境中基于语义的查询研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱敏;极性异构信息网络相关性搜索技术研究[D];山东大学;2015年
2 房佳;基于多级模型的金融异构信息获取与预测分析[D];哈尔滨工业大学;2014年
3 郝敬彬;融合异构信息的长途客车乘客异动情况觉察技术研究[D];浙江工业大学;2014年
4 邢欣;基于网络异构信息挖掘的新股知识服务研究[D];哈尔滨工业大学;2015年
5 罗琛;异构信息网络上半监督机器学习算法研究[D];吉林大学;2015年
6 王倩;异构信息网络上的主题建模研究[D];山东大学;2014年
7 吴晶;面向异构信息集成的数据服务通道的设计与实现[D];电子科技大学;2013年
8 李立;基于元路径选择和融合的异构信息网络社区挖掘算法研究[D];西安电子科技大学;2014年
9 肖颖;面向信息集成的异构信息描述方法研究[D];国防科学技术大学;2003年
10 贾伟;云环境下异构信息交换模板的研究与设计[D];北京邮电大学;2012年
,本文编号:772019
本文链接:https://www.wllwen.com/jingjilunwen/zbyz/772019.html