当前位置:主页 > 经济论文 > 资本论文 >

基于文本挖掘技术的创业板股票招股说明书风险分析

发布时间:2017-07-27 02:19

  本文关键词:基于文本挖掘技术的创业板股票招股说明书风险分析


  更多相关文章: 招股说明书 风险信息披露 文本挖掘 特异性风险


【摘要】:2009年10月30日,我国筹备许久的创业板在深圳正式开盘。创业板的开启为许多不符合在主板或者中小板上市的中小企业开通了融资渠道。由于创业板是主板之外的一种新型资本市场形式,其与主板在市场定位、发行条件、信息披露和监督管理等方面存在差异。同时,由于创业板企业更关注于成长性,往往面临着更高的风险。因此本文针对在创业板拟上市企业发布的招股说明书,对这些创业板企业的风险信息披露状况进行分析。本文将招股说明书作为研究对象,主要因为招股说明书是上市公司信息披露最重要的法律文献之一,对投资者,监管者具有重要的参考价值。本文对于不同企业的招股说明书披露的风险信息先进行量化分析,对其中披露风险信息的数量以及披露风险因素所用篇幅进行描述性统计,对比不同地区的企业风险信息披露状况。在对招股说明书的文本内容进行分析时,本文引入了文本挖掘技术。首先,对搜集的招股说明书文本数据进行了清洗、降噪等预处理,利用中科院计算技术研究所研究的汉语词法分析系统——ICTCLAS,对文本数据进行分词处理。将文本非结构化的数据转化为结构化的存储模式,之后将文本数据降维。企业在进行风险披露时,按照其可能影响业绩的重要性依次披露,因此本文提取各个企业的首要风险,对其中关键词语进行分析。利用编程实现TF-IDF算法,词频TF展现了不同地区企业的共同性风险,利用TF-IDF取值提取了不同地区创业板拟上市企业的特异性风险,结合该地区企业所属行业的分布情况,总结我国创业板拟上市企业对于共同性风险披露的特点以及各地企业特异性风险披露状况。通过对创业板拟上市企业招股说明书的披露风险研究,本文得出我国创业板企业招股说明书中风险信息披露的现状,并对完善披露提出了思考及建议。本文将传统应用于互联网的文本挖掘技术,应用于传统的招股说明书的分析,具有创新性,但是本文建立的挖掘模型还不是很完善,模型缺乏连贯性。在之后的研究中,如果可以将预处理、分词、特征提取等挖掘模块集合起来,形成分析流程,对今后招股说明书信息挖掘更有帮助。
【关键词】:招股说明书 风险信息披露 文本挖掘 特异性风险
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F832.51
【目录】:
  • 中文摘要4-6
  • Abstract6-10
  • 第1章 绪论10-13
  • 1.1 研究的背景与问题的提出10-11
  • 1.2 研究的目的与意义11
  • 1.3 研究的内容、方法与技术路线11-12
  • 1.4 研究的主要贡献12-13
  • 第2章 相关内容文献综述13-17
  • 2.1 对于招股说明书的研究及成果13-14
  • 2.2 企业风险概念的研究14-15
  • 2.3 文本信息挖掘研究15-17
  • 第3章 基于文本信息挖掘的风险分析技术17-28
  • 3.1 中文分词的主要方法17-19
  • 3.1.1 机械式分词方法17-18
  • 3.1.2 理解分词方法18
  • 3.1.3 ICTCLAS中文分词系统18-19
  • 3.2 文本存储模型19-22
  • 3.2.1 布尔模型20
  • 3.2.2 向量空间模型20-21
  • 3.2.3 概率模型21-22
  • 3.3 文本特征降维22-26
  • 3.3.1 文本特征析取22
  • 3.3.2 文本特征提取22-23
  • 3.3.3 全局特征提取与局部特征提取23
  • 3.3.4 有监督特征选择23-26
  • 3.4 文本特征加权26-28
  • 第4章 招股说明书中风险信息披露的实证分析28-47
  • 4.1 创业板上市公司地区分布特征28-31
  • 4.2 证监会对创业板上市公司风险披露的要求31-33
  • 4.3 招股说明书披露风险量化分析33-37
  • 4.3.1 风险信息披露数量分析33-35
  • 4.3.2 风险信息披露篇幅量分析35-37
  • 4.4 首要风险分析37
  • 4.5 不同地区企业的共同风险披露状况37-42
  • 4.5.1 不同地区制造业企业的共同风险披露状况39-40
  • 4.5.2 不同地区信息技术行业企业的共同风险披露状况40-42
  • 4.6 不同地区企业特异性风险分析42-44
  • 4.7 招股说明书风险信息披露状况及地区特点44-47
  • 4.7.1 不同地区创业板拟上市企业风险披露情况44-45
  • 4.7.2 招股说明书风险信息的现状和存在问题总结45-47
  • 第5章 结论47-50
  • 5.1 本文结论47-48
  • 5.2 本文创新与改进48-50
  • 参考文献50-53
  • 致谢53

【参考文献】

中国期刊全文数据库 前10条

1 张星星;葛察忠;海热提;;我国上市公司环境信息披露现状初步研究[J];环境保护;2008年06期

2 吴斌,傅伟鹏,郑毅,刘少辉,史忠植;一种基于群体智能的Web文档聚类算法[J];计算机研究与发展;2002年11期

3 冉秋红;罗嫣;赵丽;;上市公司智力资本信息披露的实证分析及改进设想[J];经济管理;2007年22期

4 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期

5 肖华芳;万文军;;我国上市公司智力资本信息自愿披露的实证研究[J];会计之友(上旬刊);2009年06期

6 孙学刚,陈群秀,马亮;基于主题的Web文档聚类研究[J];中文信息学报;2003年03期

7 李婉丽;张婧;;西部地区上市公司环境信息披露实证研究[J];青海社会科学;2008年04期

8 张丹;;上市公司智力资本信息披露市场效应研究——基于上市公司IPO招股说明书的经验证据[J];新会计;2009年02期

9 杨乃定;企业风险管理发展的新趋势[J];中国软科学;2002年06期

10 汪宜霞;夏新平;;招股说明书信息含量与新股长期市场表现的实证研究[J];中国会计评论;2004年01期

中国硕士学位论文全文数据库 前4条

1 苏力华;基于向量空间模型的文本分类技术研究[D];西安电子科技大学;2006年

2 丁琼;基于向量空间模型的文本自动分类系统的研究与实现[D];同济大学;2007年

3 种莉萍;基于内容分析法的IPO招股说明书中的风险信息披露研究[D];山东财经大学;2012年

4 张海明;我国上市银行招股说明书信息披露研究[D];山东大学;2013年



本文编号:579418

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/zbyz/579418.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b5461***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com