采用数据分析的证券投资盈余简述,金融证券论文
第一章 绪论
1.1 研究背景及意义
统计的主要目标是对收集的数据间的关系和参数进行推断,这些数据可能有不同的形式,例如公司的股票收盘价数据是一个时间序列数据,投资者可能需要这些时间序列数据来决定是否购买该公司的股票。数据也可以通过向量的形式存在。例如,体检时医生会记录一个人的升高、体重、年龄和血压等指标,在这种情况下,每一个观测值就是一个长度为 4 的向量,医生可以通过这些数据来对病人患病的可能进行分析。 公司的股票价格数据也可以通过向量来进行记录。如果 1 分钟的间隔来对交易日股票的价格进行记录,每天就可以获得长度为 390 的向量。股票价值在它进行交易的时候是已知的,有些股票每秒可能要进行多次交易,而有些股票在一天中才进行少数几次交易。已知股票每天交易的时刻不同,而且不同天交易次数也不相同,如果每一天用向量来表示,则向量的大小也不尽相同,向量中相对应的元素也不能表示不同天的同一时刻,一种方法是通过一条曲线或一个函数来表示股票在一个交易日中的价值,由于股票的价值在进行交易的时候才知道,因此得到的数据是离散的,然而,可以把这些离散的数据近似看为一个连续型数据。此时,这些连续数据就可以通过插值的方法来近似,如样条法。
.........
1.2 国内外研究状况
1.2.1 国外研究现状
将这些数据用恰当的函数型数据分析方法处理自然是一个重要应用方向,我们可以预见在不远的将来,函数型数据分析方法会延伸到别的社会科学和自然科学的各个领域中去。统计推断大体上分为两大类:模型估计和假设检验。许多函数型数据分析文献主要关注于模型的估计,少部分研究假设检验问题。因此,我们从标准回归模型,均值函数模型和主成分分析模型几方面来进行文献综述。 对于估计问题,许多研究通过运用光滑技术对均值函数模型和主成分分析模型 进行分析 。 对于标准回归 模 型,现有很多参数和非参数方法,如Wahba(1990),Haerdle(1990)和 Wand(1995)等都对这方面进行了研究,Ramsay 和 Silverman(1997)回顾了许多非参数技术来重建曲线数据集的抽样路径。 有几个研究者也对均值模型进行了研究,如 Hart 和 Wehrly(1986)在给定度量的情况下,通过运用核方法对静态过程的均值函数进行估计。Rice 和 Silverman(1991)通过惩罚旋转光滑技术估计了均值函数和特征函数,Besse(1997)等人提出一种混合旋转技术对均值函数进行估计。岳敏,朱建平(2009)把函数型主成分分析运用于我国的股票市场,对股票的收益率变动进行分析,通过该方法从方向和程度上来分析股票收益率的时变特点,研究结果表明通过函数型主成分分析得到的主成分能够对股票收益率的变动进行很好的解释,但是文章没有运用惩罚来对函数数据进行修正,若此将使得结果更加准确。
..........
第二章 函数型数据和模型
2.1 函数型数据
2.1.1 曲线数据与平面数据
近些年函数型数据分析在空间数据的分析领域也有着一定的应用,其某些思路和方法当研究问题维数的增加,出现了一些待解决的问题。本文旨在为后续研究做铺垫,更深层次的函数型数据分析研究和广泛的实际应用还需要大家共同的努力。通过数据到模型这种常用的模式进行介绍。首先介绍函数型数据的概念,然后再对常用的函数型数据模型进行介绍。通常数据类型可以根据观察值的维度分为单变量和多变量类型,例如,单变量数据集把数字作为观测值,而多变量数据集把向量作为它的观测值,数字是单维度的,而向量是多维度的。 一条曲线或一个平面可以认为是一个无穷维的向量。以曲线为观测值的数据集称为曲线数据集,以平面为观测值的数据集称为平面数据集,通常,称以函数为观测值的数据集为函数型数据集。函数型数据是单维和多维数据的自然推广。 曲线数据存在于多个领域,如生物学,医学和气象学等等。最典型的是在生长曲线的纵向研究中,Rice 和 Silverman(1991),Kneip(1994)也提出了很多关于曲线数据的例子。 科学实验中也会经常遇到曲线数据,例如,对孩子的生长模式进行研究,它有助于很好地了解孩子的生长过程。这种实验通常是通过实验来进行的。如下是一个简单的实验:该实验包含多个孩子,他们的身高是通过时间间隔来记录的,现在对两年中孩子的身高进行测量,每隔半个月测量一次,总共记录 48 条数据。我们知道这 48 条数据是从孩子的潜在的生长曲线中抽取的样本,因此我们非常关注孩子的生长曲线,而通过这些抽取的数据,可以对孩子的潜在生长曲线进行估计。潜在的生长曲线表示每个孩子的生长模式。
........
2.2 函数型数据的预处理
函数型数据分析分为以下步骤:首先对收集到的数据进行预处理,使之符合函数型数据分析的要求,选择相应的基函数来对该数据进行拟合,对拟合得到的函数进行求导,分析函数的变化形式。得到了函数之后,通过均值函数、方差函数、协方差函数、相关系数函数和交叉相关函数等对该函数的特征进行分析。然后通过套准来消除样本在不同时刻的变化的差异,最后对套准后的函数型数据进行分析,可以运用主成分分析或典型相关分析等,然后建立相应的线性相关模型或微分方程模型。 通常我们得到的数据都是离散的,如何来理解数据是一个函数呢?这并不是说在每个时刻都有观测值,这是不可能的。而是说假设离散数据的生成过程是一个连续的过程,这样就可以对生成过程函数和它的导数进行分析。在通常情况下我们获得的数据不仅是离散的,而且有噪音,因此首先就对数据进行预处理,消除噪音的影响。数据预处理通常用插值法和平滑法。如果获得的观测值没有误差,那么可以运用插值法进行拟合,而如果得到的观测值具有误差,那么应该用平滑法进行拟合,通常数据是有噪音的,,因此常用平滑法来进行数据预处理,下面对平滑法进行介绍。
..........
第三章 函数型数据分析 ............ 17
3.1 经典回归分析回顾 ........... 17
3.2 基函数模型 .......... 18
3.3 函数光滑性的度量 ............ 21
3.4 方差分析 .......... 24
第四章 函数型数据分析在证券投资中的应用 ............. 32
4.1 投资组合理论回顾 ............. 32
4.2 证券收益实证分析 ........... 34
第五章 结论及建议 ........... 39
第四章 函数型数据分析在证券投资中的应用
4.1 投资组合理论回顾
投资风险是指对投资未来结果的不确定性,在金融投资领域中,风险特指的是未来资产价值的不确定性或未来资产收益的不确定性。由于这种不确定性的存在投资者在进行投资时需要承担着或多或少的风险。显然,认识风险、选择风险及投资者对风险的敏感程度是与投资决策密切相关的问题。统计学中,方差和标准差是度量随机事件各种可能结果与期望结果偏离幅度的参数,在投资组合理论中,方差和标准差被用来衡量投资风险的大小。方差或标准差越大,资产未来的不确定性越大,因而风险就越大。 Markowitz 在其 1952 年著名的论文《证券组合选择》中构建了均值-方差模型,翻开了现代投资组合理论的新篇章。在这篇论文中,Markowitz 考察了投资期限为一期的情形,即投资人在某一时点即期初,以一定的资金买进一系列证券并保持在手中一段时间即投资期,在投资期末的时点即期末,将期初买进的证券卖掉。在这个问题中,首次规范地形式了投资的风险。
.........
第五章 结论及建议
在本文的前两章中,我们首先介绍了函数型数据分析的研究背景和当前研究现状,随后介绍的函数型数据的几种常见类别,并列出了几种常见的处理函数型数据时用到的模型及它们的性质,此外我们还回顾了经典统计中,回归分析是如何实现的。然后,我们在第三章中介绍拟合曲线的方法,也就是基函数拟合法,并分别针对周期函数数据和非周期函数数据较为详细的介绍了基函数系统。我们在把原始的数据利用基函数线性表出之后,就可以通过修正后的最小二乘法即广义最小二乘法得到基函数系数的估值。此外,为了避免在经典统计中拟合过程中发生的过拟合现象,我们加入了光滑参数和光滑矩阵的概念来调节拟合函数的整体平滑性。我们为了控制函数局部的性质,如拟合程度或光滑性等,甚至可以用两组或更多的基函数系统来拟合,此时我们而另一组基函数来控制函数的全局性质。 在得到了拟合函数之后,我们介绍了其他的方法来探索函数包含的信息,这些方法都是在经典统计中常用到的,包括方差分析、主成分分析、典型相关分析。方差分析是研究一个或多个因素对模型的影响程度的方法;主成分分析是一种利用降低数据的维数的思想来压缩数据、提取函数内在信息的方法;典型相关分析是研究两组函数相关性的方法。在以上几种方法中,我们都利用了光滑参数和光滑矩阵来使拟合函数的系数函数具有更好的光滑性。
...........
参考文献(略)
本文编号:11875
本文链接:https://www.wllwen.com/caijicangku/wuyoulunwen/11875.html