本科毕业设计(论文)
外文翻译
股票价格指数波动性的预测
作者:Tae Hyup Roh
国籍:韩国
出处:韩国首尔女子大学工商管理系
摘要:准确的波动性预测是风险管理中的核心任务,在风险管理中,各种投资组合的定价、对冲和期权策略都被运用。以往对股票市场的研究主要集中在利用金融时间序列模型和数据挖掘技术估计股票价格指数。本文提出了基于神经网络和时间序列模型的混合模型,从偏差和方向两个角度预测股票价格指数的波动性。说明了混合模型在波动性预测中的应用。该模型证明了神经网络预测与时间序列分析相结合对金融商品的实用性。
关键词:波动性预测;股价指数;时间序列分析;神经网络;混合模型
1.简介
自1997年7月7日韩国综合股价指数(Kospi)200期权市场成立以来,交易市场成交量急剧增加。投资者和金融机构开始担心Kospi200波动性增加带来的风险。准确的波动性预测是进行风险管理的重要组成部分,特别是在将资产分配给各种投资组合以有效对冲这些投资组合的风险时。
预测时间序列波动的模型多种多样。Engle提出了许多金融分析师使用的ARCH(P)(自回归条件异方差)模型(Engle,1982年)。GARCH(gen-eralized arch)模型是拱的广义形式(Bollerslev,1986)。摩根大通(JP Morganamp;Reuters,1996)的风险度量建议EWMA(指数加权移动平均数),它基本上是一个非站ARY GARCH(1,1)模型。考虑到GARCH模型的局限性、杠杆效应,提出了EGARCH(Expo-Nential GARCH)模型(Nelson,1991)。这些金融时间序列模型可以用计量经济学进行分析,并根据市场和金融理论进行系统解释。然而,由于市场条件和环境变化引起的许多噪音,金融分析师应考虑许多市场变量。金融时间序列模型要求对时间序列的分布进行严格的假设,因此很难在模型中直接反映市场变量。由于金融时间序列模型的这些缺点,人工神经网络已直接应用于各种复杂金融市场。神经网络模型是一种非参数化的方法,可以通过学习市场变量的模式来预测未来的结果,而无需任何严格的理论假设。利用这些特征,我们发现,通过分析标准普尔500指数期货期权波动率,人工神经网络可以优于金融时间序列模型(Hamid和Zahid,2002年)。在预测金融时间序列的波动性时证明了神经网络的可能性(Brooks,1998)。
本研究的目的是通过整合金融时间序列模型,如EWMA、GARCH、EGARCH和ANN模型,增强股票价格指数领域的预测能力。以往的研究主要比较了单个模型的预测能力。然而,本研究主要集中在两个观点:股票价格指数的偏差和方向。此外,以往的研究大多采用反复试验和错误学习的方法来调整原始挥发物的重量,并发现输入变量的最佳系数以产生最佳结果。本研究通过金融时间序列过程来确定输入变量的系数,并提取出对结果影响很大的新变量。
在介绍了研究背景的基础上,本文余下的部分组织如下:第二部分简要回顾了相关工作。第三和第四部分介绍了人工神经网络财务时间序列模型和实验的方法论,最后两部分阐述了研究结果和对未来连续研究问题的贡献。
2.相关工作
2.1金融时间序列波动性预测
作为一个经典的金融时间序列模型,Arch(P)被提议对具有波动性聚类和肥尾的时间序列特征进行建模(Engle,1982)。由于ARCH(P)导致预测波动性的时滞P变得更大,因此建议使用广义ARCH-as-GARCH(P,Q)(Bollerslev,1986年)。GARCH模型限制其参数具有条件方差的正值,这些条件将使条件方差过程对必要性有很大的限制。最初的GARCH模型不考虑未来收益率和波动性之间的负相关。同样,当市场低于参与者的预期时(负面影响),负面影响的影响比同等规模的正面影响更大。这种不对称冲击通常被称为杠杆效应。另一方面,一般的GARCH模型在不考虑条件波动影响的迹象的情况下导致不对称冲击,因为当前收益的残差平方对未来收益的波动有影响。考虑到这种杠杆效应,建立了Egarch模型(Nelson,1991)。
EWMA模型为最近的数据提供了比时间序列中其他数据更大的权重。该方法以参数化的方法对摩根大通的“风险度量”进行建模。在EWMA的情况下,当波动性预测的目标是捕捉它的短期运动时,EWMA是可取的。然而,如果EWMA只在最近的数据上放置了很多值,那么它会减小样本大小,并导致测量误差的可能性增加。EWMA在描述金融时间序列波动性“长期记忆”特征方面存在缺陷。
2.1利用数据挖掘技术的股票市场应用
在过去的十年中,利用数据挖掘技术对股票市场进行了大量的预测研究。在这些研究的早期,重点是估计股票价格指数的回报水平。最早的研究之一是Kimoto、Asakawa、Yoda和Takeoka(1990年),他们使用几种学习算法和预测方法来开发东京证券交易所价格指数(TSEPI)的预测系统。他们使用模块化神经网络来学习各种市场因素之间的关系。他们得出的结论是,他们的模型产生的相关系数要比多重回归产生的相关系数高得多。
一些研究者调查了股指期货市场的预测问题。Trippi和Desieno(1992)利用人工神经网络预测了标准普尔500指数期货的每日变化方向。它们使用逻辑(布尔)运算符组合各个网络的输出,以生成一组组合规则。他们认为,他们最好的合成规则集系统比以前的研究获得了更高的收益。最近的研究倾向于将几种人工智能技术混合在一起。Nikolopoulos和Fellrath(1994)开发了一个混合的投资咨询专家系统。在他们的研究中,遗传算法被用来训练和配置投资者的神经网络组件的结构。最近对Lee和Jo的研究开发了一个专家系统,在烛台图表分析中使用知识(Lee和Jo,1999年)。专家系统具有预测未来股价走势的模式和规则。实验结果表明,开发出的知识库可以提供良好的指标。此外,Tsaih、Hsu和Lai(1998)综合了一种基于规则的技术和人工神经网络来预测标准普尔500指数期货的每日变化方向。此外,一些研究人员使用遗传算法而不是局部搜索算法(包括梯度下降算法)搜索了神经网络的连接权值。他们认为,包括遗传算法在内的全球搜索技术可能会阻止人工神经网络陷入局部最优(Guptaamp;Sexton,1999;Kim,2003;Kimamp;Han,2000;Sexton、Dorsey和Johnson,1998)。
过去的研究证明,人工神经网络模型可以增强基于实际市场数据的预测能力,并建议将人工神经网络模型和金融时间序列模型集成到未来研究中是非常重要的(Hamid和Zahid,2002年)。特别是,Hu和Tsoukalas(1999)提出了在人工神经网络学习过程中重新学习预测结果的人工神经网络可以提高预测能力,并建议研究预测结果是否有助于人工神经网络预测过程。最近,在股票指数预测方面,利用人工神经网络进行了各种研究(Armano、Marchesi和Murru,2005年;Gavrishchaka和Ganguli,2003年;Yao、Li和Tan,2002年)。
这些研究为神经网络在金融工程中的应用奠定了基础,目前,在金融和预测领域开展了积极的研究,其中参数模型无法充分解释其市场行为的特征。
3. 混合神经网络时间序列模型
人工神经网络在预测波动性中一个常见缺点是它没有被经济地证明。此外,由于输入变量是影响预测结果最重要的因素,因此用户对神经网络结果感到好奇,因为输入变量是在重复试验和错误的学习过程中确定的。本研究提出混合神经网络时间序列模型以解决神经网络学习过程中的困难,提高预测波动性的预测能力。
由于输入变量是由金融时间序列模型选择和新创建的,因此混合模型在选择输入变量方面达到了效率。重复试验误差过程可以消除为一次财务时间序列过程。对预测权重最大的输入变量通常收缩为一个或两个变量,而神经网络模型大部分时间都是通过重复试验和错误来确定输入变量。研究结果表明,混合模型可以在方向和偏差的框架下提高预测能力。从理论上讲,神经网络可以近似任何函数,金融时间序列模型可以相当近似于这种灵活性。因此,GARCH(1,1)的条件波动特性可以通过人工神经网络进行近似,通过输入GARCH(1,1)过程中得到的变量,并通过人工神经网络过程学习条件波动模式,实现近似方法。人工神经网络可以通过实际使用其他市场变量来调整这些结果,以反映真实的市场行为。金融时间序列模型能有效地提取输入变量,而神经网络能从股票价格指数的偏差和方向上利用这些变量和其他市场变量提高预测能力。
3.1 NN-EWMA模型
sNN-EWMA模型是通过EWMA模型提取变量,对近期数据进行加权,捕捉短期波动行为。EWMA方程如下:
(1)
EWMA对最近的数据给予了更大的权重,并降低了过去数据严重影响预测的阴影效应。NN-EWMA模型可以用两个变量表示:
- :t-1时的波动平方;
- :t-1时的残差平方。
基于上述变量,可以提取两个新创建的输入变量,每个变量通过平滑因子(衰减因子),进行调整,然后包含在ANN输入变量中。新创建变量如下:
- ,
- 。
通过EWMA模型提取的和与在GARCH(1,1)模型中提取的变量相似,但两个模型从完全不同的条件方差概念开始,即通过财务时间统计提取GARCH(1,1)模型的系数。但是,EWMA的那些是由用户基于经验的判断决定的。
3.2 NN-GARCH模型
ANN时间序列模型用于通过财务时间序列模型提取预测或调整的输入变量。大多数财务时间序列模型都很容易由GARCH(1,1)建模,因此本文首先尝试使用GARCH(1,1)模型提取输入变量。时间序列数据的GARCH(1,1)过程如下:
(2)
GARCH(1,1)模型产生了类似的效果,就像使用长时间滞后ARCH模型,即使它使用的参数很少。因此,从条件方差的角度出发,利用GARCH(1,1)模型建立具有波动性、聚类性和肥尾特征的时间序列是可取的。是提前一个周期预测条件方差。这个条件方差方程用以下三个变量表示:
- :非条件挥发性系数
- :t-1时的剩余
- :t-1时的波动平方
因此,它有和条件关系与对方可以提取和这些变量的系数调整到和。这些都包含在神经网络学习过程的输入变量中。新提取的变量如下:
- ,
- 。
3.3 NN-EGARCH 模型
NN-EGARCH模型用于改进GARCH(1,1)模型的约束条件方差过程,如下方程所示:
(3)
EGARCH模型可以解释不对称冲击,这意味着收益率的大幅下降可以使下一个周期的波动性更大的杠杆效应。等式(3)中的解释了市场冲击对杠杆的影响,EGARCH模型可以统计地解释非对称冲击,而条件方差模型不能解释这种冲击。EGARCH模型用以下四个变量表示:
- :非条件方差效率,
- :t-1时方差的对数值,
- :杠杆效应的不对称冲击,
- :杠杆效应。
基于上述变量,可以提取新的输入变量,每个变量通过、、进行调整,然后包含在神经网络模型中:
- ,
- ,
- 。
现有的研究使用可观察的市场变量和各种其他金融理论可以创建的变量,但通常不使用新创建的变量为神经网络。它是新创建的杠杆和杠杆作用变量,不同于现有的神经网络模型中的神经网络模型。为了通过新创建的变量来确定效率和预测能力,NN-EGARCH模型将使、LE、L与其他市场变量一起输入变量,并分析NN-EGARCH学习过程中的预测能力。
4.实验
4.1数据集和实验装置
本研究进行实验评估所提出的模型。在实验中,我们使用了由KSE KOSPI 200指数数据库和每日期权数据提供的KOSPI 200时间序列数据和期权每日交易材料。数据集包括样本期930个交易日指数和预测期160个指数。
为了验证金融时间序列模型的恰当性,本研究进行了ADF(增强型驾驶员信息中心(DIC)关键富勒)测试和ARCHLM(拉格朗日乘数)测试。图1显示了实验数据集的每日kospi 200索引。
4.1.1 ADF检验
ADF试验用于验证稳定性。因为ADF测试的样本数据中有一个单位根,所以这个时间序列是一个需要区别的非平稳时间序列。因此,这个时间序列变为KOSPI 200对数,得到平稳的时间序列。
图1 (a)kospi 200时间序列;(b)KOSPI 200返回的对数时间序列
表1 KOSPI200索引时间序列数据集的ADF测试
<t
剩余内容已隐藏,支付完成后下载完整资料</t
英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[272155],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。