英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
基于小波支持向量机的波动率预测
摘要:在预测股票市场收益的条件性波动率时有挑战的问题之一就是支持向量机中(SVM)的普通核函数无法准确抓住波动率的聚类特征。然而小波函数能够产生在不同的地点和不停变化着的时间粒度下的波动率时间序列的描述特征,所以本文为了解决这个问题,构建了一个多维小波核函数并证明它满足mercer条件。小波支持向量机(WSVM)对波动率预测的适用性和有效性通过电脑仿真和现实世界中股票数据的实验被证实了。
关键词:波动率预测;小波支持向量机(WSVM);Mercer条件
- 引言
波动率经常在测量金融资产的总风险、评估期权价格和实施对冲策略扮演重要作用(Day amp; Lewis, 1988; Harvey amp; Whaley, 1991; Hull amp; White, 1987; Poterba amp; Summers, 1986)。自从Engle (1982)和Bollerslev (1986)关于异方差收益序列模型开创性的工作,学术金融文献广泛承认ARCH族对波动率预测是有效的方法(Franses amp; van Dijk, 1996, Li amp; Mak, 1994)。为了进一步提升GARCH预测表现,神经网络被引入到这个领域,它有功能性的灵活性去抓住在过去收益率残差和未来波动的非线性关系。Donaldson and Kamstra (1997)提出了神经网络-GARCH模型的使用去抓住在股票收益率的波动率影响。Meissner and Kawano (2001)使用一个结合的GARCH-神经网络方法去捕捉以高频股票为标的的期权的波动率微笑。由于他们的数据驱动型和非参若属性神经网络证实了他们在建模股票收益率的条件性波动率的有效性但是神经网络最重要的弱点之一就是他们不能避免会陷入局部最优(Bishop, 1996, Haykin, 1994)。但是,SVM,一个由Vapnik和他的同事在1995年研发的新型神经网络,可以完美地解决这个问题(Vapnik, 1995, 1998)。与大多数常见的神经网络比较,基于结构风险最小化原则和线性约束二次规划理论的SVM可以获得更好的代表性能。除此之外,SVM的解是唯一的和全局最优的。因此,Perez-Cruz提出GARCH-SVM模型并且证明了使用SVM预测波动率不仅是可行的而且是有效的(Perez-Cruz, Afonso-Rodriguez, amp; Giner, 2003)。
SVM的预测表现极大取决于核函数的选择。有许多种存在的支持向量机核比如用于将输入空间中的数据映射到问题变得线性可分的高维特征空间的高斯和多项式内核(Schouml;lkopf, Burges, amp; Smola, 1999)。自从小波函数可以同时在不同的地点和不停变化的时间粒度下描述时间序列(Daubechies, 1990, 1992, Mallat, 1989, 1998),它也能很好地描述波动率的聚类特征。因此,如果我们将小波理论结合到SVM来构建一个多维的小波核函数以预测基于GARCH模型的股票市场收益率的条件性波动率,探究是否理想的表现可以获得的问题对我们而言就是有价值的。
本文的目标是根据GARCH模型通过比较与高斯核函数在SVM中的区别来评估小波核在波动率预测中的表现。本文的结构如下:第2部分提供了SVM对回归估计理论的简要介绍,第3部分描述了如何去构造小波核并且证明它是可接受的支持向量机核,第4部分讨论了仿真和现实数据集的实验结果,在最后一个部分紧跟的就是结论。
2. 回归估计的SVM理论
在敏感性的支持向量回归中,我们的目标是去找到一个函数就是距离真实得到的目标值有与此同时尽可能的平滑。假设有下面的形式:
所以,如果我们有一个小规范的,那么可以说是水平的。一种方法就是使用约束于所谓的
敏感性带的限制的欧几里德规范(Smola amp; Scholkopf, 1998)来最小化
我们得解决这个问题为了得到一个敏感性SVR解。通常,我们需要允许一些误差。我们引入松弛变量来解决这个情况。这种情况称之为软间隔准则。特别地,我们解决下面的问题:
其中,决定了的平坦度之间的权衡,并且大于的偏差量是被允许的。
拉格朗日函数会帮助我们制定对偶问题,给我们一个二次线性问题制定。接下来我们构建对偶问题。理由是由于许多变量解决原始问题是困难的。如果我们使用对偶问题定制,我们可以减少变量以及问题的规模变得更小。特别地,
接下来我们考虑非线性情况。首先,我们需要将输入空间映射到特征空间并且尝试在特征空间找到一个回归超平面(Schouml;lkopf et al., 1999)。我们可以通过使用核函数来完成那个。换句话说我们以下列形式替换k:
因此,我们可以通过使用核函数在特征空间里替换向量的点乘。所以,问题变成
在最优解,我们得到
在线性和非线性情况里主要的差别就是在非线性情况中不再是被给的很明确了。另一方面,通过使用点乘,它被定义地唯一(Smola amp; Scholkopf, 1998)。并且,我们在特征空间而不是在输入空间起作用。
3. 构建和证明小波核
让,是一个规模函数且是产生一个的正交基的小波。我们表示。被写成二进制形式的的任何整数,我们定义N-维函数
明显地,
然后,通过扩张和平移的小波家族就得到了,对
是一个的正交基准(Mallat, 1998)。
定理1. 让是一个母小波,让和分别表示扩张和偏移。如果,那么点乘核函数就是
证明. 我们证明点乘小波核是可以接受的支持向量核。
我们表示另一个的正交基准
根据对偶框架理论,
其中=,因为是正交基。
然后,根据复制核理论,我们有
让并且,
因此,点乘核满足Mercer条件。因此,它是一个可接受的支持向量核。
4. 试验结果
4.1 仿真数据集
两个仿真数据集在试验的第一个系列被检测了。每个数据集是由一个GARCH(1,1)模型产生的
其中,是日收益且是偏误,一个零均值单位方差的不相关过程。由于其简单性,金融收益序列的均值经常被忽略。除此之外,参数必须满足确保条件性方差是正的。这个试验设置如下:起初是高斯分布然后是学生t分布自由度是4(峰度=4)。这第二个分布序列去建模过多的峰度,这会出现在真实的金融序列中。每次序列由1040个样本组成。第一个520个样本被使用于训练剩下的520个样本用于检测。
SVM被用于预测波动率,根据GARCH(1,1)模型,它能消除arch效应。它意味着SVM的预测效果越好,标准化的观测()拟合正态分布越好。因此,这个试验的目的是主要证实基于标准化观测的拟合测试的小波核的表现,并与高斯核相比,高斯核是解决大多数学习问题的支持向量核之一。它的表达式是,其中是一个自由参数。输入变量是滞后的条件性方差和平方收益。输出变量是现在的条件性方差。宽度大小、惩罚参数C和管大小的值通过使用交叉验证分别被选为0.2666、12.789和0.00008。C和相同的值为比较而被使用在WSVM。被使用的小波是有4个消失时刻的Daubechies小波。在小波核的扩张参数j设为[-2,0]。Kolmogorov-Smirnov距离(KS)和Anderson-Darling距离(AND)被用作适合度测试的准则。他们被定义如下:
其中,是经验样本分布而是估计参数密度的累积分布函数并且强调了在分布中位数周围的偏离。AD统计比KS统计更加突出了尾部的差异。
我们已经运行了10个独立的有相同的设置的路径并报告了在所有的审判相应统计的最佳值。小波核在SVM中优于高斯核通过检测表1可知。该表报告了同时在高斯和学生t分布假设下两只仿真股票的计算的KS和AD统计。他们被指为Data-1和Data-2。它表明无论在训练集还是测试集,由小波核预测的的KS统计的值小于由高斯核预测的的KS统计的值。对于AD统计相同的情况是正确的。它表明小波核预测的比起由高斯核预测的更好地拟合高斯分布。对于学生t分布假设,我们可以得出相同的结论。小波核多亏了其良好的时频特性,这可以在不同的地方和不停变化的时间粒度上描述任何一种时间序列,可以给出更好的预测。
4.2. 金融数据集
在试验中检测的数据由以下日常指数组成:DAXINDX、 FRCAC40、FTSE100、JAPDOWA和 SPCOMP。这些股票市场指数随后通过100乘以他们的对数差被转化为日收益
所有指数数据包含的时间从1992年1月1日至1997年12月31日。对于每个日收益的时间序列都有1560个观测值。每个整数据集根据向前走测试常规都被分为五组重复训练和测试集(Kaastra amp; Boyd, 1996)。每个训练和测试集每130个观测值通过时间序列向前移动,在训练集中总共有520个观测值,在测试集中也与520个观测值。的最优值基于交叉验证被选择出。的相同值被使用于WSVM。相同的方法也被使用于WSVM来选择扩张值j。结果被整理且最好的结果被记录如下,这是从第二个数据集(1992年7月-1996年7月)得到的。
表2给出了日收益的描述性统计。它表明收益序列表现了很小的相关性尽管它的平方展现出了高的相关系数。标准Box Ljung统计值加强了这个证据。表2也描述了所有的序列说明了对正态分布值的零均值和多余的峰度。FTSE100收益序列被绘制在图1。图2描述了收益的概率密度函数的非参数估计与相应的正态密度。自相关系数也在图3中被展示出。这些图可以证实在表2中报道的关于这个收益的聚类、厚尾和长相关的结果。因此,使用GARCH来建模随时间变化的条件性方差就很合理。
表3给出了由高斯核预测的标准化观测值的描述性统计。它不能够加强仿真试验的结论——在标准化观测中仍存在过多的峰度。这可以由模拟的试验是简单明了的会消除一些可能影响真实世界数据集的试验结果的未知因素的干扰来解释。但是平方收益比起表2给出的值展示了标准化Box Ljung统计值的减少。这以为着它的自相关性是不再显著的。表4报道了由小波核预测的标准化观测值的描述性统计。通过分析它相同的结论也可以得到。而且,通过比较两个表格的结果,可得出就标准化观测值的描述性统计而言,在两个核之间结果是可比较的。我们必须指出结合GARCH后的高斯核和小波核的SVM似乎都可以足够描述平方收益序列的动态性。
预测效果通过使用下列的统计指标可以评估出:归一化的均方误差(NMSE)、归一化的平方绝对误差(NMAE)和命中率(HR)。这些指标如下计算:
其中,N代表测试集中数据点的总数目,表示预测的条件性方差,y代表预测的收益,y表示真实的收益。NMSE将SVM的预测波动率的均方误差与原始模型的均方误差相关联。与NAME相比,NAME对异常值更稳健。他们是真实和预测值的偏差的衡量。他们的值越小,预测的时间序列值和真实值越近。相反,HR作为衡量模型多久给出波动率变化的正确方向的值越大,预测的表现越好。
训练集的结果在表5列出。可以观察到在所有的日指数里,NMSE和NMAE在小波核中的值较小。对于HR,排除JAPDOWA,在所有其他的日指数中(DAXINDX, FRCAC40, FTSE100和 SPCOMP)在小波核中数据更大。配对测试(Montgomery amp; Runger, 1999)被执行去决定是否基于训练集的NMSE的两核有显著的差异。计算的t值表明在10%的置信度下单侧检验小波核要比高斯核表现好。
表6中测试集的结果提供了在过拟合问题可能被忽略时两核比较的一个更好的基础。正如预期一样,就NMSE、NMAE和HR而言测试集的结果比训练集的结果差。但是相似的结论仍可以得到。表阐明了除了FTSE100的NMSE、DAXINDX的NMAE和JAPDOWA的HR,总体上NMSE和NMAR的较小值可以在小波核中被发现而HR的较大值也在小波核中发生。测试集的NMSE的配对测试也表明在10%的置信度下单侧检验小波核要比高斯核表现好。
来自两核对测试集的平方观测值和预测值在图4和图5中被阐明,只有SPCOMP画出来了,因为在所有的日指数中它是NMSE和NMAE很有代表性的值。在这个研究下,参数分别被选为3.3464和0.0097。高斯核参数被固定为0.43907。应用具有4个消失时刻的Daubechies小波到设置为1的扩展j的WSVM。很显然高斯和小波核都足够去抓住由原始模型反应的特征。根据图4和5两核的预测非常相似,尽管,正如我们在表6看到的那样,小波核的表现比高斯核好得多。
5. 结论
我们将小波理论和SVM结合起来为波动率预测而构造的有效小波核在本文中被展示出来了。小波核的存在首先被证
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[27977],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。