英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料
深度投资组合理论
JB Heaton NG Polson JH Witte
摘要
我们构建了深刻的投资组合理论。通过在Markowitz经典的风险收益折衷方案的基础上,我们开发了一个独立的四步例程,进行编码,校准,验证和验证,以制定自动化的通用投资组合选择流程。我们算法的核心是在编码步骤中构建的投资组合的深层次结构。然后,校准步骤以深层次投资组合的形式提供多变量支出,这些投资组合旨在针对各种目标函数。验证步骤需要权衡在编码和校准步骤中使用的正则化量。验证步骤使用交叉验证方法来追溯事后深入的投资组合有效前沿。我们以数学方式证明了投资组合理论的所有四个步骤。
关键字: 深度学习,人工智能,有效前沿,投资组合理论
引言
本文的目的是提供深层次的投资组合理论。虽然我们基于Markowitz的原始想法(投资组合分配是风险与收益之间的折衷)进行构建,但我们的方法在许多方面有所不同。深入投资组合理论的目标是双重的。首先,我们通过数据驱动的方法将模型的依赖关系降至最低,该方法建立了风险与收益之间的平衡,并将其作为监督学习例程(这是机器学习中熟悉的概念)的验证阶段的一部分。其次,我们针对市场m和投资组合目标构建自动编码器和多元投资组合支出,分别用F m(X)和 F p(X)表示通过子组合的单变量非线性支出的分层(或较深)层集合,从X表示的一组基础资产中获取p。我们提供编码, 校准,验证和验证的四个步骤,以制定投资组合选择过程。编码找到市场图,校准找到基于各种投资组合目标函数给定目标的投资组合图。验证步骤需要权衡编码和校准步骤中涉及的正则化和错误量。验证步骤使用交叉验证方法来找出投资组合的有效深度边界。
深层投资组合理论依赖于深层因素,即较低(或隐藏)的层抽象,通过培训,这些抽象对应于自变量。深度因素是将深度学习与常规降维技术区分开来的关键特征。这在金融领域尤为重要,因为事前所有抽象级别似乎都同样可行。经常与输入数据具有非线性关系的占优势的深层因素可确保子空间归约适用于自变量。此类表示的存在源自Kolmogorov-Arnold定理,该定理指出不存在多元函数,仅存在单变量半仿射(即投资组合)函数的组合。这激发了深度架构的普遍性。问题是如何使用训练数据来构建深层因素。具体来说,对于单变量激活函数(例如tanh或精算线性单位(ReLU)),深层因素可以解释为X表示的资产的线性组合上的金融看跌期权和看涨期权的组成。因此,深层因素成为深层投资组合并且可以投资。几乎可以逼近任何非线性支出函数的理论灵活性使正则化在训练和验证中成为深层投资组合理论的中心。在此框架中,资产组合优化和效率低下检测几乎成为了完全由数据驱动(因此没有模型)的任务。主要优势之一是我们避免指定任何统计输入,例如预期收益或方差协方差矩阵。具体来说,我们通常可以将统计模型视为劣质的自动编码器,即如果我们在确定市场地图时允许使用更丰富的非线性结构,那么我们可以捕获较低的定价误差,同时仍然提供良好的样本外投资组合效率。
本文的其余部分概述如下。第1.1节介绍了我们用于深层投资组合构建的独立的四步过程。第2节使用层次表示法发展了我们的深层投资组合理论。这是基于Heaton,Polson和Witte(2016)引入的金融深度学习方法。第3节讨论了根据经验收益构建深层投资组合体系结构所需的机器学习工具,重点是对数据的自动编码,校准,验证和验证集的使用。在整个讨论中,很明显,深度学习的关键优势之一是能够将不同信息源组合到机器学习过程中。第4节通过展示如何跟踪和超越给定的基准,提供了一个用于设计深层投资组合的应用程序。我们提供了跟踪生物技术股票指数IBB的应用程序。通过采用以给定百分比击败该指数的目标,此示例说明了我们的四步过程所涉及的权衡。最后,第5节总结了未来研究的方向。
深层投资组合建设
假定可用的市场数据已被分成两个(或更多个用于迭代过程)不相交的集合,用于分别训练和验证,表示为和。我们的目标是提供一个自包含的过程,该过程说明构建投资组合以实现给定目标(例如,将给定指标击败预定水平)所涉及的取舍。这种目标的实时预期成功将在很大程度上取决于我们的历史回报所隐含的市场结构。我们还考虑了在训练阶段也可以使用以Z表示的条件变量的情况。(这些可能包括会计信息或市场上的衍生产品价格或波动率形式的进一步收益数据。)
我们的四步深入的投资组合构建可以总结如下。
自动编码
找到以表示的市场地图,该地图可以解决正则化问题
(1)
对于适当选择,此自动编码X与自身和创建的更多信息,有效的表示X(在形式预处理)。
校准
对于期望的结果(或目标)Y,找到用表示的投资组合图,它解决了正则化问题
(2)
这将根据X逼近目标Y来创建(非线性)投资组合。
证实
找出L m和L p以适当地平衡两个误差之间的权衡
并且 ,
其中和分别是(1)和(2)的解决方案。
验证
选择市场图F m和投资组合图F p,以使验证(第3步)令人满意。为此,请检查隐含的深层投资组合边界,以找到感兴趣的目标,作为正则化量的函数,可以提供此类指标。
现在我们转向深度投资组合理论的细节。
深层投资组合理论
线性组合是半仿射规则y = Xw b,其中的列代表资产回报和b, 分别表示无风险利率,组合权重。然后,Markowitz的现代投资组合理论(1952年)基于y表示的时间序列的均值(收益)和方差(风险)之间的折衷进行优化。我们观察到,在这里,支出与可投资资产线性相关,并且假设参数均值和波动率足以充分描述样本内和样本外的资产演变。考虑大量输入数据,即T时段内N个股票的市场。X通常是一个瘦矩阵,例如N = 500 其中SP500,而T可以对应交易间隔非常大。现在,指定一个目标(或输出/目标)载体。可以将再现或解码输出矢量的输入输出映射F(·)视为数据缩减方案,因为它会减少大量的输入数据以匹配所需的目标。在这里,我们使用投资组合的单变量激活函数的层次结构。在这种层次结构中,将有一个潜在的隐藏结构,可通过深度学习很好地检测到。
换句话说,给定经验数据,我们可以训练网络以查找查询表 Y=FW(X),其中FW(·)是半仿射函数的组成(请参阅Heaton,Polson和Witte,2016年)。我们使用结合了正则化代价的目标函数来拟合参数W。
Markowitz和Black-Litterman
传统的金融定价模型基于依赖于线性定价资产组合的浅层架构(最多两层)。Sharpe(1964)紧随Markowitz之后,描述了资本资产定价模型(CAPM)。随后是Rosenberg和McKibbon(1973)和Ross(1976),他们将其扩展到套利定价理论(APT),该理论使用线性因子层来执行定价。张伯伦和罗斯柴尔德(Chamberlain and Rothschild,1983)在此基础上构建了因子模型版本。从那时起,其他人试图发现这些因素,并且许多研究都集中在样式类别上(Sharpe,1992; Asness等,1998),这些因素代表价值,动量,利差和流动性,仅举几例。
现在我们展示如何在我们的框架中解释Markowitz(1952)和Black-Litterman(1991)模型。第一个关键问题是如何对市场中的信息 进行自动编码。第二个是如何对市场中的每种资产进行解码和做出预测。
Markowitz的方法也可以看作是编码步骤,仅由经验均值和方差-协方差矩阵确定,
用统计术语来说,如果市场收益是具有恒定预期收益和方差-协方差的多元正态分布,那么这些就足够了。我们已经进行了数据约简(通过足够的统计数据),因为我们将N times; T个观测值的数据集用于一组大小为N(均值)的参数以及 方差协方差。
实际上,Markowitz自动编码器通常是一个非常差的解决方案,因为使用历史均值的隐含市场价格拟合的L 2范数会忽略不了所有大幅度波动的时期,对观察到的市场价格会有很大的误差。这些非线性特征对于在自动编码阶段捕获至关重要。具体来说,要解决非线性特征,我们必须引入正则化罚分和校准标准,以衡量我们可以多么接近实现输出目标。深度投资组合理论的关键见解之一是,如果我们允许进行正则化惩罚lambda;,那么我们就可以在适合历史收益的架构上搜索(通过改变lambda;),同时提供良好的投资组合样本外预测边界。从某种意义上说,传统方法对应于非正规化。也许出于这个目标,Black-Litterman通过以代表投资者信念的L 2范式的形式结合了边信息(或信念),从而提供了更好的市场自动编码。在深度学习框架中,这似乎是形式化的一种形式。它在拟合阶段引入了偏差,可能带来的好处是提供了更好的样本外投资组合前沿。
具体地说,假设对于给定的(P,q)投资者视图对,Pmu; = q。然后autoencoding步骤解决了从一个惩罚机制找到的最优化问题和
,
其中lambda;计正规化的量。所述新的编码装置(由表示的确切功能形式的细节 BL )被包含在原始Black-Litterman(1991)的纸张。该解决方案可以看作是岭回归-L 2 - L 2正则化问题的解决方案。从概率的角度来看,这反过来又可以看作是正常-正常分层模型中的贝叶斯后均值(与模式相对)。
如何选择正则化量lambda;仍然是一个普遍的问题。我们程序的验证阶段说,应该从预测的角度绘制有效的投资组合边界。然后通过样本外交叉验证过程中的性能来选择参数lambda;。这与可从Markowitz和Black-Litterman方法获得的传统事前高效边界形成鲜明对比,后者往往远非事后效率。通常,事前被认为具有低波动性的投资组合最终会表现出高波动性-可能是由于时变波动性,Black(1976),在简单的经验时刻并未对其进行自动编码。通过将过程分为相互关联的四个步骤,可以减轻这些类型的影响。我们的模型选择是基于事后边界进行的,而不是事前模型拟合。需要注意的另一个功能是,我们从不直接对方差-协方差矩阵建模-如果适用,它们会在深度架构拟合过程中接受训练。这可以考虑随时间变化的隐含方差-协方差结构中的非线性,将其训练为感兴趣的目标函数,例如索引跟踪或索引超越性能。
编码-解码视图
我们的理论基于首先对市场信息进行编码,然后对其进行解码以形成旨在实现我们目标的投资组合。
深度自动编码器
对于金融应用程序,最有用的深度学习应用程序之一是自动编码器。在这里,我们N输入向量X = { X 1 ,..., }isin;和N输出(或目标)矢量{ X 1 ,...,}isin;。如果(为简单起见)我们将偏差设置为零并使用仅K lt;N个因子的一个隐藏层(L = 2 ),则我们的投入产出市场图 将变为
其中,对于j=1,...,N,其中f(·)是单变量激活函数。
由于在自动编码器中,我们试图拟合模型X = F W(X)。在最简单的情况下,我们通过准则函数训练权重W =(W 1 ,W 2)
用
其中lambda;是正则化罚分。
如果我们使用增强的Lagrangian(如在ADMM中一样)并引入潜在因子Z,那么我们就有一个标准函数,该函数包括两个步骤:一个编码步骤(对Z的惩罚)和一个解码步骤,用于通过重构输出信号
,
W 1的正则化导致Z的惩罚。最后一项是编码器,前两项是解码器。
传统因素模型
假设我们有输入向量表示基准资产(例如SP500)的收益。我们需要学习一本字典,记为的ķ因素,这样我们就可以恢复样品中,输出变量
通常,我们将F k称为定价因子。Rosenberg和McKibben(1973)率先提出了这种方法。Ross(1976)为套利理论提供了理论基础。可以用以下形式将其写为统计模型(尽管没有必要)
与。
对应于我们深层投资组合的第二步(参见第1.1节)的优化问题由下式给出:
第一项是重构误差(又称精度项),第二项是规整罚分,用于衡量方差偏见的权衡(第三步),以获得良好的样本外预测性能。在稀疏编码中,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[262772],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。