广义分位数偏差修正得分分解外文翻译资料

 2022-11-19 14:28:12

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


广义分位数偏差修正得分分解

摘要

预测得分的分解是代表评估其性能的有用工具。我们认为局部评分分解允许在一系列感兴趣的条件下进行详细的预测评估。在分位数型泛函的点预测框架中,我们对分解分量的偏差进行修正,并通过仿真来说明它们的性能。目前,相关的偏差校正只有平方误差标准是已知的。

关键词:偏差矫正,相合的评分函数,Expectile,局部得分分解,分位数

引言

对未来数据做出预测是困难的,导致了关于预测评估出现了大量文献。预测值和已实现值之间的平方距离提供了一个简单的准确度量度,现有的大量工作依赖于二次误差准则。我们的重点在于预测分布的某些特征的点预测,例如均值或分位数。在这种情况下的适当误差量化取决于损失类型评分函数的概念,该函数与给定的特征一致(Gneiting,2011)。如果的平均得分低于,那么预测的得分函数将比预测好。其他条件包括技能得分(Murphy amp; Winkler,1987),校准和锐度测量(DeGroot amp; Fienberg ,1983; Gneiting等人,2007),以及将平均分数分解成通常被称为可靠性,分辨率和不确定性的三个成分(Murphy amp; Winkler,1987;Brouml;cker,2009; 2012; Weijs等,2010 ; Christensen,2015)。预测方案的综合评估需要进一步的信息,而这些统计数据并不提供进一步的信息。验证等级直方图等图形工具对于检查预测的正确校准特别有用,但准确性也是一个问题(Gneiting et al ,2007)。

因此,我们考虑得分分解,允许对这两个方面进行评估。为此,根据变量的值将数据分成若干层。通常只考虑特殊情况,其中是预测值。 A. Tsyplakov在https://mpra.ub.uni-muenchen.de/67333/发布的2014年正在进行的论文“部分知情预测审查理论指南”中指出,预报员和评估者可获得的信息可能不同,并且可以根据由编码的任何相关信息来进行评估。我们具体地考虑了X是可测量的情况。那么最好被认为是,其中代表需要单独预测评估的辅助信息或索引域,例如天气预报中的季节和纬度(Murphy,1995)。在任何情况下,有条件地对进行得分分解为局部测量校准和熵的分量,与涉及本质上全局分辨率和不确定性项的常见三项分量相反。考虑到之前对这些标准估计量的研究结果存在严重偏差(Brouml;cker,2012; Bentzien amp; Friederichs,2014),我们推导出修正这种偏差为一阶近似。迄今为止,相关结果已经使用均值型函数和平方误差(Ferro amp; Fricker,2012)后者允许代数计算,与分位数或Expectile的得分函数不可行。 我们建立在已有的这种混合表示得分函数(Ehm et al,2016)和经验分布函数的局部行为上。我们的偏倚修正适用于广义的分位数和相关的一致性评分函数,使得可以以统一的方式处理分位数和Expectile。同样,它们可以立即修正总体分数偏倚,如分辨率。

2.得分分解

诸如分位数或平均值的特征对应于实线上一些F类上的右连续分布函数,预测分布(Gneiting,2011)。给定,的点预测的非负评分函数,观测值对于是一致的,如果对于每个表达式,当时,被最小化;如果是的唯一最小值,则它是严格一致的。例如,分段线性评分对于较低的分位数是严格一致的,,非对称二次分数对判定是严格一致,是|的解(Newey amp; Powell,1987)。这里表示事件的指示函数,对于,各个矩应该是有限的。的情况检索中值和平均值,分别使期望的绝对值和平方误差最小。

在下文中,代表一个固定的评分函数,它对上的给定泛函是一致的。最小期望分数被称为熵 ,称为x与之间的散度。在中值和平均值的情况下,熵分别降低到平均绝对偏差和方差的一半,一般来说,把熵看作是一个广义的方差,将偏差视为一个偏差项是有意义的。

我们现在考虑点预测,验证观察和第三个变量作为在某个概率空间上定义的随机变量的三元组。让表示无条件分布,是给定的的条件分布,所有这些分布都应该是F的成员。随机变量将给定W的条件不确定性量化为,称为局部熵,

(1)

在上有条件地测量预测与的偏差,我们称之为局部误差校正,。 如果是可测量的,那么当固定时,是固定的,并且在上述意义上减小到发散,是非负的。通常可以假设为负值,这不会阻碍技术发展,但会使解释困难。 因此,为了简单起见,我们假设是可测量的。 重新排列(1)产生一个条件偏差方差类型分解,基本上与上面引用的Murphy(1995),Brouml;cker(2009)和Tsyplakov的方法相同,即:

(2)

为了比较,Brier(1950),Murphy amp; Winkler(1987),Brouml;cker(2009)等人以各种方式得出的无条件得分分解,

(3)

把(2)的结果写成并得到期望。 全局熵传统上称为不确定性,分辨率测量的平均变异性,而全局误标准MCB通常被称为可靠性或条件偏差。我们偏离了这个术语,因为我们认为误差修正比可靠性更合适,因为在我们的设置中,术语条件偏差是需要用于不同的目的。

我们假设是的一个独立样本。为简单起见,假设是离散的,的范围被划分成许多个分箱。的数值在大多数情况下并不重要,简单地被标记为k = 1,...,m。因此,表示给定的条件下的分布。我们通过的经验分布估计,使得。令表示它们的数量,并将局部经验得分,熵和校准项定义为:

(2)的经验类比得出:

(4)

不确定性和解决方案术语的经验对应物是:

其中为所有的经验分布。写出平均得分为,得到(3)的经验类比,

(5)

通过定义经验误差来满足(5),即。显然,与理论分解类似:平均值(4)与权重完全再现全局经验分解(5)。作为(4)的一个特殊的特征,这三个项只取决于的时的预测观察,所以在这个意义上严格来说是局部的。相反,经验分辨率和不确定性项涉及,本质上是全局性的。

3.修正分解组件的偏差

如果经验分布和接近于G和,则经验校准,分辨率和不确定性或熵项应给予其理论对应物有用的近似值。 但是,可能只有一个有限的样本偏差。 为了研究给定的条件偏差,引入由所有指标变量,生成的代数是方便的。将频繁使用以下事实:

LEMMA 1.有条件的随机变量与是独立的,分布均匀分布。

我们现在表明,为了获得单个分解成分的偏差修正估计值,它需要修正局部经验熵的条件偏差,有条件地在上。 如果表示给定的条件期望,这些偏差来自:

(6)

广义的简化是由于局部平均分数是相应的条件期望的无偏估计。对于(4)式,和的条件偏差增加到零,所以后一项的偏差等于。类似的论点适用于全局误差项:

其条件偏差为。 鉴于,是已知的,可以认为是固定的。经验不确定性的条件偏差为。 然而,又是经验熵的条件偏差,这使我们可以完全类比来确定这种偏差。最后,写和回顾表明经验分辨率的条件偏差,可以用其他偏差来表示。

总结一下,假设局部和全局条件偏差和的合适的估计和是可用的。 我们对分解(2),(3)中单项的偏差修正估计值构造为:

(7)

(8)

显然,条件偏差的修正纠正了无条件偏差。

备注1. 的符号是从(6)开始的。事实上,S的一致性意味着对每个x有:

因为我们可以设定,那么,即。类似于全局条件偏差。一个人注意到这样的事实,即具有规范1 / n的经验方差是偏向下的。

主要针对平均值研究了分数分解的偏差校正。分位数或分位数等功能近来也受到关注(Bentzien amp; Friederichs,2014)。他们一致的评分函数共享一个统一的形式,允许统一的处理:每一个这样的评分函数都承认一个点的有效表示其中是一个基本得分函数族,每个函数对于给定的泛函是一致的,M是对R的非负测度(Ehm et al,2016)。基本得分功能的一种常见形式是(Dawid,2016; Ziegel,2016):

(9)

其中函数在上不减小,并且I和L在每个y中都在上是右连续的。 具体而言,在分位数情况下,函数为, ,而对于-expectiles,其中。构成一个所谓的识别函数族。这个名字来源于这样一个事实,即它们可以用来确定相关函数的值。实际上,,从相应的定义和的事实,因此是非递减的,右连续的。

提案1.(Dawid,2016) 假设是具有函数的形式(9)的非负评分函数族,使得对于每个,映射是定义为非递减的和右连续的.令其中是上的一个非负测度,使得对于,。那么和每个对于上的功能定义为一致的评分函数:

因此,我们在命题1的设置中考虑分数分解和偏差修正。指定类型的函数将被称为广义分位数。对于我们的主要结果,我们需要假设如下。

假设1. 类包含每个条件分布,,

(i)

(ii)与导数不断微分,时,

(iii)如果是来自F的大小为n的样本的经验分布函数,则当时,过程在Skorohod 将空间转换为具有连续样本路径的平均零高斯过程(van derVaart,1998,Sect.18.3)。

上述假设很弱。对于分位数,例如弱收敛于布朗桥过程(van der Vaart,1998,p.266),它具有连续样本路径,因为(ii)中是连续的。

定理1 假设混合测度具有连续的密度,那么在假设1下,(6)中的随机变量允许另一个随机变量的随机逼近,

. (10)

和McCullagh(1987,p.209)一样,我们把的表达式(10)作为我们对的近似。(7)、(8)中使用的局部条件偏差的估计是通过(10)中的未知分布用它们的经验对应物,代替而获得的。 全局条件偏差的估计值是相同的形式,只有,,必须被,和替换为,所以我们关注局部偏差。混合物得分中最突出的是具有恒定混合物密度的那些。对于分位数, 产生分段线性分数,而对于预期产生不对称二次分数。 以下是这些标准选择的前提条件。我们首先考虑分位数的情况。由于条件(ii)每个都有一个连续的密度,我们发现。当,是的分位数时,我们的偏差修正假设为:,其中和分别是密度和的分位数的估计值。 这在两方面是不幸的:首先,密度估计往往不稳定; 其次,这个关键词出现在分母中。因此,除非足够大以使核估计有用,否则仅考虑参数模型考虑偏差校正似乎是明智的,其中可以通过插入参数估计来估计。可能的情况下不存在这样的问题。(10)中,和的经验预测可以简单地代替。(10)中的,的经验预测,校正是完全非参数的,也是局部的,因为它仅取决于各个分箱中验证观测的经验分布。对于= 1/2,校正简化为,其中是,的方差。Brouml;cker (2012)和Ferro amp; Fricker(2012)获得了相关的结果。

图1 ,偏差,即归一化的局部误校准:对于参数,的四个选择,绘制的模拟的经验偏差DEVk相对于同样平均的预测仓平均值(实线)偏差校正偏差(虚线)和真值(圆圈,点)相同。

4.模拟

为了说明偏差修正的有限样本表现,我们介绍一个小的模拟研究。为简单起见,我们取,采用二元正态模型:

(11)

对于一些gt; 0。 那么E(Y | X)=X,所以在平均值或中位数的= 1/2的情况下,当且仅当= 1时,预测才被完全校准。但是,对于,即使= 1,分位数和-expectiles的预测也是错误的。模拟中使用的参数为:,和。我们根据模型(11)生成了5000个随机样本,每个样本n = 200个数据对。 根据的顺序统计数据被分为m = 40个单元,使得每个单元包含 = 5个数据。在这种情况下,可以被认为是属于的的平均值,表示为。因此,我们用来近似给定的Y的理论条件分布,如果值足够密集的话就足够了。近似值不适用于被忽略的两个边界箱。

图1给出了我们称之为偏差的归一化误校准措施的仿真结果,我们称之为偏差,及其偏置校正的模拟,与理论量进行比较。显然,局部偏差相当大,偏差的减少程度适中。类似的结果适用于全局偏差。 在重要的特殊情况中,模拟的全局误标准估计值的标准偏差范围从2.4到5。偏差校正后,相应的值在0.25和0.87之间。他们一直比未矫正的半数小,而且通常要小得多。

5.讨论

平均得分广泛用于评估预测。对第三个变量进行调节可以将平均分数分解为局部校准和允许进行精确评估的熵项。例如,局部分解术语的图形显示可以作为诊断工具。经验分解的组成部分受到系统的,潜在的严重偏差的影响。有趣的是,Bentzien amp; Friederichs(2014)发现,这些成分在纠正偏差时较少依赖分档。我们的偏差修正方法是双向的,但它也可以用来减少全球分解项的偏差,偏差可能会大大超过色散。在整篇论文中假设数据三元组是独立的且分布相同的。事实上,定理1的证明只需要这样一个有条件的假设,即W较弱。

致谢 剩余内容已隐藏,支付完成后下载完整资料


资料编号:[23706],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。