中国50年表观太阳日辐射数据集的发展外文翻译资料

 2022-11-29 15:51:54

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


中国50年表观太阳日辐射数据集的发展

1 唐文君,杨坤,秦军amp; MIN Min

1西藏环境变化和地表过程重点实验室、青藏高原研究所,100085年中国科学院,北京,中国;
2中国科学院研究生院,北京100049,中国;
3辐射校准和验证环境卫星重点实验室,国家卫星气象中心,100081年中国气象局,北京,中国

收到3月12日,接受了9月18日,2012;2012;2012年11月23日在线发表

摘要:

虽然太阳辐射在设计太阳能设备和地表研究的过程中是一个至关重要的参数,但对于长期的太阳辐射以及人口分布密集区的太阳辐射数据通常是不可用的。本文介绍了中国气象局(CMA)716个基站50年日常表面太阳辐射的数据集的发展。首先,在没有任何本地校准的情况下,一个物理模型应用于716 CMA常规站的日常辐射估计。其次,一个ANN-based(人工神经网络)模型应用于延长辐射对于早期所有96个 CMA辐射站的估计。ANN-based模型用最新和最可靠的辐射数据来操作,因此它的估计比物理模型更可靠。因此,ANN-based模型用于纠正每月动态物理模型。校正通常通过物理模型提高辐射数据集估计的准确性:从1994 - 2002年,96个辐射站的均值偏移误差(MBE)从0.68减少到0.11MJ㎡,根的均方误差(RMSE)从2.01减少到1.80 MJ㎡。结合当地校准Angstrom-Prescott模型,新的辐射数据集比先前的估计显示出优越性。基于新的辐射数据集,年平均每天的太阳辐射中国是14.3 MJ m2。以季节来看,日太阳辐射平均值最大值的出现在青藏高原的夏季,值为27.1 MJ ㎡,而最小的日太阳辐射平均值出现在四川盆地的冬天,为4.7 MJ ㎡。

关键词:太阳辐射;数据集;校正方法;混合模型;ANN模型;

表面上的太阳的辐射时空分布信息对地表太阳辐射建模、研究气候变化和设计光伏电力和太阳能加热系统是必不可少的流程。日射强度计的测量在地面上是获得表面太阳辐射最可靠的方法,但相比其他气象变量的测量(如风速、空气温度、相对湿度,降水和日照时间),由于其高成本[1,2],应用并不。此外,辐射测量由于技术故障[3]和操作的相关的问题通常包含错误和虚假的值。因此,缺乏足够的和高质量的太阳辐射数据已经成为一个普遍的问题[4],特别是在远程和高地地区。因此,必须开发估计太阳辐射的方法来解决这个问题。

到目前为止,许多方法已经开发去配置表面太阳辐射,如从气象变量估计、模型仿真和卫星检索[5]。其中,基于气象变量的方法根据数据的可用性被广泛应用于农业、生态、和水文建模。这些方法根据他们的输入可以大致分为三类:基于光照的,基于温度的(9 - 12)和基于云的[13 - 15]。一般来说,校准度较高的基于光照的模型比云或基于温度的模型表现的更好(4、16、17)。 许多研究人员使用当地的辐射观测来校准中国的表面辐射模型[2,18-21],并试图在没有辐射测量的情况下应用模型。基于在不同的气候区进行的局部校准,Lam等。[18]提出不同的埃-普雷斯科特系数为每个主要的热能和太阳能气候区域估计太阳辐射。刘等人。[2]在黄河流域校准不同时间尺度下的Angstrom-Prescott系数(a,b),分析他们对太阳辐射估计的影响。李等人在青藏高原[19]校准不同的Angstrom-Prescott模型(二次、三次、对数、指数、幂,和他们的组合),结果显示用复杂的表达式修改并没有使简单得线性Angstrom-Prescott模型的到明显好转。刘et al。[20]也验证了几个青藏高原的本地校准的基于温度模型和基于光照的模型。结合当地的辐射观察,使用四种不同三角模型校准,Lam et al。[21]估计中国每日太阳辐射通过每年的一天。最近,一些研究人员使用ANN-based(人工神经网络)模型从气象变量的角度来估计表面太阳辐射(22日至25日)。Lam等[24]分别从日照持续时间和大气平均气温在中国的40个辐射站和九个不同气候地区建立ANN模型。评价结果表明,构建在独立站点的模型的表现略优于建立在相应的气候地区的模型。

然而,很难从一个站到另一个站去扩展校准模型的应用,因为模型参数通常是站点独立的。如果一个模型(如Angstrom-Prescott模型或ANN-based模型)没有实际的考虑大气中的辐射削弱过程。杨的et al(26、27),一个校准模型在低地或潮湿的地区可能会低估在高地(或干)地区太阳辐射,反之亦然。这个问题增加了在中国估计太阳辐射的困难,它的特点是复杂的地形和气候条件。除了从气象变量角度评估外,遥感卫星检索是很有前途的方法,可以估计全球的表面太阳辐射[28-32],在各类研究中显示出较高的潜力。然而,通常他们的产品的历史记录相对较短。

在中国,相比于,716个常规气象站,自1961年来仅略超过100个气象站稀疏的分布着。此外,这些辐射站很少部署在高海拔地区偏远地区。另一个问题是,辐射测量在中国通常包括错误和虚假的值以及缺少的数据(33、34)。因此,可利用的长期的太阳辐射和人口密集地区的太阳辐射较少。

本研究的目的是开发一个有效的方法使太阳辐射区域化,然后在所有的CMA站开发一个50年(1961 - 2010)表面太阳辐射数据集。首先,我们介绍一个物理模型来估计在1961年和2010年之间每天716 个CMA站的太阳辐射。这个模型结合了埃-普雷斯科特模型简单的优点和辐射转移过程的物理性质[26,35],因此在文献中被称为混合模型。第二,每一个辐射站构建一个ANN-based模型。ANN-based模型用近年来(2003 - 2010)可靠的并且可利用的辐射数据建立,然后模型用于估算在1961年和2010年之间每个辐射站每天的太阳辐射。这种基于数据的站点训练使得ANN-based模型比混合模型的估计更为可靠。第三,我们使用ANN-based估计去校正混合模型每月的动态估计,并使校正区域化,使成为可能得到一个高精度的表面太阳辐射数据集。

1 数据集

在这项研究中使用的是CMA气象信息中心提供的716个站点的每日常规气象数据。包括空气温度,气压、相对湿度、日照时间和降水日数。自1994年以来,在716个CMA站中,只有96个站包含太阳辐射的测量。CMA站的太阳能辐射测量在1957年开始,之后逐渐增加到122个站。然而,太阳辐射的测量在某些站停了在过去。自1994年以来,仍有96个车站测量太阳辐射。CMA辐射测量的历史上在1994年前后,分别有两个不同类型的辐射计用于测量太阳辐射。一个是模仿前苏联的,另一个是由中国制造的,叫做DFY-4。更详细的信息辐射数据,我们可以引用数据描述(从网站:http://cdc.cma.gov。cn/)。图1显示了716个站点的地理分布。其中,96个辐射站都做上五角星符号的标记。在这项研究中,50年组成日太阳辐射数据集是由两组估计。一个是混合模型和输入气温、气压、相对湿度,以及日照时间的估计。该估计覆盖全部716个CMA站。另一个是由ANN-based模型,需要可靠的辐射数据训练模型,因此,只能用于96个辐射站。这两个数据集描述如下。

图1 716个CMA站的空间分布,其中96个辐射站用五角星符号标注

1.1 从1961 - 2010年,716个CMA站的日太阳辐射估计

在没有没有本地校准的情况下混合模型可以对低地和高地地区太阳辐射进行合理地每月、每日,每小时的估计。杨等等。该混合模型用于估计在青藏高原太阳辐射并显示出他们的结果要优于广泛利用的卫星产品(GEWEX-SRB ISSCPFD[36][30])。唐家璇等。[37]在中国,针对质量检测的太阳辐射数据混合模型的性能的评价,显示出模型对于表面太阳辐射的估计要优于大多数的辐射站。详细的混合模型信息都是在杨的论文中可以找到的。[26]。在这项研究中,1961年和2010年之间CMA的716个站日常太阳辐射数据集是由混合模型估计的。这个数据集的一部分(混合模型用于估计在 从1961年到2006年CMA716个站)用于分析中国太阳辐射变化。唐等。[37],这表明,混合模型估计的数据集可以探测到太阳辐射的趋势,但是相比于某一些站的观察值而言对于辐射值的估计略高。在这项研究中,我们关注于从1961年到2010年混合动力模型对于CMA716个站点数据集的估计系统偏差的消除。

1.2 1961 - 2010 96个辐射站每日太阳辐射估计

存在于每天的太阳辐射观察中的几个问题。一个是数据不连续。这在大多数辐射站是非常常见的。例如,在96个辐射站,“1961年和2006年完整记录”(定义为一组数据包含在每个月至少20天的记录)只出现在16辐射站。另一个明显的错误也被史等指出,在几个站的原始测量中存在明显的错误数据。[33]和唐et al。[34]。由于这些缺陷,观察到的值不适合纠正混合模型估计。此外,我们在每个辐射站引入了ANN-based模型来估计其他气象变量的太阳辐射然后利用其估计正确的混合模型估计。ANN-based模型可以得到连续时间序列,在每个辐射站比混合模型估计具有更高的准确性,因为这是最近的训练与可靠的辐射数据。在这个研究中,ANN-based模型的结构和类型和唐的一样[37]。ANN-based模型的输入有日常空气温度范围、降水、日照时间,每日平均空气温度,空气压力和相对湿度。与先前的有效估计(3.3节)比较,我们选择在2003年和2010年之间的质量控制观测数据用于测试ANN-based模型以及在1994年和2002年之间的数据用于验证顶尖数据集的开发在96个辐射站中的每个。然后应用于训练模型估计在1961年和2010年之间辐射站每天的太阳辐射。因此,1961年和2010年之间的96个辐射站每天的太阳辐射数据集。这个数据集将被用于混合模型CMA716个站进行正确的数据估计。

2校正方法
ANN-based模型估计用于校正混合模型估计,因为ANN-based模型形成与当地辐射数据结合,而混合模型在中国没有与辐射校准数据结合。为了建立高精度的太阳辐射数据集,采取如下三个步骤:在1961年和2010年之间96个辐射站每个月修正系数是由下面的表达式决定的:

(1)其中alpha;是校正系数,RANN,monthly是ANN-based模型估计的月平均值,Rhybrid,monthly混合模型估计之一。每个月的修正系数和站点的地理参数(高度、经度和纬度)之间的关系是由以下函数由一个前馈反向传播(BP)神经网络决定的:


其中alt,lon,lat分别是站的高度,经度和纬度。这是证明任何非线性函数可以由只有一个隐藏层的多层前馈网络来表示[38]。此外,贝叶斯正规化训练算法通常是优于其他培训算法,以及在隐藏层中最好的单一的神经元数量是输入变量的数量的两倍[39]。因此,ANN在这一节中包含一个隐藏层和一个输出层。隐藏层包含六个神经元与双曲正切转移函数作为传递函数,传递函数用于神经元输出的线性传递函数(“purelin”)。输入层包括三个参数,所站的高度、经度和纬度。ANN的目标(或输出)是修正系数,这在eq.(1)中有定义。在训练的过程中Levenberg-Marquardt bp优化算法再加上贝叶斯算法正规化的用于ANN。更多关于ANN细节的理论知识,我们可以参考神经网络工具箱trade;6用户指导[40]。

(eq的派生关系(2)根据站点的地理参数应用到所有CMA716个站,并且716个 CMA站修正后的数据集由以下表达式所决定,假设每个月每个站的修正系数不变:

其中 是每日混合模型估测值, 是日常校准值。

3.结果评估

3.1校正数据集的评估
在使用以上所有程序对所有716个 CMA站的混合模型进行评估后,新的数据集建立。观察到的太阳辐射数据集,包含1994 - 2002九年的96个辐射站的每日值,如图1所示,用于挑选去验证新的数据集。观察到的数据集是根据唐.[33]的质量检测程序是进行质量控制的。为了评估新的辐射数据集,三个指标均值的偏差错误(MBE),均方根错误(RMSE),相关系数(R)在每个辐射站计算。

图2显示了1994 - 2002年之间在个别的辐射站原始数据集(混合模型估计)和纠正数据集三个误差指标的比较。水平轴表示一系列站点代码值。辐射站修正后的数据比原来的数据具有相对较低的错误率。由小MBEs表示数据集和rms纠正。MBE和RMSE原始数据集的平均值分别是0.68和2.01MJ㎡。在修正后的数据集中相应的值下降到0.11和1.80 MJ㎡。这也说明了修正后的数据集的精度高于原始数据集。图3和图4的空间分布的MBE和RMSE分别为为原始数据集和修正的数据集。它仍然显示了在大多数站中修正后的数据集要比原始数据集偏差低。一个明显的特征是修正后的数据集在中国南部的改善要比其他地方好得多。

我们还展示了1984 - 1993年这时期的验证结果。它类似于1994 - 2002年间的某一个。MBE和RMSE原始数据集的平均值分别是0.86和2.28。在修正后的数据集中相应的值下降到0.09和2.05MJ㎡。它可以发现MBE的值和RMSE这个时期更高的数据集比相应的时间1994 - 2002。一个可能的原因是,观测到数据的质量在1993年之前比辐射数据1993年之后差,尽管观察到的辐射数据在被使用之前经历了质量控制程序。


图2 三个统计指标的比较两

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[29326],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。