英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
通过负荷识别与图谱聚类的用户用电预测
摘要:预测能源或电力使用量是对电网提供稳定的电力供应给所有客户的一个重要组成部分。我们提出了一个新颖的方法,旨在通过非侵入性负荷监测(NILM)和图谱聚类对单个家庭或者一组家庭的电力消耗进行预测。在提出的方法中,总功率信号被分解为单个设备信号,分别预测每个设备的功率。然后通过累加单个设备的功耗来实现总的电力负荷预测。我们使用四个公共可用数据集()来测试我们的预测方法并汇报他的准确性。结果显示我们的方法比现在流行的方法更加精确,例如:自回归综合移动平均线,类似的配置文件负荷预测,人工神经网络和最近基于NILM的预测。
关键词:电力预测、负荷分解、非侵入性负荷监测,图谱聚类,智慧电网
1.介绍:精准的电力需求预测对于维持一个稳定的电网是很重要的。根据先前需求激增的警告,电力供应者能够更好的制定他们电力供应同时执行其他措施,比如削减峰值以及负荷转移。大量预测方法是基于外推法提出的。卡尔曼滤波,模糊逻辑,自回归综合移动平均(ARIMA)模型,提出了各种预测方法。人工神经网络(ANN和类似的配置文件负荷预测(SPLF),所有这些方法都试图直接依靠总功率信号的时间依赖性来预测总功率(所有负载的总和)。但是,我们注意到单个设备的电源信号中可能存在较强的时间依赖性。在周期性设备(如冰箱)中,这很容易看出来,它们周期性地打开和关闭。当汇总不同设备的电源信号时,这种时间依赖性可能会受到干扰,
因此,预测总功率可能比预测单个设备的用电量更困难。最近,基于非侵入式负载监控(NILM),首先基于分解单个设备的原理提出了一些住宅功率预测方法。1这里,聚集功率信号首先被分解为单个信号。然后单个信号分别预测每个设备的功率,最后通过汇总单个设备的预测功率水平来形成总功率预测。与直接对聚合信号进行操作的传统方法相比,这些基于NILM的方法提供了更好的预测准确性。但是,均假设单个设备的行为与其他设备的行为不相关,实际上并非如此。因此,在本简介中,我们提出了一种基于NILM的住宅电力预测方法,该方法结合了电器行为的状态(ON / OFF)持续时间方面的相关性。此外,由于我们具有单独的设备级别预测,因此所提出的预测方法更适合依赖设备级别信息来评估可节省电量的实时需求侧管理。关于状态持续时间概率的讨论在第二部分中介绍,然后在第三部分中提出。在第四节中,我们通过广泛的评估表明,与基于NILM,ANN,ARIM和SPLF的几种现有方法相比,所提出的预测方法具有更高的准确性。最后,结论在第五节中给出。
2. 状态持续时间的可能性某些设备。例如传统冰箱,只有两种状态:ON和OFF。 其他设备(例如洗衣机)可能具有多种状态(功率水平连续变化),其中一种状态为OFF(关闭)状态,而其他状态则代表在不同操作模式下使用的不同功率水平。 为了简化我们的模型,我们将连续状态和/或多状态设备分解为多个两个状态(ON / OFF)设备,如下所示。之后,连续变化的功率曲线被量化为多个状态。 然后,如果结果多状态配置文件中有N个状态(其中一个状态为OFF状态),我们将通过N-1个虚拟两状态设备来表示这样的设备,其中这两个状态设备中的每一个都包含一个 OFF状态和N-1个剩余状态之一。 在本文的其余部分,术语“设备”是指两态(ON / OFF)设备。
1NILM是一项根据聚合信号确定每个设备使用多少功率的技术。 在文献中,有许多用于家用电器识别的NILM方法。
图1. ON / OFF状态持续时间概率的示例。
图1. ON / OFF状态持续时间概率的示例。
确实是两态设备或虚拟的二态设备从多状态设备获得。根据经验,我们知道某些电器具有保持预期的开启时间。例如洗衣机通常会开启30-60分钟,而水壶通常会开启2-5分钟。 在本摘要中,我们将利用此类开/关持续时间模式来预测未来功率需求。 对于给定的设备a i,开启状态的持续时间用T {a i}表示,代表自设备已打开。 一套电器S据说是如果集合中的所有设备都为ON,则为ON。 的持续时间集合S的接通状态由TS表示。 如果在S中使用不同的电器在不同时间打开,然后从该时间开始测量T S集合中的最后一个设备打开时的瞬间。状态持续时间是随机数量,因此我们对其进行描述具有概率分布。 具体来说,我们计算以下概率:
P[T S ge; t]= n^t*s(ns) (1)
其中n S是训练集中的次数集合S中的所有设备都已开启,并且n ^t/s是的数量所有这些都至少在t个时间单位内开启的次数。如果至少有一个应用程序,则说设备组S为OFF。集合中的ance为OFF。 关断状态持续时间的特征是类似于ON状态:
(2)
其中代表自输入集合S以来经过的时间OFF状态,n S是训练内的次数设集合S为OFF,是在S看作OFF训练集中的次数,是S关闭至少t个时间单位的次数,如果S中的其他电器在不同时间关闭,从该组中的第一个设备关闭时的时刻开始测量。
图1显示了(LCD电视,灯)对的开和关持续时间概率分布。 在这里,使用tracebase [28]中的五十天资料来计算这些概率。
3, 放置的方法让t表示当前时间,表示以前的时间(lt;t),表示将来的时间(gt; t),
想做出一个预测。 同样,令= t-是在和当前时间t之间经过的时间,而让= -是在和之间经过的时间。 所提出的住宅用电预测方法具有三个主要阶段:设备状态识别,ON-set预测和聚合。 每个阶段如下所述。
器具状态识别:首先,从给定的房屋总功率信号中,在当前时间t识别开/关器具。 然后,对于每个设备,确定设备当前状态启动的最近时刻。 NILM方法可以识别在当前时间t之前的任何给定时间打开/关闭的设备。 因此,我们最近的NILM方法[24]用于标识设备当前状态启动时的最近时刻。 识别出的设备状态以及状态持续时间概率(第二部分)使我们能够预测在时间哪些设备将打开。
ON-Set预测:ON-set是在特定时间打开的所有设备的集合。 我们借助频谱聚类[29]预测了时间t f的ON-set,该过程主要包括三个步骤:图形构造,频谱表示和聚类。 首先,我们构建设备图,并根据状态持续时间概率选择设备对之间的距离。
假设一对设备{,}当前处于打开状态。 根据先前确定的设备状态,我们可以确定该对进入ON状态的最近时刻。 令为该时刻。 现在考虑这两个设备在未来的时间或更长的时间内保持开启状态的可能性。 假设这两个设备当前处于开启状态,则此事件的条件概率为用Bayes的学说。
通过的定义和,我们得知因此,=1因此所需的条件概率变为 (4)从状态持续时间概率中可以找到(4)右边的两个项(第二部分)。 最后,在时间处器具与之间的距离定义为 (5)因此,条件概率大意味着距离小。
现在考虑一对当前关闭的电器{},根据我们在第二节中的定义,这意味着一个i或j或两者当前都处于关闭状态。 根据先前确定的设备状态,我们还可以确定该对进入OFF状态的最近时刻()。 使用与上述相同的推理,我们可以计算该对货币对处于截止状态直到未来时间t f的条件概率,前提是该对当前处于断开状态: (6)右边的概率是从状态持续时间概率中找到的(第二部分)。 然后,在时间处器具与之间的距离定义为 (7) 在获得每个设备对的之后,一个完全连接的无向图称为设备图,其中V是所有设备的集合(图形的顶点),E是边的集合。 边缘的权重由亲和矩阵A表示,其中连接和的边缘的权重由[29]给出
(8)
L其中sigma;是亲和力缩放因子。 亲和力之间的直觉是,它们反映了设备行为的相关性。 与[30]相似,我们选择sigma;作为D中值的标准偏差。图2显示了一个设备图的示例,其中设备之间的亲和力作为边缘权重,可以从(8)中计算出。 在时间t f构造完设备图之后,从拉普拉斯矩阵L获得每个设备的频谱表示。首先,L的计算公式为[29]: (9)其中W是一个对角矩阵,其对角线项是A对应列的总和:W [i,j] = 然后,将与L的m个最大特征值相对应的特征向量用于构造矩阵X,其中X [:,i] = ,其中X [:,i]是i- 矩阵X的第t列。最后,矩阵Y定义为
(10)其中Y [i ,:]是矩阵Y的第i行,而是欧几里得范数。 矩阵Y是设备图的频谱表示,其中设备i由R的第i行表示为中的一个点。然后,使用K均值聚类对Y的行进行聚类[31]。 聚类数(K)是根据矩阵L的特征值差异确定的,如下所示[32]: (11) 其中表示L的第k个最大特征值。聚类时,第j个聚类表示设备集。 对于K个簇中的每一个,与相关的向量的平均欧几里得距离为 (12)其中是中的电器数量,是代表这些电器的向量的质心: 如[24]中讨论的,的值与中的设备在时间接通的联合概率成反比。 但是,对于包含单个设备的群集,A=0。因此,如果在群集之后存在任何单例群集(例如= {}),我们将使用虚拟设备 (因此S j = {, })与D【k,】
图2.设备图示例图3. REDD数据集中房屋1的样本预测概况。
此外,将虚拟设备添加到单例群集之后,构造一个新图,获得其频谱表示,并计算新的。 带有最小的设备集预计在开启。 集合:该集合中每个设备的平均功率水平用作其在时间的预测功率水平。 在这里,类似于[23],获得每个设备的平均功率水平。 预测的单个设备功率水平的总和被视为时间处的总预测功率。 对于一组房屋,每个房屋的预测功率之和就是该组房屋的总预测功率需求。
4。实验结果我们将提出的方法与其他四种基于NILM [19],ANN [11],ARIMA [11]和SPLF [17]的预测方法进行了比较。所有方法均在MATLAB中实现
配备Intel Core i7处理器和16GB内存的2.2 GHz MacBook Pro上的R2015b。对于任何一种方法都没有进行特别优化。按照[17],平均绝对百分比误差(MAPE)和均方根误差(RMSE)用作性能指标。我们使用来自四个公共数据集的数据进行了三个案例研究:参考能源分类数据集(REDD)[33],雨林自动化能源数据集(RAE)[34],《分钟电力年鉴》数据集版本2(AMPds2)[ 35]和tracebase [28]。将REDD,RAE和跟踪数据库的数据转换为1分钟间隔,以匹配AMPds2中的数据。
案例研究1:在此案例研究中,使用了REDD数据集中的所有六栋房屋和RAE数据集中的一栋房屋。从REDD数据集中,有功功率曲线的前26天用于训练,而后30天用于测试。在这里,“训练”是指在建议的方法中计算开/关状态持续时间概率(1)-(2),确定[19]中的方法的单个设备的开/关状态持续时间模式,并获得用于文献[11]中的两种方法。在[17]中,训练集是相似配置文件的搜索空间。根据RAE数据集,前25天用于培训,后38天用于测试。使用建议的方法以及[ 11],[17]和[19]。表I显示了MAPE和RMSE结果,最佳结果以粗体显示。从表中可以看出,所提出的方法始终在性能上一直领先于其他方法,MAPE降低了42-67%,RMSE降低了46-65%。图3显示了房屋1的样本预测功率曲线,在图中我们可以看到所提出的方法倾向于执行相当准确的预测。尼姆[19],
ANN [11],ARIMA [11]和SPLF [17]通常能够预测功耗的向上和向下波动,但是对功率水平的准确预测要差得多,并且具有一些相位偏移。表I中还显示了每个样本的平均执行时间,可以预测提前180分钟。
从结果可以看出,基于ANN的方法是最快的,基于NILM的方法是第二快的,紧随其后的是SPLF和提出的方法,而基于ARIMA的方法要慢大约三倍。
案例研究2:在第二个案例研究中,我们评估AMPds2数据集上的预测方法的有效性。该数据集包含一栋房屋的两年数据。我们使用第一年的数据进行培训,第二年进行测试。在这种情况下,我们有多种选择:我们可以创建一个全年训练的模型,我们称之为无上下文模型,或者通过分别在每个季节(冬季,春季,夏季,秋季)进行训练来产生四个模型,
我们称其为季节性基于上下文的模型。表II以MAPE和RMSE的形式,对AMPds2房屋中2013年4月至2014年3月每个季节的功耗精确度进行了180分钟的提前预测(以一分钟为单位)。同样,我们与[11],[17]和[19]中的方法进行了比较。如表II所示,该方法的MAPE和RMSE明显优于其他方法,MAPE和RMSE分别降低了50-71%和48-63%。此外,季节性背景有助于提高所有五种方法的预测准确性,但所提出方法的季节性背景版本是最准确的一种,与之相比,MAPE和RMSE分别降低了50-75%和56-72%其他方法。
案例研究3:最后,我们评估了大型房屋的综合电力预测性能。由于REDD,RAE和AMPds2数据集包含相对较少的房屋的数据,因此我们从tracebase手动创建了大量“虚拟”房屋。从tracebase中选择的大多数设备具有超过120天的电源配置文件。前50天用于培训,其余时间用于在虚拟房屋上进行测试。对于每个虚拟房屋,从20个设备中随机选择12个设备。 2然后,从每个选定的设备中,随机选择一个连续10天的电源配置文件窗口,以表
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[235577],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。