英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
用随机Bass模型预测产品销售
约翰·格瑞斯玛,马赛尔·科内利斯
通信地址:johan.grasman@wur.nl
(瓦赫宁根大学 生物识别研究中心,瓦赫宁根,荷兰)
摘 要:利用Bass模型和以前的销售数据,可以对未来的销售进行点估计,以便进行库存管理。为了获得关于估计精度的信息,可以使用置信区间。在这项研究中,这样一个区间是由一个扩展了噪声项的低音模型构造的。噪音的大小被认为与年销售量成正比。还假定与确定性解的偏差足够小,可以进行小的噪声近似。这种扰动的形式是一个时间相关的奥斯坦乌伦贝克过程。对于扰动的方差,可以给出一个精确的表达式,这是获得置信区间所必需的。
关键词:Bass模型;奥恩斯坦乌伦贝克过程;参数对数据的敏感性;信任域
1引 言
对新产品的最初购买常常被解释为创新者主动购买产品而不受其他购买者的影响。模仿者购买产品是因为其他人已经这样做了。它们共同构成了购买者的总数,一个市场的饱和程度。Bass扩散模型【1】根据销售数据生成这些指标的估计值。该模型由一个微分方程组成,而该方程与当前销售增长水平和累计销售水平相关。不仅用于新产品扩散模式【2-7】,这种建模方法已经变得非常流行。
在使用Bass扩散建模方法时,面对可靠的市场预测有关键兴趣的产品引入,公司可能面临以下基本挑战。首先,要获得可靠的预测,需要对创新和模仿效应以及饱和度进行准确的测量。然而,人们已经认识到,市场数据的信息内容(人们必须从中获得准确性)不仅可能随时间而变化,而且在这些兴趣【8】的指标之间也可能不同。由于信息内容的分布反映在市场指标对于现有数据的敏感性上,因此其推导是一个经验问题,为此需要一种适当的统计方法。同时,利用Bass扩散模型的微分方程求解,得到了未来(期货)销售的点估计。然而,从一个点的估计,我们不能得出关于其准确性的结论。一个有利于置信区间的构造的随机的方法对于未来销售的估计是必要的。
Author(s).2019.本文是分布式根据 Creative Commons Attribution4.0国际许可,允许无限制的使用,分布,和复制在任何媒介,你提供给适当的信贷原始作者(年代)和来源,提供一个链接到Creative Commons许可,并指出如果变化。
在本研究中,有以下几个步骤。我们首先考虑的情况是,所有年份的销售数据都是已知的,并将Bass扩散模型拟合到这些数据中。接下来,我们研究(兴趣的)度量标准的超时信息内容。基于这些结果,我们确定了获得可靠预测所需的最小样本量。为此目的,可以将该样本与过去类似产品介绍的样本进行比较【9】。在我们的方法中,我们只使用所考虑的产品的销售信息。我们也没有使用额外的参数去扩展确定性模型,这确实可能会产生有趣的结果 【3, 4, 10,11】。
接下来,我们介绍Bass模型的一个随机扩展。假设以白噪声形式出现的随机扰动很小,我们考虑该扩展模型的解在确定性贝斯扩散模型解的邻域内。接下来,我们计算解的随机分量的方差,这些方差又将被用于构建年销售量的置信区间的上下界。最后,根据前面的方法步骤,我们应用了一种预测方法。最后,给出了数据点预测的置信区间。为了便于说明,我们在每个连续步骤中都使用了数据集【12】。我们的方法与Boswijk和Franses的方法【8】有关,他们在分析参数估计过程的有效性时使用了类似的方法。
2 方 法
巴斯模型是根据多年来累积的产品销售额y(t)建立的微分方程,其形式主要为: ,【其中,】 (1)
参数为p的项,称为创新系数,代表主动购买产品而不受其他购买者影响的消费者。关于q的项,即模仿系数,代表消费者购买产品是因为其他人已经这样做了。最后,参数m表示历年的总购买人数。为了说明我们提出的方法和步骤,我们可以在Lilien等人的文章中找到相应的策略。【12】。它处理蒸汽铁的销售,并给出累计年销售额, i = 0,1,hellip;,n,【其中,n = 31】。
3 估 计 模 型 参 数
利用基于Matlab的软件包Grind,将模型(1)拟合到该数据中,得到参数值:m = 86.35, p = 0.00204 and q = 0.2735. (2)
图1(a)给出了(1)的参数值(2)和数据点的数值解。如果n减少,则在某一值处,参数估计过程失败。由于信息矩阵的病态性,使得无法进行可靠的参数估计,参见Massiani和Gohs【5】。本研究采用线性回归方法对参数进行估计。对于小的数据集,这会导致不准确的估计,特别是对于m,参见图3。
图1.(a)由实曲线给出的满足(1)(2)的函数y(t)与数据(●)吻合
图1.(b)年销售额(5)用实曲线表示。虚线表示95%置信区间的边界。
从市场决策的角度来看,人们通常对年度销售额感兴趣:
, (3)
见图1(b)。为了求置信区间边界的估计值,用导数来近似就足够了。【其中 = i 0.5】。这个近似是基于当t = i 0.5时的泰勒展开式:
交换求和及集合,我们获得:
(4)
从图2中可以看出,(4)右边的第一项确实很接近左边。
图2.年销售额(1)-(2):时间间隔(i,i 1)的精确值(○)由(4)的左侧给出,近似值(◆)除以是右边的第一项
现在,(1)的准确解是:
(5)
所以,
(6)
4 数 据 的 信 息 内 容
在估计参数时,仅使用进化过程的第一部分时间间隔的数据(例如,进行预测),必须了解数据使用时的信息内容。同样,对于(1)的精确解的可用性使得这样的分析成为可能。参数m对数据的敏感性可以用Kalaba和Spingarn[13]提出的方法来分析。假设其他两个参数是固定的,我们通过最小化惩罚函数从一个数据集确定参数m。
(7)
惩罚函数所对应的m的值从(7)中得到最小值。
(8)
式中,表示第时,对参数m,解的灵敏度函数:(9)
同样的,我们推导;
和
可知与m无关。
接下来,通过对求导(8)来追踪对数据的依赖关系。这种依赖关系不仅来自于本身,也来自于m:
这就产生了(反向)灵敏度函数。
参数p的灵敏度稍微复杂一点,因为y(t;p)在p中是非线性的。现在(8)成为
(10)
其中d为解对参数p的灵敏度函数。接下来,通过关于对(10)的微分,再次追踪对数据的依赖关系:
这就得到了灵敏度函数
其中,
对于参数q,可以采用与p相同的步骤。因此,总而言之,灵敏度函数:,其中r=m,p,q.
图3.数据点(t,y)参数m(实线)、p(虚线)、q(虚线)的灵敏度R(t)。见(6)
只有乘性常数与解的灵敏度在参数方面有所不同:
用常数代替上面的乘法常数:
(11)
通过这种标准化,我们可以比较不同时期数据点的影响。这一分析表明,早期对销售曲线的观察,对于内部(q)和外部(p)影响的信息比对饱和水平(m)的信息更丰富,见图3。在从t = 0开始到t = 结束的时间间隔内,可以对ngt;=17的三个参数进行可靠的估计。注意,恰好在s(t)的倾角点之前,它可以由(6):推导出来。
5推 导 置 信 域
允许模型噪声我们对解(5)附近的系统动力学感兴趣。更具体地说,我们以其相关的置信域的形式来研究模型的充分性。为此,我们引入了与年度销售额成比例的白噪声增强的切线。这样做,我们考虑以下初值问题:
,其中 (12)
有解:y=s(t)=。如果不是完全已知的,人们可能会对稍微不同的初始值的解的进化感兴趣。因此,我们分析了微分方程的邻近解。令扰动后的初值为: (13)
扰动随时间进化为v(t) 。将y(t)=s(t) v(t)带入(1)式:
注意,右边的项是在y = s(t)的泰勒展开式中得到的。假设扰动仍然很小,我们在第二项之后停止了这个展开。自=f(s(t))之后,方程形式为切线方程:
(14)
其中xi;(t)表示标准白噪声。注意,通过一个不同的变换,Skiadas和Giovanis(在89页的方程式(21))得到了一个类似的线性方程【14】。
利用Ito演算将(14)重新表述为一个与时间有关的Ornstein Uhlenbeck过程,得到了Langevin方程:
(15)
见Gardiner 【15】。在那个研究中,它被推导出来:
(16)
用公式处理软件包Drive 5,我们得到:
(17)
使用这个数据,参数beta;可以估计。在(14)中假设白噪声与年销售额成正比,也就是,它在销售过程的开始和结束阶段都很小。然而,对数据集的可视化检查显示,在样本的开始和结束阶段,模型曲线有很大的偏差(见图4)。显然,模型中没有采用的流程正在工作。当估计用最小二乘法的参数beta;时,通过引入加权函数和=i 0.5,我们这些潜在偏压(偏置)效应占较大的相对误差。使用(3)和(17),得出惩罚函数:
(18)
必须最小化。结果是一个估计值:=0.00141.
在图1(b)中虚线是基于经验规则【16】和模型完备性假设的95%的置信区间的边界。后者显然不是这样。因此,我们必须考虑年销售量小的随机模型的有限准确性。图4注:用纵实线t = 19分隔过去和未来的年度销售的置信区间(未来数据未知)。
图4.(a)通过拟合tlt;=19的数据(●)得到满足(1)和(10)的函数y(t)。
图4.(b)满足(9)-(11)的95%置信区间(虚线)的边界。
6 结 论
现在,我们到达了我们所提议的方法的最后一个阶段,在这个阶段中,我们推导出Bass模型的点预测的置信区间。让我们有数据,其中=1,2,...,n。 在本例中,参数的估计过程基于(1)的数值解。这个基于最小二乘法的迭代过程,只收敛于gt;=17。因此,对未来销售额的预测只能针对此后的年份。可以看出,在t = 17时,图1.(a)的曲线恰好在倾角点之前。我们可以用(16)来计算的置信区间只对tgt;=19有令人满意的结果,就在倾角点之后。因此,我们考虑= 19的情况。利用tlt;=19的数据,我们得到了以下参数的估计:
m = 74.75, p = 0.001393 and q = 0.3209, (19)
其中给出了t gt; 19的累计销售额和年销售额的点估计值,分别见图4(a)和图4(b)。现在,根据式(16),我们从过去的数据(t lt;=18.5)中得到:
= 0.00110. (20)
它导致可以接受95%的置信区间,直到t = 26.5时 的年销售额。之后,我们到达一个(t)越小相对误差越大的范围。
7 讨 论 和 结 论
在这项研究中,我们以一种不同于统计中常用定义的方式引入置信区间。在这种统计中,一个数量的点估计值是通过该数量的样本均值获得的。那么95%置信区间包含了大约95%的数据点。在这里,一个量的点估计值是从一个与系统的其他量的数据相吻合的模型中获得的。因此,如果模型不完美,95%置信区间内的数据点的数量可能比预期的差95%。值得注意的是,从tlt;=18.5的数据中得到的置信区间与从完整数据集(tlt;=30.5)中得到的置信区间相差不大。这是由于这样一个事实,一旦达到倾斜点,信息从低年度销售到高年度销售处获得:在倾斜点之后,同样的路线会朝着相反的方向走。
值得注意的是,利用Bass模型,可以在倾斜点附近做出可靠的未来销售估计。在这一点附近,累计销售额的曲线看起来接近于一条直线。基于当地数据的线性预测可能导致对所需库存的严重高估。Bass模型很好地降低了这种风险。
关于我们的实证分析,值得注意的是,无论是在年初还是年末,当年销售量很小的时候,模型都与市场观察不一致。显然,该模型并不涵盖不同于假定的创新和模仿特征的购买行为。产品促销或特殊折扣可能是造成这种偏差行为的原因。
利用Bass方程的数值解进行了参数估计。由于这个一阶微分方程有一个光滑解,所以可以达到较高的精度。用Levenberg- Marquardt法(MATLAB)寻找各参数的最优值。当信息矩阵是病态的,这种近似过程不收敛,因此无法进行估计。通过这种方法,可以发现在这个过程的哪个阶段有足够的过去的数据是可靠的,以便作出相关的预测。注意,在线性回归【17】中,对于只覆盖很小的初始时间间隔的数据集,我们发现参
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[239249],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。