第1章 样本空间外文翻译资料

 2022-12-29 11:52:05

第1章 样本空间

1.1 经验背景

概率论的数学理论,与许多实际的和理想的实验相联系,或结合一些生活现象,便获得了实用的价值和直观的意义.这里所谓实际的和理想的实验,例如有:扔1次硬币;扔100次硬币;掷3颗骰子;理一副纸牌;用两副纸牌对点1;玩轮盘赌;观察放射性原子的寿命或观察人的寿命;以人为随机样本而观察其中左撇子的人数;将两种作物杂交而观察它们后代的遗传型.所谓生活现象,例如有:初生儿的性别;电话交换中被占用的通话线路的数目;电话的来电次数;在电信系统里面的随机噪声;生产过程的例行质量控制;意外事故的频率;天空某一区域内双星的个数;在扩散过程中一个质点的位置.上列各项描述是含糊了一点,要使概率论有意义,我们还必须一同明确所探讨的实验或观察的可能结果究竟是指什么.

硬币掉下时不一定是正面朝上或反面朝上,它可能是滚掉了,也可能是笔直地站着.但是我们只承认正面和反面是扔硬币以后仅有的可能结果.这样一来,理论要简洁得多,同时也不影响其应用.这种类型的理想化是实践中标准的处理办法.测定原子的寿命或人的寿命而没有误差是不可能的,但是为了理论上的目的,我们不妨设想寿命是实实在在的一个数.这样问题就产生了:什么样的数值能确实地代表一个人的寿命?有没有生命不可逾越的最大年龄?是否一切年龄都是可以设想的呢?一方面,谁也不认为人能活到一千岁;另一方面,现行的保险业务对于人的可能寿命却不加任何上限.按照寿险死亡率表所根据的公式算出来,千年不死的人在全人类中大约只占101036分之一,101036这个数共含有1028亿个零.这个结论从生物学或社会学的角度看来,固然是毫无意义的,但是单纯从统计上着眼,它和经验当然没有什么矛盾.因为一个世纪内出生的人数还不到1010.要想用统计方法来检验上述说法,就需要101035个世纪以上的时间,而这个时间段比地球的寿命的101034倍还要大得多.毫无疑问,这样小的概率和我们认为的“不可能”是没有什么矛盾的.你也许认为,这种小概率的使用本身就是荒谬绝伦的.其实不然,使用这种小概率非但没有坏处,而且还可以简化公式.再说,如果我们真的把活一千年的可能性排除掉,就势必承认一个最大年龄限的存在,说人能活年而不能活年零两秒,这种说法决不会比无限寿命的说法更能讲得通些.

任何理论都必然含有理想化,对于我们来说,第一个理想化是关于“实验'或“观察'的可能结果.如果我们要为实验制作一个抽象模型,必须一开始就作出决定:这(理想的)实验的可能结果是由哪些东西构成的.

为了统一术语起见,我们把实验或观察的结果叫作事件.这样一来,我们就可以谈论“扔5个硬币至少出现3个正面'的事件.同样,打桥牌1的“实验',其结果可以是“北家拿到2张爱司(ace)'的事件.一个样本的组成元素(例如“85人组成的样本中有2个左撇子rsquo;rsquo;)和一个测量的结果(例如“温度120。rsquo;,, “7部电话占线')。也都叫作事件.

我们要区分复合事件(即可分解的)和简单事件(即不可分解的).例如,要是掷2个骰子使“总和为6',那就是使骰子点数成为“(1,5)或(2,4)或(3,3)或(4,2)或(5,1)',即这个事例把“总和为6rsquo;rsquo;的事件分解成5个简单事件.同样,“两个奇数点rsquo;rsquo;事件就分解为“(1,1)或(1,3)或hellip;hellip;或(5,5)'9个简单事件.注意:如果掷出的结果是(3,3),那么,这个相同的结果既包含在事件“总和为6rsquo;rsquo;

又包含在事件“两个奇数点rsquo;rsquo;之内.这两个事件不是互斥的,它们可以同时发生.再举一例,我们来考虑人的寿命.每一个特殊数值z代表一个简单事件,“此人50多岁'代表在50到60之间这一事件.用这种办法,每一个复合事件都可以分解为一些简单事件,也就是说,复合事件是一些简单事件的集合.

如果要在理论上很明确地讨论“实验'或者“观察rsquo;rsquo;,那么必须首先约定:简单事件代表可以想象的结果,我们用它们来定义理想的实验.换句话说,这种简单(不可分解)事件是不定义的,犹如几何中的点和线是不定义的一样.习惯上,这些简单事件叫作样本点,或干脆就叫点.由定义得知:(理想)实验的每一个不可分解的结果可用一个且只能用一个样本点来表示.所有这些样本点的全体称为样本空间.于是,牵涉到给定的(理想)实验的一切事件,都可以用样本点来表达.

在把这些基本的约定形式化以前,我们讨论几个以后常要用到的例子.

1.2 例 子

(a)三个球在三个盒中的分布.表1—1列出了3个球放人3个盒中的“实验rsquo;rsquo;的全部可能结果.

其中每一个排列都代表一个简单事件,即一个样本点.事件“某个盒内放了不止一个球rsquo;rsquo;为第1到第21个排列的总体,我们说事件是由第1到第21个样本点所构成的集合.类似地,事件8“第一个盒是不空的'是第1、第4到第15、第22到第27这几个样本点构成的集合.事件“和都发生'是由第1、第4到第15共13个样本点构成的集合.在这个例子中,2 7个样本点中的每一个或者属于或者属于(或者同属于二者).因此,事件“或者或者8或者二者都发生'就是整个样本空间,因此它必然发生.事件“不发生rsquo;rsquo;是由第22到第.27个这6个样本点所构成,它可以用下述条件来描述:没有一个盒是空的.事件。“第一个盒是空的而其他的盒没有放多个球'是不可能发生的,因为没有一个样本点能满足这样的条件.

表1-1 3个球放入3个盒中全部可能放法

(b)个球在个盒中的随机分布.对于个球分布在个盒中的一般情形完全可以用类似的办法来进行研究,只不过这时的排列个数随和的增加而大幅度增加.当=3,=4时,样本空间由81个样本点构成,当==10时,样本空间共有1010个样本点.造一个完整的表就要有约十万卷的篇幅.

我们用上面这个例子来说明一个重要的事实,即样本点的性质和我们的理论是无关的.对于我们来说,样本空间(及定义在样本空间上的概率分布)决定了理想的实验.我们应用球和盒这种形象的语言,但是同一个样本空间可以允许有很多种不同的实际解释.为了说清这一点并为了今后的应用,我们在这里抄录一些直观背景很不相同的实验,然而抽象地看,它们都等价于个球分布于个盒中的模型.在这些情形中,合理的赋概是不完全一样的,后面我们将要重新讨论.

(b,1)生日.个人的生日的可能情形相当于个球放人365个盒中的不同排列(假定一年有365天).

(b,2)事故.如果把个事故按其发生在星期几来分类的话,则它等于个球放入=7个盒中.

(b,3)打个靶.子弹相当于球,靶相当于盒.

(b,4)抽样.把个人按其年龄或职业来分类,于是类就相当于盒而人就相当于球.

(b,5)生物学中的照射.当光线射到视网膜中的细胞时,光粒子相当于球,而细胞就是我们模型中的盒.类似地,在研究照射的遗传效果时,染色体相当于盒,而alpha;粒子相当于球.

(b,6)宇宙射线的实验,击中盖革计数器的粒子相当于球,而计数器相当于盒.

(b,7)一部电梯,开始有个乘客,它在层楼中每一层都停.乘客走出电梯的各种不同方式的排列与个球放入个盒中的各种不同排列相同.

(b,8)骰子.掷个骰子的可能结果相当于把个球放入=6个盒中.如果是扔硬币,则对应的盒只有=2个.

(b,9)随机数.个数字所构成的序列的各种可能的次序,相当于个球(对应于位置)放入10个称为0,1,hellip;,9的盒中的可能分布.

(b,10)个人的性别分布.这时我们有=2个盒以及个球.

(b,11)优惠券的收集.优惠券的不同种类相当于盒,收集的优惠券代表球.

(b,12)桥牌中的爱司.4个玩牌者代表4个盒,我们有=4个球.

(b,13)基因的分布.每一个生物(人,植物或动物)的后代都从其祖先那里继承一些遗传基因.如果一种特殊的遗传基因可以有种不同的形式,hellip;,,则后代可以按其基因的类型来分类.后代相当于球,遗传基因的类型,hellip;,相当于盒.

(b,14)化学.假定长链聚合物与氧发生反应,每一个链都可能和0,1,2,hellip;个氧分子起反应.这里参加反应的氧分子相当于球,而聚合物的链相当于盒.

(b,15)显影液的理论.在一个照相底板上涂上一层显影液,当这种液体的粒子被个光子击中时,它就起反应.为了区分黑白对比度,必须知道多少个粒子(想象为盒)被个光子所击中.由此,我们得到一个占位问题,粒子相当于盒,而光子相当于球.(当然,实际问题是很复杂的,因为底板上的液体的粒子的感光性强弱是不一样的.)

(b,16)印刷错误.个错误在一本页的书中的一切可能的分布相当于个球放入个盒中的一切可能分布,不过必须小于每一页的字数.

(c)球为不可辨的情形.让我们回到例(a),并且假定那3个球是不可辨别的.这

意味着像表1—1中的4,5,6这样的3种不同的排列都分不清了,因此表1—1变为表1—2.表l—2确定了下述理想实验的样本空间:把3个不可辨别的球放入3个盒中.而且同样我们可以采用个球放入个盒中的办法

表1-2 3个不可辨别球放入3个盒中的全部可能放法

实际生活中球是否可辨别与我们的理论不相干.甚至当它们可以辨别时,我们也可以作不可辨别的来处理.桥牌中的爱司[例(b,1 2)]或者电梯中的人[例(b,7)]都是可以辨别的,但是把它们当作不可辨别的来处理会更方便.例(b,8)中的骰子就可以涂上颜色使之可辨别,但是,当我们讨论一些具体的问题时,到底是应用可辨别的还是不可辨别的球的模型,则可以根据特定的目的和便利性来决定.问题的性质将决定我们如lsquo;何选择,不过,无论如何选择,只有当适当的模型选定以后,即当样本空间定义以后,理论才能开始登场.

在上面的模型中,我们考虑的球不可辨别,不过表1—2仍然区分第1、第2及第3个盒,而且它们的次序还是至关重要的.我们可以进一步假定盒也是不可辨别的(例如,盒可以随机地选取而不考虑其外在表现).当球和盒都是不可辨别的时候,所有可能的排列只有3种,即(***|—|一),(**|*|一),{*|*|*).

(d)抽样.假定为了估计吸烟的人数,我们任意选取100个人作为样本.在这里,我们只对其中吸烟的人数感兴趣,而z可以是0到100之间的任意一个整数.这样一来,我们可以确定这个样本空间是由=0,1,2,hellip;,100等101个“点rsquo;rsquo;所组成的.每个个别的样本或观察的结果完全可以用对应的点来代表.现在举一个复合事件的例子:“样本中的人超过半数吸烟'.这个事件意味着,实验的结果为,在.=51,52,hellip;,100等50个事件中有一个发生.究竟发生的是哪一个呢?这里并没有交待.同样,样本的每个性质都可以通过列举它所对应的情况或样本点来表示.为了术语上

的统一,我们称其为事件而不说成样本的性质.用数学的术语来说,一个事件就是与之对应的所有的样本点的集合.

(e)抽样(续).现在我们对这100个人,不但要按吸烟与否来分类,而且还要

区分他们的性别.于是,现在的样本点需由男女吸烟者、男女非吸烟者的人数来表示.也就是由整数的四元组(Ms,Fs,Mn,Fn)来描述.我们可以把这样的四元组的全体作为样本空间:其中的每个整数都在0与100之间,且每组四个数的和为100.一共有176 851个这样的四元组共同组成样本空间(参见2.5节).在一个样本中,“相对而言男性吸烟者多于女性',意思就是说:在这个样本中,比值大于.譬如像“点'(73,2,8,1 7)就具有这个性质,而“点'(0,1,5 0,49)则不然.原则上,任何事件都可以把具有所需特性的全部四元组列举出来作为描述.

(f)扔硬币.如果把一个硬币扔3次,这时,样本空间就由8个点构成.如果以H表示正面,T表示反面,那么这8个点就可以用HHH,HHT,HTH,THH,HTT,THT,TTH,TTT来代表.“其中至少有2次出现正面'的事件可以由这8个:点中前4个所构成的集合来表示.“恰巧有1次出现背面'的事件是指HHT或HTH或THH,所以我们就说包含着这3个点.

(g)夫妇的年龄.保险公司对于夫妇年龄的分布比较感兴趣.让我们以代表丈夫的年龄,代表妻子的年龄.于是每作一次考察就可以得到一个数对(,).对应于考察的整个样本空间,就可以用,平面的第一象限来表示.于是每一个gt;0,gt;0的点都是这个样本空间中的一个样本点.“丈夫的年龄大于40岁'的事可以用直线=40右边的全部点来代表;“丈夫的年龄比妻子大'的事件可以用z轴与第一象限的等分线=之间所夹的角状区域来代表,也就是说可以用gt;的点的全体来代表;“妻子的年龄大于40岁rsquo;rsquo;的事件C可以用第一象限中位于直线=40以上的部分来代表.至于2对夫妇年龄的联合分布的几何表示,就需要用到四维空间了.

(h)相空间.在统计力学里,体系的每个可能“状态'被称为“相空间中的一个点'.这仅仅只是术语上的不同,其实相空间就是样本空间,它的点也就是样本点.

1.3 样本空间·事件

如前所述,可以清楚地看出,我们不讨论概率则已,如果要提到概率,就总是把它结合着所给定的样本空间(或者用物理上的话来说是结合着某个理想的实验)来谈.由样本空间和它的点的概念出发,今后我们认为,它们是已经给定的了.它们是概率论中的原始的无定义的概念,正如“点'和“直线rsquo;rsquo;是欧氏几何的公

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 141 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[279975],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。