热门搜索:

  • /?93
  • 下载费用:2 金币 ?

现代高等工程数学1(1).ppt

关?键?词:
工程数学
资源描述:
现代高等工程数学电子教案,第8章 估计理论与假设检验数学学院应用数学系 王国富2010年3月,问题提出 某厂有一批产品,须经检验后方可出厂。按规定标准,次品率不得超过1%。今在其中随机抽取100件进行检查,结果发现有2件次品,问这批产品的次品率是多少?能否出厂?,,,,,,,引进变量X,当抽取一件产品是次品,记为X=1,当抽取一件产品不是次品,记为X=0;P{X=1}=p, P{X=0}=1-pP就是产品的次品率。这批产品的次品率是多少就是对p的取值作出一个推断,称为估计。能不能出厂,就看p的值是超过1%还是没有超过1%,这就是检验。,数理统计其实质就是利用样本对总体进行统计推断,而总体可以看作是一个随机变量,要知道一个随机变量的取值规律性就是要对它的分布作出一个推断。当我们对总体一无所知的时候,可以利用样本对分布作出估计,通常可以用频率分布表来估计离散型总体的分布率;用直方图估计连续性总体的分布密度;用经验分布函数估计总体的分布函数。当我们对总体的分布类型有了一定的了解,但分布中含有未知参数时,可以利用参数估计方法对参数的取值作出估计,其中包括点估计和区间估计。当我们对总体已经有了比较全面的了解,但实际中可能出现一些大的改变,这些改变会不会影响总体的分布,那就需要进行假设检验了。估计理论与假设检验是数理统计中两个最基本和最重要的内容,统计量 统计量的定义 定义1.2 设 为总体X的一个样本, 为 的连续函数,且不含有任何未知参数,则称T为一个统计量。 注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值 ; 2.统计量是一个随机变量,它将高维随机变量问题转化为一维随机变量来处理 ,但不会损失所讨论问题的信息量.,,,,常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩4.k 阶中心矩 5.顺序统计量6.样本极差 与中位数,,抽样分布 我们称统计量的分布为抽样分布 ,不同的统计量其分布不一定相同.常见的分布类型有: 正态分布 伽玛分布 卡方分布 t 分布 F分布,,,,,,,伽玛分布定义1.4 如果连续型随机变量X的密度函数为其中 为 函数,则称X为服从参数是 的伽玛分布,记为,,,,,,,,,,,,,伽玛分布的性质(1)由此可得,,,,,,,,,(2) 如果 ,并且X和Y相互独立,容易求得 这个性质称为可加性,即伽玛分布具有可加性.,,,,,,,,,卡方分布用构造性的方式定义是 定义1.5 设 为相互独立的随机变量,且均服从 ,则它们的平方和 也是一个随机变量,它所服从的分布称为自由度为n的 分布,记为,,,,,,,,,,,,它的密度函数为 其密度函数与参数n有关,它的图形也有一定差异.,,,,,,,,卡方分布的性质   若      ,则  即卡方分布是一种伽玛分布,因此具有伽玛分布的性质  (1)  (2) 如果        ,并且X和Y相互独立,有  卡方分布也具有可加性,,,,,,,,,,,,,t 分布 构造性的方式定义  定义1.6 设     ,     ,且X与Y相互独立,记   则T也是一个随机变量,它所服从的分布称为自由度为n的t分布,记为,,,,,,,,,,,它的密度函数为与参数n有关,不同的n其图形也有差异.,,,,,,,,,性质若     则(1)当   时,t分布是柯西分布,柯西分布不存在数学期望和方差.参数为2的t分布也不存在数学期望和方差.(2)    时,,,,,,,,,,,(3)可以证明 这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布,,,,,,,,F分布 构造性的方式定义  定义1.7 设     ,     ,且X与Y相互独立,记   则F也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为,,,,,,,,,,,它的密度函数为它与m,n有关,其图形也有一定差异.,,,,,,,,容易得到  若      ,则,,,,,,,,,分位数:定义1.6 设X为连续型随机变量,其分布函数为   ,对    ,如果存在数   满足 则称  为此分布的  分位数 分位数的几何意义 可用图形表示,它的值可查表得到,不同的分布有不同的分位数,有不同的表可查.,,,,,,,,,,,,常见的分位数有它们的值可以通过附表1、附表2、附表3、附表4 查得,,,,,,,,,,,,分位数具有性质(1)(2)(3)当n 足够大时(一般n > 45)有近似公式,,,,,,,,,,,,,,例:查表求下列分位数的值,,,,,,,,,,,抽样分布定理 定理8.2.1 设总体 , 为X的一个简单随机样本, 为样本均值与样本方差,则有: (1) (2),,,,,,,,,,,,(3) 相互独立; (4),,,,,,,,定理8.2.2 设有两个总体X与Y,       ,从两个总体X与Y中分别独立抽取容量为m,n的简单随机样本              记    为样本      的样本均值与方差,   为样本     的样本均值与方差,则 (1),,,,,,,,,,,,,,,,(2)(3)若       则 其中,,,,,,,,,,,定理8.2.3 设总体X为任意总体,存在有限的数学期望与方差         ,    为X的一个样本,当n充分大时(称之为大样本),有 (1) (2),,,,,,,,,,,定理8.2.4 设事件A发生的概率为p,在n次重复试验中事件A发生的次数为m,当n充分大时,近似地有 (1) (2),,,,,,,,,,,定理8.2.5 设总体X服从参数为 的指数分布,     为X的一个简单随机样本, 为样本均值,则,,,,,,,,,,例1.8 设总体       ,分别从X中抽取容量为10与15的两个独立样本,求它们的均值之差的绝对值大于0.3的概率,,,,,,,,,,,,例1.9 设总体       ,是从总体中抽取的简单随机样本,选取常数c,d使得并求出n.,,,,,,,,,,,,,,一、估计理论,,,,,,,,,,,1.参数点估计 参数点估计是对参数取哪一个值作出估计.定义:设总体的分布已知,但其中含有未知参数 (可以是一个向量),点估计就是依据某种原理,根据样本来构造统计量 (可以是一个向量)作为 的估计量,记为,,,,,,,,,,,当样本取定一个观察值时,估计量也有一个值,这个值称为估计值,不同的抽样,有不同的估计值,它与真值会有差异,这种差异除了抽样带来的误差外,与估计量的形式有关.因此,选取统计量也是非常重要的.我们介绍两种统计量的方法:矩法与极大似然法,,,,,,,,,,,矩法估计假设样本为简单随机样本,则由大数定律,有,,,,,,,,,,,其中当n比较大时,,,,,,,,,,,利用这种近似相等关系的思想,得到矩法估计的定义.定义:用样本原点矩去代替总体相应的原点矩得到的参数的估计量的方法称为矩法,称这种估计为矩法估计量.,,,,,,,,,,,例1总体X的分布密度为 其中 为未知参数,现从中抽取一个样本,试求 的矩法估计量.解:,,,,,,,,,,,由于故令得到估计量通常我们是采用下面的方法,,,,,,,,,,,另解我们可认为而由矩法,我们令得到,,,,,,,,,,,极大似然估计极大似然估计是利用小概率原理作出估计的.小概率原理:一个概率非常小的一个事件在一次试验中几乎是不可能发生的;也就是说,如果一个事件在一次试验中居然发生了,那么这个事件发生的概率不可能很小,而应认为其概率会尽可能地大.,,,,,,,,,,,例 设总体     ,现从中抽取一个样本观察值(500,300,600,400,700),试估计 的值.解:,,,,,,,,,,,这里,n是5,设      为样本,在一次试验中事件发生了,而,,,,,,,,,,,是参数 的函数,由小概率原理,这个概率不会太小,应尽可能大,即求这个概率的最大值.利用求导可得到当      时,这个概率达到最大.因此,我们有理由认为参数 为500.这就是极大似然估计.,,,,,,,,,,,一般地,当总体为离散型总体,其分布中含有未知参数  (可以是向量), 为一个样本,       为一次观察值,称 为似然函数.,,,,,,,,,,,称对数似然函数.称满足的 为 极大似然估计值,记为,,,,,,,,,,,而称为极大似然估计量.简称ML估计. 上例的一般情况是,,,,,,,,,,,例:设总体X服从参数为 的泊松分布,求的极大似然估计.,,,,,,,,,,,解:总体X的分布为 似然函数为,,,,,,,,,,,对数似然函数为 这两个函数的极值点相同,对对数似然函数求导,并令其为0,得,,,,,,,,,,,得到从而极大似然估计为,,,,,,,,,,,当总体是连续型总体时,我们定义似然函数为对数似然函数为,,,,,,,,,,,例 设总体     ,试求 的极大似然估计.解:,,,,,,,,,,,解:似然函数为对数似然函数为,,,,,,,,,,,对 求导并令其为0,得从而解得 的极大似估计,,,,,,,,,,,2.区间估计 点估计方法有两个缺陷: (1)不能说明估计值与真值的偏差到底有多大(精确性); (2)不能说明这个估计有多大的可信度(可靠性);,,,,,,,,,,,,,,,,,,,,,,需要指出:  区间估计中的精确性与可靠性是相互矛盾的. 当样本容量一定时,提高估计的可靠度,将降低估计的精度,相反,提高估计的精度,将降低估计的可靠度.,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,例2:在某次选举前的一次民意测验中,随机地抽取了400名选民进行民意测验,结果有240人支持某个指定的候选人。求在所有的选民中,这位候选人的支持率的95%的置信区间,,,,,,,,,,,,,,,,,,,,,,例3:在甲、乙两市进行的职工家计调查结果表明:甲市抽取的500户中平均每户消费支出     元,标准差    元;乙市抽取的1000户中平均每户消费支出    元,标准差   元,试求:两市职工家庭每户平均年消费支出之间差别   的置信水平为0.95的置信区间。,,,,,,,,,,,,,,,,,,,,,,假设检验问题提出 某厂有一批产品,须经检验后方可出厂。按规定标准,次品率不得超过1%。今在其中随机抽取100件进行检查,结果发现有2件次品,能否出厂?,,,,,,,分析:我们可算得,不合格品出现的频率为0.02。由于我们不可能对所有生产的产品进行检验,因此即使可以出厂,不合格率不超过0.01,在随机抽样检验中,不合格品出现的频率也有可能比0.01大. 如果记“X=1”表示生产出来的产品为不合格品;“X=0”表示生产出来的产品为合格品,我们有 这里参数 为不合格率。那么产品可以出厂等价于总体X的分布为0-1分布,参数 ;产品不可以出厂等价于总体的分布为0-1分布,参数 。关于产品能否可以出厂的两种假设就转化为关于总体分布的两种假设,,,,,,,,,,,所谓假设检验问题,就是要判断原假设是否正确,也就是要作出一个决定,是接受还是拒绝原假设,,,,,,,,,,,如何作出选择,需要我们从总体中抽取样本,然后根据样本的观测值作出决定。这就需要我们给出一个规则,此规则告诉我们,在有了样本观测值后,我们可以作出是接受还是拒绝原假设。 我们把这样的规则称为检验。要给出一个有实际使用价值的检验,需要有丰富的统计思想。我们首先对样本进行加工,把样本中包含的关于未知参数的信息集中起来,构造出一个适合于假设检验的统计量T。,,,,,,,,,,,上面例子中,我们取 它表示所检验的100件产品中不合格品的总数。是p的充分统计量,服从参数是100, p的二项分布。一般说来,在 为真即生产过程稳定时,T的值应比较小;而在 不真即生产过程不稳定时,T的值应相对地比较大。因此,我们可以根据T值的大小来制定检验法则。对样本的每个观测值,当统计量的观测值较大时就拒绝 ,而当T较小时就接受 。这就是说,按照规则,,,,,,,,,,,,当 时,拒绝原假设; 当 时,接受原假设; 其中c是一个待定的常数。不同的c值表示不同的检验,如何确定c,需要有熟练的计算技巧和丰富的统计思想,我们称T为检验统计量;c为检验临界值; 为拒绝域; 为接受域。,,,,,,,,,,,,,,两类错误 每一个检验都会不同程度地犯两类错误。上面例子中,原假设本来正确,由于样本的随机性,检验统计量的观测值落入了拒绝域,就拒绝原假设,这时称假设检验过程中犯了第一类错误,也称“弃真错误”;原假设本来不正确,由于样本的随机性,检验统计量的观测值落入了接受域,就接受原假设,这时称假设检验过程中犯了第二类错误,也称“存伪错误”。,,,,,,,,,,,一个检验的好坏可由犯这两类错误的概率来度量。常把犯第一类错误的概率记为 ,犯第二类错误的概率记为  。由于它们常依赖于总体中未知参数 ,故又常记为      。上面例子中,,,,,,,,,,,,,可见,犯两类错误的概率均为参数p的函数。犯第一类错误的概率是  的函数;犯第二类错误的概率是 的函数。犯两类错误的概率也是c的函数,c的值越大,犯第一类错误的概率就越小,而犯第二类错误的概率就越大;相反, c的值越小,犯第一类错误的概率就越大,而犯第二类错误的概率就越小;因此,犯两类错误的概率是相互制约的 .,,,,,,,,,,,奈曼(Neyman)和皮尔逊(Pearson)提出,首先控制犯第一类错误的概率,即选定一个数     ,使得检验中犯第一类错误的概率不超过 。然后,在满足这个约束条件的检验中,寻找犯第二类错误的概率尽可能小的检验。这就是假设检验理论中的奈曼-皮尔逊原则。寻找犯第二类错误的概率尽可能小的检验,在理论和计算中都并非容易。为简单起见,在样本容量n固定时,我们着重对犯第一类错误的概率加以控制,适当考虑犯第二类错误的概率的大小。称控制犯第一类错误的概率不超过 的检验为显着性检验。称 为显着性水平,,,,,,,,,,,假设检验的一般步骤 (1)根据实际问题提出原假设和备择假设; (2)确定检验统计量T; (3)取适当的显着性水平 ,并由显着性水平和统计量的分布确定拒绝域W,使得检验中犯第一类错误的概率的最大值 尽可能的接近 ,特别在总体为连续型总体时,往往要使它等于 .拒绝域有单侧和双侧两种形式.  (4)由样本观测值算得统计量的观测值,并与拒绝域中临界值比较,如果观测值落入拒绝域,则拒绝原假设,否则接受原假设.,,,,,,,,,,,,例4: 由点估计,可用 ,因此,我们可选取统计量 来检验,显然它的值太大或者太小都应拒绝 ,因此,拒绝域的形式为,,,,,,,,,,,由来确定,,,,,,而在    为真时 ,由标准正态分布的分位数可知 因此拒绝域为,,,,,,,,,,,,,,例5 某种食品在处理前后含脂率抽样数据如下: 处理前: 0.19 0.18 0.21 0.30 0.41 0.12 0.27 处理后: 0.15 0.13 0.07 0.24 0.19 0.06 0.08         0.12   假定处理前后的含脂率均服从正态分布,且标准差保持不变,问在0.05显着性水平下,处理前后的含脂率有无显着变化?,,,,,,,,,,,解:我们采用t检验。设处理前后含脂率分别为X、Y, ,作假设,,,,,,,,,,,,,,,,,,,,,,,,例6 某厂有一批产品,共1000件,须经检验后方可出厂。按规定标准,次品率不得超过1%。今在其中随机抽取100件进行检查,结果发现有2件次品,问这批产品能否出厂?(     ),,,,,,,,,,,,解:设这一批产品的次品率为p,我们作假设,,,,,,,,,,,,分布假设检验 参数的假设检验中,总体分布的类型是已知的。然而在许多场合,并不知道总体分布的类型,此时首先需要根据样本提供的信息,通过概率论有关理论推导或有关专业知识、经验等形成对总体X的分布类型的猜想、看法,提出假设。对这种假设的检验称为分布假设检验。,,,,,,,,,,,(1)单个分布的假设检验 设总体X的分布函数为 ,我们对总体的分布作如下假设: 其中, 为一个完全已知为分布函数,它不含任何的未知参数 . 假设检验的重要步骤是要构造一个检验统计量。采用不同的统计量,就形成不同的统计检验方法。关于分布的假设检验常用的有皮尔逊(K.Pearson) —检验法和柯尔莫哥洛夫(Kolmogorov)检验法。我们仅介绍皮尔逊—检验法,,,,,,,,,,,,,K.Pearson检验法是运用频率接近概率这一思想.其方法是 将样本数据分为m个组:,,,,,,,,,,,如何确定c,需要知道1900年皮尔逊(K.Pearson)证明了下面结论:  定理:当 成立时,不论  是什么样的分布函数,当n充分大时,均有 由此定理可得到的拒绝域为,,,,,,,,,,,,,,,例7 从总体X中抽取容量为80的一个样本,其频率分布如下表:试问总体X的分布函数是否为 取,,,,,,,,,,,,解:对总体的分布作如下假设:,,,,,,,,,,,,,(2) 分布族的假设检验 设总体X的分布函数为 ,我们对总体的分布作如下假设:,,,,,,,,,,,,,例8 设某种动物的血型有A、B、AB三种,根据遗传学模型,在该种动物的群体中,三种血型分配的比例应满足关系 其中, ,现捕捉到98只这样的动物,测得三种血型的数目分别为8,49,41。在5%的显着性水平之下来检验上述数据是否满足遗传学模型?,,解:这是一个分布族的假设检验。我们作极大似然估计。似然函数可求得p的极大似然估计值为此时可得到这时统计量的值为 查表 即可认为上述数据满足遗传学模型,,,,,,,,,,,,,
? 汽车智库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:现代高等工程数学1(1).ppt
链接地址:http://www.autoekb.com/p-1492.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2008-2018 mywenku网站版权所有
经营许可证编号:京ICP备12026657号-3?

收起
展开