心情愉快的的英文快的翻译快的英语怎么说-河海大学研究生分数线


2023年4月5日发(作者:武汉理工大学排名)

22

第三章平均数、标准差与变异系数

本章重点介绍平均数(mean)、标准差(standarddeviation)与变异系数(variation

coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而

分布的性质;后两者用于反映资料的离散性,即观测值离中分散变异的性质。

第一节平均数

平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位

置。在畜牧业、水产业生产实践和科学研究中,平均数被广泛用来描述或比较各种技术措施

的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数(arithmeticmean)、

中位数(median)、众数(mode)、几何平均数(geometricmean)及调和平均数(harmonic

mean),现分别介绍如下。

一、算术平均数

算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,

记为

x

。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。

(一)直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算。

设某一资料包含n个观测值:x

1

、x

2

、…、x

n

,则样本平均数

x

可通过下式计算:

n

x

n

xxx

x

n

i

i

n





121

(3-1)

其中,为总和符号;

n

i

i

x

1

表示从第一个观测值x

1

累加到第n个观测值x

n

。当

n

i

i

x

1

在意义上已明确时,可简写为x,(3-1)式即可改写为:

n

x

x

=

【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、

600、480、510、505、490(kg),求其平均体重。

由于x=500+520+535+560+585+600+480+510+505+490=5285,n=10

代入(3—1)式得:

23

.5(kg)528

10

5285∑



n

x

x

即10头种公牛平均体重为528.5kg。

(二)加权法对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础

上采用加权法计算平均数,计算公式为:







f

fx

f

xf

fff

xfxfxf

x

k

i

i

k

i

ii

k

kk

1

1

21

2211

(3-2)

式中:

i

x—第i组的组中值;

i

f

—第i组的次数;

—分组数

第i组的次数f

i

是权衡第i组组中值x

i

在资料中所占比重大小的数量,因此f

i

称为是x

i

的“权”,加权法也由此而得名。

【例3.2】将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如

下,求其加权数平均数。

表3—1100头长白母猪仔猪一月窝重次数分布表

组别组中值(x)次数(f)fx

10—15345

20—256150

30—3526910

40—45301350

50—55241320

60—658520

70—753225

合计1004520

利用(3—2)式得:

)(2.45

100

4520

kg

f

fx

x

即这100头长白母猪仔猪一月龄平均窝重为45.2kg。

计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权

法计算。

【例3.3】某牛群有黑白花奶牛1500头,其平均体重为750kg,而另一牛群有黑白

花奶牛1200头,平均体重为725kg,如果将这两个牛群混合在一起,其混合后平均体重为

多少?

此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛

群牛的头数为权,求两个牛群平均体重的加权平均数,即

24

)(89.738

2700

12

kg

f

fx

x





即两个牛群混合后平均体重为738.89kg。

(三)平均数的基本性质

1、样本各观测值与平均数之差的和为零,即离均差之和等于零。

0)(

1



xx

n

i

i

或简写成0)(xx

2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。

n

i1

(x

i

-

x

)2<

n

i1

(x

i

-a)2(常数a≠

x

或简写为:2)(xx<2)(x

以上两个性质可用代数方法予以证明,这里从略。

对于总体而言,通常用表示总体平均数,有限总体的平均数为:

Nx

n

i

i

1

(3-3)

式中,N表示总体所包含的个体数。

当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏

估计量。统计学中常用样本平均数(

x

)作为总体平均数()的估计量,并已证明样本平

均数

x

是总体平均数的无偏估计量。

二、中位数

将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为

M

d

。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数梅子黄时日日晴是什么季节 简称中

数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方

法因资料是否分组而有所不同。

(一)未分组资料中位数的计算方法对于未分组资料,先将各观测值由小到大

依次排列。

1、当观测值个数n促织原文 为奇数时,(n+1)/2位置的观测值,即x

(n+1)/2

为中位数;

M

d

=

2/)1(n

x

2、当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中

位数,即:

25

2

)12/(2/

nn

d

xx

M(3-4)

【例3.4】观察得9只西农莎能奶山羊的妊娠天数为144、145、147、149、150、151、

153、156、157,求其中位数。

此例n=9,为奇数,则:

M

d

=

52/)19(2/)1(

xxx

n





=150(天)

即西农莎能奶山羊妊娠天数的中位数为150天。

【例3.5】某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、

11、12、12、13、14、14天,求其中位数。

此例n=10,为偶数,则:

5.11

2

1211

22

65

)12/(2/



xx

xx

Mnn

d

(天)

即10只仔犬从发现症状到死亡天数的中位数为11.5天。

(二)已分组资料中位数的计算方法若资料已分组,编制成次数分布表,则可

利用次数分布表来计算中位数,其计算公式为:

)

2

(c

n

f

i

LM

d

(3—5)

式中:L—中位数所在组的下限;

i—组距;

f—中位数所在组的次数;

n—总次数;

c—小于中数所在组的累加次数。

【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表

如表3—2所示,求中位数。

表3—268头母牛从分娩到第一次发情间隔时间次数分布表

间隔时间(d)头数(f)累加头数

12—2611

27—4123

42—561316

57—712036

72—861652

87—1011264

102—116266

≥117268

由表3—2可见:i=15,n=68,因而中位数只能在累加头数为36所对应的“57—71”这

一组,于是可确定L=57,f=20,C=16,代入公式(3—5)得:

5.70)16

2

68

(

20

15

57)

2

(c

n

f

i

LM

d

(天)

26

即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。

三、几何平均数

n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为G。它主要应用于畜

牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长

率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代

表其平均水平。其计算公式如下:

n

n

n

n

xxxxxxxxG1)(

321321

(3—6)

为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得

G值,即

)]lglg(lg

1

[lg

21

1

n

xxx

n

G(3—7)

【例3.7】某波尔山羊群1997—2000年各年度的存栏数见表3—3,试求其年平均增

长率。

表3—3某波尔山羊群各年度存栏数与增长率

年度存栏数(只)增长率(x)Lgx

1997140——

19982000.429-0.368

19992800.400-0.398

20003500.250-0.602

lgx=-1.368

利用公式(3—7)求年平均增长率

G=)]lglg(lg

1

[lg

21

1

n

xxx

n



=lg-1[

3

1

(-0.368-0.398–0.602)]

=lg-1(-0.456)=0.3501

即年平均增长率为0.3501或35.01%。

四、众数

资料中出四年级语文上册期末考试试卷 现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M

0

。如

表2-3所列的50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数

为22天。又如【例3.6】所列出的次数分布表中,57—71这一组次数最多,其组中值为64

天,则该资料的众数为64天。

27

五、调和平均数

资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即





xn

xxxn

n

H

11

1111

1

)(

1

21

(3—8)

调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。

【例3.8】某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220

头,2世代210头;3世代190头,4世代210头,试求其平均规模。

利用公式(3—9)求平均规模:

33.208

0048.0

1

)024.0(

1

)(

1

5

1

210

1

190

1

210

1

220

1

200

1

5

1





H

(头)

即保种群平均规模为208.33头。

对于同一资料,算术平均数>几何平均数>调和平均数。

上述五种平均数,最常用的是算术平均数。

第二节标准差

一、标准差的意义

用平均数作为样本的代表,其代表性的强弱受样本资料中各观测以彼之道还施彼身 值变异程度的影响。如

果各观测值变异小,则平均数对样本的代表性强;如果各观测值变异大,则平均数代表性弱。

因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值

变异程度大小的统计量。

全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。全距大,则资料中

各观测值变异程度大,全距小,则资料中各观测值变异程度小。但是全距只利用了资料中的

最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又

要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。

为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求

出各个观测值与平均数的离差,即(

xx

),称为离均差。虽然离均差能表达一个观测值偏

离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即(

xx

)=0,

因而不能用离均差之和(

xx

)来表示资料中所有观测值的总偏离程度。为了解决离均

差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除

以观测值n求得平均绝对离差,即|

xx

|/n。虽然平均绝对离差可以表示资料纳兰容若最有名的十首诗 中各观测值

28

的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。

我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先

将各个离均差平方,即(

xx

)2,再求离均差平方和,即2)(xx,简称平方和,记为SS;

由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,

即nxx/)(2,求出离均差平方和的平均数;为了使所得的统计量是相应总体参数的无偏

估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1,

于是,我们采用统计量1/)(2nxx表示资料的变异程度。统计量1/)(2nxx称为均

方(meansquare缩写为MS),又称样本方差,记为S2,即

S2=1/)(2nxx(3—9)

相应的总体参数叫总体方差,记为2。对于有限总体而言,2的计算公式为:

2x()2/N(3—10)

由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而

不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的

平方根。统计学上把样本方差S2的平方根叫做样本标准差,记为S,即:

1

)(2

n

xx

S(3-11)

由于)2()(22

2xxxxxx

222xnxxx

2

2

2)(

)(

2

n

x

n

n

x

x





n

x

x

2

2

)(



所以(3-11)式可改写为:

1

2)(

2



n

x

Sn

x

(3-12)

相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为:

=Nx/)(2(3-13)

在统计学中,常用样本标准差S估计总体标准差。

二、标准差的计算方法

29

(一)直接法对于未分组或小样本资料,可直接利用(3—11)或(3-12)式来计

算标准差。

【例3.9】计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,

600,600,650(g)的标准差。

此例n=10,经计算得:x=5400,x2=2955000,代入(3—12)式得:

828.65

110

10/54002955000

1

/)(2

22



n

nxx

S(g)

即10只辽宁绒山羊产绒量的标准差为65.828g。

(二)加权法对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权

法计算标准差。计算公式为:



1

/)(

1

)(222

f

ffxfx

f

xxf

S

(3—14)

式中,f为各组次数;x为各组的组中值;f=n为总次数。

【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。

将表3-4中的f、fx、fx2代入(3—14)式得:

5524.3

1200

200/1.1070511.575507

1

/)(2

22





f

ffxfx

S

(g)

即某纯系蛋鸡200枚蛋重的标准差为3.5524g。

表3—4某纯系蛋鸡200枚蛋重资料次数分布及标准差计算表

组别组中值(x)次数(f)fxfx2

44.15—45.03135.06075.0

45.85—46.76280.213085.34

47.55—48.416774.437480.96

49.25—50.1221102.255220.22

50.95—51.8301554.080497.20

52.65—53.5442354.0125939.00

54.35—55.2281545.0853渠组词 17.12

56.05—56.9301707.097128.30

57.75—58.612703.241207.52

59.45—60.35301.518180.45

61.15—62.04248.015376.00

合计f=200fx=10705.1fx2=575507.11

30

三、标准差的特性

(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差

也大,反之则小。

(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。

(三)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a

倍。

(四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍

标准差(xS)范围内;约有95.43%的观测值在平均数左右两倍标准差(x2S)范围内;

约有99.73%的观测值在平均数左右三倍标准差(x3S)范围内。也就是说全距近似地等

于6倍标准差,可用(6/全距)来粗略估计标准差。

第三节变异系数

变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异

程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)

平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对

值)来比较。标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和

(或)平均数不同对两个或多个资料变异程度比较的影响。

变异系数的计算公式为:

%100

x

S

VC(3—15)

【例3.11】已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大

约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重

变异程度大。

此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较

其变异程度的大小。

由于,长白成年母猪体重的变异系数:

%53.5%100

190

5.10

VC

大约克成年母猪体重的变异系数:

%34.4%100

196

5.8

VC

所以,长白成年母猪体重的变异程度大于大约克成年母猪。

注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系

数表示资料的变异程度时,最好将平均数和标准差也列出。

习题

1、生物统计中常用的平均数有几种?各在什么情况下应用?

31

2、何谓算术平均数?算术平均数有哪些基本性质?

3、何谓标准差?标准差有哪些特性?

4、何谓变异系数?为什么变异系数要与平均数、标准差配合使用?

5、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。试计算这10头母猪

第一胎产仔数的平均数、标准差和变异系数。(x=9.8头,S=2.098头,CV=21.40%)。

6、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平

均数、标准差与变异系数。

组别组中值(x)次数(f)

80—842

88—9210

96—10029

104—10828

112—11620

120—12415

128—13213

136—1403

(x=111.07cm,S=12.95cm,CV=11.66%)。

7、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。试

求潜伏期的中位数。(4天)

8、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的

年平均增长率。(G=0.1106或11.06%)。

9、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、

130、140、120、110头。试计算平均世代规模。(H=123.17头)

10、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。

甲地2

乙地0

(S甲=5.75cm,C.V甲=4.42%;S乙=1.25cm,C.于易水送人于易水送别 V乙=0.96%)

更多推荐

coefficient是什么意思fficient在线翻译读音