分组频数分布

频数

频数是出现的次数。

足球队

例子:芯芯在以下的时间踢足球:

频数是星期六 2次、星期四 1次 和 整个星期 3次。

频数分布

我们可以用计算出来的频数做个 频数分布表。

例子:报纸

这是报摊在过去 10天的报纸销量:

22、20、18、23、20、25、22、20、18、20

我们来数每个销量发生的次数:
报纸销量 频数
18 2
19 0
20 4
21 0
22 2
23 1
24 0
25 1

我们也可以把数据分组。例如,把五个顺序的销量分成一组:

报纸销量 频数
15-19 2
20-24 7
25-29 1

 

分组频数分布

在以上的例子中,我们把频数分成组。当数据有很多不同的值时,这是非常有用的

栎树叶

例子:叶子

欣欣测量了栎树叶子的长度(到最近的 cm):

9、16、13、7、8、4、18、10、17、18、9、12、5、9、9、16、1、8、17、1、
10、 5、9、11、15、6、14、9、1、12、5、16、4、16、8、15、14、17

在开始时,决定把数据分成什么组别可能会有些困难。以下是一些提示:

先把数值顺序排列,然后寻找数据里最小最大的值,再求数据的值域(值域 = 最大值 - 最小值)。

 

例子:叶子(续)

从小到大,叶子的长度是:

1、1、1、4、4、5、5、5、6、7、8、8、8、9、9、9、9、9、9、10、10、11、12、12、
13、14、14、15、15、16、16、16、16、17、17、17、18、18

最小值是 1 cm

最大值是 18 cm

值域是 18−1 = 17 cm

 

每组的大小

接下来,求组的大小的近似值,就是 值域 除以你想要的组的数目。

最后把结果舍入为一个简单的数(像 2,而不是 1.83;或 5,而不是 4.26)。

例子:叶子(续)

比方,我们想用 5组。

把值域除以 5:

17/5 = 3.4

上舍入为 4

初值

初值应该是小于或等于数据的最小值,并且最好是组的大小的倍数。

在这例子里,以 0 为初值最合适

接着算出所有的组(从小到大,直至超过最大值)。

例子:叶子(续)

从 0 开始,组的大小是 4: 0、4、8、12、16

把组写下来,包括每组的上限(要小于下一组的下限):

长度(cm) 频数
0-3  
4-7  
8-11  
12-15  
16-19  

最后的组大到 19,大于最大值,这是合适的。

(注意:如果你对组不满意,回去用其他的初值或组的大小来试试。)

 

每组的下限和上限

虽然欣欣只用整数来测量,其实数据是 连续的,所以 "4 cm" 的意思是实际长度是在 3.5cm 到 4.5cm 之间。欣欣已经把数值舍入成整数了。

例子:叶子(续)

这是所有的组:

长度 下限/上限 频数
0-3 cm 0-3.5  
4-7 cm 3.5-7.5  
8-11 cm 7.5-11.5  
12-15 cm 11.5-15.5  
16-19 cm 15.5-19.5  

 

计数和总计

现在计算结果、求频数和求总数。

例子:叶子(续)

1、1、1、4、4、5、5、5、6、7、8、8、8、9、9、9、9、9、9、10、10、11、12、12、
13、14、14、15、15、16、16、16、16、17、17、17、18、18:

长度 下限/上限 频数
0-3 cm 0-3.5 3
4-7 cm 3.5-7.5 7
8-11 cm 7.5-11.5 12
12-15 cm 11.5-15.5 7
16-19 cm 15.5-19.5 9
  总计: 38

做好了!/b>

直方图

你可以用这些数据来做个 直方图