分组频数分布
频数
频数是出现的次数。
例子:芯芯在以下的时间踢足球:
- 星期六早上,
- 星期六下午
- 星期四下午
频数是星期六 2次、星期四 1次 和 整个星期 3次。
频数分布
我们可以用计算出来的频数做个 频数分布表。
例子:报纸
这是报摊在过去 10天的报纸销量:
22、20、18、23、20、25、22、20、18、20
我们来数每个销量发生的次数:报纸销量 | 频数 |
---|---|
18 | 2 |
19 | 0 |
20 | 4 |
21 | 0 |
22 | 2 |
23 | 1 |
24 | 0 |
25 | 1 |
我们也可以把数据分组。例如,把五个顺序的销量分成一组:
报纸销量 | 频数 |
---|---|
15-19 | 2 |
20-24 | 7 |
25-29 | 1 |
分组频数分布
在以上的例子中,我们把频数分成组。当数据有很多不同的值时,这是非常有用的
例子:叶子
欣欣测量了栎树叶子的长度(到最近的 cm):
9、16、13、7、8、4、18、10、17、18、9、12、5、9、9、16、1、8、17、1、
10、
5、9、11、15、6、14、9、1、12、5、16、4、16、8、15、14、17
在开始时,决定把数据分成什么组别可能会有些困难。以下是一些提示:
先把数值顺序排列,然后寻找数据里最小和最大的值,再求数据的值域(值域 = 最大值 - 最小值)。
例子:叶子(续)
从小到大,叶子的长度是:
1、1、1、4、4、5、5、5、6、7、8、8、8、9、9、9、9、9、9、10、10、11、12、12、
13、14、14、15、15、16、16、16、16、17、17、17、18、18
最小值是 1 cm
最大值是 18 cm
值域是 18−1 = 17 cm
每组的大小
接下来,求组的大小的近似值,就是 值域 除以你想要的组的数目。
最后把结果舍入为一个简单的数(像 2,而不是 1.83;或 5,而不是 4.26)。
例子:叶子(续)
比方,我们想用 5组。
把值域除以 5:
上舍入为 4
初值
初值应该是小于或等于数据的最小值,并且最好是组的大小的倍数。
在这例子里,以 0 为初值最合适
组
接着算出所有的组(从小到大,直至超过最大值)。
例子:叶子(续)
从 0 开始,组的大小是 4: 0、4、8、12、16
把组写下来,包括每组的上限(要小于下一组的下限):
长度(cm) | 频数 |
---|---|
0-3 | |
4-7 | |
8-11 | |
12-15 | |
16-19 |
最后的组大到 19,大于最大值,这是合适的。
(注意:如果你对组不满意,回去用其他的初值或组的大小来试试。)
每组的下限和上限
虽然欣欣只用整数来测量,其实数据是 连续的,所以 "4 cm" 的意思是实际长度是在 3.5cm 到 4.5cm 之间。欣欣已经把数值舍入成整数了。
例子:叶子(续)
这是所有的组:
长度 | 下限/上限 | 频数 |
---|---|---|
0-3 cm | 0-3.5 | |
4-7 cm | 3.5-7.5 | |
8-11 cm | 7.5-11.5 | |
12-15 cm | 11.5-15.5 | |
16-19 cm | 15.5-19.5 |
计数和总计
现在计算结果、求频数和求总数。
例子:叶子(续)
1、1、1、4、4、5、5、5、6、7、8、8、8、9、9、9、9、9、9、10、10、11、12、12、
13、14、14、15、15、16、16、16、16、17、17、17、18、18:
长度 | 下限/上限 | 频数 |
---|---|---|
0-3 cm | 0-3.5 | 3 |
4-7 cm | 3.5-7.5 | 7 |
8-11 cm | 7.5-11.5 | 12 |
12-15 cm | 11.5-15.5 | 7 |
16-19 cm | 15.5-19.5 | 9 |
总计: | 38 |
做好了!/b>
直方图
你可以用这些数据来做个 直方图。