百分位数
百分位数: 如果有某个百分比的数据低于一个值,这个值便叫百分位数
例子: 你是班上 20个学生里身高第四的学生
80% 的学生比你矮:
你身高是第 80个百分位数(百分等级是 80%)。
如果你的身高是 1.85m,"1.85m" 是班上身高的 80% 百分位数。
顺序排列
把数据顺序排列,你便可以知道哪些数据在上面,哪些数据在下面。
- 要计算身高的百分位数,先把数据按身高顺序排列。
- 要计算年龄的百分位数,先把数据按年龄顺序排列。
- 依此类推。
分组数据
当数据是分开成组别的时候:
把分数以下的所有百分比加起来,
再加上所在分数的百分比的一半。
例子:你的分数是 B!
在测验里,12% 的学生的分数是 D、50% 拿到 C、30% 拿到 B、8% 拿到 A
你的分数是 B,所以把
- 拿到 D 的 12%,
- 拿到 C 的 50%,
- 拿到 B 的 30% 的一半
加起来,百分等级是 12% + 50% + 15% = 77%
换句话说,你的分数比 77% 的学生的分数"更好或相同"
(为什么用 B 的百分比的一半?因为你不能假设你在拿到 B 的学生里的分数是"最高"的还是"最低"的,你只能假设你拿到一个"平均"的 B 的分数。)
十分位数
十分位数和百分位数相似,它把数据分成 10% 的组:
- 第一个十分位数 是 第十个百分位数(10% 的数据低于这个值)
- 第二个十分位数 是 第二十个百分位数(20% 的数据低于这个值)
- 等等!
例子:(续)
你在第 8个十分位数(第 80个百分位数)。
四分位数
另外一个相似的概念是四分位数,它把数据分成四份:
例子:1、3、3、4、5、6、6、7、8、8
数值已经是顺序排列了。把它分成四个四分之一的部分:
在这个例子里,第二个四分位数是在 5 和 6 的正中间:
Q2 = (5+6)/2 = 5.5
结果是:
- 四分位数 1 (Q1) = 3
- 四分位数 2 (Q2) = 5.5
- 四分位数 3 (Q3) = 7
四分位数也把数据分成 25% 的组,所以:
- 四分位数 1(Q1)也可以被称为第 25个百分位数
- 四分位数 2(Q2)也可以被称为第 50个百分位数
- 四分位数 3(Q3)也可以被称为第 75个百分位数
例子:(续)
1、3、3、4、5、6、6、7、8、8:
- 第 25个百分位数 = 3
- 第 50个百分位数 = 5.5
- 第 75个百分位数 = 7
估计百分位数
我们可以用线型图来估计百分位数。
例子:购物
在过去的 12小时里,有 10,000个人去了商场:
时间(小时) | 人数 |
---|---|
0 | 0 |
2 | 350 |
4 | 1100 |
6 | 2400 |
8 | 6500 |
10 | 8850 |
12 | 10,000 |
一、估计第 30个百分位数(30% 的人来到商场)。
二、估计第十一个小时后有多少人来了商场。
首先,为数据画个线型图:画数据点,再用一条平滑曲线把点连起来:
一、第 30个百分位数是 3,000个人。
在 3,000 画一条水平直线,在这条线与曲线的交叉点再向下画一条垂直线,这条线与水平轴的交叉点就是我们想求的时间:
所以第 30个百分位数 是大约 6.5 小时。
二、估计第十一个小时后有多少人来了商场:从 11向上画一条垂直线,在这条线与曲线的交叉点在向左画一条水平线,这条线与垂直轴的交差点就是我们相求的人数:
在第 11个小时后,已经有大约 9,500个人来了商场,等于第 95个百分位数。