随机变量
随机变量是一个随机实验结果的可能数值。
例子:抛硬币:结果可以是正面或反面。
我们可以用数值来代表:正面=0 和 反面=1,这就是随机变量 "X":
简单地说:
X = {0, 1}
注意:我们也可以用 正面=100 和 反面=150 或其他数值!这完全是我们的随意选择。
所以:
- 有个实验(比方抛硬币)
- 我们给每个事件分派数值
- 数值的集合是个随机变量
不像代数变量
在代数里,像 x 这样的变量,是个未知数:
例子:x + 2 = 6
我们可以解 x=4
但随机变量是不一样的……
随机变量有个数值集合……
……变量可以随机地取集合里任何的值
例子:X = {0, 1, 2, 3}
X 可以随机地取 0、1、2、或 3。
每个值可以有不同的可能性(概率).
大写字母
我们用大写字母来代表随机变量,像 X 或 Y,以有别于代数变量。
样本空间
随机变量的数值集合是它的 样本空间。
例子:掷一次骰子
随机变量 X = "向上一面的点数"。
X 可以是 1、2、3、4、5 或 6
所以样本空间是 {1, 2, 3, 4, 5, 6}
概率
我们用这个记法来代表任何一个值的概率:
P(X = 值) = 值的概率
例子(续):掷一次骰子
X = {1, 2, 3, 4, 5, 6}
在这例子里,所有值的可能性是一样的,所以每一个的概率都是 1/6
- P(X = 1) = 1/6
- P(X = 2) = 1/6
- P(X = 3) = 1/6
- P(X = 4) = 1/6
- P(X = 5) = 1/6
- P(X = 6) = 1/6
注意概率的和 = 1,这是正确的。
例子:抛 3个硬币会得到几个正面?
X = "正面的个数" 是随机变量。
可以有 0个正面(如果所有硬币都是反面向上)、1个正面、2个正面或3个正面。
所以样本空间 = {0, 1, 2, 3}
但现在结果的概率不再完全是相等的了。
三个硬币可以抛出八个结果:
X = "正面 的个数" |
|||
HHH | 3 | ||
HHT | 2 | ||
HTH | 2 | ||
HTT | 1 | ||
THH | 2 | ||
THT | 1 | ||
TTH | 1 | ||
TTT | 0 |
在列表里我们可以看到只有 1个结果有三个正面,但有 3个结果有两个正面,3个结果有一个正面,和 1个结果没有正面。所以::
- P(X = 3) = 1/8
- P(X = 2) = 3/8
- P(X = 1) = 3/8
- P(X = 0) = 1/8
例子:掷两个骰子
随机变量是 X = "两个骰子点数的和"。
做个列表:
第一个骰子 | |||||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | ||
第二个 骰子 |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
2 | 3 | 4 | 5 | 6 | 7 | 8 | |
3 | 4 | 5 | 6 | 7 | 8 | 9 | |
4 | 5 | 6 | 7 | 8 | 9 | 10 | |
5 | 6 | 7 | 8 | 9 | 10 | 11 | |
6 | 7 | 8 | 9 | 10 | 11 | 12 |
总共有 6 × 6 = 36个结果,样本空间 = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
我们数数每个值出现的次数,然后计算其概率:
- 2 只出现一次,所以 P(X = 2) = 1/36
- 3 出现两次,所以 P(X = 3) = 2/36 = 1/18
- 4 出现三次,所以 P(X = 4) = 3/36 = 1/12
- 5 出现四次,所以 P(X = 5) = 4/36 = 1/9
- 6 出现五次,所以 P(X = 6) = 5/36
- 7 出现六次,所以 P(X = 7) = 6/36 = 1/6
- 8 出现五次,所以 P(X = 8) = 5/36
- 9 出现四次,所以 P(X = 9) = 4/36 = 1/9
- 10 出现三次,所以 P(X = 10) = 3/36 = 1/12
- 11 出现两次,所以 P(X = 11) = 2/36 = 1/18
- 12 出现一次,所以 P(X = 12) = 1/36
一个范围内的值
我们也可以计算随机变量取一个范围内的值的概率。
例子(续) 两个骰子的点数的和是 5、6、7 或 8 的概率是多少?
就是:P(5 ≤ X ≤ 8) 是多少?
P(5 ≤ X ≤ 8) = P(X = 5) + P(X = 6) + P(X = 7) + P(X = 8) = (4+5+6+5)/36 = 20/36 = 5/9
解法
我们也可以解随机变量方程。
例子(续) 如果 P(X = x) = 1/12,x 的值是多少?
P(X = 4) = 1/12,P(X = 10) = 1/12
所以有两个解:x = 4 或 x = 10
注意大写 X 和小写 x 是代表不同的东西:
- X 是随机变量 "两个骰子点数的和"。
- x 是 X 的可能值。
连续
随机变量可以是 离散或连续的:
- 离散数据只能取某些数值(例如 1、2、3、4、5)
- 连续数据可以取一个范围(值域)里的任何数值(例如人的身高)
这个网页的例子都是关于离散数据的。
去阅读 连续随机变量 来了解更多。
平均、方差、标准差
你也可以去学习怎样计算 随机变量的平均、方差和标准差.
总结
- 随机变量是随机实验结果的可能数值的集合。
- 可能数值的集合是它的样本空间。
- 随机变量使用大写字母来代表,例如 X 或 Z。
- 随机变量可以是离散或连续的。