Skip to Content
👋 欢迎来到考研学堂! 了解详情
概率论与数理统计第二章 随机变量及其分布3. 离散型随机变量与连续型随机变量

二、离散型随机变量与连续型随机变量

(一)离散型随机变量

▶1. 离散型随机变量及其概率分布

\(X\) 是一个随机变量,如果 \(X\) 只取有限个或无穷可列个值,则称 \(X\) 为离散型随机变量。

设离散型随机变量 \(X\) 所有可能取的值为 \(x_{i}(i = 1,2,\dots)\)\(X\) 取各个可能值的概率(即事件 \(\{X = x_i\}\) 的概率)\(P\{X = x_i\}\)\(p_i(i = 1,2,\dots)\),则称 \(P\{X = x_i\} = p_i(i = 1,2,\dots)\)\(X\) 的概率分布或分布律。它也可以采用表格的形式表示,即

X\(x_1\)\(x_2\)\(x_n\)
\(p_i\)\(p_1\)\(p_2\)\(p_n\)

\(X\sim \left( \begin{array}{cccc}x_{1} & x_{2} & \dots & x_{n}\\ p_{1} & p_{2} & \dots & p_{n} \end{array} \right)\)

对于两个任意实数 \(a < b\),有

\[P \{a \leqslant X \leqslant b \} = \sum_ {a \leqslant x _ {i} \leqslant b} P \{X = x _ {i} \} = \sum_ {i} p _ {i},\]

其中 \(\sum\) 表示对于满足 \(a \leqslant x_{i} \leqslant b\) 的一切 \(\{X = x_{i}\}\) 发生的概率求和。

2. 离散型随机变量的概率分布的性质

(1) \(p_{i} \geqslant 0, i = 1,2,\dots;\)

(2) \(\sum_{i=1}^{\infty} p_i = 1\)

3. 离散型随机变量 \(X\) 的分布函数

设离散型随机变量 \(X\) 的概率分布为 \(p_i = P\{X = x_i\}\),则 \(X\) 的分布函数为

\[F (x) = P \{X \leqslant x \} = \sum_ {x _ {i} \leqslant x} P \{X = x _ {i} \} (- \infty < x < + \infty),\]

其中 \(\sum\) 表示对于所有满足 \(x_{i} \leqslant x\) 的一切 \(\{X = x_{i}\}\) 发生的概率求和。\(F(x)\)\((- \infty, + \infty)\) 内除 \(X\) 可能取的值 \(x_{i} (i = 1,2,\dots)\) 外,处处是连续的。

(二)连续型随机变量

▶1. 连续型随机变量及其概率密度

设随机变量 \(X\) 的分布函数为 \(F(x)\),如果存在非负可积函数 \(f(x)\),使得对于任意实数 \(x\),均有

\[F (x) = P \{X \leqslant x \} = \int_ {- \infty} ^ {x} f (t) d t, \tag {2.1}\]

则称 \(X\) 为连续型随机变量,函数 \(f(x)\) 称为 \(X\) 的概率密度函数,简称概率密度。

2. 连续型随机变量的概率密度 \(f(x)\) 的性质

(1) \(f(x)\geqslant 0\)
(2) \(\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1\)
(3) 对于任意实数 \(x_{1}, x_{2} (x_{1} \leqslant x_{2})\),有

\[P \left\{x _ {1} < X \leqslant x _ {2} \right\} = F \left(x _ {2}\right) - F \left(x _ {1}\right) = \int_ {x _ {1}} ^ {x _ {2}} f (t) \mathrm {d} t;\]

(4) 若 \(f(x)\) 在点 \(x\) 处连续,则有 \(F'(x) = f(x)\)

此外,任意连续型随机变量 \(X\) 取任何给定值 \(c\) 的概率等于0,即 \(P\{X = c\} = 0\)

【注】

① 性质(1)与(2)是函数 \(f(x)\) 为某一随机变量 \(X\) 的概率密度的充要条件。

② 给定 \(X\) 的概率密度 \(f(x)\) 就能确定 \(F(x)\),由于 \(f(x)\) 位于积分号之内,故改变 \(f(x)\) 在这个区间内有限个点的函数值,并不改变 \(X\) 在该区间内取值的概率。

③ 由于连续型随机变量 \(X\) 的分布函数 \(F(x)\) 必可表示成 \(F(x) = \int_{-\infty}^{x} f(t) \, \mathrm{d}t\),故此时的 \(F(x)\) 一定是 \((- \infty, + \infty)\) 上的连续函数。反之,不能说凡是连续的 \(F(x)\) 对应的 \(X\) 就一定是连续型随机变量。

④ 连续型随机变量 \(X\) 的分布函数 \(F(x)\) 必连续,但密度函数 \(f(x)\) 不一定连续。

例题

【例2.2】

设随机变量 \(X\) 的分布律为

X14610
P2/61/62/61/6

\(X\) 的分布函数 \(F(x)\),并利用分布函数求 \(P\{2 < X \leqslant 6\}, P\{X < 4\}, P\{1 \leqslant X < 5\}\)

【解】 \(X\) 为离散型随机变量,其分布函数为 \(F(x) = \sum_{x_i\leqslant x}P\{X = x_i\} = \sum_{x_i\leqslant x}p_i\),这里和式是对所有满足 \(x_{i}\leqslant x\)\(i\) 求和,本题中仅当 \(x_{i} = 1,4,6,10\) 时概率 \(P\{X = x_i\} \neq 0\),故有

  • \(x < 1\) 时,\(F(x) = P\{X \leqslant x\} = 0\)
  • \(1 \leqslant x < 4\) 时,\(F(x) = P\{X \leqslant x\} = P\{X = 1\} = 2/6\)
  • \(4 \leqslant x < 6\) 时,\(F(x) = P\{X \leqslant x\} = P\{X = 1\} + P\{X = 4\} = 3 / 6\)
  • \(6 \leqslant x < 10\) 时,\(F(x) = P\{X \leqslant x\} = P\{X = 1\} + P\{X = 4\} + P\{X = 6\} = 5 / 6\)
  • \(x \geqslant 10\) 时,\(F(x) = P\{X = 1\} + P\{X = 4\} + P\{X = 6\} + P\{X = 10\} = 1\)

于是

\[F(x) = \left\{ \begin{array}{ll} 0, & x < 1,\\ 1 / 3, & 1\leqslant x < 4,\\ 1 / 2, & 4\leqslant x < 6,\\ 5 / 6, & 6\leqslant x < 10,\\ 1, & x\geqslant 10. \end{array} \right.\] \[P \{2 < X \leqslant 6 \} = F (6) - F (2) = 5 / 6 - 1 / 3 = 1 / 2,\] \[P \{X < 4 \} = F (4) - P \{X = 4 \} = 1 / 2 - 1 / 6 = 1 / 3,\] \[\begin{array}{l} P \{1 \leqslant X < 5 \} = P \{1 < X \leqslant 5 \} + P \{X = 1 \} - P \{X = 5 \} \\ = F (5) - F (1) + 1 / 3 - 0 = 1 / 2 - 1 / 3 + 1 / 3 = 1 / 2. \\ \end{array}\]

评注:在求 \(F(x)\) 时要将区间 \((- \infty, + \infty)\) 分成若干个小区间,然后在各个小区间写出 \(F(x)\),要注意这些小区间除第一个小区间外都是左闭右开的。分布函数应有 \(F(-\infty) = 0, F(+\infty) = 1\),在求出 \(F(x)\) 后,可验证一下,看有没有出错。另外,在使用公式 \(P\{a < X \leq b\} = F(b) - F(a)\) 时,在这里 \(\{\}\) 中的不等式应是左开右闭的。如果 \(\{\}\) 内的不等式不是左开右闭的,应将不等式调整为左开右闭的,然后使用这一公式,如本例所示。

【例2.3】

抛掷一枚匀称的硬币,设随机变量 \(X = \left\{ \begin{array}{ll}0, & \text{出现反面 } T, \\ 1, & \text{出现正面 } H, \end{array} \right.\) 则随机变量 \(X\) 在区间 \(\left(\frac{1}{2}, 2\right]\) 上取值的概率为

【分析】 随机变量 \(X\) 的概率分布为

X01
P1/21/2

因为事件 \(\left\{\frac{1}{2} < X \leqslant 2\right\} = \{X = 1\}\),所以

\[P \left\{\frac {1}{2} < X \leqslant 2 \right\} = P \{X = 1 \} = \frac {1}{2}.\]

【例2.4】

设随机变量 \(X\) 的概率密度为 \(f(x)\),则下列函数中一定可以作为概率密度的是

(A) \(f(2x)\)
(B) \(2f(x)\)
(C) \(|f(-x)|\)
(D) \(f(|x|)\)

【分析】 根据概率密度的充要条件逐一判断。

对于(A):\(\int_{-\infty}^{+\infty}f(2x)\mathrm{d}x = \frac{1}{2}\int_{-\infty}^{+\infty}f(t)\mathrm{d}t = \frac{1}{2}\neq 1\),故(A)不对。

对于(B):\(\int_{-\infty}^{+\infty}2f(x)\mathrm{d}x = 2\int_{-\infty}^{+\infty}f(x)\mathrm{d}x = 2\neq 1\),故(B)不对。

对于(C):\(\left|f(-x)\right| = f(-x)\geqslant 0\),且

\[\int_ {- \infty} ^ {+ \infty} | f (- x) | d x = \int_ {- \infty} ^ {+ \infty} f (- x) d x = - \int_ {+ \infty} ^ {- \infty} f (t) d t = \int_ {- \infty} ^ {+ \infty} f (t) d t = 1,\]

故(C)满足概率密度的充要条件,选(C)。

对于(D) \(\int_{-\infty}^{+\infty} f(|x|) \mathrm{d}x = \int_{-\infty}^{0} f(-x) \mathrm{d}x + \int_{0}^{+\infty} f(x) \mathrm{d}x = -\int_{+\infty}^{0} f(t) \mathrm{d}t + \int_{0}^{+\infty} f(x) \mathrm{d}x = 2\int_{0}^{+\infty} f(x) \mathrm{d}x,\) 由于 \(2\int_{0}^{+\infty} f(x) \mathrm{d}x\) 不一定等于1,故不选。

【例2.5】

设随机变量 \(X\) 的概率密度为 \(f(x) = \left\{ \begin{array}{ll}4Cx, & x\in (0,2),\\ 0, & x\in (0,2), \end{array} \right.\) 试求:

(I)常数 \(C\);(Ⅱ)概率 \(P\left\{\frac{1}{2} < X < 1\right\}\);(Ⅲ)\(X\) 的分布函数。

【解】

(I)由 \(1 = \int_{-\infty}^{+\infty}f(x)\mathrm{d}x = \int_0^2 4Cx\mathrm{d}x = 8C\Rightarrow C = \frac{1}{8}\)

(Ⅱ)\(P\left\{\frac{1}{2} < X < 1\right\} = \int_{\frac{1}{2}}^{1} f(x) \, \mathrm{d}x = \int_{\frac{1}{2}}^{1} \frac{x}{2} \, \mathrm{d}x = \frac{3}{16}\)

(Ⅲ)分布函数 \(F(x) = \int_{-\infty}^{x} f(t) \, \mathrm{d}t\),由于 \(f(x)\) 是分段函数,该积分在不同的区间上被积函数的表达式各不相同,因此积分要分段进行。要注意的是不管 \(x\) 处于哪一个子区间,积分的下限总是”-∞“,积分 \(\int_{-\infty}^{x} f(t) \, \mathrm{d}t\)\((-\infty, x)\) 的各个子区间上的积分相加而得。

  • \(x \leqslant 0\) 时,\(F(x) = \int_{-\infty}^{x} f(t) \, \mathrm{d}t = \int_{-\infty}^{x} 0 \, \mathrm{d}t = 0\)
  • \(0 < x \leqslant 2\) 时,\(F(x) = \int_{-\infty}^{x} f(t) \, \mathrm{d}t = \int_{-\infty}^{0} 0 \, \mathrm{d}t + \int_{0}^{x} \frac{t}{2} \, \mathrm{d}t = \frac{x^2}{4}\)
  • \(x > 2\) 时,\(F(x) = \int_{-\infty}^{x} f(t) \, \mathrm{d}t = \int_{-\infty}^{0} 0 \, \mathrm{d}t + \int_{0}^{2} \frac{t}{2} \, \mathrm{d}t + \int_{2}^{x} 0 \, \mathrm{d}t = 1\)

因此

\[F(x) = \left\{ \begin{array}{ll} 0, & x\leqslant 0,\\ \frac{x^2}{4}, & 0 < x\leqslant 2,\\ 1, & x > 2. \end{array} \right.\]

【例2.6】

设随机变量 \(X\) 的分布函数为

\[F (x) = \left\{ \begin{array}{l l} 0, & x < 0, \\ \frac {x}{2}, & 0 \leqslant x < 1, \\ x - \frac {1}{2}, & 1 \leqslant x < 1. 5, \\ 1, & x \geqslant 1. 5, \end{array} \right.\]

\(P\{0.4 < X \leqslant 1.3\}, P\{X > 0.5\}, P\{1.7 < X \leqslant 2\}\) 以及概率密度 \(f(x)\)

【解】

\(P\{0.4 < X \leqslant 1.3\} = F(1.3) - F(0.4) = (1.3 - 0.5) - \frac{0.4}{2} = 0.6,\)

\[\begin{array}{l} P \{X > 0. 5 \} = 1 - P \{X \leqslant 0. 5 \} = 1 - F (0. 5) = 1 - \frac {0 . 5}{2} = 0. 7 5, \\ P \{1. 7 < X \leqslant 2 \} = F (2) - F (1. 7) = 1 - 1 = 0; \\ f (x) = \left\{ \begin{array}{l l} \frac {1}{2}, & 0 < x < 1, \\ 1, & 1 \leqslant x < 1. 5, \\ 0, & \text {其 他}. \end{array} \right. \\ \end{array}\]

评注

① 这里,\(F(x)\) 是一个分段函数,在求 \(F(x)\) 在某一点处的值时,应注意该点落在哪一个区间,在这区间上 \(F(x)\) 的表达式是什么。

② 由于改变概率密度 \(f(x)\) 在个别点的函数值,不影响分布函数 \(F(x)\) 的取值。因此,概率密度在个别点的函数值可以是随意指定的有限值。例如本题概率密度也可写成

\[f (x) = \left\{ \begin{array}{l l} \frac {1}{2}, & 0 \leqslant x \leqslant 1, \\ 1, & 1 < x \leqslant 1. 5, \\ 0, & \text {其 他}. \end{array} \right.\]

\(f(x)\) 的连续点上才有 \(F^{\prime}(x) = f(x)\)。这里 \(F^{\prime}(1)\) 不存在,而 \(f(1) = \frac{1}{2}\)(它是由我们随意指定的)。


练习题

例题1

设随机变量 (X$ 的分布律为:

\[\begin{array}{c|cccc} X & -1 & 0 & 1 & 2 \\ \hline P & 0.2 & 0.3 & 0.1 & 0.4 \end{array}\]

求: (I)(X\( 的分布函数 \(F(x)\); (II)概率 (P{0 < X \leq 1.5}\( 和 \(P\{X \geq 0\}\)

解答 (I)分布函数 (F(x) = P{X \leq x} = \sum_{x_i \leq x} P{X = x_i}$:

  • 当 (x < -1\( 时,\(F(x) = 0\)
  • 当 (-1 \leq x < 0\( 时,\(F(x) = P\{X = -1\} = 0.2\)
  • 当 (0 \leq x < 1\( 时,\(F(x) = P\{X = -1\} + P\{X = 0\} = 0.5\)
  • 当 (1 \leq x < 2\( 时,\(F(x) = 0.2 + 0.3 + 0.1 = 0.6\)
  • 当 (x \geq 2\( 时,\(F(x) = 1\)

因此,

\[F(x) = \begin{cases} 0, & x < -1, \\ 0.2, & -1 \leq x < 0, \\ 0.5, & 0 \leq x < 1, \\ 0.6, & 1 \leq x < 2, \\ 1, & x \geq 2. \end{cases}\]

(II)计算概率:

  • (P{0 < X \leq 1.5} = F(1.5) - F(0) = 0.6 - 0.5 = 0.1$
  • (P{X \geq 0} = 1 - P{X < 0} = 1 - F(0^-) = 1 - 0.2 = 0.8$

例题2

设随机变量 (X$ 的概率密度函数为:

\[f(x) = \begin{cases} Cx^2, & 0 \leq x \leq 1, \\ 0, & \text{其他}. \end{cases}\]

求: (I)常数 (C\(; (II)概率 \(P\{0.2 \leq X < 0.8\}\); (III)分布函数 (F(x)$。

解答 (I)由概率密度的规范性:

\[\int_{-\infty}^{+\infty} f(x) \, dx = \int_0^1 Cx^2 \, dx = C \cdot \frac{1}{3} = 1 \Rightarrow C = 3.\]

(II)概率计算:

\[P\{0.2 \leq X < 0.8\} = \int_{0.2}^{0.8} 3x^2 \, dx = \left[ x^3 \right]_{0.2}^{0.8} = 0.512 - 0.008 = 0.504.\]

(III)分布函数 (F(x) = \int_{-\infty}^x f(t) , dt$:

  • 当 (x < 0\( 时,\(F(x) = 0\)
  • 当 (0 \leq x < 1\( 时,\(F(x) = \int_0^x 3t^2 \, dt = x^3\)
  • 当 (x \geq 1\( 时,\(F(x) = 1\)

因此,

\[F(x) = \begin{cases} 0, & x < 0, \\ x^3, & 0 \leq x < 1, \\ 1, & x \geq 1. \end{cases}\]

例题3

设随机变量 (X$ 的分布函数为:

\[F(x) = \begin{cases} 0, & x < 0, \\ \frac{x}{3}, & 0 \leq x < 1, \\ \frac{1}{2}, & 1 \leq x < 2, \\ 1, & x \geq 2. \end{cases}\]

求: (I)概率 (P{0.5 < X \leq 1.5}\( 和 \(P\{X > 0.8\}\); (II)概率密度函数 (f(x)$(若存在)。

解答 (I)概率计算:

  • (P{0.5 < X \leq 1.5} = F(1.5) - F(0.5) = \frac{1}{2} - \frac{0.5}{3} = \frac{1}{2} - \frac{1}{6} = \frac{1}{3}$
  • (P{X > 0.8} = 1 - P{X \leq 0.8} = 1 - F(0.8) = 1 - \frac{0.8}{3} = \frac{7}{15}$

(II)概率密度函数 (f(x) = F’(x)$(在连续点):

  • 当 (0 < x < 1\( 时,\(f(x) = \frac{1}{3}\)
  • 当 (1 < x < 2\( 时,\(F(x)\) 为常数,故 (f(x) = 0$
  • 其他点处 (f(x) = 0$

因此,

\[f(x) = \begin{cases} \frac{1}{3}, & 0 < x < 1, \\ 0, & \text{其他}. \end{cases}\]

例题4

判断下列函数是否为概率密度函数,并说明理由: (A)(g(x) = \frac{1}{2} e^{-|x|}\( (B)\(h(x) = \sin x, \quad 0 \leq x \leq \frac{\pi}{2}\)

解答 (A)检查性质:

  1. (g(x) = \frac{1}{2} e^{-|x|} \geq 0$
  2. (\int_{-\infty}^{+\infty} g(x) , dx = \int_{-\infty}^{0} \frac{1}{2} e^{x} , dx + \int_{0}^{+\infty} \frac{1}{2} e^{-x} , dx = \frac{1}{2} + \frac{1}{2} = 1\( 满足概率密度函数的充要条件,故 \(g(x)\) 是概率密度函数。

(B)检查性质:

  1. (h(x) = \sin x \geq 0\( 在 \([0, \frac{\pi}{2}]\)
  2. (\int_{-\infty}^{+\infty} h(x) , dx = \int_0^{\frac{\pi}{2}} \sin x , dx = [-\cos x]_0^{\frac{\pi}{2}} = 1\( 但 \(h(x)\) 在 ((-\infty, 0) \cup (\frac{\pi}{2}, +\infty)$ 上未定义(或为0),且在整个实轴上积分为1,故若补充定义:
\[h(x) = \begin{cases} \sin x, & 0 \leq x \leq \frac{\pi}{2}, \\ 0, & \text{其他}, \end{cases}\]

则 (h(x)$ 是概率密度函数。


例题5

设随机变量 (X$ 的概率密度为:

\[f(x) = \begin{cases} A(1 - x^2), & -1 \leq x \leq 1, \\ 0, & \text{其他}. \end{cases}\]

求: (I)常数 (A\(; (II)分布函数 \(F(x)\); (III)概率 (P{|X| < 0.5}$。

解答 (I)由规范性:

\[\int_{-\infty}^{+\infty} f(x) \, dx = \int_{-1}^1 A(1 - x^2) \, dx = A \left[ x - \frac{x^3}{3} \right]_{-1}^1 = A \cdot \frac{4}{3} = 1 \Rightarrow A = \frac{3}{4}.\]

(II)分布函数 (F(x) = \int_{-\infty}^x f(t) , dt$:

  • 当 (x < -1\( 时,\(F(x) = 0\)
  • 当 (-1 \leq x < 1$ 时, \[F(x) = \int_{-1}^x \frac{3}{4}(1 - t^2) \, dt = \frac{3}{4} \left[ t - \frac{t^3}{3} \right]_{-1}^x = \frac{3}{4} \left( x - \frac{x^3}{3} + \frac{2}{3} \right)\]
  • 当 (x \geq 1\( 时,\(F(x) = 1\)

(III)概率计算:

\[P\{|X| < 0.5\} = P\{-0.5 < X < 0.5\} = F(0.5) - F(-0.5)\]

代入 (F(x)$ 表达式:

\[F(0.5) = \frac{3}{4} \left( 0.5 - \frac{0.125}{3} + \frac{2}{3} \right) = \frac{3}{4} \cdot \frac{11}{12} = \frac{11}{16}\] \[F(-0.5) = \frac{3}{4} \left( -0.5 + \frac{0.125}{3} + \frac{2}{3} \right) = \frac{3}{4} \cdot \frac{5}{12} = \frac{5}{16}\] \[P\{|X| < 0.5\} = \frac{11}{16} - \frac{5}{16} = \frac{6}{16} = \frac{3}{8}\]
Last updated on