Skip to Content
👋 欢迎来到考研学堂! 了解详情

二、假设检验

(一)假设检验的基本概念和原理

1. 假设检验的基本概念

(1)假设检验问题:在总体的分布函数完全未知,或只知其形式但不知其参数的情况,提出某些关于总体分布函数或关于其参数的假设,然后抽取样本,构造合适的统计量,再根据样本对所提的假设作出是接受还是拒绝的决策,这样的问题称为假设检验问题。

(2)检验法:借助于样本值来判断接受假设或拒绝假设的法则,称为检验法。

(3)原假设和备择假设:称需要着重考察的假设为原假设,原假设常记为 \(H_{0}\);与原假设相对立的假设称为备择假设或对立假设,备择假设常记为 \(H_{1}\)

(4)检验统计量:如果基于某一个统计量的观测值来确定接受 \(H_{0}\) 或拒绝 \(H_{0}\) 时,这一统计量称为检验统计量。

(5)拒绝域和临界点:当检验统计量的观测值落在某个区域时就拒绝 \(H_0\),这一区域称为拒绝域,拒绝域的边界点称为临界点。

(6)假设检验的两类错误\(H_{0}\) 实际上为真时,而拒绝 \(H_{0}\),这类”弃真”的错误称为第 I 类错误。\(H_{0}\) 实际上为假时,而接受 \(H_{0}\),这类”取伪”的错误称为第 II 类错误。

(7)显著性水平\(\alpha\) 是一个小的正数,在作检验时要求犯第 I 类错误的概率 \(\leqslant \alpha\)\(\alpha\) 称为检验的显著性水平。\(\alpha\) 通常取 \(0.1, 0.05, 0.01, 0.005\) 等值。

(8)显著性检验:对于给定的样本容量,只控制犯第 I 类错误的概率,而不考虑犯第 II 类错误的概率的检验法,称为显著性检验。

(二)假设检验的基本思想与原理

假设尽管有种种不同的形式,但对这些假设进行检验的基本思想都是相同的,即都是采用某种带有概率性质的反证法。依据是小概率原理:认为小概率事件在一次试验或观察中实际上不会发生,若在一次试验中发生了,就认为”不合理”。“小概率”的值通常根据实际问题的要求,规定一个可以接受的充分小的数 \(\alpha (0 < \alpha < 1)\),当一个事件的概率不大于 \(\alpha\) 时,即认为它是小概率事件,这里 \(\alpha\) 为显著性水平。

(三)假设检验的一般步骤

(1)提出所要检验的原假设 \(H_0\) 与备择假设 \(H_{1}\)
(2)选择检验的统计量,并在 \(H_0\) 成立下求出它的分布
(3)给定显著性水平 \(\alpha\),在 \(H_0\) 成立下确定临界值和否定域
(4)由样本值计算统计量的值,并判断该值是否落入否定域,从而对假设 \(H_0\) 作出拒绝还是接受的判断。若该值落入否定域,则拒绝 \(H_0\),否则接受 \(H_0\),认为 \(H_0\) 是相容的。

【例7.6】设一批零件的长度服从正态分布 \(N(\mu, \sigma^2)\),其中 \(\sigma^2\) 已知,\(\mu\) 未知。现从中随机抽取 \(n\) 个零件,测得样本均值 \(\bar{x}\),则当置信度为0.90时,判断 \(\mu\) 是否大于 \(\mu_0\) 的接受条件为

\[\left(u_{\alpha} \text{满足} \int_{-\infty}^{u_{\alpha}} \frac{1}{\sqrt{2\pi}} \mathrm{e}^{-\frac{t^{2}}{2}} \mathrm{d}t = 1 - \alpha\right)\]

(A) \(\bar{x} > \mu_0 - \frac{\sigma}{\sqrt{n}} u_{0.10}\)
(B) \(\bar{x} > \mu_0 + \frac{\sigma}{\sqrt{n}} u_{0.05}\)
(C) \(\bar{x} > \mu_0 + \frac{\sigma}{\sqrt{n}} u_{0.10}\)
(D) \(\bar{x} > \mu_0 - \frac{\sigma}{\sqrt{n}} u_{0.05}\)

【分析】本题假设检验的假设应为 \(H_0: \mu \leqslant \mu_0\)\(H_1: \mu > \mu_0\)

统计量为 \(\frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\),单侧检验。由于 \(\int_{-\infty}^{u_*} \frac{1}{\sqrt{2\pi}} \mathrm{e}^{-\frac{t^2}{2}} \mathrm{d}t = 1 - \alpha\),故拒绝域为

\[\bar{X} > \mu_{0} + \frac{\sigma}{\sqrt{n}} u_{0.10}.\]

因此选(C)。

【例7.7】已知总体 \(X\) 的概率密度只有两种可能,设

\[H_{0}: f(x) = \left\{ \begin{array}{ll} \frac{1}{2}, & 0 \leqslant x \leqslant 2, \\ 0, & \text{其他}, \end{array} \right. H_{1}: f(x) = \left\{ \begin{array}{ll} \frac{x}{2}, & 0 \leqslant x \leqslant 2, \\ 0, & \text{其他}, \end{array} \right.\]

\(X\) 进行一次观测,得样本 \(X_{1}\),规定当 \(X_{1} \geqslant \frac{3}{2}\) 时拒绝 \(H_{0}\),否则就接受 \(H_{0}\),则此检验犯第一、二类错误的概率 \(\alpha\)\(\beta\) 分别为

【分析】由检验的两类错误概率 \(\alpha\)\(\beta\) 的意义,知

\[\alpha = P \left\{X_{1} \geqslant \frac{3}{2} \mid H_{0} \right\} = \int_{\frac{3}{2}}^{2} \frac{1}{2} \mathrm{d}x = \frac{1}{4},\] \[\beta = P \left\{X_{1} < \frac{3}{2} \mid H_{1} \right\} = \int_{0}^{\frac{3}{2}} \frac{x}{2} \mathrm{d}x = \frac{9}{16}.\]

(四)正态总体均值、方差的假设检验

正态总体假设检验分为一个正态总体与两个正态总体的假设检验问题。即在总体 \(X\) 服从正态分布 \(N(\mu, \sigma^2)\) 的条件下,关于期望 \(\mu\) 与方差 \(\sigma^2\) 的种种假设检验问题;两个相互独立正态总体 \(X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2)\),关于期望 \(\mu_1\)\(\mu_2\),方差 \(\sigma_1^2\)\(\sigma_2^2\) 的种种假设检验问题。虽然检验问题不同,然而它们都是按照检验基本思想与步骤进行的,其关键是检验统计量的选取与否定域的确定。

对于正态总体均值和方差的检验,选取检验统计量时都是考虑相应的样本均值和方差,根据正态总体样本均值与方差的分布不难推出这些统计量的分布,进而求得否定域。只要理解检验的统计思想就不难推导出教材中的各种检验否定域,千万不要死记硬背。

【例7.8】已知正态总体 \(X \sim N(a, \sigma_x^2)\)\(Y \sim N(b, \sigma_y^2)\) 相互独立,其中4个分布参数都未知。设 \(X_1, X_2, \dots, X_m\)\(Y_1, Y_2, \dots, Y_n\) 是分别来自 \(X\)\(Y\) 的简单随机样本,样本均值分别为 \(\overline{X}\)\(\overline{Y}\),样本方差相应为 \(S_x^2\)\(S_y^2\),则检验假设 \(H_0: a \leq b\) 使用 \(t\) 检验的前提条件是

(A) \(\sigma_{x}^{2}\leqslant \sigma_{y}^{2}\)
(B) \(S_{x}^{2}\leqslant S_{y}^{2}\)
(C) \(\sigma_x^2 = \sigma_y^2\)
(D) \(S_x^2 = S_y^2\)

【分析】应该选(C)。因为 \(t\) 检验使用统计量

\[t = \frac{\bar{X} - \bar{Y}}{S_{xy}} \sqrt{\frac{mn}{m + n}},\]

其中 \(S_{xy}^{2}\) 是两个总体的联合样本方差:

\[S_{xy}^{2} = \frac{(m - 1) S_{x}^{2} + (n - 1) S_{y}^{2}}{m + n - 2}.\]

只有当选项(C)即 \(\sigma_x^2 = \sigma_y^2\) 成立时才能导出统计量 \(t\) 的抽样分布——\(t\) 分布,并且根据 \(t\) 分布来构造 \(t\) 检验。

考题型及其解题方法与技巧

题型一 点估计的无偏性与有效性

【例7.9】设总体 \(X \sim N(0, \sigma^2)\),参数 \(\sigma > 0\) 未知,\(X_1, X_2, \dots, X_n\) 是取自总体 \(X\) 的简单随机样本(\(n > 1\)),令估计量

\[\hat{\sigma}_{1}^{2} = S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} \left(X_{i} - \bar{X}\right)^{2}, \quad \hat{\sigma}_{2}^{2} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}^{2},\]

(I)验证 \(\hat{\sigma}_{1}^{2}\)\(\hat{\sigma}_{2}^{2}\) 的无偏性;(II)比较 \(\hat{\sigma}_{1}^{2}\)\(\hat{\sigma}_{2}^{2}\) 的有效性。

【解】(I)由于 \(X_{1}, X_{2}, \dots, X_{n}\) 相互独立且与总体 \(X\) 同分布,故

\[E X_{i} = 0, \quad D X_{i} = \sigma^{2}, \quad E X_{i}^{2} = \sigma^{2}, \quad E \bar{X} = 0, \quad E \bar{X}^{2} = D \bar{X} = \frac{\sigma^{2}}{n},\] \[E \hat{\sigma}_{1}^{2} = E S^{2} = \frac{1}{n - 1} E \sum_{i = 1}^{n} \left(X_{i} - \bar{X}\right)^{2} = \frac{1}{n - 1} E \left(\sum_{i = 1}^{n} X_{i}^{2} - n \bar{X}^{2}\right)\] \[= \frac{1}{n - 1} \left(\sum_{i = 1}^{n} E X_{i}^{2} - n E \bar{X}^{2}\right) = \frac{1}{n - 1} \left(n \sigma^{2} - n \cdot \frac{\sigma^{2}}{n}\right) = \sigma^{2},\] \[E \hat{\sigma}_{2}^{2} = E \left(\frac{1}{n} \sum_{i = 1}^{n} X_{i}^{2}\right) = \frac{1}{n} \sum_{i = 1}^{n} E X_{i}^{2} = \sigma^{2}.\]

(Ⅱ)根据抽样分布有关结论知

\[\frac{1}{\sigma^{2}} \sum_{i = 1}^{n} \left(X_{i} - \bar{X}\right)^{2} = \frac{(n - 1) S^{2}}{\sigma^{2}} \sim \chi^{2} (n - 1),\] \[\frac{X_{i}}{\sigma} \sim N(0, 1), \quad \frac{1}{\sigma^{2}} \sum_{i = 1}^{n} X_{i}^{2} \sim \chi^{2} (n).\]

再由 \(\chi^2\) 分布随机变量的方差公式有:\(Y\sim \chi^2 (n)\),则 \(D Y = 2n\)

所以 \(D\hat{\sigma}_{1}^{2} = DS^{2} = D\left(\frac{\sigma^{2}}{n - 1}\cdot \frac{n - 1}{\sigma^{2}} S^{2}\right) = \frac{\sigma^{4}}{(n - 1)^{2}} D\left(\frac{n - 1}{\sigma^{2}} S^{2}\right) = \frac{\sigma^{4}}{(n - 1)^{2}}\cdot 2(n - 1) = \frac{2\sigma^{4}}{n - 1},\)

\[D \hat{\sigma}_{2}^{2} = D \left(\frac{1}{n} \sum_{i = 1}^{n} X_{i}^{2}\right) = D \left(\frac{\sigma^{2}}{n} \cdot \frac{1}{\sigma^{2}} \sum_{i = 1}^{n} X_{i}^{2}\right) = \frac{\sigma^{4}}{n^{2}} D \left(\frac{1}{\sigma^{2}} \sum_{i = 1}^{n} X_{i}^{2}\right) = \frac{\sigma^{4}}{n^{2}} \cdot 2n = \frac{2\sigma^{4}}{n}.\]

计算可知 \(D\hat{\sigma}_{2}^{2} < D\hat{\sigma}_{1}^{2}\),因此 \(\hat{\sigma}_{2}^{2}\)\(\hat{\sigma}_{1}^{2}\) 有效。

【例7.10】已知总体 \(X\) 服从参数为 \(\lambda\) 的泊松分布,\(X_{1},\dots ,X_{n}\) 是取自总体 \(X\) 的简单随机样本,其均值为 \(\overline{X}\),方差为 \(S^2\),如果 \(\hat{\lambda} = a\overline{X} + (2 - 3a)S^2\)\(\lambda\) 的无偏估计,则 \(a =\) ________。

【分析】直接由 \(E\hat{\lambda} = \lambda\)\(a\)。依题意 \(EX = DX = \lambda\),故 \(E\overline{X} = \lambda ,ES^2 = DX = \lambda ,E\hat{\lambda} = aE\overline{X} +(2 - 3a)ES^2 = a\lambda +(2 - 3a)\lambda = (2 - 2a)\lambda = \lambda\),解得 \(a = \frac{1}{2}\)

【例7.11】已知总体 \(X\) 服从正态分布 \(N(\mu, \sigma^2), X_1, \dots, X_{2n}\) 是来自总体 \(X\) 容量为 \(2n\) 的简单随机样本,当 \(\sigma^2\) 未知时,\(Y = C\sum_{i=1}^{n}(X_{2i} - X_{2i-1})^2\)\(\sigma^2\) 无偏估计,则 \(C = \_\)\(DY = \_\)

【分析】通过 \(EY = \sigma^2\) 求得 \(C\),为此需先求得 \(X_{2i} - X_{2i-1}\) 分布。由于 \(X_i \sim N(\mu, \sigma^2)\),且相互独立,故 \(X_{2i} - X_{2i-1} \sim N(0, 2\sigma^2)\)\(E(X_{2i} - X_{2i-1})^2 = D(X_{2i} - X_{2i-1}) + [E(X_{2i} - X_{2i-1})]^2 = 2\sigma^2\)

所以由 \(EY = C\sum_{i=1}^{n}E(X_{2i} - X_{2i-1})^2 = Cn2\sigma^2 = \sigma^2\),解得 \(C = \frac{1}{2n}\)

\(\frac{X_{2i} - X_{2i-1}}{\sqrt{2}\sigma} \sim N(0,1)\) 且相互独立,故 \(W = \sum_{i=1}^{n}\left(\frac{X_{2i} - X_{2i-1}}{\sqrt{2}\sigma}\right)^{2} \sim \chi^{2}(n)\)

\[Y = C \cdot 2 \sigma^{2} \cdot \sum_{i = 1}^{n} \left(\frac{X_{2i} - X_{2i - 1}}{\sqrt{2} \sigma}\right)^{2} = 2 C \sigma^{2} W, \quad D W = 2n,\]

所以 \(D Y = 4 C^{2} \cdot \sigma^{4} D W = 4 \cdot \frac{1}{4 n^{2}} \cdot \sigma^{4} \cdot 2 n = \frac{2}{n} \sigma^{4}\)

题型二 矩估计与最大似然估计

【例7.12】已知总体 \(X\) 服从参数为 \(p(0 < p < 1)\) 的几何分布:\(P\{X = x\} = (1 - p)^{x - 1}p(x = 1, 2,\dots), X_1,\dots,X_n\) 是来自总体 \(X\) 的简单随机样本,则未知参数 \(p\) 的矩估计量为________;最大似然估计量为________。

【分析】由几何分布的期望公式即得

\[\mu \triangleq E X = \frac{1}{p},\]

则由上式解得 \(p\) 的矩估计量 \(\hat{p} = \frac{1}{\overline{X}}\) 其中 $\bar{X} = \frac{1}{n}\


练习题

例题1

题目内容
设总体 (X \sim N(\mu, \sigma^2)\(,其中 \(\sigma^2 = 4\) 已知。现从中随机抽取容量为 (n = 16\( 的样本,测得样本均值 \(\bar{x} = 5.2\)。在显著性水平 (\alpha = 0.05\( 下,检验假设 \(H_0: \mu \leq 4.5\) 对 (H_1: \mu > 4.5\(。 (1) 写出检验统计量及其分布。 (2) 确定拒绝域。 (3) 根据样本值判断是否拒绝 \(H_0\)

题目解答
(1) 检验统计量为 (Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}\(,其中 \(\mu_0 = 4.5\)。在 (H_0\( 成立下,\(Z \sim N(0, 1)\)
(2) 对于右侧检验,拒绝域为 (Z > z_\alpha\(。由 \(\alpha = 0.05\),查表得 (z_{0.05} = 1.645\(,故拒绝域为 \(Z > 1.645\)
(3) 计算统计量值:

\[Z = \frac{5.2 - 4.5}{2 / \sqrt{16}} = \frac{0.7}{0.5} = 1.4.\]

由于 (1.4 < 1.645\(,未落入拒绝域,故接受 \(H_0\),认为 (\mu \leq 4.5$。


例题2

题目内容
已知总体 (X$ 的概率密度为:

\[f(x) = \begin{cases} \frac{1}{2}, & 0 \leq x \leq 2, \\ 0, & \text{其他}, \end{cases} \quad \text{或} \quad f(x) = \begin{cases} \frac{x}{2}, & 0 \leq x \leq 2, \\ 0, & \text{其他}. \end{cases}\]

对 (X\( 进行一次观测,得样本 \(X_1\),规定当 (X_1 \geq 1.5\( 时拒绝 \(H_0\)(即 (f(x) = \frac{1}{2}\(),否则接受 \(H_0\)。求此检验犯第一类错误和第二类错误的概率 (\alpha\( 和 \(\beta\)

题目解答

  • 第一类错误概率 (\alpha = P(\text{拒绝 } H_0 \mid H_0 \text{ 为真}) = P(X_1 \geq 1.5 \mid H_0)$:
\[\alpha = \int_{1.5}^{2} \frac{1}{2} \, dx = \frac{1}{2} \times (2 - 1.5) = \frac{1}{4}.\]
  • 第二类错误概率 (\beta = P(\text{接受 } H_0 \mid H_1 \text{ 为真}) = P(X_1 < 1.5 \mid H_1)$:
\[\beta = \int_{0}^{1.5} \frac{x}{2} \, dx = \frac{1}{2} \cdot \frac{x^2}{2} \Big|_{0}^{1.5} = \frac{1}{4} \times (2.25) = \frac{9}{16}.\]

因此,(\alpha = 0.25\(,\(\beta = 0.5625\).


例题3

题目内容
设总体 (X \sim N(\mu, \sigma^2)\(,\(\mu\) 未知,(\sigma^2\( 未知。现有样本 \(X_1, X_2, \dots, X_n\),样本均值为 (\bar{X}\(,样本方差为 \(S^2\)。在显著性水平 (\alpha = 0.05\( 下,检验假设 \(H_0: \mu = \mu_0\) 对 (H_1: \mu \neq \mu_0\(。 (1) 写出检验统计量及其分布。 (2) 若 \(n = 25\),(\bar{x} = 10.5\(,\(s^2 = 4\),(\mu_0 = 10\(,判断是否拒绝 \(H_0\)

题目解答
(1) 检验统计量为 (T = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}\(,在 \(H_0\) 成立下,(T \sim t(n-1)$。
(2) 计算统计量值:

\[T = \frac{10.5 - 10}{2 / \sqrt{25}} = \frac{0.5}{0.4} = 1.25.\]

查 (t\( 分布表,\(t_{0.025}(24) = 2.064\)。拒绝域为 (|T| > 2.064\(。 由于 \(|1.25| < 2.064\),未落入拒绝域,故接受 (H_0\(,认为 \(\mu = 10\)


例题4

题目内容
设总体 (X\( 服从参数为 \(\lambda\) 的指数分布,概率密度为 (f(x; \lambda) = \lambda e^{-\lambda x}\((\(x > 0\))。样本 (X_1, X_2, \dots, X_n\( 来自总体 \(X\)
(1) 求 (\lambda\( 的矩估计量 \(\hat{\lambda}_1\)
(2) 求 (\lambda\( 的最大似然估计量 \(\hat{\lambda}_2\)

题目解答
(1) 矩估计:由 (EX = \frac{1}{\lambda}\(,令 \(\bar{X} = \frac{1}{\lambda}\),解得 (\hat{\lambda}_1 = \frac{1}{\bar{X}}$。
(2) 最大似然估计:似然函数为

\[L(\lambda) = \prod_{i=1}^n \lambda e^{-\lambda x_i} = \lambda^n e^{-\lambda \sum x_i}.\]

取对数:

\[\ln L = n \ln \lambda - \lambda \sum x_i.\]

求导并令为零:

\[\frac{d \ln L}{d \lambda} = \frac{n}{\lambda} - \sum x_i = 0 \implies \hat{\lambda}_2 = \frac{n}{\sum x_i} = \frac{1}{\bar{X}}.\]

因此,(\hat{\lambda}_1 = \hat{\lambda}_2 = \frac{1}{\bar{X}}$。


例题5

题目内容
设总体 (X \sim N(\mu, \sigma^2)\(,\(\mu\) 未知,(\sigma^2\( 未知。样本 \(X_1, X_2, \dots, X_n\) 的均值为 (\bar{X}\(,方差为 \(S^2\)。求 (P(X \geq a)\( 的最大似然估计,其中 \(a\) 为已知常数。

题目解答
由最大似然估计的不变性,(\mu\( 和 \(\sigma^2\) 的 MLE 为 (\hat{\mu} = \bar{X}\(,\(\hat{\sigma}^2 = \frac{1}{n} \sum (X_i - \bar{X})^2\)

\[P(X \geq a) = 1 - \Phi\left( \frac{a - \mu}{\sigma} \right).\]

因此,(P(X \geq a)$ 的 MLE 为:

\[\hat{P} = 1 - \Phi\left( \frac{a - \bar{X}}{\hat{\sigma}} \right).\]
Last updated on