Skip to Content
👋 欢迎来到考研学堂! 了解详情

二、统计量

(一)统计量的概念

\(X_{1}, X_{2}, \cdots, X_{n}\) 是来自总体 \(X\) 的一个样本,\(g(X_{1}, X_{2}, \cdots, X_{n})\)\(X_{1}, X_{2}, \cdots, X_{n}\) 的函数,若 \(g\) 中不含有任何未知参数,则称 \(g(X_{1}, X_{2}, \cdots, X_{n})\) 为样本 \((X_{1}, X_{2}, \cdots, X_{n})\) 的一个统计量。设 \(x_{1}, x_{2}, \cdots, x_{n}\) 是相应于样本 \(X_{1}, X_{2}, \cdots, X_{n}\) 的样本值,则称 \(g(x_{1}, x_{2}, \cdots, x_{n})\)\(g(X_{1}, X_{2}, \cdots, X_{n})\) 的观测值。

统计量是样本 \((X_{1},X_{2},\dots ,X_{n})\) 的函数:\(T = f(X_1,X_2,\dots ,X_n)\)。统计量不依赖于任何未知参数。作为随机样本的函数,统计量也是随机变量。样本的数字特征是最常用的统计量。

(二)常用统计量(样本矩)

\(X_{1}, X_{2}, \dots, X_{n}\) 是来自总体 \(X\) 的简单随机样本,则

  1. 样本均值 \(\overline{X} = \frac{1}{n}\sum_{i = 1}^{n}X_{i};\)
  2. 样本方差 \(S^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}(X_{i} - \overline{X})^{2} = \frac{1}{n - 1}\left(\sum_{i = 1}^{n}X_{i}^{2} - n\overline{X}^{2}\right);\) 样本标准差 \(S = \sqrt{\frac{1}{n - 1}\sum_{i = 1}^{n}(X_i - \overline{X})^2}.\)

【注】如果总体 \(X\)(不管服从什么分布,只要其均值和方差存在)具有数学期望 \(E(X) = \mu\) 和方差 \(D(X) = \sigma^2\),则总有

\[E (\bar {X}) = E (X) = \mu , \quad D (\bar {X}) = \frac {D (X)}{n} = \frac {\sigma^ {2}}{n}, \quad E (S ^ {2}) = D (X) = \sigma^ {2}.\]
  1. 样本 \(k\) 阶原点矩 \(A_{k} = \frac{1}{n}\sum_{i = 1}^{n}X_{i}^{k}, k = 1,2,\dots ;\)
  2. 样本 \(k\) 阶中心矩 \(B_{k} = \frac{1}{n}\sum_{i = 1}^{n}(X_{i} - \overline{X})^{k}, k = 2,3,\dots .\)

【注】

\(B _ { 2 } = \frac { n - 1 } { n } S ^ { 2 } < S ^ { 2 }\)

② 如果总体 \(X\)\(k\) 阶原点矩 \(\pmb{E}(\pmb{X}^k) = \mu_k (k = 1, 2, \dots)\) 存在,则当 \(n \to \infty\) 时,有

\[A _ {k} = \frac {1}{n} \sum_ {i = 1} ^ {n} X _ {i} ^ {k} \xrightarrow {P} \mu_ {k}, k = 1, 2, \dots .\]

练习题

例题1

设 ( X_1, X_2, \dots, X_n \(是来自总体 \( X\) 的简单随机样本,总体 ( X \(的数学期望 \( E(X) = \mu\) 和方差 ( D(X) = \sigma^2 \(存在。定义样本均值 \( \overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i\) 和样本方差 ( S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2 $。证明:

  1. ( E(\overline{X}) = \mu $
  2. ( D(\overline{X}) = \frac{\sigma^2}{n} $
  3. ( E(S^2) = \sigma^2 $

题目解答

  1. 由于 ( X_1, X_2, \dots, X_n \(独立同分布,且 \( E(X_i) = \mu\),有: \[E(\overline{X}) = E\left( \frac{1}{n} \sum_{i=1}^{n} X_i \right) = \frac{1}{n} \sum_{i=1}^{n} E(X_i) = \frac{1}{n} \cdot n \mu = \mu.\]
  2. 由于 ( D(X_i) = \sigma^2 $ 且样本独立,有: \[D(\overline{X}) = D\left( \frac{1}{n} \sum_{i=1}^{n} X_i \right) = \frac{1}{n^2} \sum_{i=1}^{n} D(X_i) = \frac{1}{n^2} \cdot n \sigma^2 = \frac{\sigma^2}{n}.\]
  3. 利用样本方差的定义和性质: \[E(S^2) = E\left( \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2 \right).\] 已知 ( \sum_{i=1}^{n} (X_i - \overline{X})^2 = \sum_{i=1}^{n} X_i^2 - n\overline{X}^2 \(,且 \( E\left( \sum_{i=1}^{n} X_i^2 \right) = n(\sigma^2 + \mu^2) \),( E(n\overline{X}^2) = n\left( \frac{\sigma^2}{n} + \mu^2 \right) = \sigma^2 + n\mu^2 $。因此: \[E\left( \sum_{i=1}^{n} (X_i - \overline{X})^2 \right) = n(\sigma^2 + \mu^2) - (\sigma^2 + n\mu^2) = (n-1)\sigma^2,\] 所以: \[E(S^2) = \frac{1}{n-1} \cdot (n-1)\sigma^2 = \sigma^2.\]

例题2

设 ( X_1, X_2, \dots, X_n \(是来自总体 \( X\) 的简单随机样本,定义样本 ( k \(阶原点矩 \( A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k\) 和样本 ( k \(阶中心矩 \( B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \overline{X})^k\)。已知总体 ( X \(的 \( k\) 阶原点矩 ( E(X^k) = \mu_k $ 存在。

  1. 证明当 ( n \to \infty \(时,\( A_k \xrightarrow{P} \mu_k\)
  2. 若 ( k = 2 \(,证明 \( B_2 = \frac{n-1}{n} S^2 \),其中 ( S^2 $ 是样本方差。

题目解答

  1. 由大数定律,由于 ( X_1^k, X_2^k, \dots, X_n^k \(独立同分布,且 \( E(X_i^k) = \mu_k\),则样本均值 ( A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k $ 满足: \[A_k \xrightarrow{P} \mu_k \quad \text{当 } n \to \infty.\]
  2. 对于 ( k = 2 $,样本二阶中心矩为: \[B_2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \overline{X})^2.\] 而样本方差 ( S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2 $,因此: \[B_2 = \frac{n-1}{n} \cdot \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2 = \frac{n-1}{n} S^2.\]

例题3

设 ( X_1, X_2, X_3 \(是来自总体 \( X\) 的简单随机样本,总体 ( X \(服从参数为 \( \lambda\) 的泊松分布,即 ( X \sim P(\lambda) \(。定义统计量 \( T_1 = X_1 + X_2 \),( T_2 = \frac{X_1 + X_2 + X_3}{3} \(,和 \( T_3 = \frac{1}{2} \sum_{i=1}^{3} (X_i - \overline{X})^2 \),其中 ( \overline{X} = \frac{1}{3} \sum_{i=1}^{3} X_i $。

  1. 判断 ( T_1, T_2, T_3 $ 是否为统计量,并说明理由。
  2. 若 ( \lambda = 2 \(,计算 \( E(T_2) \) 和 ( D(T_2) $。

题目解答

    • ( T_1 = X_1 + X_2 \(是样本的函数,且不依赖未知参数 \( \lambda\),因此是统计量。
    • ( T_2 = \frac{X_1 + X_2 + X_3}{3} $ 是样本均值的函数,不依赖未知参数,是统计量。
    • ( T_3 = \frac{1}{2} \sum_{i=1}^{3} (X_i - \overline{X})^2 \(是样本方差的函数(注意分母为 \( n-1 = 2\)),不依赖未知参数,是统计量。
  1. 由于 ( X \sim P(\lambda) \(,有 \( E(X) = \lambda \),( D(X) = \lambda \(。当 \( \lambda = 2 \) 时:
    • ( E(T_2) = E(\overline{X}) = E(X) = 2 $。
    • ( D(T_2) = D(\overline{X}) = \frac{D(X)}{n} = \frac{2}{3} $。

例题4

设 ( X_1, X_2, \dots, X_n \(是来自总体 \( X\) 的简单随机样本,总体 ( X \(的分布未知,但 \( E(X) = \mu\) 和 ( D(X) = \sigma^2 \(存在。定义样本均值 \( \overline{X}\) 和样本标准差 ( S = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2} $。

  1. 证明 ( E(\overline{X}) = \mu \(和 \( D(\overline{X}) = \frac{\sigma^2}{n}\)
  2. 若 ( n = 4 \(,且样本观测值为 \( 1, 3, 5, 7 \),计算 ( \overline{x} \(和 \( s^2\)(样本方差的观测值)。

题目解答

  1. 同例题1的证明。
  2. 样本观测值:( x_1 = 1, x_2 = 3, x_3 = 5, x_4 = 7 $。
    • 样本均值观测值:( \overline{x} = \frac{1 + 3 + 5 + 7}{4} = 4 $。
    • 样本方差观测值:( s^2 = \frac{1}{4-1} \left( (1-4)^2 + (3-4)^2 + (5-4)^2 + (7-4)^2 \right) = \frac{1}{3} (9 + 1 + 1 + 9) = \frac{20}{3} \approx 6.667 $。
Last updated on