跳转至

7 章 参数估计

2665 个字 预计阅读时间 13 分钟

核心知识
  • 点估计

    • 矩法:一般情况下用一阶、二阶的原点矩就能求出来了
    • 极大似然法
      • 离散 / 连续
      • 似然函数、似然方程
      • 转化成对数似然函数求解
      • 极大似然函数的不变性
  • 估计量的评估准则:无偏(期望、有效(方差、均方误差、相合(依概率收敛)

  • 区间估计
    • 置信区间
      • 双侧置信区间
      • 单侧置信上 / 下限
    • 枢轴量法:记住它与置信区间的关系
    • ⭐正态总体的区间估计:六大情况

点估计⚓︎

设总体 XX 的分布函数为 F(x;θ)F(x; \theta)θ\theta 是待估参数,X1,X2,,XnX_1, X_2, \dots, X_n XX 的一个样本。点估计问题就是要构造一个适当的统计量 θ^(X1,X2,,Xn)\hat{\theta}(X_1, X_2, \dots, X_n),用来估计参数 θ\theta

  • 此时称 θ^(X1,X2,,Xn)\hat{\theta}(X_1, X_2, \dots, X_n) θ\theta (点)估计量
  • 若用样本值 x1,x2,,xnx_1, x_2, \dots, x_n 代替样本,称 θ^(x1,x2,,xn)\hat{\theta}(x_1, x_2, \dots, x_n) θ\theta 估计值
  • 估计量和估计值统称为估计,简记为 θ^\hat{\theta}

两种常用的点估计方法:矩法、极大似然法。

矩法⚓︎

当样本容量 n+n \rightarrow +\infty 时,样本矩依概率收敛于相应的总体矩,即:

AkPμk,BkPvk A_k \stackrel{P}{\longrightarrow} \mu_k, \quad B_k \stackrel{P}{\longrightarrow} v_k

其中 Ak,BkA_k, B_k 分别为样本的 kk 阶原点矩和 kk 阶中心矩,μk,vk\mu_k, v_k 分别为总体的 kk 阶原点矩和 kk 阶中心矩。因此,矩法的统计思想是:用样本矩(的函数)作为相应总体矩(同一函数)的估计

基本步骤如下:

θ1,θ2,,θm\theta_1, \theta_2, \dots, \theta_m 是总体 XX 的待估参数,并假定 XX 的前 m(m1)m(m \ge 1) 阶矩存在。

  1. 求总体 XX 的前 mm 阶矩(不妨设为原点矩)μ1,μ2,,μm\mu_1, \mu_2, \dots, \mu_m,一般地,这些矩可以写成待估参数 θ1,θ2,,θm\theta_1, \theta_2, \dots, \theta_m 的函数形式,记为:

    {μ1=E(X)=g1(θ1,θ2,,θm),μ2=E(X2)=g2(θ1,θ2,,θm),μm=E(Xm)=gm(θ1,θ2,,θm), \begin{cases} \mu_1 = E(X) = g_1(\theta_1, \theta_2, \dots, \theta_m), \\ \mu_2 = E(X^2) = g_2(\theta_1, \theta_2, \dots, \theta_m), \\ \dots \\ \mu_m = E(X^m) = g_m(\theta_1, \theta_2, \dots, \theta_m), \\ \end{cases}
  2. 由上面的方程组,可求出各参数关于前 mm 阶矩 μ1,μ2,,μm\mu_1, \mu_2, \dots, \mu_m 的函数表达式:

    θk=hk(μ1,μ2,,μm),k=1,2,,m \theta_k = h_k(\mu_1, \mu_2, \dots, \mu_m), k = 1, 2, \dots, m
  3. 根据矩法思想,以 AiA_i 代替 μi,i=1,2,,m\mu_i, i = 1, 2, \dots, m,即可得各参数的估计量为:

    θk^=hk(A1,A2,,Am),k=1,2,,m \widehat{\theta_k} = h_k(A_1, A_2, \dots, A_m), k = 1, 2, \dots, m

    θk^\widehat{\theta_k} 为参数 θk\theta_k 矩估计量k=1,2,,mk = 1, 2, \dots, m

  • 就个人的做题经验而言,大多数情况下待估参数只有一个,因此只需根据一阶原点矩,即期望列方程即可
  • 在上面的不等式组中,可以用部分总体中心矩 viv_i 代替原点矩 μi\mu_i,此时在步骤 3 中以相应的样本矩 BiB_i 代替 viv_i 即可
  • 矩估计没有涉及总体是正态分布的信息
  • 当总体的分布未知,但知道待估参数关于总体各阶矩的函数形式时,便可求出该参数的矩估计
  • 缺点:在总体分布已知时,没有充分利用总体分布所提供的信息,矩估计量不具有唯一性

极大似然法⚓︎

基本思想:设某事件 AA 发生的概率依赖于待估参数 θ\theta,如果观察到 AA 已发生,那么就使取得事件 AA 发生的概率达到最大的 θ\theta 值作为 θ\theta 的估计。

XX 离散型总体,其概率分布律为 P(X=x)=p(x;θ)P(X = x) = p(x; \theta)θΘ\theta \in \Theta 是未知的待估参数,Θ\Theta 为参数可取值的范围。X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本,并设 x1,x2,,xnx_1, x_2, \dots, x_n 是已经得到的样本值,则样本 X1,X2,,XnX_1, X_2, \dots, X_n 取到样本值 x1,x2,,xnx_1, x_2, \dots, x_n 的概率为:

P(X1=x1,X2=x2,,Xn=xn)=i=1nP(Xi=xi)=i=1np(xi;θ) P(X_1 = x_1, X_2 = x_2, \dots, X_n = x_n) = \prod\limits_{i=1}^nP(X_i = x_i) = \prod\limits_{i=1}^np(x_i;\theta)

将其记为似然函数L(θ)L(\theta)

L(θ)=L(θ;x1,x2,,xn)=i=1np(xi;θ) L(\theta) = L(\theta; x_1, x_2, \dots, x_n) = \prod\limits_{i=1}^np(x_i;\theta)

形式上,L(θ)L(\theta) 与样本联合分布律 p(x1,x2,,xn;θ)p(x_1, x_2, \dots, x_n ; \theta) 相同,但,

  • L(θ)L(\theta) 是样本值给定时关于 θ\theta 的函数
  • p(x1,x2,,xn;θ)p(x_1, x_2, \dots, x_n ; \theta) 是参数给定时关于样本值的函数

基于上述思想,应选取 θ\theta 的估计值 θ^\hat{\theta},使得 L(θ)L(\theta) 取到最大,于是 θ^\hat{\theta} 满足:

L(θ^)=L(θ^;x1,x2,,xn)=maxθΘL(θ;x1,x2,,xn) L(\hat{\theta}) = L(\hat{\theta}; x_1, x_2, \dots, x_n) = \max\limits_{\theta \in \Theta}L(\theta; x_1, x_2, \dots, x_n)

由此获得的 θ^=θ^(x1,x2,,xn)\hat{\theta} = \hat{\theta}(x_1, x_2, \dots, x_n) 称为参数 θ\theta 极大似然估计值,相应的统计量 θ^(X1,X2,,Xn)\hat{\theta}(X_1, X_2, \dots, X_n) 称为参数 θ\theta 极大似然估计量


XX 连续型总体,其密度函数为 f(x;θ)f(x; \theta)θΘ\theta \in \Theta 是未知的待估参数。X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本,并设 x1,x2,,xnx_1, x_2, \dots, x_n 是已经得到的样本值,此时似然函数为:

L(θ)=L(θ;x1,x2,,xn)=i=1nf(xi;θ) L(\theta) = L(\theta; x_1, x_2, \dots, x_n) = \prod\limits_{i=1}^nf(x_i;\theta)

形式上,L(θ)L(\theta) 与样本联合密度函数 f(x1,x2,,xn;θ)f(x_1, x_2, \dots, x_n ; \theta) 相同。

极大似然估计值极大似然估计量的定义同离散型版本。寻求极大似然估计常用微分法,有:dL(θ)dθθ=θ^=0\dfrac{\text{d}L(\theta)}{\text{d}\theta} \Big|_{\theta = \hat{\theta}} = 0,称之为似然方程

为了计算方便,往往对似然函数求对数,记 l(θ)=lnL(θ)l(\theta) = \ln L(\theta) 对数似然函数,此时似然方程等价为:dl(θ)dθθ=θ^=0\dfrac{\text{d}l(\theta)}{\text{d}\theta} \Big|_{\theta = \hat{\theta}} = 0,称为对数似然方程

  • 乘除式 -> 加减式,计算更加方便!

  • 若总体分布含有多个待估参数,可将上文的 θ\theta 看成向量,此时需要对似然方程的每个参数求偏导数,建立含多个式子的似然方程
  • 当似然方程的解不存在时,往往根据似然函数关于待估参数的单调性来求其极大似然估计,常用结论有:
    • 当似然函数单调递减时,极大似然估计 θ^=max{X1,X2,,Xn}\hat{\theta} = \max\{X_1, X_2, \dots, X_n\}
    • 当似然函数单调递增时,极大似然估计 θ^=min{X1,X2,,Xn}\hat{\theta} = \min\{X_1, X_2, \dots, X_n\}

极大似然估计的不变性:设参数 θ\theta 的极大似然估计为 θ^\hat{\theta}θ=g(θ)\theta^* = g(\theta) θ\theta 连续函数,则参数 θ\theta^* 的极大似然估计为 θ^=g(θ^)\widehat{\theta^*} = g(\hat{\theta})

估计量的评价准则⚓︎

无偏性准则⚓︎

θΘ\theta \in \Theta 是总体 XX 的待估参数,X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本。若估计量 θ^=θ^(X1,X2,,Xn)\hat{\theta} = \hat{\theta}(X_1, X_2, \dots, X_n) 的数学期望存在,且满足:E(θ^)=θ,θΘE(\hat{\theta}) = \theta, \theta \in \Theta,称 θ^\hat{\theta} θ\theta 的无偏估计量或无偏估计

  • 偏差E(θ^)θE(\hat{\theta}) - \thetaE(θ^)θE(\hat{\theta}) \ne \theta
  • 渐近无偏估计:满足 limn+E(θ^)=θ\lim\limits_{n \rightarrow +\infty} E(\hat{\theta}) = \theta,但 E(θ^)θE(\hat{\theta}) \ne \theta

有效性准则⚓︎

θ1^=θ1^(x1,x2,,xn),θ2^=θ2^(x1,x2,,xn)\widehat{\theta_1} = \widehat{\theta_1}(x_1, x_2, \dots, x_n), \widehat{\theta_2} = \widehat{\theta_2}(x_1, x_2, \dots, x_n) 都是参数 θ\theta 的无偏估计,若 θΘ,Varθ(θ1^)Varθ(θ2^)\forall \theta \in \Theta, Var_\theta(\widehat{\theta_1}) \le Var_\theta(\widehat{\theta_2}),且至少有一个 θΘ\theta \in \Theta 使不等号成立,则称 θ1^\widehat{\theta_1} θ2^\widehat{\theta_2} 有效。

均方误差准则⚓︎

θ^=θ^(X1,X2,,Xn)\hat{\theta} = \hat{\theta}(X_1, X_2, \dots, X_n) 是总体参数 θ\theta 的估计量,称 E[(θ^θ)2]E[(\hat{\theta} - \theta)^2] 是估计量 θ^\hat{\theta} 均方误差,记为 Mse(θ^)Mse(\hat{\theta})

  • Mse(θ^)=E[(θ^θ)2]=Var(θ^)+[E(θ^)θ]2Mse(\hat{\theta}) = E[(\hat{\theta} - \theta)^2] = Var(\hat{\theta}) + [E(\hat{\theta}) - \theta]^2
  • θ1^,θ2^\widehat{\theta_1}, \widehat{\theta_2} 都是 θ\theta 的估计量,若 θΘ,Mse(θ1^)Mse(θ2^)\forall \theta \in \Theta, Mse(\widehat{\theta_1}) \le Mse(\widehat{\theta_2}),则称在均方误差准则下,θ1^\widehat{\theta_1} 优于 θ2^\widehat{\theta_2}
  • 均方误差准则常用于有偏估计之间,有偏估计与无偏估计之间的比较
  • θ^\hat{\theta} 是参数 θ\theta 的无偏估计量,则 Mse(θ^)=Var(θ^)Mse(\hat{\theta}) = Var(\hat{\theta}),即均方误差准则在无偏估计之间的比较等价于有效性准则
  • 在实际情况下,均方误差准则比无偏性准则更重要,即如果一个估计量虽然有偏,但其均方误差较小,有时比方差较大的无偏估计更有用

相合性准则⚓︎

θn^=θ^(X1,X2,,Xn)\widehat{\theta_n} = \hat{\theta}(X_1, X_2, \dots, X_n) 是总体参数 θ\theta 的估计量,若  ε>0\forall\ \varepsilon > 0,有:limn+P(θn^θ<ε)=1\lim\limits_{n \rightarrow +\infty}P(|\widehat{\theta_n} - \theta| < \varepsilon) = 1,即 θn^\widehat{\theta_n} 依概率收敛于 θ\theta,称 θn^\widehat{\theta_n} θ\theta 相合估计量,并记 θn^Pθ,n+\widehat{\theta_n} \stackrel{P}{\longrightarrow} \theta, n \rightarrow +\infty

  • 一般地,由矩法求得的参数估计量都满足相合性
  • 对于极大似然估计,在总体分布满足一定条件下,求得的估计量也是待估参数的相合估计量

考得最多的是估计量的无偏性相合性

区间估计⚓︎

置信区间⚓︎

设总体为 XXθΘ\theta \in \Theta 为待估参数,X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本,统计量 θL^=θL^(X1,X2,,Xn)\widehat{\theta_L} = \widehat{\theta_L}(X_1, X_2, \dots, X_n) θU^=θU^(X1,X2,,Xn)\widehat{\theta_U} = \widehat{\theta_U}(X_1, X_2, \dots, X_n) 满足 θL^<θU^\widehat{\theta_L} < \widehat{\theta_U},且对给定 α(0,1)\alpha \in (0, 1) 和任意 θΘ\theta \in \Theta,有:P(θL^<θ<θU^)1αP(\widehat{\theta_L} < \theta < \widehat{\theta_U}) \ge 1 - \alpha,则

  • 称随机区间 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) 是参数 θ\theta 置信水平 1α1 - \alpha 置信区间

    • 置信区间是一个随机区间,对某次具体样本观测来说,有时包含 θ\theta,有时不包含 θ\theta,且包含 θ\theta 的可能性至少为 1α1 - \alpha
    • 在实际应用中,通常取 α=0.1\alpha = 0.1 0.050.05
  • θL^,θU^\widehat{\theta_L}, \widehat{\theta_U} 分别称为 θ\theta 的置信水平是 1α1 - \alpha 双侧置信下限双侧置信上限

  • 精确度:区间的平均长度 E(θU^θL^)E(\widehat{\theta_U} - \widehat{\theta_L})
  • 误差限12E(θU^θL^)\dfrac{1}{2}E(\widehat{\theta_U} - \widehat{\theta_L})
  • 奈曼原则:当样本容量给定时,置信水平和精确度是相互制约的。因此在保证置信水平达到一定的前提下,尽可能提高精确度。
    • 当总体 XX 连续型随机变量时,对于给定置信水平 1α1 - \alpha,应使上面的不等式取等号,即 P(θL^<θ<θU^)=1αP(\widehat{\theta_L} < \theta < \widehat{\theta_U}) = 1 - \alpha 的随机区间 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) 作为置信区间
    • 当总体 XX 离散型随机变量时,则应选择使 P(θL^<θ<θU^)=1αP(\widehat{\theta_L} < \theta < \widehat{\theta_U}) = 1 - \alpha 且尽可能接近 1α1 - \alpha 的随机区间 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) 作为置信区间

对于给定的 α(0,1)\alpha \in (0, 1),如果统计量 θL^,θU^\widehat{\theta_L}, \widehat{\theta_U} 满足:

P(θL^<θ)1α,P(θ<θU^)1α,θΘ P(\widehat{\theta_L} < \theta) \ge 1 - \alpha, \quad P(\theta < \widehat{\theta_U}) \ge 1 - \alpha, \quad \theta \in \Theta

那么分别称 θL^\widehat{\theta_L} θU^\widehat{\theta_U} 是参数 θ\theta 的置信水平为 1α1 - \alpha 单侧置信下限单侧置信上限

  • 当总体 XX 是连续型随机变量时,应选择 θL^,θU^\widehat{\theta_L}, \widehat{\theta_U} 使:P(θL^<θ)=P(θ<θU^)=1α,θΘP(\widehat{\theta_L} < \theta) = P(\theta < \widehat{\theta_U}) = 1 - \alpha, \theta \in \Theta
  • 设统计量 θL^,θU^\widehat{\theta_L}, \widehat{\theta_U} 分别是参数 θ\theta 的置信水平为 1α1,1α21 - \alpha_1, 1 - \alpha_2 的单侧置信下限和单侧置信上限,且 θL^<θU^\widehat{\theta_L} < \widehat{\theta_U},那么 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) θ\theta 置信水平为 1α1α21 - \alpha_1 - \alpha_2 的置信区间。

枢轴量法⚓︎

设总体 XX 的密度函数(或概率分布律)为 f(x;θ)f(x;\theta),其中 θ\theta 为待估参数,并设 X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本,如果样本和参数 θ\theta 的函数 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta) 的分布完全已知,且形式上不依赖于其他未知参数,那么称 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta) 枢轴量

寻找 θ\theta 的置信区间的步骤:

  1. 构造一个分布已知的枢轴量 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta)
  2. 当总体 XX

    • 连续型随机变量时,对给定的置信水平 1α1 - \alpha,根据枢轴量 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta) 的分布,适当地选择两个常数 a,ba, b,使:
    Pθ(a<G(X1,X2,,Xn;θ)<b)=1α P_\theta (a < G(X_1, X_2, \dots, X_n; \theta) < b) = 1 - \alpha
    • 离散型随机变量时,对给定的置信水平 1α1 - \alpha,选择常数 a,ba, b 满足:
    Pθ(a<G(X1,X2,,Xn;θ)<b)1α and be close to 1α as much as possible P_\theta (a < G(X_1, X_2, \dots, X_n; \theta) < b) \ge 1 - \alpha \text{ and be close to } 1- \alpha \text{ as much as possible}
  3. 假如参数可以从 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta) 中分离出来,不等式 a<G(X1,X2,,Xn;θ)<ba < G(X_1, X_2, \dots, X_n; \theta) < b 可以等价地转化为 θL^<θ<θU^\widehat{\theta_L} < \theta < \widehat{\theta_U}

    • 对于连续型总体:
    P(θL^<θ<θU^)=1α P(\widehat{\theta_L} < \theta < \widehat{\theta_U}) = 1 - \alpha
    • 对于离散型总体:
    P(θL^<θ<θU^)1α and be close to 1α as much as possible P(\widehat{\theta_L} < \theta < \widehat{\theta_U}) \ge 1 - \alpha \text{ and be close to } 1 - \alpha \text{ as much as possible}

    表明 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) θ\theta 的置信水平为 1α1 - \alpha 的置信区间

对于步骤 2,满足式子的常数 a,ba, b 的解是不唯一的。根据奈曼原则,应选择使置信区间 (θL^,θU^)(\widehat{\theta_L}, \widehat{\theta_U}) 的平均长度达到最短的 a,ba, b,习惯上取 a,ba, b 满足:

Pθ(G(X1,X2,,Xn;θ)a)=Pθ(G(X1,X2,,Xn;θ)b)=α2 \begin{align} & P_\theta (G(X_1, X_2, \dots, X_n; \theta) \le a) \notag \\ = & P_\theta (G(X_1, X_2, \dots, X_n; \theta) \ge b) \notag \\ = & \dfrac{\alpha}{2} \notag \end{align}

⭐关于枢轴量的结论

对于枢轴量 G(θ)G(\theta)

  • 双侧置信区间:g1α2(n)<G(θ)<gα2(n)g_{1 - \frac{\alpha}{2}}(n) < G(\theta) < g_{\frac{\alpha}{2}}(n)
  • 单侧置信下限:G(θ)>g1α(n)G(\theta) > g_{1 - \alpha}(n)
  • 单侧置信上限:G(θ)<gα(n)G(\theta) < g_\alpha(n)

其中 gα(n)g_\alpha(n) 代表分位数

正态总体参数的区间估计⚓︎

LaTeX 公式太累了,所以下面就直接贴上课本给的表格,公式都是整理好的:

提示

记住不同情况下的枢轴量的分布,以及上面关于枢轴量的结论,我们就可以较为容易地推导出对应的置信区间,无需再额外记忆一堆置信区间的公式了,减轻记忆压力。

注意

表格中“两个正态总体方差不等且未知时,求均值差的区间估计”(即表格第 6 行(不包括表头行)这块内容不考!!!

非正态总体参数的区间估计⚓︎

注意

这块内容不考!!!

0-1 分布参数的区间估计⚓︎

设总体 XX 服从 0-1 分布分布 B(1,p),X1,X2,,XnB(1, p), X_1, X_2, \dots, X_n 是来自总体 XX 的样本,当 nn 充分大时,由中心极限定理知:

i=1nXinpnp(1p)=nXnpnp(1p) \dfrac{\sum\limits_{i=1}^n X_i - np}{\sqrt{np(1-p)}} = \dfrac{n \overline{X} - np}{\sqrt{np(1-p)}}

近似服从标准正态分布 N(0,1)N(0, 1),于是有:

P(zα/2<nXnpnp(1p)<zα/2)1α P\Big(- z_{\alpha / 2} < \dfrac{n \overline{X} - np}{\sqrt{np(1-p)}} < z_{\alpha / 2}\Big) \approx 1 - \alpha

等价于:

P((n+zα/22)p2(2nX+zα/22)p+nX2<0)1α P((n + z_{\alpha / 2}^2)p^2 - (2n \overline{X} + z_{\alpha / 2}^2)p + n\overline{X}^2 < 0) \approx 1 - \alpha

求一元二次方程,可得参数 pp 的置信水平为 1α1 - \alpha 的近似置信区间为:

(12α(bb24ac),12α(b+b24ac))=(pL^,pU^) (\dfrac{1}{2 \alpha}(-b - \sqrt{b^2 - 4ac}), \dfrac{1}{2 \alpha}(-b + \sqrt{b^2 - 4ac})) = (\widehat{p_L}, \widehat{p_U})

其中 a=n+zα/22,b=(2nX+zα/22),c=nX2a = n + z_{\alpha / 2}^2, b = -(2n\overline{X} + z_{\alpha / 2}^2), c = n\overline{X}^2,取 p(1p)p(1-p) 的估计量为 X(1X)\overline{X}(1 - \overline{X}),得参数 pp 的置信水平为 1α1 - \alpha 的近似置信区间为:

(Xzα/2X(1X)n,X+zα/2X(1X)n) \Big(\overline{X} - z_{\alpha / 2}\sqrt{\dfrac{\overline{X}(1 - \overline{X})}{n}}, \overline{X} + z_{\alpha / 2}\sqrt{\dfrac{\overline{X}(1 - \overline{X})}{n}}\Big)

在实际应用中,通常要满足 n>30n > 30 np>5,n(1p)>5np > 5, n(1-p) > 5

其他均值分布 μ\mu 的区间估计⚓︎

设总体 XX 的均值为 μ\mu, 方差为 σ2\sigma^2X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XX 的样本,当 nn 充分大时(n>50n > 50,由中心极限定理知:

i=1nXinμnσapproximatelyN(0,1) \dfrac{\sum\limits_{i=1}^n X_i - n\mu}{\sqrt{n}\sigma} \stackrel{\text{approximately}}{\sim} N(0, 1)

μ\mu 的置信水平为 1α1-\alpha 的近似置信区间为:(X±σnzα/2)(\overline{X} \pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha / 2})。如果方差未知,可用估计量 S2S^2 代替 σ2\sigma^2

当样本容量 n50n \le 50 时,tt 分布具有良好的统计稳健性,即当总体 XX 不服从正态分布,但样本数据基本对称时,枢轴量 XμS/n\dfrac{\overline{X} - \mu}{S / \sqrt{n}} 仍可以看成近似服从分布 t(n1)t(n - 1),从而均值 μ\mu 的置信水平为 1α1-\alpha 的近似置信区间为:(X±Sntα/2(n1))(\overline{X} \pm \dfrac{S}{\sqrt{n}}t_{\alpha / 2}(n - 1))

评论区

如果大家有什么问题或想法,欢迎在下方留言~