分位点与分位数z

分位数在统计学是中一个比较简单和容易理解的概念,大部分初级的统计学教材中都会有相应的介绍。但实际在理解这个概念的时候,要注意连续情形下与分位数相关的几个概念之间的联系与区别。

1 离散情形

举一个例子,将100名同学的期末考试总分成绩所组成的向量\(\mathbf{x}\)按从小到大的规则进行排序,生成一个新的顺序统计量\(\mathbf{x}'\),那么\(\mathbf{x}\)\(1/4\)分位数指的是\(\mathbf{x}^\prime\)第25号位上的那个数字,同理可知中位数以及\(3/4\)分位数等。

2 连续情形

以正态分布为例,\(1/4\)分位数指的是\(\mathrm{Pr}(X\leqslant x)=1/4\)对应的\(x\)值,类似的,标准正态分布中中位数对应的\(x\)为0。

从上面的例子可以看出,分位点确定的基础是在离散情形下将样本数量标准化为1,而在连续情形下则是将x坐标轴的可用长度标准化为1(对于正态分布和t分布而言,原始长度为\(-\infty\)\(+\infty\)之间的全部范围。

在连续情形下,若考虑的置信系数是左单侧的,那么置信系数\(\alpha\)对应的下\(\alpha\)分位点的\(x\)值与\(\alpha\)分位数以及\(\mathrm{Pr}(X\leqslant x)=\alpha\)中的\(x\)实际上指向同一个\(x\)值。

这个值在大部分统计软件中对应的命令以q开头,比如R中的qnorm命令。

0%