分位数在统计学是中一个比较简单和容易理解的概念,大部分初级的统计学教材中都会有相应的介绍。但实际在理解这个概念的时候,要注意连续情形下与分位数相关的几个概念之间的联系与区别。
1 离散情形
举一个例子,将100名同学的期末考试总分成绩所组成的向量\(\mathbf{x}\)按从小到大的规则进行排序,生成一个新的顺序统计量\(\mathbf{x}'\),那么\(\mathbf{x}\)的\(1/4\)分位数指的是\(\mathbf{x}^\prime\)第25号位上的那个数字,同理可知中位数以及\(3/4\)分位数等。
2 连续情形
以正态分布为例,\(1/4\)分位数指的是\(\mathrm{Pr}(X\leqslant x)=1/4\)对应的\(x\)值,类似的,标准正态分布中中位数对应的\(x\)为0。
从上面的例子可以看出,分位点确定的基础是在离散情形下将样本数量标准化为1,而在连续情形下则是将x坐标轴的可用长度标准化为1(对于正态分布和t分布而言,原始长度为\(-\infty\)到\(+\infty\)之间的全部范围。
在连续情形下,若考虑的置信系数是左单侧的,那么置信系数\(\alpha\)对应的下\(\alpha\)分位点的\(x\)值与\(\alpha\)分位数以及\(\mathrm{Pr}(X\leqslant x)=\alpha\)中的\(x\)实际上指向同一个\(x\)值。
这个值在大部分统计软件中对应的命令以q
开头,比如R中的qnorm
命令。