对于对称、单峰分布,只有在方差相同的情况下,才能通过比较 kurtosis 大小来判断峰、尾形态的差异,否则 kurtosis 大小跟峰、尾形态没有必然联系。比如对正态分布 N(0, sigma),通过调节 sigma 的大小可以得到一系列峰、尾形态的分布,但是这些分布的 kurtosis 都一样。 有一些初级甚至高级的统计教材都犯过这种错误,那就是把不同方差的分布拿来比较 kurtosis 来判断峰、尾性质,这样会得到错误的结果。比如对于 t 分布,当其自由度 n 大于等于 5 时,其超额 kurtosis 为6/(n-4),有些书上就会把不同自由度的 t 分布画在同一个坐标系下,得出随着自由度下降 (kurtosis 变大) ,t 分布越来越平坦,尾部越来越厚的结论。而我们都知道,相同方差下 t 分布较正态分布的峰更尖、尾更厚,只有当自由度趋近于无穷时,t 分布才趋近于正态分布。 在方差相同的情况下,kurtosis 越大,大致表明: 1) 尾越厚,或者 2) 峰越尖,或者 3) 两者兼具 通常情况下 1) 是主要效果。用"大致表明",是因为这里并没有在数学上严格定义什么是厚尾、什么是尖峰,仅仅是基于直观。 一些典型的厚尾分布 (如 t 分布和 Lapalace 分布),考察他们同方差时和正态分布峰尾形态的差异 t 分布:自由度 n=5,均值 0,方差 5/3,kurtosis=9 Laplace 分布:均值 0,方差 5/3,kurtosis=9 |