数据描述的三个角度:集中趋势,离散程度和分布形态。常用统计推断检验方法分为参数检验和非参数检验两大类。参数检验假设总体服从正态分布,样本统计量服从T分布,用于推断总体参数。当总体分布情况未知或样本容量小,无法应用中心极限定理时,采用非参数检验,无需假设总体分布,直接从样本分析推断总体分布。非参数检验方法多样,如秩检验、K-S检验等。适用于小样本、非正态分布、方差不齐或混合样本等。相较于参数检验,非参数检验适用范围更广。在参数检验条件不符时,选择非参数检验。T检验和方差分析适用于正态分布数据的均值差异性问题。非参数检验适用于非正态分布数据,通过秩分、符号法等技术转化数据,然后进行分析。
判断数据序列分布形态时,采用K-S检验、单样本游程检验、二项分布检验或卡方检验,检验数据序列与正态分布的差异性。对于非正态分布数据,可转化为正态分布序列,或直接使用非参数检验方法进行差异性检验。非参数检验方法包括秩检验、符号检验等,实质上是通过秩分或符号等技术转化原始序列,再应用类似参数检验的手段进行数据分析。
对于非正态分布数据的检验,分为高测度数据和低测度数据。高测度数据检验包括单样本K-S检验、卡方检验等。低测度数据检验则使用卡方检验进行不同类别的数据对比。两关联样本的非参数检验关注分布形态的比较,而多关联样本的非参数检验则用于判断多个样本序列的差异是否显著。两独立样本非参数检验和多独立样本非参数检验分别适用于两个和多个独立样本的差异性分析。