随机样本的性质
定义:从总体中抽取的随机变量相互独立且有相同的边缘密度(质量)函数,称为总体的随机样本或独立同分布随机变量。
在统计学中,随机样本从给定分布的总体中抽取,联合概率密度函数表示不同样本值下的行为。注意抽样模型通常基于无限总体,有限总体的无放回抽样称为简单随机抽样。
随机样本的统计量描述样本特征,例如均值、方差等。下面三个统计量常见于实际应用。
定理:考察统计量期望值有助于理解抽样分布。若函数可导,则统计量和总体参数之间存在联系。
引理:随机样本取自总体,函数存在时,统计量期望值等于总体参数。
定理:随机样本取自总体,若总体期望值为μ,方差为σ²,则统计量为无偏估计。
随机变量和的抽样分布可借助变量替换法和卷积公式求解。例如,Cauchy分布和指数分布族的随机变量和的抽样分布较为简单。
正态分布下,样本方差和样本均值具有特定性质。样本均值依概率收敛于总体均值,样本方差依概率收敛于总体方差,其极限分布为标准正态分布。样本量增大时,样本均值趋近于总体均值。
对于有限样本,样本量趋向无穷时,存在依概率、殆必收敛和依分布收敛等不同类型的收敛。弱大数定律描述样本均值依概率收敛于总体均值;强大数定律描述样本均值殆必收敛于总体均值。
依分布收敛定义为累计分布函数的收敛。中心极限定理表明,当样本量足够大时,样本均值的分布近似为正态分布。
生成随机样本的方法包括直接法和间接法。直接法适用于通过初等函数变换均匀分布生成所需分布的随机变量。间接法则通过变换概率积分函数生成随机变量。