数理统计学自由度研究及应用
【摘 要】 本文通过对数理统计作出简要的介绍,对数理统计中自由度的理解作了较为详实的分析,并在研究基础上进一步科学的定义了自由度概念。通过举例,列举自由度在梳理统计当中的应用,为提高和增强对自由度的认识奠定现实基础。
【关键词】 数理统计 自由度 研究及应用
1 数理统计学自由度研究与分析
数理统计学教程中的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,自由度通常记为df 。数理统计上的这个定义一般可以从五个方面来理解:
首先,研究者通过调查样本数据,并运用科学计算得出“统计量”,被调查客观主体所具备的属性为之“参数”。在数理统计学上,认为二者属于无偏估计,所以是相等的,但是在实际应用中,因为其抽样的偏差,会客观的导致二者不等同,对于出现的这种情况,作为研究者是无法知晓的。因此在理论假设条件下,“统计量”和“参数”共同被看作是现实的、固定的。
其次,从以上我们可以知道,既然在理论层面上,“统计量”是确定的,那么在实际应用层面上,计算“统计量”的那组参数就不应当是完全自由的。因为自由度概念当中“自由”一词就是相对这个“确定、固定”条件而设立的。同时也就是说“统计量”的固定、确定性限制了相关参数的自由性,为此,它必须支持“统计量等于总体参数”这一假设理论,这才是“自由度”所存在的根本。
其三,在现实生活中,有很多统计量的计算公式中里拥有自由度,但他们的表现形式大有不同,虽然他们都是计算标准差,可是当总体标准差的自由度是q 的时候,样本标准差的自由度表现为q-1,甚至是q-2、q-3。是什么样的原因导致这样的事实存在呢。其实在数理统计模型中,自由度是指在样本中能够自由变动的变量的个数,当有约束条件时,自由度减少自由度计算公式:自由度(df )=样本个数(n )-样本数据受约束条件的个数(k ),即df=n-k(df 自由度,n 样本个数,k 约束条件个数),q-1是一般情况下的计算方法,更准确的讲应该为q-k ,q 表示“需要处理”的数量,k 表示实际计算的参数的数量。如需要计算2个参数,则数据里只有q-2个数据可以自由变化。
第四,自由度的所属。自由度产生于这样的背景下:运用一组数据来求“统计量”,离开“一组数据”就不可能有“统计量”。所以,“自由度”应该是“统计量”和“一组数据”所共同拥有的。
第五,统计学上的自由度包括在估计总体平均个数的情形下,由于样本个数q 是相互独立的,从其中抽出任何一个数不会导致其他任何数据发生变化,所以
数理统计学自由度研究及应用
【摘 要】 本文通过对数理统计作出简要的介绍,对数理统计中自由度的理解作了较为详实的分析,并在研究基础上进一步科学的定义了自由度概念。通过举例,列举自由度在梳理统计当中的应用,为提高和增强对自由度的认识奠定现实基础。
【关键词】 数理统计 自由度 研究及应用
1 数理统计学自由度研究与分析
数理统计学教程中的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,自由度通常记为df 。数理统计上的这个定义一般可以从五个方面来理解:
首先,研究者通过调查样本数据,并运用科学计算得出“统计量”,被调查客观主体所具备的属性为之“参数”。在数理统计学上,认为二者属于无偏估计,所以是相等的,但是在实际应用中,因为其抽样的偏差,会客观的导致二者不等同,对于出现的这种情况,作为研究者是无法知晓的。因此在理论假设条件下,“统计量”和“参数”共同被看作是现实的、固定的。
其次,从以上我们可以知道,既然在理论层面上,“统计量”是确定的,那么在实际应用层面上,计算“统计量”的那组参数就不应当是完全自由的。因为自由度概念当中“自由”一词就是相对这个“确定、固定”条件而设立的。同时也就是说“统计量”的固定、确定性限制了相关参数的自由性,为此,它必须支持“统计量等于总体参数”这一假设理论,这才是“自由度”所存在的根本。
其三,在现实生活中,有很多统计量的计算公式中里拥有自由度,但他们的表现形式大有不同,虽然他们都是计算标准差,可是当总体标准差的自由度是q 的时候,样本标准差的自由度表现为q-1,甚至是q-2、q-3。是什么样的原因导致这样的事实存在呢。其实在数理统计模型中,自由度是指在样本中能够自由变动的变量的个数,当有约束条件时,自由度减少自由度计算公式:自由度(df )=样本个数(n )-样本数据受约束条件的个数(k ),即df=n-k(df 自由度,n 样本个数,k 约束条件个数),q-1是一般情况下的计算方法,更准确的讲应该为q-k ,q 表示“需要处理”的数量,k 表示实际计算的参数的数量。如需要计算2个参数,则数据里只有q-2个数据可以自由变化。
第四,自由度的所属。自由度产生于这样的背景下:运用一组数据来求“统计量”,离开“一组数据”就不可能有“统计量”。所以,“自由度”应该是“统计量”和“一组数据”所共同拥有的。
第五,统计学上的自由度包括在估计总体平均个数的情形下,由于样本个数q 是相互独立的,从其中抽出任何一个数不会导致其他任何数据发生变化,所以