变异系数_一个衡量离散程度简单而有用的统计指标

POPULAR STATISTICS

变异系数

——  一个衡量离散程度简单而有用的统计指标

文 / 王文森

分析写作过程中,我们常常会 碰到这样的问题:如何定量地

图2

标,当用其来对同一总体的不同时期或 不同总体进行对比时,缺乏可比性。原 因 是: 第一,当总体平均水平不同时,用 绝对差异指标不可比。例如当比较广东 与新建两地的人均收入差异程度时,若 计算得出两地的人均收入标准差都是 5 0 0 元,这时我们不能简单地认为两省 的人均收入差异程度是一样的,因为 上述两个数据序列的平均数都是 5 0 0 元对两省人均收入的意义大不一 样 。 第二,绝对指标受量纲(计量单 位)的限制,导致横向数据不可比。 比如在比较中国和美国各地人均 G D P 的 差异程度时,就存在一个不同货币计量 单位之间的换算问题,如果采用相对差 异指标,就可以消除这种限制。因此, 在不同水平的总体之间、不同量纲的总 体之间,需要采用变异系数来比较标志 值变动程度的大小。变异系数越小,说 明标志值离散程度越小,总体各单位的 差距越小。

说明一个总体各单位的不同时期集中或 分散的发展变化趋势,或不同总体同一 时期的发展差异程度?比如我们要分析 某地区工业企业的盈利水平在五年内是 趋于平均化还是趋于分化,又如要对比 分析 2001 年广东与广西两省内部的经济 发 展 均 衡 程 度 ,等 等 。 在 这 里 , 笔 者 介绍一个既简单常用又能说明问题的统 计指标——变 异 系 数 。 3 0 0 ,但标准差和变异系数不同,序列 1 的变异系数为 0 . 2 5,而序列 2 的变异 系数为 0.13。表现在图上,就是图 1 的 数据波动幅度比较大,而图 2 的数据波 动幅度比较小,也即序列 1 各数据之间 的差距大于序列 2 。变异系数正是用来 描述这种数据波动程度。

平均数 =300,标准差 =37.79,变异系数 =0.13

变异系数的概念

变异系数,就是标准差系数,有 的书上也称差异系数、离散系数,都 是同一个意思。 变异系数是发映总体各单位标志值 的差异程度或离散程度的指标,是反映 数据分布状况的指标之一。其含义是总 体各单位的标准差与其算术平均数对比 的 相 对 数 , 其 计 算 公 式 为:

标准差

在进一步了解变异系数之前,需要 先解释标准差。标准差是总体各单位标 志值与其算术平均数离差平方和的算术 平 均 数 的 平 方 根 , 通 常 用 σ 表 示 。标 准差的平方称为方差,用σ 2 表示。标 准差的一般计算公式为:

上式中,V 代表变异系数,σ代表 标准差,x 代表算术平均数。 大家知道

,我们一般用平均数来反 映客观现象总体各单位某一数量标志的 一般水平,如平均年龄、平均收入等。 但平均数只能反映总体的一般数量水 平,不能说明总体各单位标志值的数量 差异程度,不能揭示其离散程度和集中 趋势,这时候就要用到平均差、标准 差 和 变 异 系 数 ( 标 准 差 系 数 )等 变 异 指标。下面图示可帮助大家理解平均数 和变异系数的含义。

图1

变异系数的计算

由上面的内容可知,计算出一个数 据序列的标准差和平均数,就可得出变 异系数。上例中,

式中 N 代表数据个数,X 代表各单 位标志值,x 代表各单位标志值的平均 数 。 下表列出 5 个企业产值数据,以此 为例计算企业产值的标准差。 变异系数的计算较简便,利用计算 器或有关的统计软件就可以得出结果。 如在 E X C E L 软件中,利用“工具”菜 单中的“数据分析”工具就可计算出 标准差、平均数和变异系数等一些常用 的统计指标。 在实际计算时,若有必要考虑各数 根 据 上 表 ,可 计 算 出 标 准 差 σ: 据的不同重要性,则通常采用加权平均的 形式。比如,在计算各地区人均 GDP 的变 异系数时,一般应以各地区的人口数作为 标准差的局限性。标准差以算术平 均数为中心,它可以反映一个总体全部 权数进行加权评价。用公式表示为:

平均数 =300,标准差 =75.59,变异系数 =0.25

标志值的离散程度。但它是一个绝对指

            CHINA STATISTICS

41

200 7. 6

统计科普

200 7. 6

见 解

VIEW POINT

式中 v 、x 和 x 的意义同上,p i 代表第 i 地区的人口数,p 代表全部地区的人口 数总和。 集数据的一项实践活动,调查总体由有 限或无限个总体单位所构成,因此,就 统计调查的范围来看,统计调查方法有 全面调查和非全面调查之分。顾名思

变异系数的应用

变异系数是一个虽简单但用途广泛 的指标,普遍地用于反映某一总体各单 位标志值的差异程度、集中或离散状 况。国内外学者普遍利用变异系数来分 析地区差距问题。下面笔者举出在写作 过程中用过的几个例子,其他可以举一 反三。 例 1 :工业 5 0 强发展差距分析。 在一篇分析广东工业 5 0 强的文章 中,利用变异系数来说明大企业发展差 距拉大。引文: “从 5 0 强 企 业 的 发 展 变化看,强势企业间的差距有进一步拉 大的趋势。1 9 9 8 年 5 0 强企业销售收入 的变异系数为 0.58,1999 年的变异系数 为 0.60,显示强势企业间的差距也在拉 大 。” 例 2 :广东省地

区发展差距分析。 利用 1995 年和 2000 年广东省各市 人均 GDP 数据,计算得出 1995 年人均 GDP 的变异系数为 0.16,2000 年人均 GDP 的 变异系数为 0.18(未作加权) 。计算结果 表明, “九五”期间,广东省各地区的发 展速度快慢不均,发展差距有所拉大。如 果将改革开放以来全省人均 G D P 的变异 系数都计算出来,则可进一步分析地区 差距的发展变化趋势。

统 计 调 查 方 法 的

文 / 王 天 营

义,全面调查就是对调查总体中全部总 体单位一一进行调查,而非全面调查仅 对调查总体中部分总体单位进行调查。 第二,就非全面调查而言,按照从总 体中选取部分单位方法的不同,又可以 分 为 重 点 调 查 、典 型 调 查 和 抽 样 调 查 等。重点调查就是仅对调查总体中调查 者认为比较重要的单位进行的调查。典 型调查就是仅对调查总体中调查者认为 比较典型的单位进行的调查。抽样调查 就是根据随机性原则从调查总体中选取 部分单位进行的调查。第三,从抽样

哲 学 思 考

调查的具体组织实施来看,抽样调查又 有简单随机抽样调查、系统抽样调查、 分层(组)抽样调查、整群抽样调查 和多阶段抽样调查等。 唯物辨证论通常要研究有限与无 限、部分与整体、现象与本质、原因 与结果、特殊与一般、可能性与现实 性、相对性与绝对性、量变与质变、 偶然性与必然性、形式与内容等基本哲 学范畴。而对这些问题的基本观点与态 度,不仅影响着一个人对周围世界的基 本态度,而且对一门学科的发展同样有 着基础性的影响。例如,对各种统计 方法的衍生与应用就有着至关重要的引

计学作为一门关于如何收集数 据、整理数据和分析数据的方

领作用。

分析差异状况的其他指标

除变异系数外,还有其他反映总体 各单位标志值差异状况的统计指标,如 极差、极值比率、基尼系数、T h e i l 熵 等 。 极差是数据序列中极大值和极小值 之间的差额,极值比率是极大值与极 小值之比。这两个指标在分析中也比 较常用,比如算工业 5 0 强中的第一名 和 最 后 一 名 的 差 距 或 比 率 ,分 析 其 实 力差距。基尼系数将在后面章节中具 体介绍。Theil 熵最早是由 Theil 于 1967 年提出来的,用于研究国家之间的收 入差距,该指标相对复杂,这里不做 叙述。 (作者单位:广东省统计局)

法论科学,其之所以成为科学就在于其 以世界是可以认知的观点为基本出发 点,在于其所阐述的各种统计方法中无 不处处闪烁着哲学的思想火花,更在于 通过各种统计方法的应

用,能帮助人们 对五彩缤纷的世界有更深刻的认识。尽 管统计学是从量的方面认知社会、自 然、科技等现象的方法论体系,而且 每一具体的方法都蕴涵着朴素的哲学思 想,但是本文仅就收集数据中几种基本 调查方法所体现的哲学意义加以探讨, 以便使人们能更自觉、科学地使用这些 统计调查方法,并强化人们对运用这些 统计调查方法所得数据的尊重意识。

统计调查方法的哲学意义

1 . 全面调查与非全面调查的哲学意 义。从全面调查与非全面调查的含义来 看,它体现着“部分与整体” “有 、 限性与无限性” “可能性与现实性” 、 等辩证关系。事实上,只要承认通过 对总体中足够多的个体的认识,就可以 达到对总体一定程度上的正确认识,那 么,人们在一定的场合无论采用全面调 查获取数据,还是采用非全面调查获取 数据都可以达到认识总体数量规律性的 目的。其二,客观事物(现象)通常 都可以看成是由有限个或无限个个体所 构成。显然对有限个个体所构成的事 物,可以采用全面调查,也可以采用 非全面调查。但是,对由无限个个体 所构成的事物,则必须采用非全面调查

统计调查方法与哲学的基本范畴

统计调查是在一定的调查总体内收

4 2             CHINA STATISTICS

POPULAR STATISTICS

变异系数

——  一个衡量离散程度简单而有用的统计指标

文 / 王文森

分析写作过程中,我们常常会 碰到这样的问题:如何定量地

图2

标,当用其来对同一总体的不同时期或 不同总体进行对比时,缺乏可比性。原 因 是: 第一,当总体平均水平不同时,用 绝对差异指标不可比。例如当比较广东 与新建两地的人均收入差异程度时,若 计算得出两地的人均收入标准差都是 5 0 0 元,这时我们不能简单地认为两省 的人均收入差异程度是一样的,因为 上述两个数据序列的平均数都是 5 0 0 元对两省人均收入的意义大不一 样 。 第二,绝对指标受量纲(计量单 位)的限制,导致横向数据不可比。 比如在比较中国和美国各地人均 G D P 的 差异程度时,就存在一个不同货币计量 单位之间的换算问题,如果采用相对差 异指标,就可以消除这种限制。因此, 在不同水平的总体之间、不同量纲的总 体之间,需要采用变异系数来比较标志 值变动程度的大小。变异系数越小,说 明标志值离散程度越小,总体各单位的 差距越小。

说明一个总体各单位的不同时期集中或 分散的发展变化趋势,或不同总体同一 时期的发展差异程度?比如我们要分析 某地区工业企业的盈利水平在五年内是 趋于平均化还是趋于分化,又如要对比 分析 2001 年广东与广西两省内部的经济 发 展 均 衡 程 度 ,等 等 。 在 这 里 , 笔 者 介绍一个既简单常用又能说明问题的统 计指标——变 异 系 数 。 3 0 0 ,但标准差和变异系数不同,序列 1 的变异系数为 0 . 2 5,而序列 2 的变异 系数为 0.13。表现在图上,就是图 1 的 数据波动幅度比较大,而图 2 的数据波 动幅度比较小,也即序列 1 各数据之间 的差距大于序列 2 。变异系数正是用来 描述这种数据波动程度。

平均数 =300,标准差 =37.79,变异系数 =0.13

变异系数的概念

变异系数,就是标准差系数,有 的书上也称差异系数、离散系数,都 是同一个意思。 变异系数是发映总体各单位标志值 的差异程度或离散程度的指标,是反映 数据分布状况的指标之一。其含义是总 体各单位的标准差与其算术平均数对比 的 相 对 数 , 其 计 算 公 式 为:

标准差

在进一步了解变异系数之前,需要 先解释标准差。标准差是总体各单位标 志值与其算术平均数离差平方和的算术 平 均 数 的 平 方 根 , 通 常 用 σ 表 示 。标 准差的平方称为方差,用σ 2 表示。标 准差的一般计算公式为:

上式中,V 代表变异系数,σ代表 标准差,x 代表算术平均数。 大家知道

,我们一般用平均数来反 映客观现象总体各单位某一数量标志的 一般水平,如平均年龄、平均收入等。 但平均数只能反映总体的一般数量水 平,不能说明总体各单位标志值的数量 差异程度,不能揭示其离散程度和集中 趋势,这时候就要用到平均差、标准 差 和 变 异 系 数 ( 标 准 差 系 数 )等 变 异 指标。下面图示可帮助大家理解平均数 和变异系数的含义。

图1

变异系数的计算

由上面的内容可知,计算出一个数 据序列的标准差和平均数,就可得出变 异系数。上例中,

式中 N 代表数据个数,X 代表各单 位标志值,x 代表各单位标志值的平均 数 。 下表列出 5 个企业产值数据,以此 为例计算企业产值的标准差。 变异系数的计算较简便,利用计算 器或有关的统计软件就可以得出结果。 如在 E X C E L 软件中,利用“工具”菜 单中的“数据分析”工具就可计算出 标准差、平均数和变异系数等一些常用 的统计指标。 在实际计算时,若有必要考虑各数 根 据 上 表 ,可 计 算 出 标 准 差 σ: 据的不同重要性,则通常采用加权平均的 形式。比如,在计算各地区人均 GDP 的变 异系数时,一般应以各地区的人口数作为 标准差的局限性。标准差以算术平 均数为中心,它可以反映一个总体全部 权数进行加权评价。用公式表示为:

平均数 =300,标准差 =75.59,变异系数 =0.25

标志值的离散程度。但它是一个绝对指

            CHINA STATISTICS

41

200 7. 6

统计科普

200 7. 6

见 解

VIEW POINT

式中 v 、x 和 x 的意义同上,p i 代表第 i 地区的人口数,p 代表全部地区的人口 数总和。 集数据的一项实践活动,调查总体由有 限或无限个总体单位所构成,因此,就 统计调查的范围来看,统计调查方法有 全面调查和非全面调查之分。顾名思

变异系数的应用

变异系数是一个虽简单但用途广泛 的指标,普遍地用于反映某一总体各单 位标志值的差异程度、集中或离散状 况。国内外学者普遍利用变异系数来分 析地区差距问题。下面笔者举出在写作 过程中用过的几个例子,其他可以举一 反三。 例 1 :工业 5 0 强发展差距分析。 在一篇分析广东工业 5 0 强的文章 中,利用变异系数来说明大企业发展差 距拉大。引文: “从 5 0 强 企 业 的 发 展 变化看,强势企业间的差距有进一步拉 大的趋势。1 9 9 8 年 5 0 强企业销售收入 的变异系数为 0.58,1999 年的变异系数 为 0.60,显示强势企业间的差距也在拉 大 。” 例 2 :广东省地

区发展差距分析。 利用 1995 年和 2000 年广东省各市 人均 GDP 数据,计算得出 1995 年人均 GDP 的变异系数为 0.16,2000 年人均 GDP 的 变异系数为 0.18(未作加权) 。计算结果 表明, “九五”期间,广东省各地区的发 展速度快慢不均,发展差距有所拉大。如 果将改革开放以来全省人均 G D P 的变异 系数都计算出来,则可进一步分析地区 差距的发展变化趋势。

统 计 调 查 方 法 的

文 / 王 天 营

义,全面调查就是对调查总体中全部总 体单位一一进行调查,而非全面调查仅 对调查总体中部分总体单位进行调查。 第二,就非全面调查而言,按照从总 体中选取部分单位方法的不同,又可以 分 为 重 点 调 查 、典 型 调 查 和 抽 样 调 查 等。重点调查就是仅对调查总体中调查 者认为比较重要的单位进行的调查。典 型调查就是仅对调查总体中调查者认为 比较典型的单位进行的调查。抽样调查 就是根据随机性原则从调查总体中选取 部分单位进行的调查。第三,从抽样

哲 学 思 考

调查的具体组织实施来看,抽样调查又 有简单随机抽样调查、系统抽样调查、 分层(组)抽样调查、整群抽样调查 和多阶段抽样调查等。 唯物辨证论通常要研究有限与无 限、部分与整体、现象与本质、原因 与结果、特殊与一般、可能性与现实 性、相对性与绝对性、量变与质变、 偶然性与必然性、形式与内容等基本哲 学范畴。而对这些问题的基本观点与态 度,不仅影响着一个人对周围世界的基 本态度,而且对一门学科的发展同样有 着基础性的影响。例如,对各种统计 方法的衍生与应用就有着至关重要的引

计学作为一门关于如何收集数 据、整理数据和分析数据的方

领作用。

分析差异状况的其他指标

除变异系数外,还有其他反映总体 各单位标志值差异状况的统计指标,如 极差、极值比率、基尼系数、T h e i l 熵 等 。 极差是数据序列中极大值和极小值 之间的差额,极值比率是极大值与极 小值之比。这两个指标在分析中也比 较常用,比如算工业 5 0 强中的第一名 和 最 后 一 名 的 差 距 或 比 率 ,分 析 其 实 力差距。基尼系数将在后面章节中具 体介绍。Theil 熵最早是由 Theil 于 1967 年提出来的,用于研究国家之间的收 入差距,该指标相对复杂,这里不做 叙述。 (作者单位:广东省统计局)

法论科学,其之所以成为科学就在于其 以世界是可以认知的观点为基本出发 点,在于其所阐述的各种统计方法中无 不处处闪烁着哲学的思想火花,更在于 通过各种统计方法的应

用,能帮助人们 对五彩缤纷的世界有更深刻的认识。尽 管统计学是从量的方面认知社会、自 然、科技等现象的方法论体系,而且 每一具体的方法都蕴涵着朴素的哲学思 想,但是本文仅就收集数据中几种基本 调查方法所体现的哲学意义加以探讨, 以便使人们能更自觉、科学地使用这些 统计调查方法,并强化人们对运用这些 统计调查方法所得数据的尊重意识。

统计调查方法的哲学意义

1 . 全面调查与非全面调查的哲学意 义。从全面调查与非全面调查的含义来 看,它体现着“部分与整体” “有 、 限性与无限性” “可能性与现实性” 、 等辩证关系。事实上,只要承认通过 对总体中足够多的个体的认识,就可以 达到对总体一定程度上的正确认识,那 么,人们在一定的场合无论采用全面调 查获取数据,还是采用非全面调查获取 数据都可以达到认识总体数量规律性的 目的。其二,客观事物(现象)通常 都可以看成是由有限个或无限个个体所 构成。显然对有限个个体所构成的事 物,可以采用全面调查,也可以采用 非全面调查。但是,对由无限个个体 所构成的事物,则必须采用非全面调查

统计调查方法与哲学的基本范畴

统计调查是在一定的调查总体内收

4 2             CHINA STATISTICS


相关内容

  • 样本的标准差
  • 样本的标准差 计算公式 标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量.标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根.它反映组内个体间的离散程度.测量到分布程度的结果,原则上具有两种性 ...

  • 变异系数的统计推断及其应用
  • 第12卷 第1期 铜仁学院学报 2010年 1 月 Journal of Tongren University 变异系数的统计推断及其应用 吴 媚1,2 顾赛赛1 ( 1.东南大学 数学系,江苏 南京 210096:2.南京化工职业技术学院 基础部,江苏 南京 210048 ) 摘 要:变异系数是反 ...

  • 4统计指标
  • 第四章 统计指标 本章考核内容和考核要求: 考核内容: 1.统计指标的相关概念 (1)统计指标的定义 (2)统计指标体系 (3)统计指标的特点 (4)统计指标的分类 2.总量指标 (1)总量指标的定义 (2)总量指标的种类 (3)总量指标的计量单位 (4)总量指标的统计要求 3.相对指标 (1)相对 ...

  • GIS课件第10章 空间统计分析
  • 第10章 空间统计分析 统计分析是空间分析的主要手段,贯穿于空间分析的各个主要环节.空间统计分析方法不仅仅限于常规统计方法,还包括利用空间位置的空间自相关分析.本章主要介绍常用统计量.数据特征分析(即探索性数据分析).分级统计分析.空间插值和空间回归分析五方面内容. 10.1概述 10.1.1基本概 ...

  • 流行病学的常用指标
  • 流行病学的常用指标 ⏹ 疾病发病频率测量指标 ● 发病率(incidence rate) ● 罹患率(attack rate) ● 患病率(prevalence rate) ● 感染率(infection rate) ● 续发率(secondary attack rate,SAR) ● 病残率(di ...

  • 特高压输电工程成本分摊方法研究
  • [摘 要] 特高压输电工程成本分摊是成本核定的关键.由于特高压输电工程一般由电网企业集团公司统一经营,大部分特高压输电工程的资产.负债.成本等项目无法按工程拆分,目前对成本的归集一般简单以资产或者收入为基础,缺乏科学.规范的分摊机制.基于电压等级.线路长度.输电容量.总投资.输电量.固定资产原值等成 ...

  • 第五章 思考与练习答案高教出版社
  • 第五章 思考与练习答案 一.单项选择题 1. A (算术平均数).H (调和平均数)和G (几何平均数)的关系是: ( D ) A .A ≤G ≤H : B.G ≤H ≤A : C.H ≤A ≤G : D.H ≤G ≤A 2. 位置平均数包括 ( D ) A .算术平均数: B.调和平均数: C.几 ...

  • 2014统计学试题库
  • < 统 计 学 > 试 题 库 知识点一: 统计基本理论和基本概念 一.填空题 1.统计研究的具体方法主要有. . 2.统计工作可划分为. 四个阶段. 3.随着是可以相互转化的. 4.标志是说明. 5.可变的数量标志和所有的统计指标称为,变量的具体数值称为 6.变量按分,可分为连续变量和 ...

  • 标准偏差与相对标准偏差公式(汇编版)
  • 标准偏差 相对标准方差的计算公式 准确度:测定值与真实值符合的程度 绝对误差:测量值(或多次测定的平均值)与真(实)值之差称为绝对误差,用δ表示. 相对误差:绝对误差与真值的比值称为相对误差.常用百分数表示. 绝对误差可正可负,可以表明测量仪器的准确度,但不能反映误差在测量值中所占比例,相对误差反映 ...