Bootstrap在商业银行资产负债评价中的运用

  摘 要:Bootstrap方法是一种利用样本信息来估计总体的非参方法,聚类分析方法是将样本或变量进行归类评价的一种多元统计方法。基于bootstrap抽样法和系统聚类技术对我国部分商业银行的资产负债况进行分析,聚类结果将各个商业银行的资产负债情况分为3类。

  关键词:bootstrap;聚类分析;商业银行;资产负债

  中图分类号:F83 文献标识码:A doi:10.19311/j.cnki.1672-3198.2016.33.104

  1 引言

  自Efron首次提出Bootstrap以来,在众多统计学家贡献下,bootstrap统计方法得到了充分的发展,尤其是在计算机技术发达的今天,bootstrap变得更加容易实现。就bootstrap方法的基本原理,Efron、Tibshirani、DiCiccio等曾作详细的论述。国内学者对bootstrap的研究也取得一定的成绩,施锡铨在上世纪九十年代论述过独立同分布数据的bootstrap逼近方法。更多的国内学者是运用bootstrap方法做实证分析,如赵亮、程锦秀等把bootstrap运用到生物学研究上,孙佳美、段白鸽利用该方法做死亡模型检验的研究,刘勤、金丕焕推广了bootstrap法在医学统计上运用。

  国内学者对商业银行的研究主要集中于银行的效率分析,如魏煜、张建华、姚树洁、朱南、郑录军等对此作有详细的论述,详见参考文献。另外一些学者重点研究了我国商业银行的信用风险的评估问题,沈沛龙、王春峰、唐国储等在这个方面作出贡献。后来的学者也在继续关注着这些领域。涉及商业银行收益研究的国内文献并不多见,张铁铸曾从银行贷款的多元化角度研究银行风险、收益与之的关系;于研、孙磊运用SFA方法探索银行收益结构与银行效率的相关性;蒲勇健、李绍芳考察研究了金融衍生品对商业银行收益的影响;王连则运用了非参数统计手段研究了信用卡的信用额度变化与银行收益的关系;黄陈曾将我国商业银行收益水平作国际比较并归纳出商业银行收益的四个层次。银行的收益水平是投资者关注的重要指标之一,而银行资产负债情况正能反映银行经营状况,所以继续对此进行深入研究有着重要的现实意义。本文,笔者尝试利用多元统计技术并借助bootstrap方法来剖析我国商业银行的资产负债,分析各银行经营收益。

  2 银行资产负债评价方法

  2.1 BOOTSTRAP

  Bootstrap方法是一类非参数Monte Carlo方法,其基本思想是根据样本的经验信息(分布),通过又放回的简单随机抽样获得B个bootstrap样本,进而利用这些Bootstrap样本信息进行统计推断。其中Bootstrap样本容量依然和原样本一致,且观测值被抽到的概率相等。当目标总体未指定的情况下,Bootstrap方法经常被使用,此时样本为唯一已有的信息。

  Bootstrap方法的基本步骤为,假设x=(x1,x2,…,xn)为已知的一个样本,来自未知分布F。X*为从x中随机抽取的一个样本,通过有放回的抽样得到样本X*1,…,X*n,显然X*1,…,X*n服从{x1,…,xn}上的均匀分布,P(X*=xi)=1n,i=1,…,n。我们抽取简单子样本X*=(X*1,X*2,…,X*n),该样本为一个Bootstrap子样本。进行B次抽样,就可以得到B个Bootstrap样本。

  另外,Bootstrap方法需借助计算机完成大量的模拟计算,通过足够多的重复抽样可以把样本均值的Bootstrap分布找出来,进而进行统计推断。

  2.2 聚类分析

  聚类分析思想是根据已知数据,观察各样品或变量之间亲疏关系的相似程度,依照某种准则,把一些相似程度较大的样品或变量聚合为一类,把另外一些相似程度较大的样品或变量聚合为另外一类,使同一类内差别较小,而类与类之间的差别较大,最终将观察样品或变量分为若干类。

  聚类分析中需要进行相似性度量,通常用距离来衡量哪些样本应该聚为一类。我们假设有n个样本单位,每个样本测有p个指标(变量),每个样本都可以看成p维空间中的一点,n个样本就是p维空间中的n个点,第i个样本与第j个样本之间的距离记为dij,聚类过程中,相距较近的点归为一类,相距较远的点归为不同的类。其中dij满足条件:

  dij≥0对一切的i和j成立,且仅当i=j时dij=0;

  dij=dij对一切的i和j成立;

  dij≤dik+dkj对于一切的i和j成立。

  聚类中常用的距离有明氏(Minkowski)距离,马氏距离,具体的聚类的方法有系统聚类、模糊聚类、K均值聚类等等,其中系统聚类中常用的方法有最短距离法、最长距离法、中间距离法、重心法、离差平方和法等。综合考虑到数据是跨时间的面板数据,本文选用离差平方和法聚类。

  3 实例分析

  3.1 数据描述

  商业银行的收益情况可以由其资产负债表反映出来,考虑到数据的可得性,本文选取了包括五大国有商业银行、中兴(CITIC)、光大(CEB)、兴业(IBC)、浦发(SHANG)、招商(CMB)、宁波商业银行(NCB)、深发展(SHENG)、华夏(HXB)、民生银行(CMBC)在内的14家银行作为研究对象,选取了2002年至2008年间银行的其他收入财产、总收入财产、固定资产、无收益资产、总资产、存款及短期资金、其他债券、其它免息财产、资产净值、总负责及股东权益、资产负债平衡、坏账准备金、流动性资产等13个指标考察各商业银行的收益水平情况。为消除部分数据缺失造成的影�,笔者在原有数据基础上采用Bootstrap方法,对原始数据进行重抽样计算得到各商业银行的13个指标的均值,简记指标名依次为COL1-COL13,具体数据见图1。

  3.2 结果分析   我们采用和离差平方和法利用SAS软件将14个商业银行的资产负债结构进行聚类分析,最终将其分为三个类别。运行以下SAS语句可以得到聚类的树状图以及分类结果。

  proc cluster data=banks method=ward ccc pseudo;

  var col1-col13;

  id banks;

  run;

  proc tree horizontal ncl=3 out=out;/*out为分类结果输出数据*/

  id banks;

  run;

  聚类树状图如图2所示:

  对比聚类结果,可以发现部分的指标有减少的趋势。其中中国工商银行大部分指标都高于其他商业银行,一定程度说明了工行的优势地位。1类商业银行较工行存在不小差距,需要完善其�Y产负债的合理性。本文基于Bootstrap-聚类分析对商业银行的资产负债进行初步的分类,必须意识到各个商业银行都在发展中,该分类不是一劳永逸的。在此分类基础上,我们还可以进一步挖掘资产负债与银行盈利能力、金融稳定性等的关系。而且,随着时间的发展,我们还可以引入时间序列分析方法,进行多指标时间序列聚类。

  参考文献

  [1]Efron Bradley.Bootst rap methods : another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.

  [2]Efron Bradley,Tibshirani Robert.An introduction to the bootstrap[M].New York:Chapman & Hall Ltd,1993.

  [3]Thomas J.DiCiccio and Bradley Efron.Bootstrap Confidence Intervals[J].Statistical Science,1996,(11).

  [4]施锡铨.独立非同分布情况的光滑Bootstrap逼近[J].数学物理学报,1990,(10).

  [5]赵亮,程锦秀.Bootstrap方法及其在生物学研究中的应用[J].四川动物,2010,(29).

  [6]孙佳美,段白鸽.Bootstrap方法在死亡模型中的应用[J].统计研究,2010,(6).

  [7]刘勤,金丕焕.Bootstrap方法及其在医学统计中的应用[J].中华预防医学杂志,1998,1(32):1.

  [8]谢益辉,朱钰.Bootstrap方法的历史发展和前沿研究[J].统计与信息论坛,2008,(2):90-96.

  摘 要:Bootstrap方法是一种利用样本信息来估计总体的非参方法,聚类分析方法是将样本或变量进行归类评价的一种多元统计方法。基于bootstrap抽样法和系统聚类技术对我国部分商业银行的资产负债况进行分析,聚类结果将各个商业银行的资产负债情况分为3类。

  关键词:bootstrap;聚类分析;商业银行;资产负债

  中图分类号:F83 文献标识码:A doi:10.19311/j.cnki.1672-3198.2016.33.104

  1 引言

  自Efron首次提出Bootstrap以来,在众多统计学家贡献下,bootstrap统计方法得到了充分的发展,尤其是在计算机技术发达的今天,bootstrap变得更加容易实现。就bootstrap方法的基本原理,Efron、Tibshirani、DiCiccio等曾作详细的论述。国内学者对bootstrap的研究也取得一定的成绩,施锡铨在上世纪九十年代论述过独立同分布数据的bootstrap逼近方法。更多的国内学者是运用bootstrap方法做实证分析,如赵亮、程锦秀等把bootstrap运用到生物学研究上,孙佳美、段白鸽利用该方法做死亡模型检验的研究,刘勤、金丕焕推广了bootstrap法在医学统计上运用。

  国内学者对商业银行的研究主要集中于银行的效率分析,如魏煜、张建华、姚树洁、朱南、郑录军等对此作有详细的论述,详见参考文献。另外一些学者重点研究了我国商业银行的信用风险的评估问题,沈沛龙、王春峰、唐国储等在这个方面作出贡献。后来的学者也在继续关注着这些领域。涉及商业银行收益研究的国内文献并不多见,张铁铸曾从银行贷款的多元化角度研究银行风险、收益与之的关系;于研、孙磊运用SFA方法探索银行收益结构与银行效率的相关性;蒲勇健、李绍芳考察研究了金融衍生品对商业银行收益的影响;王连则运用了非参数统计手段研究了信用卡的信用额度变化与银行收益的关系;黄陈曾将我国商业银行收益水平作国际比较并归纳出商业银行收益的四个层次。银行的收益水平是投资者关注的重要指标之一,而银行资产负债情况正能反映银行经营状况,所以继续对此进行深入研究有着重要的现实意义。本文,笔者尝试利用多元统计技术并借助bootstrap方法来剖析我国商业银行的资产负债,分析各银行经营收益。

  2 银行资产负债评价方法

  2.1 BOOTSTRAP

  Bootstrap方法是一类非参数Monte Carlo方法,其基本思想是根据样本的经验信息(分布),通过又放回的简单随机抽样获得B个bootstrap样本,进而利用这些Bootstrap样本信息进行统计推断。其中Bootstrap样本容量依然和原样本一致,且观测值被抽到的概率相等。当目标总体未指定的情况下,Bootstrap方法经常被使用,此时样本为唯一已有的信息。

  Bootstrap方法的基本步骤为,假设x=(x1,x2,…,xn)为已知的一个样本,来自未知分布F。X*为从x中随机抽取的一个样本,通过有放回的抽样得到样本X*1,…,X*n,显然X*1,…,X*n服从{x1,…,xn}上的均匀分布,P(X*=xi)=1n,i=1,…,n。我们抽取简单子样本X*=(X*1,X*2,…,X*n),该样本为一个Bootstrap子样本。进行B次抽样,就可以得到B个Bootstrap样本。

  另外,Bootstrap方法需借助计算机完成大量的模拟计算,通过足够多的重复抽样可以把样本均值的Bootstrap分布找出来,进而进行统计推断。

  2.2 聚类分析

  聚类分析思想是根据已知数据,观察各样品或变量之间亲疏关系的相似程度,依照某种准则,把一些相似程度较大的样品或变量聚合为一类,把另外一些相似程度较大的样品或变量聚合为另外一类,使同一类内差别较小,而类与类之间的差别较大,最终将观察样品或变量分为若干类。

  聚类分析中需要进行相似性度量,通常用距离来衡量哪些样本应该聚为一类。我们假设有n个样本单位,每个样本测有p个指标(变量),每个样本都可以看成p维空间中的一点,n个样本就是p维空间中的n个点,第i个样本与第j个样本之间的距离记为dij,聚类过程中,相距较近的点归为一类,相距较远的点归为不同的类。其中dij满足条件:

  dij≥0对一切的i和j成立,且仅当i=j时dij=0;

  dij=dij对一切的i和j成立;

  dij≤dik+dkj对于一切的i和j成立。

  聚类中常用的距离有明氏(Minkowski)距离,马氏距离,具体的聚类的方法有系统聚类、模糊聚类、K均值聚类等等,其中系统聚类中常用的方法有最短距离法、最长距离法、中间距离法、重心法、离差平方和法等。综合考虑到数据是跨时间的面板数据,本文选用离差平方和法聚类。

  3 实例分析

  3.1 数据描述

  商业银行的收益情况可以由其资产负债表反映出来,考虑到数据的可得性,本文选取了包括五大国有商业银行、中兴(CITIC)、光大(CEB)、兴业(IBC)、浦发(SHANG)、招商(CMB)、宁波商业银行(NCB)、深发展(SHENG)、华夏(HXB)、民生银行(CMBC)在内的14家银行作为研究对象,选取了2002年至2008年间银行的其他收入财产、总收入财产、固定资产、无收益资产、总资产、存款及短期资金、其他债券、其它免息财产、资产净值、总负责及股东权益、资产负债平衡、坏账准备金、流动性资产等13个指标考察各商业银行的收益水平情况。为消除部分数据缺失造成的影�,笔者在原有数据基础上采用Bootstrap方法,对原始数据进行重抽样计算得到各商业银行的13个指标的均值,简记指标名依次为COL1-COL13,具体数据见图1。

  3.2 结果分析   我们采用和离差平方和法利用SAS软件将14个商业银行的资产负债结构进行聚类分析,最终将其分为三个类别。运行以下SAS语句可以得到聚类的树状图以及分类结果。

  proc cluster data=banks method=ward ccc pseudo;

  var col1-col13;

  id banks;

  run;

  proc tree horizontal ncl=3 out=out;/*out为分类结果输出数据*/

  id banks;

  run;

  聚类树状图如图2所示:

  对比聚类结果,可以发现部分的指标有减少的趋势。其中中国工商银行大部分指标都高于其他商业银行,一定程度说明了工行的优势地位。1类商业银行较工行存在不小差距,需要完善其�Y产负债的合理性。本文基于Bootstrap-聚类分析对商业银行的资产负债进行初步的分类,必须意识到各个商业银行都在发展中,该分类不是一劳永逸的。在此分类基础上,我们还可以进一步挖掘资产负债与银行盈利能力、金融稳定性等的关系。而且,随着时间的发展,我们还可以引入时间序列分析方法,进行多指标时间序列聚类。

  参考文献

  [1]Efron Bradley.Bootst rap methods : another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.

  [2]Efron Bradley,Tibshirani Robert.An introduction to the bootstrap[M].New York:Chapman & Hall Ltd,1993.

  [3]Thomas J.DiCiccio and Bradley Efron.Bootstrap Confidence Intervals[J].Statistical Science,1996,(11).

  [4]施锡铨.独立非同分布情况的光滑Bootstrap逼近[J].数学物理学报,1990,(10).

  [5]赵亮,程锦秀.Bootstrap方法及其在生物学研究中的应用[J].四川动物,2010,(29).

  [6]孙佳美,段白鸽.Bootstrap方法在死亡模型中的应用[J].统计研究,2010,(6).

  [7]刘勤,金丕焕.Bootstrap方法及其在医学统计中的应用[J].中华预防医学杂志,1998,1(32):1.

  [8]谢益辉,朱钰.Bootstrap方法的历史发展和前沿研究[J].统计与信息论坛,2008,(2):90-96.


相关内容

  • 偿二代风险计量数理方法课题报告
  • <中国第二代偿付能 力监管制度的 风险计量数理方法> 课题研究报告(摘要) 北京大学课题组 2013年11月 一.课题执行情况和主要研究成果总结 本课题是由"汉诺威再保险股份公司上海分公司"资助的研究性课题,自2013年3月开始启动,目前已按照原计划完成主要的研究工作 ...

  • 2015年秋季中国精算师协会会员水平测试指南
  • 2015年秋季中国精算师协会会员水平测试指南 第I部分 中国精算师协会会员水平测试 准精算师部分(A系列) 测试时间:3小时 测试形式:选择题 测试要求: 本科目是关于风险管理和精算中随机数学的基础课程.通过本科目的学习,考生应该掌握基本的概率统计知识,具备一定的数据分析能力,初步了解各种随机过程的 ...

  • 一个Java程序的执行过程
  • 我们手工执行java程序是这样的: 1 在记事本中或者是UE的文本编辑器中,写好源程序: 2 使用javac命令把源程序编译成.class文件: 编译后的.class(类字节码)文件中会包含以下内容: ConstantPool:符号表: FieldInfo:类中的成员变量信息: MethodInfo ...

  • 进化树分析步骤
  • 进化树分析步骤 一.用CLUSTALX (1.83)排列序列(alignment ) 方法: 1.打开记事本,以FASTA 格式粘贴序列到记事本,所有要比对的序列都这么粘贴,格式如下: >aa (序列名称) aaagggtttttcccc (序列) >bb aaagggtttttcccc ...

  • 金融加速器效应在中国存在吗_赵振全
  • 2007年第6期 金融加速器效应在中国存在吗? 赵振全 于 震 刘 淼* 内容提要:本文从金融加速器理论出发, 运用门限向量自回归(TVAR) 模型在宏观层 面上对中国信贷市场与宏观经济波动的非线性关联展开实证研究.通过非线性脉冲响应 函数的检验结果我们发现:在1990年1月至2006年5月期间, ...

  • 有调节的中介:是竞争还是抑制
  • 心理学报 2014, Vol. 46, No.5 714−726 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2014.00714 有调节的中介模型检验方法:竞争还是替补? * 温忠麟1 叶宝娟2 (1华南师范大学心理应用研究中心/心理学院, 广州 ...

  • 基于PLS―SEM的供热企业运营服务质量影响因素研究
  • 摘要: 针对现阶段我国供热企业运营服务质量水平普遍不高的现状,采用PLS-SEM方法对我国部分省市的集中供热企业进行实证研究,探索供热企业运营服务质量的关键影响因素,并对影响路径进行了详细分析,提出了从制度环境.技术创新.管理能力以及财务能力四个方面科学提升运营服务质量水平的有效建议. Abstra ...

  • Cisco期末考试选择题题库
  • 第1小组成员出题集: 1. 一台主机已经正确布线并配置有唯一的主机名和有效的IP 地址.要使主机可以远程访问资源还应配置哪两个额外的组件? AC A .子网掩码 B .MAC 地址 C .默认网关 D .环回 IP 地址 E .DHCP 服务器 IP 地址 2. 支持可变长子网掩码的路由协议有?BC ...

  • 多重序列比对及系统发生树的构建
  • 多重序列比对及系统发生树的构建 来源:生物谷 2010-1-8 访问量:6568 评论(0) 分享0 [实验目的] 1.熟悉构建分子系统发生树的基本过程,获得使用不同建树方法.建树材料和建树参数对建树结果影响的正确认识: 2.掌握使用Clustalx 进行序列多重比对的操作方法: 3.掌握使用Phy ...