投资组合优化模型

投资组合优化模型

摘要

长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。

本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,以获得最高的回报。

对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益U 与x,y 之间的关系,对于模型中的各项自变量前的系数估计量,利用spss 软件来进行逐步回归分析。发现DW 值为0.395,所以原模型的随机误差项违背了互相独立的基本假设的情况,即存在自相关性。为了处理数据间的自相关问题,运用了迭代法,先通过Excel 进行数据的处理和修正,达到预定精度时停止迭代,再一次用spss 软件来进行检验,发现DW 值变为2.572,此时DW 值落入无自相关性区域。在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程度的科学依据。

对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB 软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。

最后,对模型的优缺点进行评价,指出了总收益与购买A 类资产x 份数和B 类资产y 份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。

关键字:经济效益 回归模型 自相关 迭代法 线性规划 有效投资方法

一、问题重述

某金融机构选定了A ,B 两种投资品种, 购买A 类资产x 份和B 类资产y 份的

(1)确定U 与x,y 的关系;

(2)若A 的价格是每份120元,B 的价格是每份80元,现有资金960万元,选定有效的投资方案以使收益最大。

二、问题分析

对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买A 类资产和购买B 资产各自都会带来收益,因此,一般先确定U 与x 、y 之间的关系,有利于我们在决定投资时,如何分配对A ,B 两类资产的投入资金的比重,这也是我们建立模型首先要解决的难点。

观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行预测和分析。

对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB 软件来进行求解,得到最优解,最后进行检验。

三、模型假设

1.投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”的假设。

2. 在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。

3. 假设题设中给的参数是准确值没有偏差。

4. 存在无风险资产,即本文对A 、B 两类资产的投资都为无风险投资。

5. 每种投资是否收益是相互独立的。

6. 对收益率和风险的预测值是可信的

四、符号说明

U ——收益

x ——, 购买A 类资产的份数

y ——, 购买B 类资产的份数

β0、β1、β2——分别为回归模型的常数项,自变量x 、y 前面的系数 εi ——第i 个样本回归模型的随机误差项

U t ——第t 个收益的回归估计

x t ——第t 个购买A 类资产的样本份数

y t ——第t 个购买B 类资产的样本份数

五、理论背景 1. 多元线性回归

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y 为因变量X1,X2„Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:

Y i =β0+β1X 1i +β2X 2i +„+βk X ki +μi i=1,2,„,n

其中 k为解释变量的数目,βj (j=1,2,„,k)称为回归系数(regression coefficient) 。上式也被称为总体回归函数的随机表达式。它的非随机表达式为

E(Y∣X 1i ,X 2i ,„Xki ,)=β0+β1X 1i +β2X 2i +„+βk X ki

βj 也被称为偏回归系数(partial regression coefficient)

建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;

(4)自变量应具有完整的统计数据,其预测值容易确定。

2、自相关的概念

如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。 对于模型

Y i =β0+β1X 1i +β2X 2i +„„+βk X ki +μi i=1,2,„„,n

随机误差项互不相关的基本假设表现为:

Cov(μi , μj )=0 i≠j,i,j=1,2,„„,n

如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。

在其他假设仍旧成立的条件下,序列相关即意味着

E (μi , μj )!=0

⎛ ⎛ μ ⎫ 1 ⎪ E ( NN T ) = E ⎪ μ ⎪ ⎝ ⎝ n ⎭ ⎫ ⎛ μ 2 ⎪ 1 μ )⎪ = E n ⎪ μ μ ⎭ ⎝ n 1 μ μ ⎫ ⎪ ⎪ μ 2 ⎪

n ⎭ 1 n (μ 1

⎛ E ( μ 2 ) 1 = ⎝ E ( μ n μ 1 )

⎛ σ 2 = ⎝ E ( μ n μ 1 ) E ( μ 1 μ n ) ⎫ ⎛ σ 2 1 ⎪ ⎪ = ⎪ 2 ) μ μ E ( μ n ⎭ ⎝ E ( n 1 ) E ( μ 1 μ n ) ⎫ ⎪ 2 ⎪ = σ Ω ⎪ σ 2 ⎭ E ( μ 1 μ n ) ⎫ ⎪ ⎪ σ 2 ⎪⎭ n ≠ σ I 2

3、自相关性的后果

(1)参数估计量非有效

(2)变量的显著性检验失去意义

(3)模型的预测失效

4、自相关性的检验

杜宾-瓦森(Durbin-Watson )检验法

该方法的假定条件是:

(1)解释变量 X非随机;

(2)随机误差项μi 为一阶自回归形式:

μi =ρμi-1+εi

(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi =β0+β1X 1i +⋯βk X ki +γY i-1+μi

(4)回归含有截距项;

(5)没有缺失数据。

D.W. 统计量

d l 则存在正自相关若 0

d u 不能确定 d l

d u

4 - d u

4 - d l

5、具有自相关性模型的估计

(1)广义最小二乘法

(2)一阶差分法

(3)广义差分法

(4)随机误差项相关系数ρ的估计

科克伦-奥科特迭代法

首先,采用OLS 法估计原模型

Yi =β0+β1X i +μi

得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS 法估计下式

μi =ρ1μi-1+ρ2μi-2+⋯ρL μi-L +εi

得到ρ1,ρ2,⋯,ρk ,作为随机误差项的相关系数ρ1,ρ2,⋯,ρk 的第一次

估计值。

其次,将上述ρ1,ρ2,⋯,ρk ,带入以差分模型

Y i -ρ1Y i-1-„„-ρi Y i-1=β0(1-ρ1-„„-ρi )+βi (Xi -ρ1X i-1-„„-ρ

i X i-1)+εi i=1,2,„„,n

在此,将β0,β1代回原模型,计算出原模型随机误差项的新的“近似估计值”,并以之作为模型

Μi =ρ1μi -1+ρ2μi-2+„„+ρk μi-k +ε

的样本观测值,采用OLS 法估计该方程,得到ρ1,ρ2,⋯,ρk 作为相关系数

ρ1,ρ2,⋯,ρk 的第二次估计值。

关于迭代的次数,可根据具体的问题来定。

一般是事先给出一个精度,当相邻两次ρ1,ρ2,⋯,ρk 的估计值之小于这一

精度时,迭代终止。

杜宾(Durbin )两步法

该方法仍是先估计ρ1,ρ2,⋯,ρk ,再对差分模型进行估计。

第一步,变换差分模型为下列形式:

Y i =ρ1Y i-1+„„+ρl Y i-l +β0(1-ρ1-„„-ρk )+β1(Xi -ρ1X i-1-„„-ρ

k X i-k )+εi i=1,2,„„,n

采用OLS 法估计该方程,得到各Y j (j=i-1,i-2,„„,i-k) 前的系数ρ1,ρ2,⋯,ρk 的估计值ρ1,ρ2,„„,ρk 。

第二步,将估计的ρ1,ρ2,⋯,ρk , 代入差分模型

采用OLS 法估计,得β0(1-ρ1-„„-ρk ), β1的估计量,记为*β0,*β1。

于是: ˆ 0 = βˆ 1 - - ρˆ l ) , - ρˆ 1 = βˆ 1 β*

六、模型建立

问题一:假定收益U 与x 、y 之间存在线性关系,则可建立二元线性回归模型

U=β0+β1*x+β2*y+ε

式中,U 表示总的收益;x 表示购买A 类资产的份数;y 表示购买B类资产的份数;β0、β1、β2分别表示回归方程的常数项、x 和y 前面的系数;ε表示随机误差项。

问题二:由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大值

建立约束条件:

120x+80y≤9600000

X ≥0

Y≥0

式中,x 、y 表示的是整数。

七、模型求解及优化

1. 问题一

(1)根据数据资料定义变量U (收益)、x (A 类资产的份数)、y (B 类资产的份数),再将全部数据输入spss 界面,建立数据文件。

(2)选择U 为因变量,以x 、y 为自变量,进行逐步回归;在Statistics 对话框中选择Estimate 、Model fit 、Discriptives 、Durbin-Watson ;选择Plots 对话框的残差直方图、残差正态概率图。并输出以ZRESID 为X 轴,以DPENDNT 为Y 轴的散点图;在Save 对话框里选择保存未标准预测值、未标准预测值残差、标准预测值、标准预测值残差;Options 对话框选项选择默认选项,各选项确认以后,交系统运行。

(3)结果及分析

描述统计表如下:

Descriptive Statistics

表中显示各个变量的全部观测量的Mean(均值) 、Std.Deviation(标准差) 和观测量总数N 。U 的均值和标准差分别为14.231579、5.6033772,x 的均值和标准差分别为77.368421、77.1479175,y 的均值和标准差分别为81.368421、97.2106593。

(4)相关系数矩阵如下:

Correlations

U x y

Pearson 1.000 .852 .725 Correlation

.852 1.000 .614

.725 .614 1.000

Sig. . .000 .000 (1-tailed)

.000 . .003

.000 .003 .

N 19 19 19

19 19 19

19 19 19

表中显示了三个自变量两两间的Pearson 相关系数,以及关于相关系数关系等于零的假设的单尾显著性检验概率。从表中看到因变量U (收益)与自变量x(A类资产的份数)、y (B 类资产的份数)之间相关系数一次为0.852、0.725,反应它们之间有显著的相关关系,而可以看出在同等条件下,购买A 类资产相比购买B 类资产的收益更大。

(5)回归系数表如下:

Coefficients(a)

据表中数据费标准化系数B 的数值可以知道,逐步回归过程中先后建立的两个回归模型分别是:

模型1:U=9.445+0.062*x

模型2:U=9.042+0.047*x+0.019*y

即β0=9.042, β1=0.047, β2=0.019

Std.Error(标准误) 列显示的是各系数的估计标准误差。

从模型中可以看到,购买A类资产和购买B类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。

(6)回归模型概述表如下:

Model Summary(c)

b Predictors: (Constant), x, y

c Dependent Variable: U

回归模型概述表中给出了第一个模型中因变量U 与自变量x 之间的相关系数R=0.852,说明变量U 与x 之间具有显著的线性关系。第二个模型中因变量U 与x 、之间的复相关系数R=0.890,反映了变量U 与x 、y 之间具有高度线性关系。

对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的dl=1.08,du=1.53,因为0

由于回归模型存在序列自相关性,在此,我们用迭代法来处理。

Ut =k0+k1xt+k2y t

et =ρ*et-1+ut

U ’t =Ut -ρ*Ut-1

x ’t =xt -ρ*xt-1

y’t =yt -ρ*yt-1

其中,上式中的自相关系数p 是未知的,可以由DW 值做出估计p=1-1/2*DW,计算后得出p 的估计值为0.8025。

于是原式变为

U ’t =β0+β’1*xt +β’2*yt +ut

(7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel 做出有变换后的数据,并录入spss 界面进行检验

由变换后的数据得出的回归模型概述表如下:

Model Summary(c)

t b Predictors: (Constant), xt , yt

c Dependent Variable: Ut

概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的

dl=1.08,du=1.53,因为dl

同时,我们可以观察到修改后的回归模型的残差值也基本在水平线y=0附近随机分布

在此时自相关回归中,回归预测值Ut 不是用k0+k1*xt+k2*yt计算,而是用

U t = k’0+ρ*Ut-1+k’1(xt -ρ*xt-1)+ k’2*(yt -ρ*yt-1)

在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1和yt-1, 即

U t = k’0+ρ*Ut-1+k’1(xt -ρ*xt-1)+ k’2*(yt -ρ*yt-1)

=9.042+0.8025*22+0.047*(x t -0.8025*236)+0.019*(yt -0.8025*270) =13.678845+0.047*xt +0.019*yt

t 统计量值和t 分布的双侧显著性概率Sig. 皆远小于0.05,可以认为回归系数是显著的。

2. 问题二:

根据问题一得到的模型和给出的已知条件,可以得到

目标函数: max U=13.678845+0.047*x+0.019*y

约束条件: 120x+80y

x>=0

y>=0

用MATLAB 软件来求解线性规划的命令如下:

c=[-0.047 -0.019];

A=[120 80];

b=[9600000];

Aeq=[];

beq=[];

lb=[0;0]; vb=[];

[x,fval]=linprog(c,A,b,Aeq,beq,lb,vb)

结果: x =

1.0e+04 * 8.0000 0.0000

fval =

-3.7600e+03

并运用MATLAB 还可以求出该模型的图像 syms x y U

x=0:2:300; y=0:2:300;

U=13.678845+0.047*x+0.019*y; [x,y]=meshgrid(x,y); surf(x,y,U)

可得在A 的价格是每份120元,B 的价格是每份80元,资金960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买A 类资产80000份,这是预计的最大收益是3773.679。

八、模型检验

模型检验主要是针对问题一所提出的模型进行检验。 对回归系数的显著性检验,我们用的是t 检验。

t 检验:

在多元线性回归中,回归方程显著并不意味着美国自变量对U 的影响显著,所以需要对每个变量进行显著性检验。

如果某个自变量xj 对作用不显著,那么在回归模型中,它的系数βj 就取值为零。因此,检验变量是否显著,等价于检验假设

H 0j :βj =0, j =1,2,„„,p 据此可以构造t 统计量

t j =β/√c jj σ

其中σ是回归标准差。当∥t j ∥≥t α/2 时,拒绝元假设H 0j :βj =0,认为βj

显著不为零,自变量x j 对因变量y 的线性效果显著;当∥t j ∥<t α/2时,接受原假设H 0j :βj =0,认为βj 为零,自变量x j 对因变量y 的线性效果不显著。

下图是回归系数表 Coefficients(a)

图中的Sig 即显著性P 值,由x 的P ≈0.000,由此可知此自变量x 显著,y 的P ≈0.039,自变量y 也显著。

由spss 软件做出的残差统计表如下:

Residuals Statistics(a)

Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance

Centered Leverage Value a Dependent Variable: Ut

1.334061 -1.4082221

-1.569 -1.621 -1.5040683

-1.725 .139 .000 .008

6.122075 1.8736107

2.087 2.185 2.3974390

2.556 11.280 1.710 .664

3.665045 .0000000

.000 .028 .0771220

.053 1.889 .132 .111

1.2092543 .8431280

.939 1.032 1.0913442

1.096 2.977 .396 .175

18

18 18 18 18 18 18 18 18

本表显示预测值(Predicted Value)、残差(Std. Predicted Value)、标准化预测值(Standard Error of Predicted Value)、标准化残差的最小值(Minimum )、最大值(Maximum )、均值(Mean )、标准差(Std. Deviation)以及样本容量(N )。根据概率的3-σ原则,上图中标准化残差的绝对值的最大值为1.569

残差分布直方图和观测量累计概率P-P 图如下:

回归分析中,总是假设残差ε服从正态分布,残差分布直方图和观测量累计概率P-P 图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态的假设做出检验。

从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是很明显的服从正态分布。尽管这样,也不能盲目地否定残差服从正态分布的假设,因为我们用来进行的样本量太小,样本容量仅为19.

观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。

基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。

输出的图形中还有一个因变量的回归标准化残差图,如下所示:

对于问题二最优解的检验

由于x,y 是正整数,且有约束条件120x+80y≤9600000, 可知(x,y )的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数

U=13.678845+0.047*x+0.019*y,

经变化可得到 y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U 为最大,此时的x 与y 值便是最优投资组合。 用MATLAB 画出的图像如下

再者,由问题一建立的模型中,我们可以看到x 前的回归系数为0.047,y 前面的回归系数为0.019,再由A 的价格是每份120元,B 的价格是每份80元,在不考虑常数项的情况下,计算可得对于A 的投资,每增加1元可得到的收益是0.0003917而对于B 的投资,每增加1元可得到的收益是0.0002375,所以我认为在资金有限,不考虑风险的情况下,投资者应该先考虑投资A 类资产,如果减去能购买A 类最多份数后的剩余的资金J ,满足80≤J <120,则此时应该再考虑买一份B 类资产。

关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,再代入目标函数进行检验,,但是对于多元的线性规划最优解,还是要建立相关的矩阵,再来进行计算和检验。

九、模型评价及优化

模型的优点: (1)本模型根据已有数据较好的体现了总收益与购买A 、B 类资产的份数之间的关系,而且该模型简单易懂,使得求解有了很大的简化。

(2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住了分析的要点,较好的完成了数据的提取与应用。

(3)在本文中,我们分别用了spss 、Excel 、MATLAB 等软件来进行数据的分析和处理,这样有利于提高模型的准确度和预测的可信性。

模型的缺点:

(1)由于模型是建立在假设 是确定值的基础上的而实际中β0、β1、β2常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,缺乏动态性。

(2)该模型没有考虑到各类投资的风险性,。 (3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定 模型的优化和推广:

将β0、β1、β2 作为随机变量来考虑,并进而考虑个投资项目之间的相关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进模型。

十、参考文献

[1] 郝黎仁 樊元 郝哲欧,《spss 试用统计分析》,北京:中国水利水电出版社,2002,P217-P222。

[2] 葛哲学,《精通MATLAB 》,北京:电子工业出版社,2008,P126-P127。 [3] 何晓群 刘文卿,《应用回归分析》,北京:中国人民大学出版社,2011,P56-P58,P71-P72,P105-P115。

[4]韩中庚,《数学建模方法及其应用》,北京:高等教育出版社,2005.6,P16-P18。

[5]赵静 但琦,《数学建模与数学实验》,北京:高等教育出版社,2003.6,P52。

投资组合优化模型

摘要

长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。

本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,以获得最高的回报。

对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益U 与x,y 之间的关系,对于模型中的各项自变量前的系数估计量,利用spss 软件来进行逐步回归分析。发现DW 值为0.395,所以原模型的随机误差项违背了互相独立的基本假设的情况,即存在自相关性。为了处理数据间的自相关问题,运用了迭代法,先通过Excel 进行数据的处理和修正,达到预定精度时停止迭代,再一次用spss 软件来进行检验,发现DW 值变为2.572,此时DW 值落入无自相关性区域。在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程度的科学依据。

对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB 软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。

最后,对模型的优缺点进行评价,指出了总收益与购买A 类资产x 份数和B 类资产y 份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。

关键字:经济效益 回归模型 自相关 迭代法 线性规划 有效投资方法

一、问题重述

某金融机构选定了A ,B 两种投资品种, 购买A 类资产x 份和B 类资产y 份的

(1)确定U 与x,y 的关系;

(2)若A 的价格是每份120元,B 的价格是每份80元,现有资金960万元,选定有效的投资方案以使收益最大。

二、问题分析

对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买A 类资产和购买B 资产各自都会带来收益,因此,一般先确定U 与x 、y 之间的关系,有利于我们在决定投资时,如何分配对A ,B 两类资产的投入资金的比重,这也是我们建立模型首先要解决的难点。

观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行预测和分析。

对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB 软件来进行求解,得到最优解,最后进行检验。

三、模型假设

1.投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”的假设。

2. 在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。

3. 假设题设中给的参数是准确值没有偏差。

4. 存在无风险资产,即本文对A 、B 两类资产的投资都为无风险投资。

5. 每种投资是否收益是相互独立的。

6. 对收益率和风险的预测值是可信的

四、符号说明

U ——收益

x ——, 购买A 类资产的份数

y ——, 购买B 类资产的份数

β0、β1、β2——分别为回归模型的常数项,自变量x 、y 前面的系数 εi ——第i 个样本回归模型的随机误差项

U t ——第t 个收益的回归估计

x t ——第t 个购买A 类资产的样本份数

y t ——第t 个购买B 类资产的样本份数

五、理论背景 1. 多元线性回归

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y 为因变量X1,X2„Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:

Y i =β0+β1X 1i +β2X 2i +„+βk X ki +μi i=1,2,„,n

其中 k为解释变量的数目,βj (j=1,2,„,k)称为回归系数(regression coefficient) 。上式也被称为总体回归函数的随机表达式。它的非随机表达式为

E(Y∣X 1i ,X 2i ,„Xki ,)=β0+β1X 1i +β2X 2i +„+βk X ki

βj 也被称为偏回归系数(partial regression coefficient)

建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;

(4)自变量应具有完整的统计数据,其预测值容易确定。

2、自相关的概念

如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。 对于模型

Y i =β0+β1X 1i +β2X 2i +„„+βk X ki +μi i=1,2,„„,n

随机误差项互不相关的基本假设表现为:

Cov(μi , μj )=0 i≠j,i,j=1,2,„„,n

如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。

在其他假设仍旧成立的条件下,序列相关即意味着

E (μi , μj )!=0

⎛ ⎛ μ ⎫ 1 ⎪ E ( NN T ) = E ⎪ μ ⎪ ⎝ ⎝ n ⎭ ⎫ ⎛ μ 2 ⎪ 1 μ )⎪ = E n ⎪ μ μ ⎭ ⎝ n 1 μ μ ⎫ ⎪ ⎪ μ 2 ⎪

n ⎭ 1 n (μ 1

⎛ E ( μ 2 ) 1 = ⎝ E ( μ n μ 1 )

⎛ σ 2 = ⎝ E ( μ n μ 1 ) E ( μ 1 μ n ) ⎫ ⎛ σ 2 1 ⎪ ⎪ = ⎪ 2 ) μ μ E ( μ n ⎭ ⎝ E ( n 1 ) E ( μ 1 μ n ) ⎫ ⎪ 2 ⎪ = σ Ω ⎪ σ 2 ⎭ E ( μ 1 μ n ) ⎫ ⎪ ⎪ σ 2 ⎪⎭ n ≠ σ I 2

3、自相关性的后果

(1)参数估计量非有效

(2)变量的显著性检验失去意义

(3)模型的预测失效

4、自相关性的检验

杜宾-瓦森(Durbin-Watson )检验法

该方法的假定条件是:

(1)解释变量 X非随机;

(2)随机误差项μi 为一阶自回归形式:

μi =ρμi-1+εi

(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi =β0+β1X 1i +⋯βk X ki +γY i-1+μi

(4)回归含有截距项;

(5)没有缺失数据。

D.W. 统计量

d l 则存在正自相关若 0

d u 不能确定 d l

d u

4 - d u

4 - d l

5、具有自相关性模型的估计

(1)广义最小二乘法

(2)一阶差分法

(3)广义差分法

(4)随机误差项相关系数ρ的估计

科克伦-奥科特迭代法

首先,采用OLS 法估计原模型

Yi =β0+β1X i +μi

得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS 法估计下式

μi =ρ1μi-1+ρ2μi-2+⋯ρL μi-L +εi

得到ρ1,ρ2,⋯,ρk ,作为随机误差项的相关系数ρ1,ρ2,⋯,ρk 的第一次

估计值。

其次,将上述ρ1,ρ2,⋯,ρk ,带入以差分模型

Y i -ρ1Y i-1-„„-ρi Y i-1=β0(1-ρ1-„„-ρi )+βi (Xi -ρ1X i-1-„„-ρ

i X i-1)+εi i=1,2,„„,n

在此,将β0,β1代回原模型,计算出原模型随机误差项的新的“近似估计值”,并以之作为模型

Μi =ρ1μi -1+ρ2μi-2+„„+ρk μi-k +ε

的样本观测值,采用OLS 法估计该方程,得到ρ1,ρ2,⋯,ρk 作为相关系数

ρ1,ρ2,⋯,ρk 的第二次估计值。

关于迭代的次数,可根据具体的问题来定。

一般是事先给出一个精度,当相邻两次ρ1,ρ2,⋯,ρk 的估计值之小于这一

精度时,迭代终止。

杜宾(Durbin )两步法

该方法仍是先估计ρ1,ρ2,⋯,ρk ,再对差分模型进行估计。

第一步,变换差分模型为下列形式:

Y i =ρ1Y i-1+„„+ρl Y i-l +β0(1-ρ1-„„-ρk )+β1(Xi -ρ1X i-1-„„-ρ

k X i-k )+εi i=1,2,„„,n

采用OLS 法估计该方程,得到各Y j (j=i-1,i-2,„„,i-k) 前的系数ρ1,ρ2,⋯,ρk 的估计值ρ1,ρ2,„„,ρk 。

第二步,将估计的ρ1,ρ2,⋯,ρk , 代入差分模型

采用OLS 法估计,得β0(1-ρ1-„„-ρk ), β1的估计量,记为*β0,*β1。

于是: ˆ 0 = βˆ 1 - - ρˆ l ) , - ρˆ 1 = βˆ 1 β*

六、模型建立

问题一:假定收益U 与x 、y 之间存在线性关系,则可建立二元线性回归模型

U=β0+β1*x+β2*y+ε

式中,U 表示总的收益;x 表示购买A 类资产的份数;y 表示购买B类资产的份数;β0、β1、β2分别表示回归方程的常数项、x 和y 前面的系数;ε表示随机误差项。

问题二:由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大值

建立约束条件:

120x+80y≤9600000

X ≥0

Y≥0

式中,x 、y 表示的是整数。

七、模型求解及优化

1. 问题一

(1)根据数据资料定义变量U (收益)、x (A 类资产的份数)、y (B 类资产的份数),再将全部数据输入spss 界面,建立数据文件。

(2)选择U 为因变量,以x 、y 为自变量,进行逐步回归;在Statistics 对话框中选择Estimate 、Model fit 、Discriptives 、Durbin-Watson ;选择Plots 对话框的残差直方图、残差正态概率图。并输出以ZRESID 为X 轴,以DPENDNT 为Y 轴的散点图;在Save 对话框里选择保存未标准预测值、未标准预测值残差、标准预测值、标准预测值残差;Options 对话框选项选择默认选项,各选项确认以后,交系统运行。

(3)结果及分析

描述统计表如下:

Descriptive Statistics

表中显示各个变量的全部观测量的Mean(均值) 、Std.Deviation(标准差) 和观测量总数N 。U 的均值和标准差分别为14.231579、5.6033772,x 的均值和标准差分别为77.368421、77.1479175,y 的均值和标准差分别为81.368421、97.2106593。

(4)相关系数矩阵如下:

Correlations

U x y

Pearson 1.000 .852 .725 Correlation

.852 1.000 .614

.725 .614 1.000

Sig. . .000 .000 (1-tailed)

.000 . .003

.000 .003 .

N 19 19 19

19 19 19

19 19 19

表中显示了三个自变量两两间的Pearson 相关系数,以及关于相关系数关系等于零的假设的单尾显著性检验概率。从表中看到因变量U (收益)与自变量x(A类资产的份数)、y (B 类资产的份数)之间相关系数一次为0.852、0.725,反应它们之间有显著的相关关系,而可以看出在同等条件下,购买A 类资产相比购买B 类资产的收益更大。

(5)回归系数表如下:

Coefficients(a)

据表中数据费标准化系数B 的数值可以知道,逐步回归过程中先后建立的两个回归模型分别是:

模型1:U=9.445+0.062*x

模型2:U=9.042+0.047*x+0.019*y

即β0=9.042, β1=0.047, β2=0.019

Std.Error(标准误) 列显示的是各系数的估计标准误差。

从模型中可以看到,购买A类资产和购买B类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。

(6)回归模型概述表如下:

Model Summary(c)

b Predictors: (Constant), x, y

c Dependent Variable: U

回归模型概述表中给出了第一个模型中因变量U 与自变量x 之间的相关系数R=0.852,说明变量U 与x 之间具有显著的线性关系。第二个模型中因变量U 与x 、之间的复相关系数R=0.890,反映了变量U 与x 、y 之间具有高度线性关系。

对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的dl=1.08,du=1.53,因为0

由于回归模型存在序列自相关性,在此,我们用迭代法来处理。

Ut =k0+k1xt+k2y t

et =ρ*et-1+ut

U ’t =Ut -ρ*Ut-1

x ’t =xt -ρ*xt-1

y’t =yt -ρ*yt-1

其中,上式中的自相关系数p 是未知的,可以由DW 值做出估计p=1-1/2*DW,计算后得出p 的估计值为0.8025。

于是原式变为

U ’t =β0+β’1*xt +β’2*yt +ut

(7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel 做出有变换后的数据,并录入spss 界面进行检验

由变换后的数据得出的回归模型概述表如下:

Model Summary(c)

t b Predictors: (Constant), xt , yt

c Dependent Variable: Ut

概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的

dl=1.08,du=1.53,因为dl

同时,我们可以观察到修改后的回归模型的残差值也基本在水平线y=0附近随机分布

在此时自相关回归中,回归预测值Ut 不是用k0+k1*xt+k2*yt计算,而是用

U t = k’0+ρ*Ut-1+k’1(xt -ρ*xt-1)+ k’2*(yt -ρ*yt-1)

在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1和yt-1, 即

U t = k’0+ρ*Ut-1+k’1(xt -ρ*xt-1)+ k’2*(yt -ρ*yt-1)

=9.042+0.8025*22+0.047*(x t -0.8025*236)+0.019*(yt -0.8025*270) =13.678845+0.047*xt +0.019*yt

t 统计量值和t 分布的双侧显著性概率Sig. 皆远小于0.05,可以认为回归系数是显著的。

2. 问题二:

根据问题一得到的模型和给出的已知条件,可以得到

目标函数: max U=13.678845+0.047*x+0.019*y

约束条件: 120x+80y

x>=0

y>=0

用MATLAB 软件来求解线性规划的命令如下:

c=[-0.047 -0.019];

A=[120 80];

b=[9600000];

Aeq=[];

beq=[];

lb=[0;0]; vb=[];

[x,fval]=linprog(c,A,b,Aeq,beq,lb,vb)

结果: x =

1.0e+04 * 8.0000 0.0000

fval =

-3.7600e+03

并运用MATLAB 还可以求出该模型的图像 syms x y U

x=0:2:300; y=0:2:300;

U=13.678845+0.047*x+0.019*y; [x,y]=meshgrid(x,y); surf(x,y,U)

可得在A 的价格是每份120元,B 的价格是每份80元,资金960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买A 类资产80000份,这是预计的最大收益是3773.679。

八、模型检验

模型检验主要是针对问题一所提出的模型进行检验。 对回归系数的显著性检验,我们用的是t 检验。

t 检验:

在多元线性回归中,回归方程显著并不意味着美国自变量对U 的影响显著,所以需要对每个变量进行显著性检验。

如果某个自变量xj 对作用不显著,那么在回归模型中,它的系数βj 就取值为零。因此,检验变量是否显著,等价于检验假设

H 0j :βj =0, j =1,2,„„,p 据此可以构造t 统计量

t j =β/√c jj σ

其中σ是回归标准差。当∥t j ∥≥t α/2 时,拒绝元假设H 0j :βj =0,认为βj

显著不为零,自变量x j 对因变量y 的线性效果显著;当∥t j ∥<t α/2时,接受原假设H 0j :βj =0,认为βj 为零,自变量x j 对因变量y 的线性效果不显著。

下图是回归系数表 Coefficients(a)

图中的Sig 即显著性P 值,由x 的P ≈0.000,由此可知此自变量x 显著,y 的P ≈0.039,自变量y 也显著。

由spss 软件做出的残差统计表如下:

Residuals Statistics(a)

Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance

Centered Leverage Value a Dependent Variable: Ut

1.334061 -1.4082221

-1.569 -1.621 -1.5040683

-1.725 .139 .000 .008

6.122075 1.8736107

2.087 2.185 2.3974390

2.556 11.280 1.710 .664

3.665045 .0000000

.000 .028 .0771220

.053 1.889 .132 .111

1.2092543 .8431280

.939 1.032 1.0913442

1.096 2.977 .396 .175

18

18 18 18 18 18 18 18 18

本表显示预测值(Predicted Value)、残差(Std. Predicted Value)、标准化预测值(Standard Error of Predicted Value)、标准化残差的最小值(Minimum )、最大值(Maximum )、均值(Mean )、标准差(Std. Deviation)以及样本容量(N )。根据概率的3-σ原则,上图中标准化残差的绝对值的最大值为1.569

残差分布直方图和观测量累计概率P-P 图如下:

回归分析中,总是假设残差ε服从正态分布,残差分布直方图和观测量累计概率P-P 图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态的假设做出检验。

从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是很明显的服从正态分布。尽管这样,也不能盲目地否定残差服从正态分布的假设,因为我们用来进行的样本量太小,样本容量仅为19.

观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。

基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。

输出的图形中还有一个因变量的回归标准化残差图,如下所示:

对于问题二最优解的检验

由于x,y 是正整数,且有约束条件120x+80y≤9600000, 可知(x,y )的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数

U=13.678845+0.047*x+0.019*y,

经变化可得到 y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U 为最大,此时的x 与y 值便是最优投资组合。 用MATLAB 画出的图像如下

再者,由问题一建立的模型中,我们可以看到x 前的回归系数为0.047,y 前面的回归系数为0.019,再由A 的价格是每份120元,B 的价格是每份80元,在不考虑常数项的情况下,计算可得对于A 的投资,每增加1元可得到的收益是0.0003917而对于B 的投资,每增加1元可得到的收益是0.0002375,所以我认为在资金有限,不考虑风险的情况下,投资者应该先考虑投资A 类资产,如果减去能购买A 类最多份数后的剩余的资金J ,满足80≤J <120,则此时应该再考虑买一份B 类资产。

关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,再代入目标函数进行检验,,但是对于多元的线性规划最优解,还是要建立相关的矩阵,再来进行计算和检验。

九、模型评价及优化

模型的优点: (1)本模型根据已有数据较好的体现了总收益与购买A 、B 类资产的份数之间的关系,而且该模型简单易懂,使得求解有了很大的简化。

(2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住了分析的要点,较好的完成了数据的提取与应用。

(3)在本文中,我们分别用了spss 、Excel 、MATLAB 等软件来进行数据的分析和处理,这样有利于提高模型的准确度和预测的可信性。

模型的缺点:

(1)由于模型是建立在假设 是确定值的基础上的而实际中β0、β1、β2常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,缺乏动态性。

(2)该模型没有考虑到各类投资的风险性,。 (3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定 模型的优化和推广:

将β0、β1、β2 作为随机变量来考虑,并进而考虑个投资项目之间的相关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进模型。

十、参考文献

[1] 郝黎仁 樊元 郝哲欧,《spss 试用统计分析》,北京:中国水利水电出版社,2002,P217-P222。

[2] 葛哲学,《精通MATLAB 》,北京:电子工业出版社,2008,P126-P127。 [3] 何晓群 刘文卿,《应用回归分析》,北京:中国人民大学出版社,2011,P56-P58,P71-P72,P105-P115。

[4]韩中庚,《数学建模方法及其应用》,北京:高等教育出版社,2005.6,P16-P18。

[5]赵静 但琦,《数学建模与数学实验》,北京:高等教育出版社,2003.6,P52。


相关内容

  • 投资组合理论模型及证券选择的实证分析
  • 投资组合理论模型及证券选择的实证分析 金融091 5400109034 覃珍和 摘要: 投资组合理论有狭义和广义之分.狭义的投资组合理论指的是马柯维茨投资组合理论:而广义的投资组合理论除了经典的投资组合理论以及该理论的各种替代投资组合理论外,还包括由资本资产定价模型和证券市场有效理论构成的资本市场理 ...

  • 985院校优秀本科论文--马科维茨的均值-方差模型
  • [摘要]在当今的市场中竞争已经越来越激烈,很多企业纷纷在寻找新方法以降低经营风险,寻求更加稳 定的收益方法.在中国随着股票交易发展的不断完善,各企业开始从事股票投资的理念逐渐显现出成熟.在股市投资中组合的股票投资作为一种有效的方法,在欧美很多的国家中股票投资市场已经占据了重要的一席并有了非常广泛的应 ...

  • 量化投资分析在证券投资教学中的应用_熊海芳
  • 教学研究 量化投资分析在证券投资教学中的应用 熊海芳 (东北财经大学金融学院,辽宁大连116025) 摘要:量化投资及其交易策略对金融市场越来越重要.量化投资的"黑箱"包括阿尔法模型.风控模型和成本模型以及组合优化模型等.这些"黑箱"成分既继承了证券投资学的分 ...

  • 耶鲁模型:分散投资的资产配置策略
  • 来源 | 摘自 搞FOF必备书籍<多资产投资实践> 作者 | Yoram Lusting 翻译 | 郑志勇.孙静.李韵 通俗点讲,分散投资就是说不要把所有鸡蛋放进一个篮子.分散投资是这么一个过程,即我们去找到不同的风险来源,然后根据这些风险之间的相互关系进行组合的过程.只要投资标的并非完 ...

  • 股票投资组合风险优化
  • 经济视野 股票投资组合风险优化 易炜豪 华中科技大学 武昌分校 湖北 武汉 430000 [摘 要]对于股票投资来说,如果投资者将全部的资金都用来投资一只股票,那么这样就会在很大的程度上增加投资的风险.因此,投资者在一般的情况之下,会选择投资不同种类的股票,并对其加以整合.这样,就可以降低投资的风险 ...

  • 风险证券组合投资的最优化分析
  • 第15卷第2期 2001年6月合肥工业大学学报(社-4r科学版)JOURNALOFHEFEIUNIVERSITYV01.15No.2OFTECHNOLOGY(SocialSeianoes)Jun.2001 风险证券组合投资的最优化分析 朱厚任 (安蠢省委党校经济管理部,安徽合肥230022) 摘要: ...

  • 随机最优证券投资组合模型
  • 2000年9月 文章编号:100026788(2000)0920014205 系统工程理论与实践第9期 随机最优证券投资组合模型 任建芳,赵瑞清,鲍兰平 (军械工程学院基础部,河北石家庄050003) 摘要: 讨论了当投资的预期收益率和风险损失率为随机变量时,证券投资组合模型的优化问题Λ并 分别建立 ...

  • 考虑交易成本的套利组合研究
  • 第10卷专辑 !坚生!Q旦鱼!些』删查丛磐塑翌型墅避垡型坚!型婴 Vol 中国管理科学10.SpecialIssue 文章编号:1003-207(2002),d,一0229-04 考虑交易成本的套利组合研究 李晶莹1,刘金兰2 (天津大学管理学院,天津300072) 摘要:本文根据套利定价理论的基本 ...

  • 基于人工蜂群算法的高频交易策略组合配置研究_陈炜
  • DOI:10.13451/j.cnki.shanxi.univ(nat.sci.).2013.03.007 ():山西大学学报(自然科学版)363363-368,2013()JournalofShanxiUniversitNat.Sci.Ed. y () 02532395201303036306 文 ...