13.投资系统评估
有多个投资系统告诉人们如何在股票市场挣钱,但是它们有效吗?
在评估投资系统的过程中,有大量的潜在缺陷应该加以避免,这些缺
陷在我们考虑任何研究之前值得回顾。第一,这些缺陷在所有发表过
的研究文献中并未悉数避免,我们对此要给予应有的宽容。第二,它
们在最畅销的投资书籍中也很少避免。第三,为了测定投资系统,很
多投资经理人研究诸如数据流和布鲁伯格等系统的数据,而通常对方
法论问题一无所知。(引自亚历山大等人1993年所撰论文,第347页
起)
交易成本
许多研究都显示出良好的毛收益,却忽视交易成本。一句随意的
“所显示的利润是这么高,很显然该体系在扣除交易成本之后仍然有
利可图”,就能为之解释或开脱。这是否正确取决于需要进行的交易
量以及交易股票的种类。,一年中)-L笔成本为1%,一2%的交易就
能立即消耗掉大量的利润,而通常成本会更高—一些小规模的英国股
票其买卖价差达10%。对于一些小公司而言,真实成本很可能超过了
想象中对佣金、印花税及一般价差的估计。股票的流动性可能极差,
以至于不能完成交易,或是只有经过很长一段时期或对当前价格进行
一个很大的贴水或升水才能完成。
忽略股息
一些研究只是简单地把股票价格走势与价格指数进行比较。如果
采用这种方法,任何系统都会偏爱低收益的股票,比如一只“成长型”
股票在将来会比现在更成功。
选择后偏差或幸存者偏差
如果你买中了一只破产股票,年末评选十佳和十差股票的报纸可能会
让你心生厌恶。谁需要别人提醒自己买了市场中表现最差的一只股票?
但是当你看名单时会发现,表现最差的那只股票其价值“仅仅”缩水
了92 %,或是其他类似的数字。所发生的事情是那些破产股票已经
从计算机软件中删除了:它们不复存在因而没有了年终价格。这向研
究人员提出了一个问题。
设想某一系统购买了确实非常糟糕的股票,这是按照非常高的杠杆
率或连续三年不断下滑的销售或其他指标来衡量的。某人可以查询数
据库并检验这个投资系统,而它有一个好机会来证明自己行之有效。
一家经营状况糟糕的公司比其他公司更有可能破产或是出现转机,也
就是说,它们更有可能产生更极端的结果,但计算机软件会自动地将
全部的破产公司排除在外。持有这种假设的测验都存在偏差。最近的
大多数研究都考虑到了这一问题,一些计算机软件也避免了这种偏
差。
预见性偏差
许多系统实际上需要加强对未来的认识。比如说,如果系统涉及
一种同时期变化的变量,而事实上该变量在当时并不为人知,那么系
统就会出现现偏差例如,某人可能相信货币供给会影响股票市场,因
此二月份的货币供给会影二月份的股票市场水平,但二月份的货币供
给量要到三月份才能知道,因此只有能够预测二月份的货币供给量模型才是有用的。
预见性偏差影响了一些关于低市盈率效应的早期研究。以年终价格和收益计算市盈率假设,有几个月投资者不能获得收益信息,这就会产生偏差班茨和布林(1986年,第780页)给出了一个例子:“„„年度核算统计资料报告,天顶公司1978年末的每股收益是1. 24美元,而实际L在1978年12月3 ; }}那一天投资者所看到的12个月的每股收益是0. 85美元。用年报数据计算的收益率(即每股收益除以股票价格乘以100 )是9. 6%,而用观察到的数据所得的收益率是6. 6 %。正如预想的那样,天顶公司的股价从年底的12. 87美元上涨到三月底(此刻投资者才获悉新的收益)的15. 00美元。”
风险调整的失败
正如我们所讨论的,通常人们都认为,投资者只为超额的回报承担超额的风险,并设想高风险资产会比低风险资产产生更高的回报。相应地,如果一个投资系统选择了风险性资产,只有它产生的收益高于平均风险水平的投资组合产生的期望收益时,才会被认为是一个成功的系统。回想一下,对一个根据风险进行调整的投资系统的任何测试实际上是同时对两件事的测试一一是投资系统本身,二是相信风险会得到回报并且研究使用了正确的风险度量这一概念。学术研究对度量风险采取了各种方法,譬如总风险、p风险甚至是非系统性风险。
误导人的图表
图表
许多基金经理会给客户展示一张有关两种利率变化趋势间紧密关系的。客户和经理都对他们的所思所见深信不疑,但这种联系可能很不可因为我们中的大多数人都不能正确地读懂图表。图1中,显示了美国国库券的收益率和标准一普尔500强的股息收益率。似乎存在一种联系,因为两者一起下降。但仅凭这点,你就能马上下结论吗?仔细看一看,十年中.这两条线有四年以相反的方向运动,这种相关性J}几不像其表现的那么有用。从总体上而言,变化对预测收益更为重要,而为了测定时间或做出选择,许多表示水平的图表应当转换成表示变化的图表,以考察这种相关性的价值。
我们还应注意到领先与落后之间的相关性。如果某一序列有助于预测另一序列,则该序列领先于第二个序列(除非第二个更易被预测)。图表经常表现的是两个序列间的运动是多么地密切。大多数人在判断两条线的引领关系是否有所交替时都存在困难,以至于有时被预测的那个序列实际上是引导序列。
统计学意义和实用意义
许多关于投资的学术研究成果都声称,其发现具有统计学意义,这指的是该发现不可能是偶然的观测。例如,先后掷一枚硬币10次,或许会发现我们观察到了6次头像,但这并不意味着这枚硬币存在偏差。即便是一枚质地均匀的硬币,我们得到6次头像的可能性也很大。实际上,这种可能性如此之大,以至于我们会说这个发现不具有统计学意义。为研究结果计算统计学意义的程度是一件十分平常的事。比
如说,我们发现一只股票有两种特性与收益相关,这些发现可能在1%或5%的水平上具有统计学意义,这意味着仅有1%或1/20的可能性,这只是偶然结果而非真实可靠的发现。我们的发现由于可能的正确性而具有统计学意义,但它们或许并不具有实用意义。比如,某个发现会告诉我们如何每_年获得额外的0. 25 %,这并不具有多大的实用意义。然而,如果我们每年能获得额外的5%,这就具有很大的实用意义。发现既具有统计学意义又具有实用价值是非常重要的。
数据掘取
通常不难发现,某种统计上的联系会非常适用于一套数据。但如果对这种联系无法从理论上进行解释,则这可能只是一个偶然发现。如果你去参加一个聚会并观察其他客人,可能会发现这个群体有一些古怪的特征。也许有很多人的名字都以B开头,或者蓝眼睛人们的数量不成比例。因为你进行数据掘取友现丁统计上的联系,但这开小具有晋遍的正确性。尽管这一发现在这次聚会中有效,但它并不一定在下次聚会中仍然奏效。学术研究人员并不打算进行数据掘取的远征,但几乎无一例外都这样做了。美国研究人员通常使用两套数据—核算统计数据和证券价格研究中心( CRSP )提供的数据。如果100名研究人员每人都使用相同的数据库检验不同的投资假设,在偶然性的基础上,似乎只有少数具有统计学意义。这些发现可能得以发表,而其他的则不会。问题在于我们永远也不知道有多少其他经过检验的假设失败了。没有人撰写或发表题为《对1979年5月至1980年2月参加伦敦上流社会聚会的人所进行的研究,但并未发现他们的名字多以
B开头》这样的研究报告。这听上去很愚蠢,但研究一年中的哪一个时段创造最佳收益却大有文章可做。由于缺乏之前的理论展望,因此对于数据掘取和伪相关性而言,这可以作为一个合适的主题。
样本外数据
还有一种更为精妙的数据掘取形式,就是利用已被普遍接受的系统,使用它从一组数据中建立决策规则,然后从建立在相同数据基础上的系统中计算收益。理所当然它应该是有效的—这也正是选择此规则的原因!人们应该永远对那些以用来建设系统本身的数据作为工作对象的投资系统表示怀疑。相应地,人们应该永远对那些以非系统建设数据作为工作对象的投资系统进行评价二这通常被称为样本外数据或抵抗检验。
误导人的先知力
某种预言性的联系也许是真的,但却很脆弱:对于收益的变化,它不能做出更多的解释:然而,如果某人从浩瀚无边的股市中选择了几只股票,即便只是这种微弱的联系,他也可能获得不错的结果。从包含1 000只股票的市场中选择表现出色的20只是可能的,的确有许多研究使用的就是这种小组合。相反一位觉得不得不从400只蓝筹股中选择50只股票组成投资组合的基金经理,会发现相关性没有什么价值。
记录日期的事宜
学术文献经常对日期做出大胆的假设。大型的统计研究经常简单地假设有关利息的事件都发生在一个月的最后一天。如果你正在对1
000只股票50年的数据进行检验,你便能想象为何要这样处理,但其对于结果的影响却是难以确定的。
结束语
13.投资系统评估
有多个投资系统告诉人们如何在股票市场挣钱,但是它们有效吗?
在评估投资系统的过程中,有大量的潜在缺陷应该加以避免,这些缺
陷在我们考虑任何研究之前值得回顾。第一,这些缺陷在所有发表过
的研究文献中并未悉数避免,我们对此要给予应有的宽容。第二,它
们在最畅销的投资书籍中也很少避免。第三,为了测定投资系统,很
多投资经理人研究诸如数据流和布鲁伯格等系统的数据,而通常对方
法论问题一无所知。(引自亚历山大等人1993年所撰论文,第347页
起)
交易成本
许多研究都显示出良好的毛收益,却忽视交易成本。一句随意的
“所显示的利润是这么高,很显然该体系在扣除交易成本之后仍然有
利可图”,就能为之解释或开脱。这是否正确取决于需要进行的交易
量以及交易股票的种类。,一年中)-L笔成本为1%,一2%的交易就
能立即消耗掉大量的利润,而通常成本会更高—一些小规模的英国股
票其买卖价差达10%。对于一些小公司而言,真实成本很可能超过了
想象中对佣金、印花税及一般价差的估计。股票的流动性可能极差,
以至于不能完成交易,或是只有经过很长一段时期或对当前价格进行
一个很大的贴水或升水才能完成。
忽略股息
一些研究只是简单地把股票价格走势与价格指数进行比较。如果
采用这种方法,任何系统都会偏爱低收益的股票,比如一只“成长型”
股票在将来会比现在更成功。
选择后偏差或幸存者偏差
如果你买中了一只破产股票,年末评选十佳和十差股票的报纸可能会
让你心生厌恶。谁需要别人提醒自己买了市场中表现最差的一只股票?
但是当你看名单时会发现,表现最差的那只股票其价值“仅仅”缩水
了92 %,或是其他类似的数字。所发生的事情是那些破产股票已经
从计算机软件中删除了:它们不复存在因而没有了年终价格。这向研
究人员提出了一个问题。
设想某一系统购买了确实非常糟糕的股票,这是按照非常高的杠杆
率或连续三年不断下滑的销售或其他指标来衡量的。某人可以查询数
据库并检验这个投资系统,而它有一个好机会来证明自己行之有效。
一家经营状况糟糕的公司比其他公司更有可能破产或是出现转机,也
就是说,它们更有可能产生更极端的结果,但计算机软件会自动地将
全部的破产公司排除在外。持有这种假设的测验都存在偏差。最近的
大多数研究都考虑到了这一问题,一些计算机软件也避免了这种偏
差。
预见性偏差
许多系统实际上需要加强对未来的认识。比如说,如果系统涉及
一种同时期变化的变量,而事实上该变量在当时并不为人知,那么系
统就会出现现偏差例如,某人可能相信货币供给会影响股票市场,因
此二月份的货币供给会影二月份的股票市场水平,但二月份的货币供
给量要到三月份才能知道,因此只有能够预测二月份的货币供给量模型才是有用的。
预见性偏差影响了一些关于低市盈率效应的早期研究。以年终价格和收益计算市盈率假设,有几个月投资者不能获得收益信息,这就会产生偏差班茨和布林(1986年,第780页)给出了一个例子:“„„年度核算统计资料报告,天顶公司1978年末的每股收益是1. 24美元,而实际L在1978年12月3 ; }}那一天投资者所看到的12个月的每股收益是0. 85美元。用年报数据计算的收益率(即每股收益除以股票价格乘以100 )是9. 6%,而用观察到的数据所得的收益率是6. 6 %。正如预想的那样,天顶公司的股价从年底的12. 87美元上涨到三月底(此刻投资者才获悉新的收益)的15. 00美元。”
风险调整的失败
正如我们所讨论的,通常人们都认为,投资者只为超额的回报承担超额的风险,并设想高风险资产会比低风险资产产生更高的回报。相应地,如果一个投资系统选择了风险性资产,只有它产生的收益高于平均风险水平的投资组合产生的期望收益时,才会被认为是一个成功的系统。回想一下,对一个根据风险进行调整的投资系统的任何测试实际上是同时对两件事的测试一一是投资系统本身,二是相信风险会得到回报并且研究使用了正确的风险度量这一概念。学术研究对度量风险采取了各种方法,譬如总风险、p风险甚至是非系统性风险。
误导人的图表
图表
许多基金经理会给客户展示一张有关两种利率变化趋势间紧密关系的。客户和经理都对他们的所思所见深信不疑,但这种联系可能很不可因为我们中的大多数人都不能正确地读懂图表。图1中,显示了美国国库券的收益率和标准一普尔500强的股息收益率。似乎存在一种联系,因为两者一起下降。但仅凭这点,你就能马上下结论吗?仔细看一看,十年中.这两条线有四年以相反的方向运动,这种相关性J}几不像其表现的那么有用。从总体上而言,变化对预测收益更为重要,而为了测定时间或做出选择,许多表示水平的图表应当转换成表示变化的图表,以考察这种相关性的价值。
我们还应注意到领先与落后之间的相关性。如果某一序列有助于预测另一序列,则该序列领先于第二个序列(除非第二个更易被预测)。图表经常表现的是两个序列间的运动是多么地密切。大多数人在判断两条线的引领关系是否有所交替时都存在困难,以至于有时被预测的那个序列实际上是引导序列。
统计学意义和实用意义
许多关于投资的学术研究成果都声称,其发现具有统计学意义,这指的是该发现不可能是偶然的观测。例如,先后掷一枚硬币10次,或许会发现我们观察到了6次头像,但这并不意味着这枚硬币存在偏差。即便是一枚质地均匀的硬币,我们得到6次头像的可能性也很大。实际上,这种可能性如此之大,以至于我们会说这个发现不具有统计学意义。为研究结果计算统计学意义的程度是一件十分平常的事。比
如说,我们发现一只股票有两种特性与收益相关,这些发现可能在1%或5%的水平上具有统计学意义,这意味着仅有1%或1/20的可能性,这只是偶然结果而非真实可靠的发现。我们的发现由于可能的正确性而具有统计学意义,但它们或许并不具有实用意义。比如,某个发现会告诉我们如何每_年获得额外的0. 25 %,这并不具有多大的实用意义。然而,如果我们每年能获得额外的5%,这就具有很大的实用意义。发现既具有统计学意义又具有实用价值是非常重要的。
数据掘取
通常不难发现,某种统计上的联系会非常适用于一套数据。但如果对这种联系无法从理论上进行解释,则这可能只是一个偶然发现。如果你去参加一个聚会并观察其他客人,可能会发现这个群体有一些古怪的特征。也许有很多人的名字都以B开头,或者蓝眼睛人们的数量不成比例。因为你进行数据掘取友现丁统计上的联系,但这开小具有晋遍的正确性。尽管这一发现在这次聚会中有效,但它并不一定在下次聚会中仍然奏效。学术研究人员并不打算进行数据掘取的远征,但几乎无一例外都这样做了。美国研究人员通常使用两套数据—核算统计数据和证券价格研究中心( CRSP )提供的数据。如果100名研究人员每人都使用相同的数据库检验不同的投资假设,在偶然性的基础上,似乎只有少数具有统计学意义。这些发现可能得以发表,而其他的则不会。问题在于我们永远也不知道有多少其他经过检验的假设失败了。没有人撰写或发表题为《对1979年5月至1980年2月参加伦敦上流社会聚会的人所进行的研究,但并未发现他们的名字多以
B开头》这样的研究报告。这听上去很愚蠢,但研究一年中的哪一个时段创造最佳收益却大有文章可做。由于缺乏之前的理论展望,因此对于数据掘取和伪相关性而言,这可以作为一个合适的主题。
样本外数据
还有一种更为精妙的数据掘取形式,就是利用已被普遍接受的系统,使用它从一组数据中建立决策规则,然后从建立在相同数据基础上的系统中计算收益。理所当然它应该是有效的—这也正是选择此规则的原因!人们应该永远对那些以用来建设系统本身的数据作为工作对象的投资系统表示怀疑。相应地,人们应该永远对那些以非系统建设数据作为工作对象的投资系统进行评价二这通常被称为样本外数据或抵抗检验。
误导人的先知力
某种预言性的联系也许是真的,但却很脆弱:对于收益的变化,它不能做出更多的解释:然而,如果某人从浩瀚无边的股市中选择了几只股票,即便只是这种微弱的联系,他也可能获得不错的结果。从包含1 000只股票的市场中选择表现出色的20只是可能的,的确有许多研究使用的就是这种小组合。相反一位觉得不得不从400只蓝筹股中选择50只股票组成投资组合的基金经理,会发现相关性没有什么价值。
记录日期的事宜
学术文献经常对日期做出大胆的假设。大型的统计研究经常简单地假设有关利息的事件都发生在一个月的最后一天。如果你正在对1
000只股票50年的数据进行检验,你便能想象为何要这样处理,但其对于结果的影响却是难以确定的。
结束语