“历史是由胜利者书写的。”
——温斯顿▪邱吉尔
在金融领域中,邱吉尔说的是对的吗?
幸存者偏差
幸存者偏差(Survivorship bias,又叫“死人不会说话”)是金融领域(或生活)中最常见的偏差之一(其他常见偏差详见模型风险的七大来源),投资者在决策时如不保持警惕则很容易成为它的牺牲品。
幸存者偏差是对数据集进行统计分析时,该数据集只包含那些“存活”到某一特定时间点的实体。例如分析资本市场中证券的收益情况,有一些证券因公司损失惨重或倒闭而退市,或者别其他公司并购。如果研究样本的选取只保留当前在市场上的证券,而不包括那些被淘汰掉的证券,那么数据集就无法反映证券市场的真实风险情况,导致研究样本中证券的收益率高于市场的实际情况,这被称作幸存者效应。如果实证的期限较长,退市的公司较多,幸存者偏差就会比较严重 。
幸存者偏差会影响到金融市场中的每一个投资者。如果不正确地考虑其中的风险可能会导致错误的决策。
扭曲的现实
我们用股票指数的平均回报率的例子解释一下幸存者偏差。
2015-2017,FTSE100指数的幸存者成分股(红)和当年所有历史成分股(蓝)的平均收益率
一般来说,股票指数是各成分股票价格变动的加权平均数(有可能是其他度量值)。从上图中,我们可以看到FTSE100(伦敦证券交易所市值最大的前100家公司股票指数)成分随时间的变化。给定年份指数中所有成分股票的平均回报率都低于当年年底的幸存成分股的平均收益率。这是由于股指中有些成分股票表现不佳,被移出指数。虽然成分股的数量保持不变,但不同的成分股根据它们的市值变化不断的被移入移出股指。
如果不能适当地处理幸存者偏差效应,我们将只考虑那些“表现最佳”的股票,上图的偏差数字将会更高。幸存者偏差可以用下式表示:
\(\epsilon_t = \| M(S_t) -M(A_t) \| \quad ; \forall S_t \in A_t , \forall t \in T\)其中,其中S是幸存者的集合,A是所有成分的集合,而M是所选用的度量值。
前瞻性偏差
与幸存者偏差相关的另一种统计偏差是前瞻性偏差(Look-ahead bias)。当投资者对投资策略的路径进行仿真时,用到了在某个时间点实际上不存在的信息,就会产生前瞻性偏差。当投资者试图研究一家公司的基本面时,这种偏见更为普遍。我们通过下面一个大市值公司的市盈率(price to earnings ratio, PER)例子来说明这一点。
前瞻性偏差——市盈率差异:真实市盈率(蓝),偏差市盈率(红)
上市公司受监管要求必须公布其财务报表。问题是,公司可以通过审查和编辑过去的财务报表版本,调整之前的财务报表。但是当这些财务报表第一次发布时,投资者并不知道它们将来会被修正!投资者可能会受到这些发行版财务报表的影响,所以前瞻性偏差是对信息的非自然预期,而这会导致错误的投资决策。从上图我们可以看出前瞻性偏差的大小,有前瞻性偏差的投资者基于分析会期望更大的投资回报(实际可能不会发生)。
参考
Nicolás Forteza:Survivorship bias: an investment decision trap
本文是全系列中第5 / 6篇:模型风险
- 基于计量经济学的投资策略失败的七个原因
- 模型风险的七大来源
- Copula与模型风险
- 模型风险引发的重大金融风险事件
- 幸存者偏差:投资决策陷阱
- 数据窥视偏差:策略优化陷阱
评论