量化模型

基于计量经济学的投资策略失败的七个原因


最近被“投资组合管理杂志”评为2019年度最佳量化分析师的Marcos Lopez de Prado,发表了一篇题为“大多数计量经济投资失败的七大理由”(The seven reasons most econometric investments fail)的演讲。

他的总体观点是,许多被广泛使用的金融计量经济学方法要么依赖于误导性的p值(p-value),要么依赖于金融现象通常不满足的强假设。 此外,大多数计量经济学方法都没有充分关注过度拟合。 这些计量工具大部分是在生物学等科学领域发展起来的,有些并不适合于投资分析。 因此,“大多数基于计量经济学的投资策略都可能是错误的。”

错误的原因可以总结为以下七条:

1、大多数计量经济分析通常依赖于结构化数据集,然而最有意义的数据集通常是非结构化(unstructured)数据集。 也就是说,计量经济模型有效地拟合了意义较小的数据。

2、大多数计量经济学研究没有包括对相关性矩阵去噪音的方法。 因此,大多数计量经济学研究得出的结论,其实是由噪声数据获得而非信号本身。横断面分析特别容易导致分类错误。(见上图)

3、计量经济学试图规范判定样本内( in-sample)随机变量的方差,但样本内判定对于投资策略的研发作用不大。 总的来说,回归分析是投资策略研发的错误工具。

4、许多计量经济学方法要求我们同时获得正确的预测变量和函数形式。但是由于金融系统本身的复杂性,这些要求不切实际。

5、在p = 0.05的统计水平上,大多数投资策略都是错误的。 例如,假设一个策略的回测盈利的概率是1%。 在5%显著性和80%功效的标准阈值下,预计策略产生58个信号,其中50个是误报。 换句话说,86%的信号都是错误的。 在实践中,由于多次测试和参数配置等问题,错误的可能性甚至更高。

6、统计模型的过度拟合有两种方式:训练集过度拟合(training set overfitting )和测试集过度拟合(testing set overfitting)。 传统的计量经济学工具无法量化,甚至解决这些问题。

7、许多使用传统计量经济学工具和模型的研究人员无法理解过度拟合在多大程度上会影响了投资策略。 即使夏普比例大于3,选择偏差(selection bias)和确认偏差(confirmation bias)也可能导致误报,通常会引起灾难性后果。

 

参考:

The 7 Reasons Most Econometric Investments Fail, Marcos Lopez de Prado, 04/2019

本文是全系列中第1 / 6篇:模型风险

量化模型
市场风险测度之RNIV概述(一)
量化模型
复杂网络视角下国际股市区域特征分析
量化模型
BS公式能否正确定价资产价格变化?
  • 确实是,基于回归的样本量确实容易过拟合