来源:华创证券
随着市场的不断发展,各类因子的挖掘已经进入了规模化、工业化的时代,不论是从传统逻辑角度出发的主观因子,还是从数据角度出发的客观因子,各大机构的两类因子挖掘能力相较数年前已经有了几何倍数的增长。面对海量的
有效因子,如今一个新的问题跃然纸上,如何对其进行有效的选择并组合成我们最终的决策策略?
我们之前在《数据探索的择时系列之一:多管齐下,四两拨千斤》一文中构建了沪深 300 指数的择时模型,通过七个表现较好表达式的简单组合得到了最终的择时策略,年化收益率 61.52%,最大回撤 14.79%,年平均交易次数 26.4
次,夏普比率 2.439,胜率 61.14%,盈亏比 2.941。本次对中证 500 的择时因子挖掘过程中获得了数十倍的优良因子,随着因子数量的快速膨胀,简单叠加的组合方式有时会适得其反。首先,因子数量远大于数据量时大数定律不再适用,规划求解的方式也难以适用,必须采用特征压缩降维或抛弃部分因子的方式降低数据间的共线性。其次,部分因子之间存在着反向的关系,每个因子有其强势的市场区间也有其弱势的市场区间,如果不加区分的进行组合,会造成强弱相抵,总体的效果反而下降。最后,目前主流的神经网络组合方式是一种黑箱的逻辑,很难把握组合的逻辑。因此,本文以 GRASP(贪婪自适应搜索)算法思想进行因子组合,并以 15 个中证 500 指数择时因子为例进行组合测试。
最后,本文选取了表现较好的多个表达式合成了最终的中证 500 指数多空择时策略,年化收益率 84.02%,最大回撤 15.8%,年平均交易次数 20.75 次,夏普比率 2.999,胜率 67.88%,盈亏比 3.232。
(PDF,1M,11页)
评论0