德邦证券-金工机器学习专题之一:利用机器学习捕捉因子的非线性效应(PDF,1.6M,20页)
德邦证券-金工机器学习专题之二:机器学习残差因子表现归因(PDF,1.8M,16页)
德邦证券-德邦金工机器学习专题之三:基于财务与风格因子的机器学习选股(PDF,1.6M,20页)
德邦证券-德邦金工机器学习专题之四:动态因子筛选(PDF,1.9M,24页)
德邦证券-德邦金工机器学习专题之五:基于模型池的机器学习选股(PDF,2.2M,21页)新增
证券收益与风格因子之间不止存在线性关系。本文的研究表明,在因子与收益的线性关系之外,还有很强的待挖掘的非线性关系。
机器学习算法可以用于挖掘非线性关系 。因子与收益之间的非线性关系可能是复杂函数,而用机器学习算法可以高效地对这种非线性关系进行建模、近似。
以线性回归的残差训练机器学习模型。线性模型是具有明显含义且相对容易理解的部分。我们保留线性模型的这一优势,用机器学习模型拟合线性回归的残差。
机器 学习的训练数据需要进行筛选和处理。训练机器学习模型时,需要选择合适的回顾期和频率。尤其重要的是,输入的回报数据需要进行标准化处理。
采用集成模型的方法降低噪音和提取信号。由于回报数据的低信噪比,机器学习模型总是在拟合信号的同时拟合了噪音,通过训练多个机器学习模型,再将多个模型的预测值取平均,以尽可能消除噪音、保留信号。
通过部分依赖曲线观测机器学习模型的行为。 。机器学习模型具有黑箱特征,但我们可以通过部分依赖曲线等工具研究其输入、输出之间的关系。通过部分依赖曲线,可以观测到各个因子的非线性贡献的强度。
因子交互效应显著。 。机器学习方法具有非线性特征,因此可以表征因子共同变化时产生的协同作用,称为交互效应。交互效应对机器学习因子的值具有显著的作用。
剥离 机器学习 因子中的风格因子。 将机器学习因子对风格因子进行回归取残差,可以得到剔除风格因子线性影响后的机器学习残差因子。机器学习残差因子表现出稳定的 alpha 因子特征,也是对传统多元线性回归方法的增量因子。