前文的简要总结及算法改进方法 在前面的文章中, 我们探讨了随机决策森林算法,提出了一种基于强化学习的简单自学习算法。 概述了这种方法的以下主要优点: 易于开发交易算法和高“学习”速度。强化学习(RL)可以很容易地融入到任何交易EA中,并加速其优化。 同时,这种方法有一个主要缺点: 该算法容易过度优化(过度拟合)。换句话说,它的特点是对结果分布未知的一般情况的泛化较弱。这意味着,它不是在寻找金融工具整个历史时期的真正基本市场模式,而是根据当前市场情况过度拟合,而全球模式仍在受训代理的“理解”的另一面。然而,遗传优化也有同样的缺点,并且在大量变量的情况下工作得更慢