传统的统计都是基于取样方法的,也就是说因为数据量太大了,无法全面分析,而创造的一种方法,大多数情况下,最多抽取10%的典型数据进行统计分析,这个取样或多或少都受个人偏好的影响,就连美国在房地产股票预测上都出现了重大偏差,他们为了预测未来的房地产行情,取了20年所有的数据,研究结果表明房价不会上涨,这明显是个错误结论,如果他们用过去200年数据来分析,就不会有这个结论。
现在计算机技术已经足够计算所有的数据,这就是大数据时代的特点之一:不要抽样,要全部。
很多有经验的操盘手都认为自己的指标使用非常有效,要知道,你这就是交易经验而已,一旦把你的方法写成程序,放到全数据测试,结果就是盈亏对半,好一点,三七开,30%的错误信号足够让您倾家荡产,来世再战。
在过去4年里,我接到过无数的指标编写任务,最夸张的是计算9个时间周期,56个货币对,8个技术指标的共振,委托人希望通过这种方式,找到更加有效的交易信号,我做了(因为他付钱),我告诉他需观察9!56!8!(每个指标还有n个参数)种组合,传统方式下,我想他必须采用愚公移山的精神,动员他的儿子、孙子、重孙子、重孙子的儿子、孙子连续不断地做排列组合,才能完成数据的收集工作,还不能奢谈数据分析。
在大数据时代,不要过于自信个人的经验,外汇交易到现在也不过40年时间,即使你从业经验有20年(因为超过20年的工作时间,你恐怕也老得不行了),也不过是拥有对某几个货币对以及某几个时间周期用某几个指标的经验罢了,既然我们有了先进的计算机手段,不妨将你的经验放到全数据中去做个验证,然后优化调整。