Note

FollowQuant如何挖掘用户交易数据背后的价值

· Views 48,801

今年6月,Followme交易社区发布了一款大数据类的金融科技产品——基于用户行为的量化策略开发平台FollowQuant。自2015年成立至今,Followme交易社区累积了将近25万个活跃账户,用户日交易订单超过10万笔,平均每1秒就有1笔新的订单产生。如何从当前海量且与日俱增的用户交易数据中“挖掘”出“超额价值”,是我们一直在思考与研究的课题。

经历了长达2年的探索,我们打造了一个可以快速处理千万级实时订单流与上亿级历史订单数据的FollowQuant,帮助我们发现用户交易数据背后所蕴含的统计规律,并支持各种交易思路的可行性验证与优化,最终构建出基于用户行为且具备稳健盈利能力的量化交易策略。

基于用户行为的量化交易策略是一种全新的交易方式,与传统的交易有很大的不同。长期以来,大多数的交易员都是基于图表行情分析或基本面数据来做交易,他们通过各种技术分析从市场价格走势中寻找高胜率的入场点,有时候也会结合自己对市场新闻或各类风险事件的判断来决定自己的交易方向。传统的交易方式存在最大的一个问题在于,大部分甚至所有的交易决策都是建立在自己主观的意识之内,无论是采用何种分析方式,在执行下单的那一刻,所有的判断仍旧来源于自己。由于潜意识里的认知偏差,导致我们的大脑都会倾向于过滤掉不符合自己认知的信息,简而言之,即我们更容易认为自己是对的,而总能找到支撑自己观点的理由或资讯。这也是导致大多数人做不好交易的重要原因,因为在零和博弈的市场里要想获胜就意味着你必须与大多数人不一样,但要在潜意识里靠自己去对抗或改变人性是非常困难的一件事。

既然一个人的思维方式和习惯一旦形成之后很难去改变,那么在大多数人行为的统计基础上所得出的结论无疑将具有很强的“稳健性”。因此,我们才有了基于用户行为来构建量化交易策略的想法。而这种全新的交易方式,将不再去关注市场的行情走势,各国的政治、经济决议或任何突发的风险事件,而是建立在对某一群用户,在某一段周期与某一个市场上交易绩效的平均表现,再通过非相关性因子来设计或组合不同的“策略”,可以是同一个品种或一群用户也可以是不同,那我们所得到的交易模型将是完全基于用户交易的数据样本,由于我们关注的是用户整体的行为而非个体,因此在未来行情的应用中除非发生用户交易量的大幅变化或整体行为的改变,才会导致该类策略的失效,而这个概率要远远低于因市场价格走势的改变,各种经济、政策或风险事件而导致传统交易方式失效的可能性。

基于用户行为的量化交易方式,本质上是建立在正向或反向跟随某个用户群体(可以基于品种或账户规模等划分)交易订单的基础上,根据历史回测统计的风险回报比确定投入的资金和仓位,通过自定义分析指标来构建的策略模型进行自动化跟随交易。下面就我们利用FollowQuant所开发的“黄金1号”量化策略的主要思路与流程跟大家做一个简要的分享与探讨。该策略是基于Followme近2年来用户的“黄金”交易数据样本(含交易员与跟随者自主交易订单,已过滤掉跟随交易订单)来创建的。

一、根据用户交易的“盈亏效率”来选择交易品种与策略类型。FollowQuant如何挖掘用户交易数据背后的价值

如上图所示,我们引入了一个指标“Avg.Profit”(即排除掉隔夜利息与手续费后的平均每手盈亏金额,以下简称“盈亏效率”)来衡量用户交易的平均绩效。上图的功能在于可以快速找到适合进行正向或反向跟随的交易品种订单。如果用户在某一品种上的整体是亏损的,且“亏损效率”大于交易成本(点差)的2~2.5倍,则表明对该品种的用户订单进行反向交易最终获得盈利的可能性很高(因为反向交易的成本至少是原始订单的2倍),反之则可以进行正向跟随交易。

右边的柱形图还可以看月或周(根据选择的统计周期自动调整)“盈亏效率”的分布情况,如果分布的标准差不大,则表明用户的平均绩效比较稳定,即策略净值的波动会更小,更适宜跟随。另外,我们也要注意交易订单量的大小,尽可能选择交易订单量较大的品种,才能确保统计规律的客观性与有效性。由于“黄金”的交易量占到了全网的50%以上,且“亏损效率”为86USD/手,若按照该品种的原始平均点差为50USD/手,而策略执行点差为25USD/手计算的话,仍旧有 11USD/手(86-50-25)的盈利空间。 

二、通过指标创建策略并进行回测分析与优化

1.对所有“黄金”交易订单反向跟随交易回测

在策略编辑器中选中品种“Gold”,并把原始点差设置为0.5(即50USD/手),策略执行点差设置为0.25(即25USD/手),初始本金为100万USD,在不添加任何指标的情况下,进行回测,结果如下图所示:

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

策略约交易了40万笔订单,收益率为129.23%,但最大回撤却高达74.31%,“盈利效率”也仅有12.43USD/手,虽然最终的收益不错,但从风险回报比来看并不理想,且交易过程中存在爆仓风险。我们可以尝试在该策略的基础上继续优化。

2.增加“交易笔数”指标过滤订单

FollowQuant如何挖掘用户交易数据背后的价值

根据上图统计结果显示,用户在前20笔的黄金交易中亏损效率最高,达到-177USD/手;从第20-60笔之间亏损效率急剧下降至-90 USD/手, 100笔之后亏损效率已经基本接近-50 USD/手。因此,我们可以有一个策略优化的思路,即增加一个指标,只对每个账户的前100笔黄金交易订单进行反向跟随交易,超过100笔之后的交易订单将不再跟随,下图是优化后的策略回测报告。

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

策略总交易订单减少了将近30万笔,收益率虽然下降至86%,但最大回撤也大幅下降至了15%,“盈利效率”提升至26.98USD/手,风险回报比显著提升。

显然,随着用户对某个品种的交易笔数和经验的累加,他的亏损效率大概率会逐步降低,如果能够交易超过100笔,那很有可能说明他已经对该品种掌握了较好的风控,平均亏损基本上会接近成本,而这对我们的反向策略来说,则是应该过滤掉的“成本账户”。

3.增加“利润因子”指标过滤订单

按照反向交易的思路继续思考,既然我们要找的是“平均亏损”大于“平均盈利”的账户,如果我们先对前N笔的“利润因子”进行判断,比如“前20笔的平均盈利小于平均亏损“(即“前20笔订单平均盈利/平均亏损<1”的账户才从第21笔开始进行反向跟随,回测结果如下:

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

策略交易订单进一步减少了将近3万张至78000张,盈利效率从26.98 USD/手提升至43.51USD/手,策略收益率从85.95%提升至107.47%,最大回撤从15%进一步下降至7%,风险回报比从原先的5显著提升至15以上,验证了该思路的有效性。我们再来看日内时段的“亏损效率”分布,对那些亏损效率较高的时段停止跟随交易,看看能否还有再提升的空间。

4.增加“交易时段”指标过滤订单

从第3次优化后策略的日内时段“盈亏效率”分布来看,20点至24点中进行跟随交易的订单亏损概率更高,因此我们进一步优化,把20点至24点的订单过滤掉。

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

FollowQuant如何挖掘用户交易数据背后的价值

从回测结果来看,这次优化对于策略绩效的整体提升幅度不大,因为过滤掉的订单仅有4000张(仅为5%)。 至此,我们的“黄金1号”策略就基本建立好了,接下来将根据回测报告的结果,以及我们自身的风险回报要求,来投入真实资金将该策略应用至实盘交易中。

5.2019年1月至今的策略实盘交易绩效:

FollowQuant如何挖掘用户交易数据背后的价值

我们今年初启动了“黄金1号”策略,初始本金为10万USD,按照0.4倍比例进行反向跟随(因为回测报告100万USD本金按1倍比例反向跟随的最大回撤为7%,而我们希望投入的风险资金为30%即3万USD)。截止目前的收益率约为35%,最大净值回撤不足10%,绩效表现基本符合回测结果。四季度,我们将会引入战略合作的百万美元基金,进一步发挥该策略的价值。

三、关于FollowQuant未来的构想

前文主要与大家简单分享了我们团队如何利用FollowQuant来构建基于用户行为的量化交易策略的案例,包含了数据概览、策略创建、回测分析等这几大模块的功能简介。当然,关于这类型的量化策略研究仍旧是方兴未艾,还有很大的探索空间,我们相信Followme交易社区用户数据的价值远不止于此。未来我们将不断完善分析指标库,包括但不限于出入市优势分析、账户盈亏比例、延迟跟随等,并引入机器学习与神经网络算法,对海量的用户交易数据与行为数据进行更深度的挖掘,真正打造一个行业内领先的智能量化策略开发平台。今年四季度,我们针对个人用户的SAAS版也会上线,大家可以构建基于我们全网交易员数据的自动跟随交易算法,真正实现智能跟随交易。

我们也欢迎各路大神为我们提供宝贵的意见,共创硕果。

 

 

 

Edited 24 Oct 2019, 12:05

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

Verified Person
這篇文章可花了心思寫了,你基本把我們這麼多年要幹的產品模式全部公開化了!
WillPan
Author
@Marco Chu:花了2年,才真正把你的思路搞明白,希望今年内能基本把产品的主要功能完成。
Verified Person
Marco Chu
@WillPan
@WillPan 這碩士學位怎麼拿到的?花2年理解一句話⋯⋯
WillPan
Author
@Marco Chu
@Marco Chu 我发现在销售这个产品的过程中,最大的问题不是产品做得够不够好,而是大多数人没有理解这个产品背后的理念,这个认知门槛还是挺高的
交易笔数前20是什么意思?
WillPan
Author
@NinjaLoveFish 一个账户交易某个品种的第1-20笔交易订单
@WillPan 这个指标,那你能保证未来的一批账户也会有相同的情况发生吗?历史如果是10年的数据,略有参考意义,但时间太短的就不行。也许你还可以考虑地域文化的情况,但数据一旦大了,情况复杂了,应该还是一个零和游戏
@WillPan 个人理解,反跟是个思路。我还有个观点:有人说我不相信你们人类,我只相信AI。我说我不相信机器,我只相信人类的智慧。
1、时间筛选还可以做周一至周五,不过也可能fm做过了;2、结合信号,还可以对信号前一段的k线形态进行过滤,例如连续k线属性或者影线比例等等。一点数据分析的经验
WillPan
Author
@汇智者 周一到周五也有的,也还可以继续扩展;结合K线可能要到晚一点才会进行这方面的结合
汇智者
@WillPan
@WillPan 还有均线周期筛选,布林通道区间筛选……任重道远啊
WillPan
Author
@汇智者
@汇智者 先聚焦于用户行为的分析
文章写的TM太好了,好想多看一点儿这种文章。我会翻来覆去来看一看,总有启发,这是目前为止我在佛罗密看到的最好的一篇文章,没有之一!
传统的交易方式存在最大的一个问题在于,大部分甚至所有的交易决策都是建立在自己主观的意识之内,无论是采用何种分析方式,在执行下单的那一刻,所有的判断仍旧来源于自己。
这么高质量的文章,能否还有机会再次看到类似的高质量文章!
牛🐮
加油我一直都在
社区的账户大部分是跟单的,同质化严重,跟单账号不应该作为样本来分析
WillPan
Author
@风吹走天涯:跟随订单是被排除掉的
没有一个稳定的模式只靠大数据来做单
这个是对
这个想法可以,牛
photo
photo
🐮牛
我看懂了,感觉很实用的策略,具体效果需要时间。
大笑
学习
挑选交易员才是最关键的,只有能稳定盈利的样本才能通过赋予各种因子构建出来一个更稳定的正函数吧,但是交易了那么足够长时间的交易员很少吧。
👍

Pull-up Update