关于如何使用机器学习优化量化交易

2016/6/30 posted in  干货 天书

别问我为什么要说,今晚喝大了,趁我后悔前发出来。

作为一个量化交易的老司机,以及非高频的草根量化交易人士,以及风险管理公司的创(shen)始(jing)人(bing)。

本来做风控和量化是两个思路,风控的小伙伴基本都心里拧巴~因为我们把每天都当做世界末日,天天假设世界末日来了咋办~~~恩,好的风控都有精神分裂。今天聊赚钱,就先不聊怎么少赔一点了。

但是呢,我们公司又自诩为一个有逼格的投顾公司,因此,为了表现出我们的逼格,我们就用公开市场的公募基金做策略来让大家赚钱,已经发布的有精选固收,精选alpha。但是!!!到底有没有一种折中的全球宏观对冲(啥赚钱投啥)的策略呢?这是我们苦苦思询的事情。当然,作为一个有实力(哈哈哈),虽然我们的宏观对冲阉割版(中国股市日间CTA策略)在15年到现在为客户创造了1.35倍的利润,但是,作为一个追求无止境的公司,我们必须降低震荡市的交易频率!公募的费用太TM高了!怎么搞呢?

传统的量化交易要么择时,要么选股。 亦或套利交易,亦或高频。但是经历了长期的市场洗礼,到底还是人民选择了cta作为重要的防守型策略,有点不可谓不多:资金可大可小,操作灵活,日内,日间,资产种类丰富,还是安全啊~~~~

但是,注意!但是!cta作为趋势交易,不可避免的就是震荡市的持续下挫。让人颇感无奈。

我们有没有好的办法来优化这样的事情,与cta搭配来躲过这段难熬的日子呢?自然,金融民工会说期权搭配固收策略啊!我等天朝中小投资者哪来的期权交易权限啊~~~~看看就能不能用公募基金(etf+qdii做!)

关于市场趋势判断其实对很多策略都非常有用,量化选股完了以后,选择震荡市和强势市场进入,当然能获得更好收益啊。

因此,有很多小伙伴使者进行了尝试,当然,大数据这么火,不用都不好意思说自己是做分析的。

于是,把大数据引入量化交易必然成了每个团队的必然尝试路径,我们自然也不会落下。从14年开始,我们就开始采用有监督学习来优化策略,但是实际效果其实并没有比已经经过历史验证的garch,arima模型优秀到那里去,都是40%左右的准确程度。

后来这两年冒了点论文出来,这里给大家转几篇。 但是,记住,他们的结果也只有40%。而且一看就是学生写的,做交易的时候参考时间线,是绝对不能用简单的随机抽取数据去确定训练数据和预测数据的。金融市场本质是一个时序市场,每个人都会基于对未来和成本进行综合核算。而且市场会自我进化以及学习,MIT的金融大牛就说过自适应市场假说。

我们自己在做的时候经历了长时间的摸索,在试图使用ohlc,引入宏观变量进行学习,但是效果十分有限,其实分析里面的基础逻辑不难发现,做一个最根本的问题就是数据降维,到底如何提取对我们有用的数据显得至关重要。单纯的原始数据最大的问题:无法考虑到不同时间维度的数据对现在及未来时间的影响。不同成本,不同时间都会作用在投资人的决策上,如何让机器来学习不同的时间对现在产生的价值加以评估,是无法再不对数据进行一次处理就直接采用原始数据学习永远无法提高到应用结果的最关键因素。

因此,在经历了癫狂,神经,脑袋撞墙数月后,我忽然找到了一个思路。

我们不应该装逼!!!

啥意思呢?尊重传统,站在巨人的肩膀上。

废话!说人话!对已有投资指标进行二次学习!!!!!

说到这里,可能已经有小伙伴get到我的点了。!!!对 这个点子值一个亿呢!!!!!!!!

快打赏,快给钱!

具体怎么做呢?定好你的学习目标,然后吧能想到的 什么 macd boll rsi 宏观数据,按照分析出的最有效的时间维度进行计算,然后对每一天进行数据对齐。

然后,注意,一定要Rolling Apply 每天学习,每天预测,最好预测时间段不超过10天。否则你会死的很惨,相信我!相信我!万万不可随机抽取数据学习

然后呢?LSTM优化!!!!!!Reinforcement Learning!!!!优化!!!概率提升至60%-70%

fuck!!!!!!!!!什么概念!!!!!!!!!!!!

完全模拟未知的市场环境,之前用HMM吃了大亏,卧槽,hmm是典型的后验概率分类啊!rolling apply效果是一坨屎

fuck!!!!!!!!!!

这样子能让机器每天自动学习不同时间维度的指标,自动学习重要的参数,根据不同的市场环境自适应!!!!!!卧槽!!!!!!!!!!!!!

居家旅行,量化交易必备良药!

具体代码,我喝再多也不可能放在这里的,自己琢磨去吧!代码再告诉你们,我还赚个屁啊!家财去买会员去!!!