七禾网注:嘉宾回答仅代表其本人观点,不代表七禾网的观点及推荐。金融投资风险丛生,愿七禾网用户理性谨慎。
张忠辉
程序化短线交易者,机器学习方面的算法专家,目前兼职交易,继续进行机器学习算法研究。
2015年开始接触期货量化交易,2016年进入期货市场实盘操作,保持每年都盈利。
精彩观点
还是要发挥自己的专业,一个人一辈子就做一件事情,就把这件事情做好。
从近些年的历史数据看,历史上那些比较新的品种往往有大行情,这意味着上市时间特征对于品种加权很重要。
关于机器学习,基本上不是简单套用机器学习的模型,而是重点关注怎么灵活应用机器学习背后的理念。
永远保持一种客观的态度,做量化交易,是个纯粹客观的东西。
机器学习有一个缺点,按一些正常的方法,它黑盒太严重了,黑盒太严重的话不太可控。我们需要认真对交易过程进行拆解,在局部应用机器学习模型,让这个里面的黑盒可控一些。
品种层面特征都人工考虑了,包括还有品种的一些波动性,这个东西需要人工去定义一些特征。
如果这个策略跟原有策略集合里面的相关性很大,那它的权重是要降低的。
选品种其实就是策略加权,我们把它归结为一个统一的框架,就是说我们认为不同的品种的策略,是不同的策略,这样子的话我们就是一个统一的框架,不会说单独有一个选品种的模型,就是统一的有一个策略加权的模型。并且策略之间的相关性如何影响这个策略加权,也是放在一个统一的加权框架中。
我还是比较关注自然语言处理,现在像GPT4语言大模型,其实大模型的核心还是语言为主,它现在有多模态,我还是在关注这个研究这个。
流动性下降了,意味着成交额少了,市面上投机的钱少,策略容量就少了,这个很明显,一般来讲,意味着模型也难跑一些。
一般趋势是有个过程的,开始反转反弹,慢慢地斜率越来越大,其实中间有一个比较稳定的斜率阶段,但如果在某一个阶段斜率突然比前段时间大很多了,实际上一般来讲这个地方有一定的反转信号,我们目前,在这种阶段可能会减少开仓,就是不会继续加仓了。
AI这个领域也方兴未艾,其实看着现在大模型很强大,但是从业内人士来看,还是有很多突破的方向,应该很多方面与我们人类的智能越来越对齐了,但是还是有一些方面没有对齐,还是可以努力。
七禾网1、张先生您好,感谢您和七禾网进行深入对话。据介绍,您2015年开始接触期货量化交易,2016年进入期货市场实盘操作。请问当时是怎样的机缘巧合,接触到期货量化交易?
张忠辉:有一个“天健一号”账户,最早是我的合伙人杨竑的账户,后面又有个“天健二号”账户。2014年的时候,我就认识了杨竑,当时在同一家公司当同事,他在这之前已经做了很多年期货了,2010年股指刚出来的时候,他就开始做了。那会儿正好是股票牛市,所以同事之间投资的话题交流比较多。
当时我做机器学习也很多年了,从2009年在北京读研究生开始,就一直研究机器学习方面。我觉得还是要发挥自己的专业,一个人一辈子就做一件事情,就把这件事情做好。我自己手动去炒股,感觉也不适合,但是我觉得可以用自己机器学习的专业知识去做,无论是做模型,还是做细节,其实本质上都是对数据的处理。
当时是杨竑带我入门了,也讲了一些基本的内容,像海龟交易策略什么的。后面我也慢慢地有一些自己的想法,就开始做了,应该是2016年开始实盘。
七禾网2、在这期货量化实盘交易的8年时间中,您的交易理念、交易方法经历过怎样的变化?
张忠辉:我觉得大的框架是没变的,其实我做的东西不多,主要都是以海龟法则为代表的趋势策略。据我所知,大部分做CTA的人,主体应该是做趋势模型,底层是海龟策略,当然少部分可能还有一些套利什么的。
这些年的研究主要是在细节方面,还是会有一些改进。
1、第一个主要的变化就是策略组合中的策略数目越来越多了。策略组合中的每个策略,一般都基于一个简单的海龟法则,随便改几个参数就可以生成一组具体的新策略。比如说k线周期参数,可以是一个小时和三个小时。然后是止损或止盈参数,可以是1%止损,也可以2%止损。
在2022年之前,其实实盘运行的策略数目还比较少,总共可能也就几百组策略。近两三年,专门对这个做了优化,实盘运行的策略数目达到了数万级别。
2、另一个重要变化就是策略加权。早些年的话,几百个策略都是等权的,可能100个策略每个是1%的权重。但是现在会引入新的特征来对策略权重进行建模,不同的策略的权重会不通。
策略加权中,比较重要的是一个期货品种加权。品种加权会考虑品种的成交额、活跃度、品种的上市时间等。
从近些年的历史数据看,历史上那些比较新的品种往往有大行情,这意味着上市时间特征对于品种加权很重要。
七禾网3、做了8年的期货量化交易,您最大的感受有哪些?
张忠辉:第一个感受,关于机器学习,基本上不是简单套用机器学习的模型,而是重点关注怎么灵活应用机器学习背后的理念,特别是关于过拟合问题的多种思考及方法论。有一些处理过拟合的方法,往往很直观,比如参数高原,也就是说它这一块区域,这个参数突然就很突出,它跟它的邻居差异很大,那证明这个参数不稳定,但是很有用。
另一个是样本的问题,我们说长周期跟短周期,其实短周期的话,理论上来讲它的有效样本就多一些,可能10分钟就采一个样本,你如果是一个星期才采一个样本,所以为什么说有些要强调做短周期,也就是说它的样本多一些,所以做起来的话,它的曲线比较平滑一些。但短周期的话,意味着它的交易成本高,所以这是个折中,也就是说在交易成本靠谱的情况下,你能够把周期做短一点,特别是在你没有担心策略容量的时候。
所以这背后的一个问题,我觉得也是过拟合,通常来讲,这种CTA的策略,期货其实数据不多,大家注意的行业数据,整体上讲,用这些复杂的机器学习模型,是很容易过拟合的,就是现成拿来用的模型,是很容易过拟合的,也就是数据量不够。你看现在的比如GPT4,它们为什么好,其实它们数据量是挺大的,能够支撑起这么大的模型量,也就是说你在数据量不够、噪声很大的情况下,是很容易过拟合的。
第二个感受,永远保持一种客观的态度,做量化交易,是个纯粹客观的东西。早期候也会去手工试一两把,往往会比机器跑的要差。更重要的是,主观交易时心理上更容易焦虑,无论卖还是买,往往都会后悔。哪怕是赚钱了,心理消耗都很大。
保持客观态度的前提就是要有端正平和的心态。做这个事情,你别把赚钱看得太重要,这个可能会影响你的心态,然后可能让你操作不那么稳健。这么多年交易整体的一个特点,是我的仓位越来越低,就是说我希望不至于这个交易太影响我的心态,很容易把自己牵扯进去,让自己不能客观地去做一些真正应该需要做的事情。
七禾网4、据了解,您的期货投资经历比较顺利,保持每年都盈利。您认为,能保持每年盈利的关键有哪些?
张忠辉:应该还是说,毕竟有多年的算法基础,也就是说,我一入场就是专业人士。所以我不会干那种主观交易的事情,有些人做主观交易可能更容易会经历大起大落。
还有一点,可能我在有数理逻辑思维方面,有一定的天分。
我讲一个小时候的小故事,大概1993年10岁的时候,那会哪有什么互联网,书也没得看。我姑父是瓦匠,砌墙的,他说,他们砌墙的时候,给定三条边,3、4、5,这里面就有个直角,等于有直角的话这个墙就直了。
我就觉得很奇怪,3、4、5,这个数字还挺好,这怎么会有直角呢?那会信息也不发达,现在的话查个互联网肯定知道。那会儿只能自己琢磨,然后自己想了两个星期,就发现,如果有两条边的平方和,等于第三条边的平方,就会有一个直角。不小心就自己发现了勾股定理。
这个证明其实我小时候,在数学方面还是有天赋的。
当然未来竞争越来越激烈的话,我觉得盈利的效率会下降,但是应该不至于很大起大落或者亏很多。只能说竞争激烈了,大家都赚得少了,这个是肯定的,还是很明显的,因为这个时代在进步,然后这个圈子肯定也越来越卷,每个行业发展都一样。其实我们业内每一个人都能感觉到,肯定会越来越难。
所以说,第一个的话,我觉得有基本功,第二个的话,回过头看,其实也还有一些运气因素。
这两年的行情,如果用两年前的模型,会略有亏损。但是,因为这两年组织团队全职投入,模型框架从数百级别的策略组合上升到数万策略级别,模型的稳定性有了明显提升,保证了较稳定的净值曲线。
七禾网5、您表示,交易基本框架是以海龟法则为核心的趋势交易。基于简单的策略框架,通过对于策略参数大规模搜索,基于多种评价指标筛选出大量策略进行组合。请问您筛选策略的评价指标,主要有哪些?
张忠辉:一般来讲,先随机生成百万组策略。在随机生成的策略集合上面,把历史数据跑一遍,可以得出每个策略中的历史净值曲线。然后我们先做一些初筛,一般来讲会用风报比,当然也会用一些不同的指标,比如夏普率等去筛选初始的策略组合。
整体来讲会有两层,一个是评价指标来做初筛,基于策略的历史净值曲线,根据多个评价指标(包括风报比、夏普率、月度胜率等)进行初筛,去掉一些明显较差的策略。
第二个的话,对于剩余的策略,有一个加权模型对每个策略进行打分,打分越高的策略在策略组合中的权重越高。
七禾网6、您表示,您会在基本框架保持不变的前提下,不断增加策略组合中的策略数量。请问在策略组合中,是否会通过一些筛选机制,逐步淘汰个别策略?
张忠辉:其实没有刻意淘汰策略。我们大概每半年会重新跑一下评价和加权流程。跑完之后,会生成新的策略集合,可能有一些老策略集合中的策略自动在这个过程中就被淘汰了。