欢迎来到量化小学

第三讲:一个公式理解量化投资的基本逻辑
▲ 全年订阅  加入“量化小学”校友圈儿

Video Player is loading.
Current Time 0:00
Duration -:-
Loaded: 0%
Stream Type LIVE
Remaining Time -:-
 
1x

详细内容请观看PPT视频

句读知之

  • “如果把本钱都输光,那就不能玩了,这点必须要控制。”
  • “如果用金庸的武侠小说里的一种武功来比喻CTA策略的话,我觉得是降龙十八掌。”
  • “如果还用金庸武侠小说里的武功来形容高频交易的话,我也冒着拍砖的危险,顶着锅盖说一下:我觉得有点像葵花宝典或者辟邪剑法,确实也不是一般人能玩...”

内容梗概

大家好,欢迎来到量化小学。我是渔阳。今天是第三讲,我们来谈谈量化投资的基本逻辑。

我们先复习一下上一课讲过的内容:

我们把量化投资大概的分为六个步骤,其中比较关心的还是中间这几步分析,做预测,做判断,还有投资决策。

今天我们就看一看,从宏观上来讲,量化是怎么样来思考这个问题的?我们会谈以下几个内容:首先是量化投资的杜邦公式,然后是一些常见的大类策略分析,最后也谈一谈国内市场的情况。

“杜邦公式”

我们投资总有一些目标,很显然最重要的是赚钱,要有比较高的收益率,同时也必须控制风险。这里面包括回撤的风险,波动率风险,还有一个特别重要的就是所谓的极端风险(risk of ruin)。说白了,如果把本钱都输光了,那就不能玩了,这点必须要控制。

机构投资者还会有一些特殊的考虑,因为他们的钱比较多,会考虑到策略的容量、利润总额、策略相关性,以及一些合规、税务、政策导向等因素。

在量化的框架下,我们怎么来实现收益和风险控制的目标呢?这个是我总结的量化投资的“杜邦公式”,把年化收益率做了拆解:

年化收益率=单笔交易的利润率*交易次数*杠杆率

数学上来讲是很显然,但它却提示我们做量化交易应该往哪里使劲。无非是三个地方,要么去提高单笔交易的利润率,这要靠非常好的信号;或者可以提高交易次数,也叫turnover,或者周转率;最后一点就是要合理的使用杠杆。

在这个框架下面,我们来分析一下一些常见的量化策略:

CTA策略

首先是CTA策略,这应该算是最早的一类量化策略,发源于美国,70年代得到了比较大的发展,当时是美国脱离了布雷顿森林体系,美元和黄金脱钩,所以一些大宗商品就涨得非常厉害。一些投资界的老前辈包括索罗斯他们都是在70年代通过CTA策略赚到的第一桶金。

上面这张图是螺纹钢1801合约今年的一张走势图。我们都知道螺纹钢是非常重要大宗商品,螺纹钢期货是国内期货市场交易最活跃的品种,今年螺纹钢的供需各种各样的因素比较多,也比较复杂。一方面是供给侧改革,有限产、环保,有的时候会停产;另外一方面经济究竟是向好,还是可能会拥有进一步的下滑,也不是非常确定。

另外螺纹钢主要的需求方面,房地产、基建也有一些不确定的因素,这就导致了螺纹钢虽然总体的趋势是向上的,但并不是那么一帆风顺。在这张图上我们也看到了中间有过几次来来回回的情况。CTA策略就是企图去抓一些大的趋势性的东西,在这张图上有过三次比较顺利地向上,一般来说,CTA策略在这样的市场当中都能取得不错的成绩。在中间这一块来来回回震荡的时候,CTA就比较痛苦。

放到我们的框架里面来看一看,CTA策略单次的交易利润率预期比较高,但不是特别稳定,赚百分之几十甚至于翻倍都是有可能的。但遇到来回震荡的行情,也会连续的遭遇回撤。

交易次数:CTA我们一般是中频策略,与高频相对应。它的持仓是以天、周或者是以月为单位的。

最后,CTA的杠杆是个有趣的话题,英文叫“All over the place”。大家使用杠杆的态度特别不一样,职业选手对于杠杆的使用是非常谨慎的。为什么这么说?

以螺纹钢为例,它的波动率是非常高的,现在大概年化达到30~40%,也就是说在正常的年景里面,螺纹钢涨30%或者跌30%是非常正常的一件事情。在这种情况下,如果你加了杠杆,市场一旦市场发生了于你不利的变化,本金就会遭遇很大的损失。因此职业选手在螺纹钢这个品种上,不会把很大的赌注押在上面。

而实际当中,很多人还是在期货上用了极高的杠杆。还是以螺纹钢为例:

这个交易的保证金一般也就在10%左右。所以如果你有10万块钱,你可以买100万块钱的螺纹钢。但如果你真的这样做了,只要市场发生了于你不利的变化,这10万块钱很快就会输光。

所以在期货市场里面,一方面传奇故事很多,有不少大佬靠期货挣了很多钱;另外一方面也有很多爆仓的悲剧。我比较喜欢看武侠小说,如果用金庸的武侠小说里的一种武功来比喻CTA策略的话,我觉得是降龙十八掌,需要有深厚的功力,特别是对现货的理解、对宏观经济的理解,你就可以赚很多钱。

高频交易

下一个是高频交易,最近几年大家讨论的比较多,好像是一些计算机天才玩的东西。前几年在美国有一位著名的财经作家叫迈克尔•刘易斯(Michael Lewis),他写了一本书叫《Flash Boys》,揭露了一些高频的玩法,引起了挺大的社会反响。

右边这张图是我从网上找的,讲的是所谓的订单簿的概念,是对市场的微观结构的一种展示。在这个图上面,红点是代表卖单,蓝点是代表买单。市场当中买卖的力量是随时变化的,有人可能会挂出更多的买单或者卖单,会撤掉,也会有成交等等。

高频策略就是随时随地盯着市场的微观结构,企图对市场的方向做出一些判断究竟应该提供流动性(provide liquidity),还是应该拿走流动性(take liquidity),靠这个来赚钱。

放到我们的框架里面,高频策略的利润率非常低,是微观的交易机会,往往就是在1tick、2tick的级别来进行交易。其实高频交易本身往往是不赚钱,要靠交易所和券商、期货商返点才能够赚钱。为什么交易商愿意给他们返点呢?因为高频交易的交易量一般来说非常大,有的时候也会为市场提供流动性。

交易次数:非常高,既然是高频交易,它的持仓是以秒甚至毫秒来计算的,所以说单笔交易的利润率虽然低,但是总的来说高频交易赚钱还是挺快的。

杠杆率:因为高频交易通常不会持仓过夜,从这个意义上来说没有杠杆,但是在日内有可能会使用比较多的杠杆。

高频交易特点:

我们来看一下高频交易的特点。首先是锱铢必较,最能和期货商、券商谈费率的一定是他们。第二是毫秒必争,因为在市场的微观的层面来进行竞争,快上一毫秒甚至于一微秒,就可能抢到一个比较好的单子,所以高频交易在这方面特别的重视,非常讲究。

因此高频交易是技术至上的,也可以说是需求比较变态。比如机器一定要放在离交易所的主机非常近的地方,然后还会把自己的软件写到硬件里面去,因为这样跑起来最快,甚至还会修改操作系统的内核,把觉得影响速度的东西都给去掉。

我们打一个比喻,为了让汽车开的快一点,把那些座位、空调都给拆下来,就剩发动机,这样能达到最快的速度。如果还用金庸武侠小说里面的武功来形容高频交易的话,我也冒着被做高频的同行拍砖的危险,顶着锅盖说一下:我觉得有点像葵花宝典或者辟邪剑法,确实也不是一般人能玩儿的。

高频交易的现状:

我们来看一下高频交易的现状。首先在美国市场,最近几年高频还是面临着一些社会舆论的压力,前面讲到:《Flash Boys》揭露了高频一些不是很体面的玩法,所以现在监管也比较严格。

另外一点特别重要的就是所谓狼多肉少,因为竞争实在是越来越激烈。高频这个东西是十几年前兴起的,当时因为没有人做,就比较容易赚钱。最近5、6年很多人都看到了高频里面的机会,大家都来做这个。

我在美国的时候对job market 比较了解,确实一些最牛的初出茅庐,技术非常强的博士都去了高频公司。那么多的高手在一起,就像打扑克一样,大家的水平都很高,那谁能赢钱呢?最后的结果打来打去都很困难。我觉得美国的高频现在也进入了这样的阶段,经过了多年的快速发展,行业已经进入洗牌阶段。

再看一下国内市场,在2015年的股灾前后,也有过一些关于高频的报道,比如说著名的伊士顿做了一些非法的事情,但也确实在短期内赚到了很多钱。所以现在监管对高频基本上是不鼓励的态度,各个交易所也设置了很多限制,比如报撤单比率、报撤单次数、持仓量、交易量等等,就造成了一个很有意思的现象,再牛你也只能做那么多交易。

因此在国内的高频市场并不是赢家通吃,很难讲这对行业是怎样的影响。既然不是赢家通吃,做的谈不上第一流的高频交易者,也还有生存空间。我刚才也讲过,高频交易不是一般人能玩儿的,确实也不建议普通的投资者,特别是散户朋友们去尝试这个东西,对技术的要求实在太高了。

量化选股(Alpha策略)

下面讲点有意思的,所谓的量化选股,其实也没有统一的叫法。在国外有人就直接把它叫做Quant Trading,也有叫Equity Stat Arb,在国内有人把它叫做Alpha策略

上面这张图我是从网上找来的,挺好的概括了所谓的Equity Stat Arb和传统投资的区别。左边这个慈祥的白胡子老头是西蒙斯,大概接触过一些量化的朋友们都应该知道。他是文艺复兴对冲基金的创始人,旗下著名的大奖章基金,在过去差不多30年当中,平均每年赚百分之四、五十。

右面这位是巴菲特,全世界最牛的投资者,敢跟巴菲特叫板的人不多,大概索罗斯算一个,还有就是这位西蒙斯。巴菲特的投资方式大家都非常清楚,价值投资,根据基本面,根据宏观经济的判断,投资偏向长期等等。

西蒙斯就是一个典型的量化投资,他是依靠数学模型,用海量的数据来进行多层次多方面的定量分析,投资周期偏向中短期,持仓标的高度分散化,在风险最小化的前提下实现收益的最大化,基本上是教科书式的量化的框架。

放到我们的杜邦公式里面去分析一下,在美国市场Equity Stat Arb的单次交易利润率并不是很高。大家谈到西蒙斯通常都会说他的模型怎么高大上,模型固然高大上,但是在美国这样比较有效的市场,股票相对来说定价比较合理,一次交易确实赚不了很多钱。一般来说就是10个bp,也就是0.1%左右。

当然这只是一个示例,实际上可能有时候比这个多,有时候比这个少,另外也不是说每次固定的赚钱,有赚得很多的时候也有亏得很多的时候,所谓10个bp也好,5个bp也好是一个平均数。

单次交易的利润率并不是很高,那我们怎么办?

交易次数(Equity Stat Arb),它的交易次数还是比较高的,一般来说几天到一两周是比较常见的,所以也属于中频的范围。

还有就是杠杆率,在美国市场,融资融券还是比较容易的,所以做Equity Stat Arb有3到5倍的杠杆是很常见的,甚至于更高。在这里我要再稍微讲的细致一点,就是如何计算杠杆。通常是用总持仓的绝对值,把多头的绝对值和空头的绝对值加在一起,然后除以你有多少钱。

比如说我有一亿元的基金,买了多头是一亿的股票,卖出空头也是一亿的股票,一般来说算是两倍的杠杆,因为你的总持仓是两倍。来看一下他们在国外Equity Stat Arb是怎样一年挣出百分之几十的。根据这个简单的示例,可能一次平均只赚0.1个百分点,但是一年做上50次,再来五倍的杠杆,这样一乘,也就有25%的收益率了,基本上就是这样的逻辑。

由于对于国外市场比较有效,想要去寻找投资机会不是那么容易,所以一般来说,必须要把多个模型的信号组合起来,才能够有能赚钱的Alpha信号。因此风控和投资组合的构建就非常讲究,在之后的章节当中也会反复的讲到这一点,控制住风险才能够去加杠杆,才能够去获取更高的收益。

交易执行

最后一点是交易执行,还是比较讲究的。因为利润率不高也就是0.1%,就不能够容忍在交易环节交太多的手续费,或者产生太多的市场冲击。因此一些比较大的投行也会专门为这些投资者开发出各种各样的算法交易。说到这儿,在我们quant<OS>平台上有比较专业的交易系统,里面也是有这些算法交易的。

中美市场对比

很多人希望把西蒙斯的成功经验搬到中国来,那么我们可以先看一下中美市场到底是否一样?恰好我在两边都做过,对情况比较了解,在这里就归纳一下。

美国市场:

首先看美国市场,融资融券确实是比较容易。双边合计也就0.5到1个百分点。在美国融券,一般来说不但不用给钱,券商还会倒找你钱。因为你先把股票卖空了,多出一笔现金,这笔现金是可以获取短期现金收益的,所以券商还要给你分钱。

当然融资的话,你是要给券商一些利息。融券有一个不确定因素,就是不好借的股票要多付一些利息,完全市场化的定价。合起来融资融券双边也就是在1%或者稍微多一点。

国内的融资融券,单边就在7%左右,两个加起来就是14%。还是建立在能够融券的基础上。实际上自从股灾以后,融券非常困难。杠杆在国内不太好加,因为成本实在是太高了。

再看对冲,在国外做空个股基本不受限制,做Equity Stat Arb的通常都会做多很多股票,也会做空很多股票,几百只甚至于上千只。说到赚钱,一般来说做空股票赚钱更稍微容易一点。在国外做这个策略,很多时候是通过做空来赚钱的,做多部份是一个对冲。

在国内,完全不是这个情况,因为在股灾之后,融券非常困难,所以一般的基金经理做Alpha的时候只能用股指期货来对冲。这就造成两个问题,首先失去了通过做空个股来赚钱的机会,还有一点就是股指期货现在有贴水的现象,贴水意味着你用股指期货对冲有一个额外的成本。

那能不能通过提高交易的周转率来赚钱呢?在国内其实也是比较困难的。我们来看一下交易手续费,在美国市场双边的费用,就是来回的费用是不到万分之一的,这跟股票多少钱一股有关系。在国内,双边的费用超过万分之十。首先有万分之十的印花税,这你肯定逃不掉。然后券商肯定还要收一些手续费,万分之一、二就算很便宜的,加起来至少万分之13,14。所以在国内想把周转率搞得特别高也不是太可能。

当然,凡事也都有例外,国内有一种叫T+0的玩法,在某一些波动性比较高的股票上面,还是有可能做日内交易的。但是大部分的股票,特别是波动性比较低的股票,这样做不太可能。

中国市场:

下面我们看一下中国市场,Equity Stat Arb刚才我们说了,一般来说杠杆比较低,大概只能有七成的股票仓位,另外三成还要做股指期货对冲的保证金。交易次数是中频的,但是不可能太高,主要是因为成本比较高,有印花税等。

所以华山一条路,必须单次交易利润率要高。除了需要研究实力要强之外,也需要市场给力,需要比较高的波动率,这样才有机会。还有就是个股表现需要有差异。如果没有差异的话,选股也没用,有差异才可能赚钱。

刚才我们谈过国内市场和国外市场的差异,不易融券不易做空个股,融资融券成本都高,交易成本也高,通常只能用股指期货来对冲。因此最后只有一条路,需要比较强的信号,比较强的预测能力,单笔的交易利润率一定要高。

那么这个事好不好做呢?我觉得也可以用一个武侠小说里的武功来形容Equity Stat Arb,我觉得有点像天龙八部里的六脉神剑,它分为两个阶段,一个是回测阶段,这时候可能发现你的六脉神剑指哪打哪。

但是上实盘就未必是这样了,能像段誉那样时灵时不灵也就不错了。为什么会出现这种情况?因为既然是统计套利,主要就是从一些历史数据当中寻找规律。这些规律有可能是真实的,也有可能只是巧合,甚至是由于计算机程序的错误引起的。即便是历史上真实的规律,也有可能在未来不能够重复,因为发生这种规律的环境现在可能已经不存在了。

以国内市场为例,前两年小的股票表现比较好,自从去年证监会开始限制在小票上的投机、鼓励价值投资之后就完全变了。所以如果从历史上去挖掘一些所谓的规律,放到现在的市场就未必适用。因此在做统计套利时一定要有这方面的思想准备,在回测当中工作的模型在实盘当中未必能行。

但是中国的Equity Stat Arb前两年还有不错的表现,为什么会这样?我们也来做一个简单的分析,我这收集了一些数据,就只有两行,第一行是A股中位数股票的涨跌幅,就是那几千只A股当中每年排在中间那支股票涨了多少或者跌了多少;第二行是沪深300指数的涨跌幅。

假设用随机选股的方式做Alpha策略,我预期的收益率就应该是中位数的那只股票的涨跌幅,再减掉沪深300的涨跌幅。如果这样做了,在历史上会怎么样?2013年还不错,因为中位数涨了16%,沪深300跌了7%,所以即便是乱选股票,也肯定是赚钱。

2014年中位数没有跑赢沪深300,如果对那段历史有所了解的话,其实到11月份都是一般的股票跑赢了大票。在那年的12月份,大牛市刚刚开始时,有过金三胖,即所谓银行、券商、保险的一轮巨大的行情,一下把大票给推上去了。巧的是,很多Alpha基金正是在那一年的12月出现了很大的回撤。当然,不是说选股都是瞎选,但这至少说明如果用来做对冲的标的出现比较大的涨幅,确实会比较痛苦。

2015年股灾大家都知道,沪深300是先起后落,只涨了5%,中位数的股票倒是涨了61%。当然61%是有一些水分的,因为当时有很多股票停牌了,但是不管怎么算中位数股票也是大大的跑赢了指数。所以2015年是很多Alpha基金特别棒的一年。这里面也还有另外一个因素,刚才我们讲过Alpha喜欢波动性,喜欢差异性,在股灾的时候这两个都是非常不缺乏的。

2016年情况变了,中位数股票又开始跑输沪深300了。在这一年,股指期货出现了比较大幅度的贴水,要用沪深300来对冲的话,其实不是亏11%,可能要亏到20%以上,所以乱选股票肯定是不行的,比较有经验的、技术比较高的基金经理还是可以战胜市场,但是也赚不了太多钱。

2017年确实就有点惨淡的,今年是所谓一九行情,只有最大的一些股票在上涨,其他的大部分都在跌,A股的中位数的股票跌了18%,沪深300涨了20%,所以今年如果用乱选股的策略会亏非常多的钱,即便是有经验的基金经理在这样的市场当中,除非你选中了大股票,即所谓的白马股,否则也是比较辛苦的。

最后我们从量化的角度看一下:size是个风险因子。这什么意思呢?所谓的size就是衡量是大股票还是小股票的量化指标。在刚才简单的分析当中,所用策略很明显是对size有风险暴露的,因为我们是用中位数的股票和沪深300相比较,沪深300就是A股3000多只股票里面基本上是最大的那300只,而中位数差不多就是排到一千多名了,现在的情况是1500名、1600名、1700名的样子。如果你这样做了,那你就对size风险因子有很大的暴露,无论你赚钱或者亏钱都是跟这个很有关系的。

除了size之外,还有很多其他的风险因子,要想量化选股做得好,需要对风险模型有比较清晰的认识,我们在今后的一些章节当中也会谈到这一点。

课堂总结

今天讲了挺多内容的,我们总结一下,量化投资有这么几个目标:

  • 首先需要预测效果好的交易信号,这样才能够使单次交易的平均利润率比较高;
  • 第二,需要有效地使用杠杆来增厚收益率。第三,在可能的情况下,希望能够加快交易周转速度;
  • 最后一点特别重要,一定要理解风险、控制风险。

今天的课就到这里,从下一期开始我们将回归本源,去谈论一些更基础的、对于量化属于foundation的一些知识,请看下集——“老司机的心得”。谢谢大家。

 

-END-

 

 加入“量化小学”的见识圈,一起学习 

感谢您订阅本特辑,全年订阅用户请扫描下方二维码或点击链接,即可加入专属见识圈子深入交流学习。