欢迎来到量化小学
▲ 加入“量化小学”校友圈儿提问交流
详细内容请在wifi环境下观看视频

<本期课程5973字,视频21分58秒,合理安排学习时间>
>>(订阅专辑后即可观看精彩的幻灯片视频以及案例操作视频哦)

正文阅读

大家好,欢迎来到量化小学。

前面我们讲了因子研究的一些基本方法,包括线性回归、分组法等等。今天我们来谈一个有意思的话题,也是现在大家关注度非常高的一个领域——机器学习。

首先我们讲一讲,怎么样构建问题、以及在量化研究当中使用机器学习的一些要点,然后给大家介绍一些常用的基础方法。

机器学习的关键

首先我必须强调一点,机器学习并不是从石头缝里冒出来的,它是传统的统计研究方法的延伸。另外机器学习是非常强大的,但是也不必把它神化,它确实能够帮助我们更有效的提炼和利用数据中包含的信息,但是没有办法通过机器学习来凭空造出阿尔法。

我举一个例子,比如说我们可以把量化研究比喻成开采石油的过程,传统方法能够开采出一些油来,如果你掌握了页岩油的开采方法,你就可以采出更多的油。但如果这个地方根本就没有石油的话,你用什么样的方法也采不出来。

所以量化研究也是一样的,首先你要想明白你要研究什么样的问题,这个问题必须是可以被研究的,然后才谈得到用机器学习这样比较好的方法来使得研究效率提高,获取更多的阿尔法。

所以我们前面讲过几次了,选股策略通常就是通过一个时间截面的因子信息,对选股池的股票进行打分分类,或者来做收益预测。因此从数学的角度来说,我们可以把这种研究抽象成X到Y的一个映射关系。

X是什么?一般来说就是我们用来做预测的信息,通常也把它叫做因子。股票研究,我们可以有基本面因子、技术面因子、情绪因子、事件因子等等,前面都讲过不少了。

那么被预测的对象呢?你要研究什么呢?根据实际情况我们可以去直接预测收益率,也可以对选股池的股票当中进行排序,也可以来做分类。

例如说我们希望知道我们把涨得多的股票分成一类,把跌得多的股票分成一类,让计算机去研究一种算法,能够正确的对股票的未来收益进行分类。

那么当你成功的把这个问题构建好了,然后又准备好了……

 

>>欢迎订阅《量化小学》,加入我们一起学习!