因子研究之机器学习基础. 第30讲

渔阳 2019-03-22 17:34

“欢迎来到量化小学”
▲ 加入“量化小学”校友圈儿提问交流
详细内容请在wifi环境下观看视频

正文阅读

大家好，欢迎来到量化小学。

前面我们讲了因子研究的一些基本方法，包括线性回归、分组法等等。今天我们来谈一个有意思的话题，也是现在大家关注度非常高的一个领域——机器学习。

首先我们讲一讲，怎么样构建问题、以及在量化研究当中使用机器学习的一些要点，然后给大家介绍一些常用的基础方法。

首先我必须强调一点，机器学习并不是从石头缝里冒出来的，它是传统的统计研究方法的延伸。另外机器学习是非常强大的，但是也不必把它神化，它确实能够帮助我们更有效的提炼和利用数据中包含的信息，但是没有办法通过机器学习来凭空造出阿尔法。

我举一个例子，比如说我们可以把量化研究比喻成开采石油的过程，传统方法能够开采出一些油来，如果你掌握了页岩油的开采方法，你就可以采出更多的油。但如果这个地方根本就没有石油的话，你用什么样的方法也采不出来。

所以量化研究也是一样的，首先你要想明白你要研究什么样的问题，这个问题必须是可以被研究的，然后才谈得到用机器学习这样比较好的方法来使得研究效率提高，获取更多的阿尔法。

所以我们前面讲过几次了，选股策略通常就是通过一个时间截面的因子信息，对选股池的股票进行打分分类，或者来做收益预测。因此从数学的角度来说，我们可以把这种研究抽象成X到Y的一个映射关系。

X是什么？一般来说就是我们用来做预测的信息，通常也把它叫做因子。股票研究，我们可以有基本面因子、技术面因子、情绪因子、事件因子等等，前面都讲过不少了。

那么被预测的对象呢？你要研究什么呢？根据实际情况我们可以去直接预测收益率，也可以对选股池的股票当中进行排序，也可以来做分类。

例如说我们希望知道我们把涨得多的股票分成一类，把跌得多的股票分成一类，让计算机去研究一种算法，能够正确的对股票的未来收益进行分类。

那么当你成功的把这个问题构建好了，然后又准备好了……