概述
多因子选股模型在模型搭建中, 往往会涉及到非常多的股价影响因子, 并可能导出数量极多的备选模型. 因此, 对于多因子选股模型的评价和筛选, 就显得尤为关键.
流程
基本面数据因子 (特征) 有很多, 所有找到对应股票收益率高的因子就尤为重要.
挖掘因子的过程
先从上百个因子当中分析出对股票收益率有效的部分因子:
- 在每个大类因子中去做筛选, 每个大类因子中筛选出有效的 N 个因子, 包括 质量, 估值, 成长等因子
- 严格: 例如 20 个有效因子
- 不严格: 例如 50 个有效因子
在筛选的单个因子当中做相关性分析, 合并相关性强的因子
- 最终得出有效的, 相关性弱的因子, 一般在 10 个左右
- 海选 -> N 个因子 -> 精选 -> n 个因子
有效性分析
因子的 IC 分析:
- IC (Information Coefficient) : 信息系数, 代表因子与股票收益的相关强度
因子的收益率分析:
- 确定因子的股票方向
因子方向
因子方向 | 因子说明 |
---|---|
因子升序 | 因子值越小越好. 如市值, 估值类 (市盈率, 市净率, 市销率等) |
因子降序 | 因子值越大越好, 如 ROE, 利润, 利润增长率类因子 |
因子中性 | 因子方向不确定, 如 周转率, 资产负债率等因子 |