南京基金投资爱好组

Carhart四因子模型有效性检验及应用

私募工场2018-02-12 18:00:34

私募工场(ID:Funds-Works,微信:guo5_guoguo):实名注册会员数万,深度尽调私募三百多家分类策略长期跟踪,独立基金多维度筛选,资产/策略专业配置。专注致力于为资产规模在千万以上的个人企业客户提供资产配置、财富保值、增值、传承等服务

关键词:专业配置 领航私募 精雕细琢 匠心服务 私募FOF 独立客观


私募工场:私募证券投资领域最权威、最独立、最专业化自媒体

果果微信:guo5_guoguo

投顾净值:[email protected]



未经允许转载私募工场所刊文章一律视为侵权(包括非私募工场原创类文章),如需转载请私信果果微信:guo5_guoguo获取授权,转载请在文章开篇处明确注明“来源:私募工场ID:Funds-Works,微信:guo5_guoguo”,未在篇首明确标注,一律视为抄袭。


众所周知,Fama、French(1992)在CAPM模型加入了规模因子和价值因子,建立了著名的Fama-French三因子模型。Carhart(1997)在三因子基础上又增加了动量因子,得到了适用性更高的四因子模型。由于因子模拟组合(factor mimicking portfolio)构建过程较复杂,我国很多研究中都使用了风格指数加以替代,而且一般选择的检验周期不长,本文较为严格的模拟了原论文当中的因子组合构建,以及因子计算过程,得到了2007至2015年[1]共9年因子月频数据。分别对沪深300成份股、市场风格指数、股票型和偏股型公募基金进行回归分析,通过对比模型解释度、参数显著性,得到四因子模型对于我国股票型组合适用性较高的结论。在应用部分,通过对Alpha、规模因子、价值因子加权打分,构建了单一股票型FOF组合,2012-2015年化收益率22.65%,收益风险比达到100.83%,同期沪深300为80.14% 。至此,本文完成了一套因子构建、因子有效性检验、再到因子筛选基金的流程方法。

 

一、因子模拟组合(factor mimicking portfolio)及因子的构建

  

四因子模型分别包含市场因子MKT、规模因子SMB、价值因子HML、动量因子MOM。首先,构建因子模拟组合(factor mimicking portfolio)。本文数据期间选择从股权分置改革成功后的2007年至2015年末,这一阶段涵盖了两次牛熊周期的更迭。以历年年末时点中证全指成份股为股票池进行6个因子模拟组合构建,采用月度频率数据,9年时间每个因子共计108个样本数据。因子的月度收益率采用市值加权。


以每年年年末时点中证全指成份股为股票池,按照每年年末的流通股市值规模由小到大排序,前50%形成Small组、后50%形成Big组。按照年末时点的1/PB(市净率倒数)代表账面市值比由小到大排序,以30%、70%作为分位数,形成Low、Medium、High三组。


将上述Small、Big组分别与Low、Medium、High组合交叉取交集,形成6个分组:SL、SM、SH、BL、BM、BH。


因子模拟组合收益率的统计描述:



SL

SM

Sh

BL

BM

BH

count

108

108

108

108

108

108

mean

3.81%

3.83%

3.78%

1.83%

1.51%

2.06%

std

12.44%

11.97%

12.21%

10.31%

10.38%

10.99%

min

-24.31%

-24.77%

-24.92%

-26.01%

-22.79%

-26.57%

0.25

-4.36%

-4.01%

-4.01%

-4.69%

-6.23%

-4.74%

0.5

4.25%

4.14%

3.73%

2.27%

2.51%

0.89%

0.75

10.87%

11.21%

11.24%

8.56%

7.77%

7.16%

max

38.12%

38.58%

42.14%

31.60%

34.87%

39.77%

因子模拟组合收益率连续9年的走势图:


按原论文公式,分别得到规模因子SMB、价值因子HML:


规模因子SMB=((SL-BL)+(SM-BM)+(SH-BH))/3


价值因子HML=((SH-SL)+(BH-BL))/2


按上述步骤滚动9年,形成连续9年的因子月度收益数据。


根据Carhart(1997)论文,本文选择回溯期设定11个月,滞后期1个月的中期1年动量因子MOM,原论文中收益率采用等权重计算,本文因子月度收益率采用市值加权。“来源:私募工场ID:Funds-Works,微信:guo5_guoguo”以每年年末时点中证全指成份股作为样本池,将T-11M至T-1M的11个月的期间收益率排序,取前30%和后30%的股票分组,然后计算两个分组在T月的收益率之差,作为第T月的动量因子MOM月度收益率,然后滚动形成9年连续月度收益率。


市场因子MKT当中,市场指数选择中证全指[2],无风险利率选择1年期国债收益率。


四因子收益率的统计描述:



MKT

SIZE

HML

MOM

count

108

108

108

108

mean

1.29%

2.18%

0.36%

-1.76%

std

10.00%

5.66%

4.92%

5.78%

min

-26.12%

-19.87%

-15.80%

-15.47%

0.25

-5.13%

-0.61%

-2.13%

-5.12%

0.5

1.83%

2.09%

0.19%

-1.79%

0.75

7.35%

5.68%

3.26%

1.35%

max

29.34%

22.17%

18.02%

12.27%

四因子月度收益率走势如下:


通过四因子的相关性检验,可以看到自变量间相关系数均不超过0.3,避免了模型多重共线性的可能。



MKT

SMB

HML

MOM

MKT

1.0000

0.2801

0.0902

-0.2163

SMB


1.0000

-0.2345

-0.0564

HML



1.0000

-0.1749

MOM




1.0000

 

二、模型回归估计


因子构建完毕,下面分别对股票、市场指数组合、偏股基金进行回归分析,本文采用最小二乘法多元线性回归模型。




(一)以个股作为检验对象


以2015年末沪深300指数成份股为样本,检验模型对个股的适用程度。连续9年共计筛选符合条件的股票194只,将月度收益率作为因变量,进行模型估计。


下图为模型R2的分布图,194个模型的解释度集中在30%-60%之间。这个结果是可以理解的,个股收益波动的影响因素会非常多,肯定不止4个因子可以解释。



检查参数显著性,市值因子、规模因子、价值因子普遍通过显著性检验。下图分别为市值因子MKT、规模因子SIZE、价值因子HML、动量因子MOM的P-value分布。当然,模型应用于个股并不是本文的主要目的。

 

(二)以市场风格指数作为组合进行检验


选取了22个市场风格指数作为检验对象,具体包括上证50、申万大盘、申万小盘、中证500等指数,验证模型的有效性,并与三因子进行对比,模型的解释度全部提升,表明加入到动量因子MOM提高了模型的解释力度。而且,如下表所示,四因子模型的R2在94%以上,解释度水平非常好。“来源:私募工场ID:Funds-Works,微信:guo5_guoguo”市场因子MKT、市值因子SIZE、价值因子HML的P-value表明普遍显著性较好,唯独动量因子MOM大概只有25%通过10%显著性检验。



TF R2*

FF R2*

MKT

SIZE

HML

MOM

count

22

22

22

22

22

22

mean

96.3942%

96.4588%

0.0000%

5.4891%

16.0707%

36.7659%

std

1.3099%

1.2866%

0.0000%

20.6143%

28.0836%

30.6802%

min

93.9552%

94.1442%

0.0000%

0.0000%

0.0000%

1.4577%

0.25

95.7860%

95.8571%

0.0000%

0.0000%

0.0000%

7.9021%

0.5

96.3060%

96.3189%

0.0000%

0.0000%

0.0209%

29.5677%

0.75

97.1106%

97.1502%

0.0000%

0.0000%

19.2239%

52.6847%

max

99.5843%

99.5847%

0.0000%

94.4406%

93.0897%

93.8347%

*TF、FF分别表示三因子模型、四因子模型


(三)对主动型股票(含偏股)基金进行检验

       

选取主动型股票基金和偏股混合基金作为检验对象,这是本文研究的主要目的。经筛选,符合条件的共计122支。


下图为模型R2的分布,可以看到在122个模型当中有近80%超过了85%。


下面检验自变量系数的显著性,从左向右依次为MKT、SIZE、HTM和MOM的P-value分布。普遍来看,在大部分模型中4个因子系数均显著。



三、应用:单一股票FOF策略组合构建


基于上文四因子模型对股票型基金较好的适用性,一个显而易见的应用是对股票型基金进行风格锚定,以及投资风格的可持续性分析。与此同时,模型也可以作为筛选基金,构建FOF策略的判别标准。要说明的是,FOF本身最大优势在于跨资产多策略、分散风险的配置,本文仅以研究目的,针对股票策略基金筛选进行实证。


詹森指数是相对于市场风险的超额收益,那么四因子模型增加了规模、账面净值比、动量因子,模型得到的Alpha是对基金选股能力的进一步提纯。另外,经验判断在这几十年间,我国股市当中的小市值股、成长股表现出超额收益,因此,我们向有选股能力的、小市值和成长股风格的基金倾斜。计算前需对指标数据标准化处理。打分公式如下:


SCORE=(Alpha+SIZE-HML)/3


策略设定回溯5年数据,持有1年,年初调仓,滚动构建组合。为了保证策略的容量,选取得分最高的20%比例股票型基金。回溯期从2007-11年开始,投资期从2012年开始,至2015年末结束。累计收益率走势如下图:



策略风险收益指标:



FOF portfolio

沪深300

中证全指

2012-15年累计收益率

126.27%

59.05%

112.70%

年化收益率

22.65%

12.30%

20.77%

年化波动率

22.46%

15.35%

22.66%

收益风险比

100.83%

80.14%

91.64%

    

这部分构造了一个简化的通过因子打分筛选基金的FOF策略,限于篇幅,很多过程都没能深入,如模型中应当分析更多有效因子,如质量因子、行业因子等;对于动量因子有必要继续深入研究适用于我国市场的参数设定;在基金权重配置上,应采用组合优化方法,如最小方差对风险加以控制。


风险提示:私募工场ID:Funds-Works所载信息和资料均来源于公开渠道,对其真实性、准确性、充足性、完整性及其使用的适当性等不作任何担保。在任何情况下,私募工场ID:Funds-Works所推送文章的信息、观点等均不构成对任何人的投资建议,也不作为任何法律文件。一切与产品条款有关的信息均以产品合同为准。私募工场ID:Funds-Works不对任何人因使用私募工场ID:Funds-Works所推送文章/报告中的任何内容所引致的任何损失负任何责任。


[1] 2006年底为标志改革成功,为避免这一重大制度性变化的影响,数据期间选择从2007年初以后。


[2]中证全指由剔除ST、*ST股票,以及上市时间不足3个月等股票后的剩余股票构成样本股。中证全指具有较高的市场代表性,可作为投资标的和业绩评价基准,并可作为其他指数的样本空间。


作者:王健  微信号:sirgaga