第4章
多因子模型
本章首先梳理学术界主流的多因子模型,为读者进行相关的研究提供思路。值得一提的是,这些多因子模型均是针对美国股票市场提出的。这背后的原因有二:第一,在全球所有股票市场中,美国股市当仁不让是最重要的。第二,现代金融学诞生于以芝加哥大学、麻省理工学院及哈佛大学等为代表的美国顶尖学府,因而学术界以美股为研究对象也就顺理成章。不过可喜的是,多因子模型经过多年的发展和完善,很多学者也把其中一些模型应用于其他国家的股票市场中,并取得了令人满意的实证结果。
本章的第4.2节使用Fama-MacBeth回归分析研究了A股中哪些因子被定价。待检验的因子正是本书第3章中涉及的因子。第3章的实证结果显示诸如价值、规模这些因子在A股上都是显著的。但是由于排序法无法完全剔除因子间的相互影响,因此造成目标因子在其他因子上有不可避免的暴露,从而影响实证结果。第4.2节的Fama-MacBeth回归分析能够规避这一问题,给出更稳健的因子收益率分析结果。
接下来,第4.3节将通过一个例子说明如何使用常见的统计学手段,如GRS检验和 $\alpha$ 检验,比较不同的多因子模型。为了使结果对A股的因子投资更具参考价值,参与比较的多因子模型之一是近年来备受关注的中国版三因子模型,而参与比较的另一个多因子模型则是笔者从公司估值角度推导出的四因子模型。值得一提的是,本节讨论的重点是比较模型方法论的应用,而非是在两个模型中决出高低。
本章最后一节讨论在构建多因子模型时应遵循的简约性原则。研究表明,多因子模型解释资产预期收益率的能力和其复杂度呈正相关。从实证研究的角度,当多因子模型中加入越来越多的因子后,它总能更好地解释资产或异象的收益率,然而这么做却意义不大。优秀的多因子模型通常只因包含少量有限个因子[1]且每个因子背后都应该有明确的金融学或经济学含义。
4.1 主流多因子模型综述
自Fama and French(1993)发表并提出第一个多因子模型以来,学术界对多因子模型的研究经历了近30年。其间,很多新的模型先后被提出,它们对人们认知市场产生了深远的影响。表4.1总结了当下学术界主流的多因子模型,其中最“年长”的模型是Fama-French三因子模型(“高龄”28岁)、最“年轻”的模型是Daniel-Hirshleifer-Sun三因子模型(还是个“小婴儿”)。
表4.1 主流多因子模型
| 模型 | 出处 | 所含因子 |
| Fama-French 三因子 | Fama and French (1993) | 市场、规模、价值 |
| Carhart 四因子 | Carhart (1997) | 市场、规模、价值、动量① |
| Novy-Marx 四因子 | Novy-Marx (2013) | 市场、价值、动量、盈利 |
| Fama-French 五因子 | Fama and French (2015) | 市场、规模、价值、盈利、投资 |
| Hou-Xue-Zhang 四因子 | Hou et al. (2015) | 市场、规模、盈利、投资 |
| Stambaugh-Yuan 四因子 | Stambaugh and Yuan (2017) | 市场、规模、管理、表现 |
| Daniel-Hirshleifer-Sun 三因子 | Daniel et al. (2020) | 市场、长周期行为、短周期行为 |
①动量因子实际上是代表股票之间相对强弱的截面动量,但通常当学术界提到这个因子的时候并不会特别加上“截面”二字。因此,依照惯例,本书也简称它为动量因子。
虽说新模型的提出是为了取代老模型,但目前学术界就各个模型的孰优孰劣尚未达成一致的观点。正如Fama-French三因子模型如今依然是实证资产定价研究中被使用最广泛的定价模型,而像Hou-Xue-Zhang四因子模型和Stambaugh-Yuan四因子模型这些完全从不同角度推出的模型也极大地丰富了人们对资产定价及因子投资的理解。接下来就逐一介绍表4.1中的多因子模型。
4.1.1 Fama-French三因子模型
在多因子模型被提出之前,CAPM是资产定价的第一范式。然而,自20纪70年代以来,学者们逐渐发现按照某种风格“打包”的股票能够战胜市场。这其中最值得一提的是Basu(1977)发现的盈利市值比(EP)效应和Banz(1981)发现的小市值效应。继EP之后,账面市值比(BM)和债务市值比(debt to market value of equity,DM)效应也被发现。虽然单一异象被发现后都对CAPM提出了挑战,但它们并没有形成合力,因此人们并未对CAPM产生太大的质疑,直到Fama and French(1992)横空出世,它整合了之前被提出的多种异象,彻底颠覆了人们对CAPM的看法。当然,由于CAPM在数学上足够简单优雅,且在业务上非常容易解释(风险来自对市场的暴露),因此它还是资产定价的一个很好的出发点,只是
人们再也无法忽视不能被CAPM解释的其他系统性风险因子了。
想要摒弃一个旧模型,唯有提出一个更好的新模型。Fama and French(1993)在CAPM的基础上,加入了价值(High-Minus-Low,HML)和规模(Small-Minus-Big,SMB)两个因子,提出了三因子模型[1],它也是多因子模型的开山鼻祖:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \text {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \text {S M B}} E \left[ R _ {\text {S M B}} \right] + \beta_ {i, \text {H M L}} E \left[ R _ {\text {H M L}} \right] \tag {4.1} $$
式(4.1)中, $E[R_i]$ 表示股票 $i$ 的预期收益率, $R_f$ 为无风险收益率, $E[R_M]$ 为市场组合预期收益率, $E[R_{\mathrm{SMB}}]$ 和 $E[R_{\mathrm{HML}}]$ 分别为规模因子(SMB)及价值因子(HML)的预期收益率, $\beta_{i,\mathrm{MKT}}$ 、 $\beta_{i,\mathrm{SMB}}$ 和 $\beta_{i,\mathrm{HML}}$ 为个股 $i$ 在相应因子上的暴露。
为构建价值和规模因子,Fama and French(1993)选择了BM和市值两个公司指标,并用它们进行了如图4.1所示的 $2 \times 3$ 独立双重排序。在排序时,以纽约证券交易所(New York Stock Exchange,NYSE)(下面简称纽交所)中上市公司的市值中位数为界,把NYSE、纳斯达克(NASDAQ)以及美国证券交易所(American Stock Exchange,AMEX)的上市公司分成小市值(Small)和大市值(Big)两组。类似的,以NYSE中上市公司BM的 $30\%$ 和 $70\%$ 分位数为界,把这三大交易所的上市公司分成三组:BM高于 $70\%$ 分位数的为High组、BM低于 $30\%$ 分位数的为Low组、位于中间的为Middle组。通过以上划分后,按照市值和BM各自所属的组别,所有股票被分到一共6( $2 \times 3 = 6$ )个组中,记为S/H、S/M、S/L、B/H、B/M及B/L。将每组中的股票收益率按市值加权就得到六个投资组合。最终,Fama and French(1993)使用如下方法构建了规模和价值两个因子:
$$ \begin{array}{l} \mathrm {S M B} = \frac {1}{3} (\mathrm {S} / \mathrm {H} + \mathrm {S} / \mathrm {M} + \mathrm {S} / \mathrm {L}) - \frac {1}{3} (\mathrm {B} / \mathrm {H} + \mathrm {B} / \mathrm {M} + \mathrm {B} / \mathrm {L}) (4.2) \ \mathrm {H M L} = \frac {1}{2} (\mathrm {S} / \mathrm {H} + \mathrm {B} / \mathrm {H}) - \frac {1}{2} (\mathrm {S} / \mathrm {L} + \mathrm {B} / \mathrm {L}) (4.3) \ \end{array} $$

图4.1 BM和市值双重排序
市值分组依据:NYSE中位数;
BM分组依据:NYSE $30\%$ 和 $70\%$ 分位数。
从式(4.2)和式(4.3)中不难看出,规模因子是三个小市值组合S/H、S/M及S/L的等权平均减去三个大市值组合B/H、B/M及B/L的等权平均;而价值因子是S/H和B/H两个高BM组合的等权平均减去S/L和B/L两个低BM组合的等权平均。在每年的六月末,Fama and French(1993)使用上一财年最新的财务数据对股票重
新排序并对这两个因子进行再平衡。Fama-French三因子模型被提出后逐步取代了CAPM成为资产定价的第一范式。而以上述双重划分以及以此衍生出来的多重划分来构建因子组合也成为学术界竞相模仿的对象。
作为第一个被提出的多因子模型,Fama-French三因子模型被反复进行检验。Davis et al.(2000)使用自1927年开始的数据检验了三因子模型;Fama and French(1998)使用其他国家的股票市场检验该模型;Fama and French(2008)使用三因子模型考察了那些无法被CAPM解释的异象。除此之外,Fama and French(1996)还尝试从风险的角度解释了SMB和HML两个因子,并猜想它们和上市公司的财务困境风险有关。此外,Fama and French(1996)认为Fama-French三因子模型是Merton(1973)提出的跨期资本资产定价模型(Intertemporal Capital Asset Pricing Model, ICAPM)的多因子版本。但是关于SMB和HML代表何种状态变量,以及为什么它们能够捕捉CAPM无法解释的风险,依旧没有定论。
4.1.2 Carhart四因子模型
作为第一代的多因子模型,Fama-French三因子模型虽然有足够的开创性,但是“适用性”却有限,有很多其无法解释的异象。在众多异象中,最显著的大概要数截面动量异象。该异象最初由Jegadeesh and Titman(1993)提出。假如当前时点为t月,他们使用了t-12到t-1这11个月之间的总收益率将所有股票排序,并选择总收益率高的构建了赢家组合(Winner)、总收益率低的构建了输家组合(Loser),发现由做多赢家和做空输家获得的多/空投资组合可以获得超额收益。之所以特意规避最近的一个月是因为Jegadeesh and Titman(1993)观察到了市场短期存在反转现象(Jegadeesh 1990),为了不使短期反转干扰中期动量,因此在计算动量时特地把最近一个月剔除,故而使用了t-12到t-1之间的11个月而非最近12个月。
受到Jegadeesh and Titman(1993)的启发,Carhart(1997)在Fama-French三因子模型中加入了截面动量因子(取动量英文单词前三个字母,记为MOM)并提出了Carhart四因子模型:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \mathrm {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \mathrm {S M B}} E \left[ R _ {\mathrm {S M B}} \right] + \beta_ {i, \mathrm {H M L}} E \left[ R _ {\mathrm {H M L}} \right] + \beta_ {i, \mathrm {M O M}} E \left[ R _ {\mathrm {M O M}} \right] \tag {4.4} $$
在式(4.4)中, $E[R_{MOM}]$ 为动量因子的收益率, $\beta_{i,\mathrm{MOM}}$ 为个股 $i$ 在动量因子上的暴露。在实际使用中,Carhart(1997)使用了NYSE、NASDAQ及AMEX的全部股票。每月末将所有股票按t-12到t-1这11个月的总收益率排序,并通过做多排名前 $30\%$ 同时做空排名后 $30\%$ 的股票构建动量因子。在计算动量因子收益率时,多空两头内的股票均采用等权重配置。
4.1.3 Novy-Marx四因子模型
Novy-Marx(2013)指出盈利能力和未来预期收益密切相关,并由此提出了一个四因子模型:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \mathrm {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \mathrm {H M L}} E \left[ R _ {H M L} \right] + \beta_ {i, \mathrm {U M D E}} \left[ R _ {\mathrm {U M D}} \right] + \beta_ {i, \mathrm {P M U E}} \left[ R _ {\mathrm {P M U}} \right] \tag {4.5} $$
其中 $E[R_{\mathrm{PMU}}]$ 是盈利因子的预期收益率(PMU是Profitability-Minus-Unprofitability的缩写,代表盈利), $\beta_{i,\mathrm{PMU}}$ 为个股 $i$ 在该因子上的暴露。除盈利因子外,该模型还包括市场、价值及动量因子。需要说明的是,Novy-Marx(2013)使用UMD(Up-Minus-Down的首字母缩写)代表动量因子,因此式(4.5)中 $E[R_{\mathrm{UMD}}]$ 和 $\beta_{i,\mathrm{UMD}}$ 分别为动量因子的预期收益及个股 $i$ 在该因子上的暴露。在使用时,动量因子的投资组合需要每月进行再平衡,而价值和盈利因子需要每年六月末使用最新的财务数据重新构建投资组合。
如何衡量企业的盈利能力呢?Novy-Marx(2013)认为毛利润(Gross Profitability,GP)要比净利润更好。首先,毛利润代表最真实的经济生产能力,是整个企业所有投入者(债权人和股东)努力的结果。其次,毛利润包含了研发投入和广告投入等费用,这些费用事实上有利于企业未来的盈利,因此不应该被减掉。最后,毛利润总体来说比较干净纯粹,因为利润表越往下,受操纵的科目可能越多,数据就越不真实。无论排序法,还是Fama-MacBeth回归,均显示GP具有和BM效果一样的预测能力,且比净利润与净资产之比以及自由现金流与净资产之比这两个指标更加优秀。
在构建因子时,Novy-Marx(2013)追随了Fama and French(1993)的脚步,分别使用logBM、t-12到t-1的总收益率及GP作为这三个因子的变量和市值进行 $2 \times 3$ 双重排序法。由此可知,该模型中的动量因子和Carhart四因子模型中的不同,因为后者的动量因子是通过单变量排序构造的。下面重点介绍一下盈利因子(PMU)的构建(图4.2)。
以NYSE中上市公司GP的30%和70%分位数为界,把NYSE、NASDAQ及AMEX三大交易所的上市公司依据GP高低分为盈利(Profitable,即GP在70%分位数之上)、中性(Neutral,即GP介于30%和70%分位数之间)以及不盈利(Unprofitable,即GP在30%分位数之下)三组。这三组再加上市值高低的独立划分共得到六个投资组合:S/P、S/N、S/U、B/P、B/N及B/U,每个组合中的股票均按其市值确定权重。
图4.2 GP和市值双重排序

市值分组依据:NYSE中位数;
GP分组依据:NYSE $30\%$ 和 $70\%$ 分位数。
与Fama-French三因子模型及Carhart四因子模型不同的是,在构建这三个因子时,Novy-Marx(2013)进行了行业中性处理,即在做多一只股票的同时按同等权重做空该股票所属的行业指数,从而得到行业中性化后的投资组合。最后,由于盈利和预期收益率呈正相关,因此使用盈利组S/P和B/P和不盈利组S/U和B/U的收益率之差构建盈利因子,公式见式(4.6):
$$ \mathrm {P M U} = \frac {1}{2} (\mathrm {S} / \mathrm {P} + \mathrm {B} / \mathrm {P}) - \frac {1}{2} (\mathrm {S} / \mathrm {U} + \mathrm {B} / \mathrm {U}) \tag {4.6} $$
4.1.4 Fama-French五因子模型
Fama and French(2015)在Fama-French三因子模型的基础上添加了盈利和投资两个因子,提出了新的五因子模型:
$$ \begin{array}{l} E [ R _ {i} ] - R _ {f} = \beta_ {i, \mathrm {M K T}} (E [ R _ {M} ] - R _ {f}) + \beta_ {i, \mathrm {S M B}} E [ R _ {\mathrm {S M B}} ] + \beta_ {i, \mathrm {H M L}} E [ R _ {\mathrm {H M L}} ] + \beta_ {i, \mathrm {R M W}} E [ R _ {\mathrm {R M W}} ] + \beta_ {i,} \ \mathrm {C M A} E [ R _ {\mathrm {C M A}} ] \end{array} $$
式(4.7)中, $E[R_{\mathrm{RMW}}]$ 和 $E[R_{\mathrm{CMA}}]$ 分别为盈利因子和投资因子的预期收益率, $\beta_{i,}$ RMW和 $\beta_{i,\mathrm{CMA}}$ 分别为个股 $i$ 在这两个因子上的暴露。每年六月末,使用最新财务数据对股票重新排序并对规模、价值、盈利和投资四个因子的投资组合进行再平衡。
该模型从股利贴现模型出发并利用Miller and Modigliani(1961)的结果推导出t时刻公司市值 $M_{t}$ 满足如式(4.8)关系:
$$ M _ {t} = \sum_ {\tau = 1} ^ {\infty} E \left[ Y _ {t + \tau} - d B _ {t + \tau} \right] / (1 + r) ^ {\tau} \tag {4.8} $$
其中, $Y_{t + \tau}$ 是 $t + \tau$ 期的净利润, $dB_{t + \tau}$ 是未来 $t + \tau$ 期的账面价值的变化, $r$ 是股票长期的预期收益率。将式(4.8)两边同时除以 $t$ 时刻公司的账面价值 $B_t$ 可得:
$$ \frac {M _ {t}}{B _ {t}} = \frac {\sum_ {\tau = 1} ^ {\infty} E \left[ Y _ {t + \tau} - d B _ {t + \tau} \right] / (1 + r) ^ {\tau}}{B _ {t}} \tag {4.9} $$
Fama and French(2015)通过分析式(4.9)提出了如下关系:
- 当除了 $M_{t}$ 和 $r$ 的其他变量不变时, 更小的 $M_{t}$ (或更高的 $B_{t} / M_{t}$ ) 对应更高的 $r$ ;
- 当除了 $Y_{t+\tau}$ 和 $r$ 的其他变量不变时,更高的 $Y_{t+\tau}$ 对应更高的 $r$ ;
- 当除了 $dB_{t + \tau}$ 和 $r$ 的其他变量不变时,更高的 $dB_{t + \tau}$ 对应更低的 $r$ 。
上述后两点说明 $r$ 和预期盈利呈正相关、 $r$ 和预期投资呈负相关。在实证中,如何围绕预期盈利和预期投资构建因子呢?这方面的研究可以追溯到Fama and French(2006)。该文专门检验了预期盈利和预期投资这两个维度和预期收益率的关系。在计算预期盈利和预期投资时,Fama and French(2006)既检验了使用历史数据作为预期的朴素估计(naive estimate),又考虑了使用回归分析预测的方法。
对于预期投资,当使用总资产变化的历史数据作为预期投资的朴素估计时,分析结果显示它和收益率之间呈显著的负相关性。而当采用回归计算预期投资
时,却并没有发现它和收益率之间的显著关系[2]。Fama and French(2006)从计量经济学的角度对两种方法的结果进行了大量探讨,并最终选择了使用历史数据进行朴素估计来计算预期投资。对于预期盈利,使用历史ROE数据和回归预测的差异很小,因此Fama and French(2006)也采用了朴素估计。上述处理方法也最终被保留到了Fama and French(2015)中。值得一提的是,按照DDM,代表投资的变量应该是账面价值的预期变化,而非总资产。Fama and French(2015)坦言他们比较了分别使用账面价值和总资产的两种方法,发现使用后者排序的话,股票收益率在截面上的差异更大,因此选择了总资产的变化。
在构建因子时,与Fama and French(1993)相似,对于新加入的盈利因子和投资因子,Fama and French(2015)依次使用ROE以及过去一年总资产变化率和市值进行 $2 \times 3$ 双重排序,分别得到六个投资组合(图4.3)。首先以NYSE中上市公司的ROE的 $30\%$ 和 $70\%$ 分位数为界,把NYSE、NASDAQ以及AMEX三大交易所的上市公司依据ROE高低分为稳健(Robust,即ROE在 $70\%$ 分位数之上)、中性(Neutral,即ROE介于 $30\%$ 和 $70\%$ 分位数之间)及疲软(Weak,即ROE在 $30\%$ 分位数之下)三组。这三组和市值高低独立排序共得到六个投资组合:S/R、S/N、S/W、B/R、B/N及B/W。每个投资组合的收益率使用各组成分股收益率的市值加权得到。对于盈利因子,由于预期盈利和预期收益率呈正相关,因此使用稳健组(S/R和B/R)和疲软组(S/W和B/W)的收益率之差构建盈利因子(Robust-Minus-Weak,RMW):
$$ \mathrm {R M W} = \frac {1}{2} (\mathrm {S} / \mathrm {R} + \mathrm {B} / \mathrm {R}) - \frac {1}{2} (\mathrm {S} / \mathrm {W} + \mathrm {B} / \mathrm {W}) \tag {4.10} $$
图4.3 ROE、总资产变化率和市值双重排序

市值分组依据:NYSE中位数;
ROE和总资产变化率分组依据:NYSE $30\%$ 和 $70\%$ 分位数。
对于投资因子,以NYSE中上市公司总资产变化率的30%和70%分位数为界,把三大交易所的上市公司依据总资产变化率高低分为激进(Aggressive,即总资产变化率在70%分位数之上)、中性(Neutral,即总资产变化率介于30%和70%分位数之间)以及保守(Conservative,即总资产变化率在30%分位数之下)三组。用这三组和市值高低进行2×3双重排序就得到六个投资组合:S/A、S/N、S/C、B/A、B/N及B/C。同样的,每个投资组合的收益率使用各组成分股收益率的市值加权得到。对于投资因子,由于预期投资和预期收益率呈负相关,因此使用保守
组(S/C和B/C)和激进组(S/A和B/A)的收益率之差构建投资因子(Conservative-Minus-Aggressive,CMA):
$$ \mathrm {C M A} = \frac {1}{2} (\mathrm {S} / \mathrm {C} + \mathrm {B} / \mathrm {C}) - \frac {1}{2} (\mathrm {S} / \mathrm {A} + \mathrm {B} / \mathrm {A}) \tag {4.11} $$
最后值得一提的是规模因子的构建方法。与Fama-French三因子模型不同,在Fama-French五因子模型中,BM、ROE及总资产变化率分别用来和市值进行 $2 \times 3$ 双重排序,一共得到了18个投资组合。在这种情况下,如果还像Fama and French(1993)一样,仅以BM和市值分组组合并按照式(4.2)构建规模因子就不太合理——人们一定会问,为什么不用市值和ROE或总资产变化率的分组组合。显然,Fama and French(2015)考虑到了这个问题,因此他们选择综合上述三个变量各自和市值双重排序得到的小市值和大市值组合来构建规模因子。具体来说,Fama-French五因子模型中的规模因子为:
$\mathrm{SMB} = \frac{1}{3} (\mathrm{SMB}{\mathrm{BM}} + \mathrm{SMB}{\mathrm{ROE}} + \mathrm{SMB}_{\mathrm{INV}})$ (4.12)
其中, $\mathrm{SMB_{BM}} = \frac{1}{3} (\mathrm{S / H + S / M + S / L}) - \frac{1}{3} (\mathrm{B / H + B / M + B / L})$ (4.13)
$$ \mathrm {S M B} _ {\mathrm {R O E}} = \frac {1}{3} (\mathrm {S} / \mathrm {R} + \mathrm {S} / \mathrm {N} + \mathrm {S} / \mathrm {W}) - \frac {1}{3} (\mathrm {B} / \mathrm {R} + \mathrm {B} / \mathrm {N} + \mathrm {B} / \mathrm {W}) \tag {4.14} $$
$$ \mathrm {S M B} _ {\mathrm {I N V}} = \frac {1}{3} (\mathrm {S} / \mathrm {C} + \mathrm {S} / \mathrm {N} + \mathrm {S} / \mathrm {A}) - \frac {1}{3} (\mathrm {B} / \mathrm {C} + \mathrm {B} / \mathrm {N} + \mathrm {B} / \mathrm {A}) \tag {4.15} $$
4.1.5 Hou-Xue-Zhang四因子模型
Hou et al.(2015)从实体投资经济学理论出发提出了一个四因子模型。由于实体投资经济学理论又被称为 $q$ -理论,因此该模型也被学术界称为 $q$ -因子模型。该模型包含市场、规模、投资和盈利四个因子:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \mathrm {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \mathrm {M E E}} \left[ R _ {\mathrm {M E}} \right] + \beta_ {i, \mathrm {I A}} E \left[ R _ {\mathrm {I A}} \right] + \beta_ {i, \mathrm {R O E}} E \left[ R _ {\mathrm {R O E}} \right] \tag {4.16} $$
式(4.16)中 $E[R_{ME}]$ 、 $E[R_{I / A}]$ 和 $E[R_{ROE}]$ 分别为规模因子、投资因子和盈利因子的预期收益, $\beta_{i,\mathrm{ME}}$ 、 $\beta_{i,\mathrm{IA}}$ 和 $\beta_{i,\mathrm{ROE}}$ 为股票 $i$ 在相应因子上的暴露。需要明确的是,在使用中规模因子和投资因子的排序变量每年六月末更新,而盈利因子的排序变量每月末更新,但所有因子的投资组合均是月度再平衡。
Hou-Xue-Zhang四因子模型受到了Cochrane(1991)的启发,源于公司投资的经济学原理。该论文的作者之一张橹教授曾在《清华金融评论》上撰文介绍过这个模型的来龙去脉(Zhang 2016)。该模型体现了公司金融学中的净现值原则(NPV rule):如果项目现值大于投资成本,则应当投资该项目;如果项目现值小于投资成本,则不应当投资。起初,公司会有很多投资项目,此时应优先投资折现率低、盈利率高,即现值最高的项目。随着被投资的项目越来越多,投资成本会慢慢增加,盈利率会越来越低。投资的最后一个项目应该是净现值为零(净现值原则):投资成本=项目现值=盈利率/折现率。
净现值原则说的是,一家公司应该持续投资,直到投资的边际效益(被折现到今天)等于投资的边际成本。这句话是对Hou et al.(2015)所依托的经济学原
理的核心概括。传统资产定价理论从投资者最优证券组合角度出发,和公司变量没有直接关系;而 $q$ -因子模型为实证资产定价研究开辟了一个新途径。
将净现值原则变化一下得出:折现率 $=$ 盈利率/投资成本。从这个式子出发,可以得到两个关于折现率的条件预期结论:当盈利率给定时,投资越多的公司(投资成本越高),折现率越低,股票预期收益率也越低;当投资给定时,盈利率越高的公司,折现率越高,股票预期收益率也越高。由此可知,股票收益率和投资成反比,和盈利率成正比。
$q$ -因子模型背后的数学模型考虑了一个两期(记为时刻0和1)的公司投资决策模型。假设在时刻0,某公司i的资产为 $A_{i0}$ 、利润率是 $\Pi_{i0}$ (假设已知);在时刻1,该公司的利润率是 $\Pi_{i1}$ ,它是一个随机变量。对于时刻0和1,公司的现金流为每一时刻的资产乘以利润率: $\Pi_{it}A_{it}, t = 0,1$ 。在这个两期模型中,公司的决策变量是时刻0的投资额 $I_{i0}$ 。该模型假设公司时刻0的资产 $A_{i0}$ 在 $t = 1$ 时全部折旧完,因此该公司在时刻1的资产正是其在时刻0的投资: $A_{i1} = I_{i0}$ 。除此之外,伴随 $I_{i0}$ 而来的还包括一个调整费用: $(a / 2)(I_{i0} / A_{i0})^2 A_{i0}$ 。对于该公司,时刻0对于股东的回报是现金流减去投资额及投资的调整费用,即 $\Pi_{i0}A_{i0} - I_{i0} - (a / 2)(I_{i0} / A_{i0})^2 A_{i0}$ ;而对于时刻1,由于不再有投资,因此其在时刻0的预期回报可以表达为 $E_0[M_1\Pi_{i1}A_{i1}]$ ,其中 $M_{1}$ 是随机折现因子、 $\Pi_{i1}A_{i1}$ 是时刻1的现金流、期望符号E的下标“0”代表时刻0时的预期。这两期的回报相加就是最优化的目标函数:
$$ \max _ {I _ {i 0}} \Pi_ {i 0} A _ {i 0} - I _ {i 0} - \frac {a}{2} \left(\frac {I _ {i 0}}{A _ {i 0}}\right) ^ {2} A _ {i 0} + E _ {0} \left[ M _ {1} \Pi_ {i 1} A _ {i 1} \right] \tag {4.17} $$
该目标函数的最优解 $I_{i0}$ 满足:
$$ 1 + a \frac {I _ {i 0}}{A _ {i 0}} = E _ {0} \left[ M _ {1} \Pi_ {i 1} \right] \tag {4.18} $$
式(4.18)的左侧为投资的边际成本(第二项为边际调整费用);右边为边际效益预期被折现到时刻0。这个关系式也说明了4.1.5中提到的净现值原则。此外,由投资第一性原理(the first principle of investment)可知,投资收益率 $r^{\mathrm{I}}$ (上标“ $I$ ”表示投资收益率,为了区分股票收益率)应满足:
$$ E _ {0} \left[ M _ {1} r _ {i 1} ^ {I} \right] = 1 \tag {4.19} $$
比较式(4.18)和式(4.19)就可以得到投资收益率和边际成本及边际效益的关系:
$$ E _ {0} \left[ r _ {i 1} ^ {I} \right] = \frac {E _ {0} \left[ \Pi_ {i 1} \right]}{1 + a \left(I _ {i 0} / A _ {i 0}\right)} \tag {4.20} $$
根据Cochrane(1991)和Liu et al.(2009)的研究结果,在上述模型设定下,公司的投资收益率等于其股票收益率(记为 $r^S$ ),因此最终可以把股票收益率和上述从公司投资角度出发的经济学理论联系起来:
$$ E _ {0} \left[ r _ {i 1} ^ {S} \right] = \frac {E _ {0} \left[ \Pi_ {i 1} \right]}{1 + a \left(I _ {i 0} / A _ {i 0}\right)} \tag {4.21} $$
观察式(4.21)可知,当预期盈利 $E_0[\Pi_{i1}]$ 给定时,股票收益率和投资 $I_{i0} / A_{i0}$ 成反比;当投资给定时,股票收益率和预期盈利成正比。在上述关系中,投资 $I_{i0} / A_{i0}$ 是时刻0的,故为历史投资。值得一提的是, $q$ -因子模型和Fama-French五因子模型中均包括投资因子,但前者从实体投资经济学理论推出收益率和历史投资的关系,而后者使用股息折现模型推出收益率和预期投资的关系,因此二者存在很大的差异。本书在6.2.1中将解读它们的差异。
在实证研究中,Hou et al.(2015)使用ROE和总资产变化率作为代表盈利和投资的指标。在构建因子时,为了体现上述条件预期收益率的关系,他们使用市值、单季度ROE和总资产变化率进行 $2 \times 3 \times 3$ 独立三重排序,其中市值按纽交所中位数划分、ROE和总资产变化率按纽交所 $30\%$ 和 $70\%$ 分位数进行划分。独立三重排序共得到18个投资组合,每个组合内的股票按照市值加权。令 $c_{1}$ 、 $c_{2}$ 、 $c_{3}$ 依次代表每个投资组合在市值、ROE和总资产变化率三个变量上的划分,其中 $c_{1}$ 取值为S和B分别代表小市值和大市值, $c_{2}$ 和 $c_{3}$ 分别取值为H、M、L来代表高、中、低三档;令数学符号 $c_{1} / c_{2} / c_{3}$ 代表上述三个变量某个划分交集得到的分组。例如,S/H/H代表由小市值、高ROE和高总资产变化率股票构成的分组。依照上述数学符号,使用这18个投资组合,规模(ME)、盈利(ROE)、投资(I/A)三因子的定义如下:
$$ \begin{array}{l} \mathrm {M E} = \frac {1}{9} (\mathrm {S} / \mathrm {L} / \mathrm {L} + \mathrm {S} / \mathrm {M} / \mathrm {L} + \mathrm {S} / \mathrm {H} / \mathrm {L} + \mathrm {S} / \mathrm {L} / \mathrm {M} + \mathrm {S} / \mathrm {M} / \mathrm {M} + \mathrm {S} / \mathrm {H} / \mathrm {M} \ + \mathrm {S} / \mathrm {L} / \mathrm {H} + \mathrm {S} / \mathrm {M} / \mathrm {H} + \mathrm {S} / \mathrm {H} / \mathrm {H}) (4.22) \ - \frac {1}{9} (\mathrm {B} / \mathrm {L} / \mathrm {L} + \mathrm {B} / \mathrm {M} / \mathrm {L} + \mathrm {B} / \mathrm {H} / \mathrm {L} + \mathrm {B} / \mathrm {L} / \mathrm {M} + \mathrm {B} / \mathrm {M} / \mathrm {M} + \mathrm {B} / \mathrm {H} / \mathrm {M} (4.22) \ + \mathrm {B} / \mathrm {L} / \mathrm {H} + \mathrm {B} / \mathrm {M} / \mathrm {H} + \mathrm {B} / \mathrm {H} / \mathrm {H}) \ \end{array} $$
$$ \begin{array}{l} \mathrm {R O E} = \frac {1}{6} (\mathrm {S} / \mathrm {H} / \mathrm {L} + \mathrm {S} / \mathrm {H} / \mathrm {M} + \mathrm {S} / \mathrm {H} / \mathrm {H} + \mathrm {B} / \mathrm {H} / \mathrm {L} + \mathrm {B} / \mathrm {H} / \mathrm {M} + \mathrm {B} / \mathrm {H} / \mathrm {H}) \tag {4.23} \ - \frac {1}{6} (\mathrm {S} / \mathrm {L} / \mathrm {L} + \mathrm {S} / \mathrm {L} / \mathrm {M} + \mathrm {S} / \mathrm {L} / \mathrm {H} + \mathrm {B} / \mathrm {L} / \mathrm {L} + \mathrm {B} / \mathrm {L} / \mathrm {M} + \mathrm {B} / \mathrm {L} / \mathrm {H}) \ \end{array} $$
$$ \begin{array}{l} I / A = \frac {1}{6} (S / L / L + S / M / L + S / H / L + B / L / L + B / M / L + B / H / L) \tag {4.24} \ - \frac {1}{6} (\mathrm {S} / \mathrm {L} / \mathrm {H} + \mathrm {S} / \mathrm {M} / \mathrm {H} + \mathrm {S} / \mathrm {H} / \mathrm {H} + \mathrm {B} / \mathrm {L} / \mathrm {H} + \mathrm {B} / \mathrm {M} / \mathrm {H} + \mathrm {B} / \mathrm {H} / \mathrm {H}) \ \end{array} $$
式(4.22)、式(4.23)和式(4.24)的文字含义如下;规模因子(ME)是等权重做多9个小市值组合 $(\mathrm{S} / c_{2} / c_{3})$ ,同时等权重做空9个大市值组合 $(\mathrm{B} / c_{2} / c_{3})$ ;盈利因子(ROE)是等权重做多6个高ROE组合 $(c_{1} / \mathrm{H} / c_{3})$ ,同时等权重做空6个低ROE组合 $(c_{1} / \mathrm{L} / c_{3})$ ;投资因子(I/A)是等权重做多6个低总资产变化率组合 $(c_{1} / c_{2} / \mathrm{L})$ ,同时等权重做空6个高总资产变化率组合 $(c_{1} / c_{2} / \mathrm{H})$ 。
4.1.6 Stambaugh-Yuan四因子模型
在4.1.6节和4.1.7节中介绍的最后两个多因子模型均是从行为金融学的角度对资产定价的探索。大量研究表明,投资者的有限理性和认知偏差造成了市场中的各种错误定价,而错误定价可以解释市场中的许多异象和因子。本书第6章的第
6.3节将系统梳理行为金融学的主要内容以及它和资产收益率的关系。下面先来说出自行为金融学的第一个多因子模型:Stambaugh-Yuan四因子模型(Stambaugh and Yuan 2017)。
Stambaugh and Yuan(2017)在市场因子和规模因子的基础上,引入管理因子和表现因子,构建了四因子模型:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \mathrm {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \mathrm {S M B}} E \left[ R _ {\mathrm {S M B}} \right] + \beta_ {i, \mathrm {M G M T}} E \left[ R _ {\mathrm {M G M T}} \right] + \beta_ {i, \text {P E R F}} E \left[ R _ {\text {P E R F}} \right] \tag {4.25} $$
式(4.25)中 $E[R_{\mathrm{MGMT}}]$ 和 $E[R_{\mathrm{PERF}}]$ 分别为管理因子和表现因子的预期收益率,而 $\beta_{i,\mathrm{MGMT}}$ 和 $\beta_{i,\mathrm{PERF}}$ 为个股 $i$ 在相应因子上的暴露。在使用中,规模、管理和表现三个因子的投资组合均为月度再平衡。
在上述四因子模型中,管理因子和表现因子均源自关于错误定价的研究。错误定价意味着价格较内在价值的偏离,当价格高于内在价值时资产被高估,当价格低于内在价值时资产被低估。被高估的资产由于价格的修正在未来会出现较低的收益率,反之被低估的资产在未来则会获得较高的收益率。为了从错误定价中寻找因子的灵感,首先要找到衡量股票价格是否被高估或低估的指标。
为此,Stambaugh and Yuan(2017)延续了两位作者以及他们的另外一位合作者余剑峰教授在早期关于错误定价的一系列研究,包括Stambaugh et al.(2012, 2014, 2015)。他们以11个Fama-French三因子模型无法解释的异象为基础,构建了错误定价指标。其背后的逻辑是,异象的超额收益反映了其投资组合内股票的收益中无法被Fama-French三因子模型解释的超额收益,即个股的错误定价。因此,异象变量取值的高低就可以用来描述错误定价的方向(被高估或被低估)和大小。表4.2总结了这11个异象。需要指出的是,该表的目的仅仅是对这些异象做简要说明,每个异象变量的名称并不完全等价于它的计算方法[4]。关于异象变量的具体计算方法,请读者参考Stambaugh and Yuan(2017)或表中列出的代表文献。
根据这11个异象之间的相关性将他们分成两组,使得每组内异象之间的相关性更好,而分属两组的异象的相关性较低。第一组包含股票净发行量、复合股权发行量、应计利润、净营业资产、总资产增长率及投资与总资产之比6个异象。这6个异象变量均和上市公司的管理决策相关,使用它们构建的因子被称为管理因子。第二组包含另外5个异象,即财务困境、O-分数、动量、毛利率及总资产回报率。它们均和上市公司的表现有关,使用它们构建的因子被称为表现因子。
表4.2 Stambaugh-Yuan四因子模型中使用的11个异象
| 中文名 | 英文名 | 代表文献 | 和预期收益率的关系 |
| 股票净发行量 | Net Stock Issues | Fama and French (2008) | 负相关 |
| 复合股权发行量 | Composite Equity Issues | Daniel and Titman (2006) | 负相关 |
| 应计利润 | Accruals | Sloan (1996) | 负相关 |
| 净营业资产 | Net Operating Assets | Hirshleifer et al. (2004) | 负相关 |
| 总资产增长率 | Asset Growth | Cooper et al. (2008) | 负相关 |
| 投资与总资产之比 | Investment to Assets | Titman et al. (2004) | 负相关 |
| 财务困境 | Distress | Campbell et al. (2008) | 负相关 |
| O-分数 | O-Score | Ohlson (1980) | 负相关 |
| 动量 | Momentum | Jegadeesh and Titman (1993) | 正相关 |
| 毛利润 | Gross Profitability | Novy-Marx (2013) | 正相关 |
| 总资产回报率 | Return on Assets | Chen et al. (2010) | 正相关 |
下面就来看看到底如何构建这两个因子。在每月末,对于这两组中的每一个异象,使用异象变量在截面上对股票排序。排序时,从每个异象指标和未来预期收益率的相关性方向(即正、负相关)出发,将被高估的股票排在前面、被低估的股票排在后面。具体来说,如果异象变量和收益率呈负相关(比如应计利润),则按变量取值从高到低排序,取值最高的排第一、第二高的排第二,以此类推,取值最低的排最后。反之,如果异象变量和收益率呈正相关(比如动量),则按变量取值从低到高排序,取值最低的排第一、第二低的排第二,以此类推,取值最高的排最后。在使用全部11个异象变量对股票排序后,每只股票就有11个分数,分别把管理和表现两组内的六个和五个异象排名取平均,就得到每只股票在两组内各自的综合排名。综合排名越高,说明该股票价格越可能被高估,其未来预期收益越低;综合排名越低,说明该股票价格越可能被低估,其未来预期收益越高。此外,Stambaugh and Yuan(2017)进一步解释说,之所以采用多个排名取平均,是为了消除单一异象变量的噪声,更准确地衡量每只股票错误定价的大小[5]。
有了股票在管理和表现这两个变量上的排名,接下来使用市值和这两个变量依次进行 $2 \times 3$ 双重排序,构建管理、表现及市值三个因子。然而,Stambaugh and Yuan(2017)的做法和学术界的传统做法又有不少差异。在使用市值排序时,该模型和其他多因子模型一致,使用纽交所包含股票的市值中位数将所有股票分为大市值、小市值两组。然而,对于管理和表现这两个变量则是将三大交易所的股票混合在一起,使用所有股票在这两个变量上各自的 $20\%$ 和 $80\%$ 分位数划分成高、中、低三组。这种做法和其他多因子模型的处理有两点不同:(1)划分的断点没有使用纽交所股票的分位数,而是使用全部股票的分位数;(2)划分阈值没有采取传统的 $30\%$ 和 $70\%$ 分位数而是“另辟蹊径”,采用了 $20\%$ 和 $80\%$ 的分位数。
Stambaugh and Yuan(2017)对此并无太多解释。然而,Hou et al.(2019b)对此提出了质疑。该文复现了上述方法并同时按照传统的纽交所 $30\%$ 和 $70\%$ 分位数的方法构造了管理因子和表现因子。结果发现,这两个错误定价因子对双重排序的构造方式十分敏感。构建管理因子和表现因子的双重排序如图4.4所示。
图4.4 管理、表现和市值双重排序

市值分组依据:NYSE中位数;
管理和表现分组依据:NYSE、AMEX、NASDAQ $20\%$ 和 $80\%$ 分位数。
以管理因子为例, $2 \times 3$ 双重排序得到六个投资组合,每个投资组合中的股票均采用市值加权配置。对于管理变量,由于低组表示被低估的股票、高组表示被高估的股票,因此通过做多两个低组、做空两个高组就可以构建管理因子
(MGMT)的投资组合:
$$ \mathrm {M G M T} = \frac {1}{2} (\mathrm {S} / \mathrm {L} + \mathrm {B} / \mathrm {L}) - \frac {1}{2} (\mathrm {S} / \mathrm {H} + \mathrm {B} / \mathrm {H}) \tag {4.26} $$
按照同样的逻辑,使用表现变量和市值的 $2 \times 3$ 双重排序得到的6个投资组合(同样的,投资组合采用市值加权),构建表现因子(PERF)的投资组合如下:
$$ \mathrm {P E R F} = \frac {1}{2} (\mathrm {S} / \mathrm {L} + \mathrm {B} / \mathrm {L}) - \frac {1}{2} (\mathrm {S} / \mathrm {H} + \mathrm {B} / \mathrm {H}) \tag {4.27} $$
最后来看Stambaugh-Yuan四因子模型中的规模因子,它的构建方法较传统方法而言差异更大。如图4.4所示,分别使用管理和表现两个变量与市值进行 $2 \times 3$ 双重排序,共得到12个投资组合。为构建规模因子,Stambaugh and Yuan(2017)摒弃了管理和表现两变量的高、低组共8个组合,而仅使用剩余的4个组合。换句话说,管理和表现分别与市值双重排序,得到各自的S/M和B/M组合。将两个S/M组合取平均做多和两个B/M组合取平均做空,以此构建规模因子(SMB)的投资组合:
$$ \mathrm {S M B} = \frac {1}{2} \left(\mathrm {S} / \mathrm {M} _ {\mathrm {M G M T}} + \mathrm {S} / \mathrm {M} _ {\mathrm {P E R F}}\right) - \frac {1}{2} \left(\mathrm {B} / \mathrm {M} _ {\mathrm {M G M T}} + \mathrm {B} / \mathrm {M} _ {\mathrm {P E R F}}\right) \tag {4.28} $$
式(4.28)中,下标MGMT和PERF分别代表由管理和表现两个变量与市值双重排序得到的S/M或B/M投资组合。对于这种构造方法,Stambaugh and Yuan(2017)的解释是,传统的双重排序方法(比如Fama and French 2015)会中性化错误定价对市值的影响。然而,由于套利不对称性(Stambaugh et al.2015),比如难以做空,导致价格被高估的股票的错误定价难以被消除。此外,大量实证结果显示,错误定价在小市值股票中更为突出。这些特点使得传统的构造方法无法在规模因子的多、空两头对称地消除错误定价的影响,造成规模因子有被高估的偏差,因此不宜采用。正因如此,Stambaugh and Yuan(2017)才采用了式(4.28)的方法构造规模因子。他们的实证表明,如此构造的规模因子比传统方
4.1.7 Daniel-Hirshleifer-Sun三因子模型
Daniel et al.(2020)提出的Daniel-Hirshleifer-Sun三因子模型是把行为金融学应用于资产定价的另一个尝试。该文从长、短两个时间尺度上提出两个行为因子(behavioral factor),与市场因子一起构成了一个复合三因子模型:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i, \mathrm {M K T}} \left(E \left[ R _ {M} \right] - R _ {f}\right) + \beta_ {i, \text {F I N}} E \left[ R _ {\text {F I N}} \right] + \beta_ {i, \text {P E A D}} E \left[ R _ {\text {P E A D}} \right] \tag {4.29} $$
式(4.29)中 $E[R_{\mathrm{FIN}}]$ 和 $E[R_{\mathrm{PEAD}}]$ 分别代表长周期和短周期的两个行为因子的预期收益, $\beta_{i,\mathrm{FIN}}$ 及 $\beta_{i,\mathrm{PEAD}}$ 为个股 $i$ 在相应因子上的暴露。在使用中,FIN因子的投资组合每年六月更新,PEAD因子的投资组合每月更新。
这两个行为因子旨在捕捉由于过度自信(overconfidence)和有限注意力(limited attention)造成的错误定价,从而解释学术界之前发现的大量选股异象。从行为金融学的角度出发,股票收益率之间的共同运动通常有两个原因:
- 股票错误定价上的共性(见Barberis and Shleifer 2003);
- 投资者对股票基本面信息的错误反应上的共性(见Daniel et al.2001)。
前者指出不同的股票实际上暴露在一些共同的风格风险上,而情绪冲击会造成同一风格的股票收益率的共同运动,因此同一风格的股票存在相关性很高的错误定价。后者说明由于认知偏差,投资者难以对股票基本面方面的信息做出及时、正确的反应,因此也会导致错误定价。由于错误定价可以预测未来收益率,这意味着可以使用行为因子来构建一个多因子模型,以期更好地解释股票预期收益率之间的截面差异。这就是Daniel et al.(2020)的研究动机。此外,该文进一步指出市场上的绝大多数异象可按照时间尺度分为短时间尺度和长时间尺度两大类。短时间尺度的异象大多来自投资者的有限注意力,而长时间尺度的异象大多来自投资者的过度自信。为此Daniel等三位作者提出了捕捉长时间尺度异象的FIN因子和捕捉短时间尺度异象的PEAD因子。
FIN因子使用上市公司股票的发行和回购计算。研究表明,一方面,由于具备信息优势,公司的管理层善于利用市场上已经形成的错误定价“择时”自己公司的股价:当他们认为公司股价过高时,往往会增发;而当公司股价被低估时,通常采取回购。另一方面,普通(非理性)投资者往往过度自信,导致对上市公司的增发、回购行为反应不足,使得股价不会在短期修正。
大量(美股上)的实证表明,增发行为和未来的收益率呈负相关,而回购行为和未来的收益率呈正相关。为此,Daniel et al.(2020)使用以下两个指标构建了FIN因子:(1)过去五年的复合股权发行量(5-year composite share issuance, CSI);(2)过去一年的股票净发行量(1-year net share issuance, NSI)[6]。首先来看CSI,它的处理比较简单。以纽交所上市公司CSI指标的 $20\%$ 和 $80\%$ 分位数为界,将全部股票分成低、中、高三档。再来看NSI,它的处理则十分复杂。Daniel et al.(2020)指出年与年之间增发和回购股票的公司数量是相当不平衡的,导致
按照传统单变量排序来构建因子不够合理。因此,他们将所有股票首先分成净回购和净发行两大类。然后,对于所有净回购的公司,按纽交所中所有净回购公司净回购数的中位数分成高、低两组;对于所有净发行的公司,按纽交所中所有净发行公司净发行数的 $30\%$ 和 $70\%$ 分位数为界,分成低、中、高三组。最后,将两个净回购公司中的高组作为NSI变量的低组、将三个净发行公司中的高组作为NSI变量的高组。图4.5展示了上述排序方式。对于如此复杂的排序方法,虽然Daniel et al.(2020)的解释有其合理之处,但仍然难逃过拟合之嫌。
有了在CSI和NSI两个变量上的分组,Daniel et al.(2020)最终使用如下的方法构建FIN因子。如果某只股票在CSI和NSI上的分组都是高组,或者在其中之一的分组是高组、在另一变量上缺数而无法划分,则认为该股票属于FIN的高组;类似的,如果某支股票在CSI和NSI上都是低组,或者在其中之一的分组是低组、在另一变量上缺数而无法划分,则认为该股票属于FIN的低组;其余股票则分入FIN的中间组。将所有股票按上述逻辑分为高、中、低组后,使用FIN和市值进行如图4.6所示的 $2 \times 3$ 双重排序,得到6个投资组合,每个投资组合内的股票按照市值加权配置。

图4.5 过去一年股票净发行量的分组逻辑
图4.6 FIN和市值双重排序

市值分组依据:NYSE中位数;
FIN分组依据见正文中说明。
有了上述6个投资组合,最终FIN因子的定义如下:
$$ \mathrm {F I N} = \frac {1}{2} (\mathrm {S} / \mathrm {L} + \mathrm {B} / \mathrm {L}) - \frac {1}{2} (\mathrm {S} / \mathrm {H} + \mathrm {B} / \mathrm {H}) \tag {4.30} $$
由于增发和回购有很多合规的要求,因此上市公司不可能频繁使用。此外,如果哪个上市公司频繁地增发或回购也会导致投资者的怀疑。因此该因子的变化非常缓慢,而其对应的错误定价的修正也是在很长的时间尺度上才能完成的。它仅能解释长时间尺度上的异象(大于1年,通常3到5年),而对小于1年尺度上的异象
则无能为力。
为此,Daniel et al.(2020)针对短时间尺度,使用盈余惯性提出了第二个行为因子。大量实证显示,业绩超预期公司的股票比业绩低于预期公司的股票在未来6到9个月内能获得更高的收益。之所以出现这种现象,是因为投资者的有限注意力使得他们对最新的业绩数据反应不足(DellaVigna and Pollet 2009,Hirshleifer and Teoh 2003)。为了捕捉上述反应的不足,Daniel et al.(2020)以上市公司最近的一个财报的披露日期为时间零点,计算[-2,1]窗口内,即披露之前两个交易日到披露后的一个交易日,其相对于市场的累计超额收益率(cumulative abnormal return,CAR)作为评价指标:
$$ \mathrm {C A R} _ {i} = \sum_ {d = - 2} ^ {d = 1} \left(R _ {i d} - R _ {M d}\right) \tag {4.31} $$
其中 $R_{id}$ 为上市公司 $i$ 在其最近一个披露期窗口内第 $d$ 日的收益率; $R_{Md}$ 为市场在同期的收益率。由于投资者反应不足,该窗口内的收益率和未来的收益率呈正相关,因此该变量越大越好。Daniel et al.(2020)使用纽交所中所有股票的市值中位数以及CAR变量的 $20\%$ 和 $80\%$ 分位数将全部股票进行如图4.7所示的 $2 \times 3$ 双重排序,得到6个投资组合,每个投资组合内的股票按照市值加权配置。
图4.7 CAR和市值双重排序

市值分组依据:NYSE中位数;
CAR分组依据:NYSE $20\%$ 和 $80\%$ 分位数。
最终PEAD因子定义如下:
$$ \mathrm {P E A D} = \frac {1}{2} (\mathrm {S} / \mathrm {H} + \mathrm {B} / \mathrm {H}) - \frac {1}{2} (\mathrm {S} / \mathrm {L} + \mathrm {B} / \mathrm {L}) \tag {4.32} $$
以上系统梳理了目前最被学术界认可的多因子模型。在结束本节讨论之前,下面一点值得强调。在这些多因子模型中,除了市场因子,几乎所有风格因子的构造都是通过首先使用排序法得到多个投资组合,继而选择其中一些做多,另一些做空的方式。在这个过程中,通过排序法划分得到的每个投资组合内部的股票均是按市值加权来配置的。换句话说,每个投资组合自身的收益率是其所包含的股票的市值加权平均。而有了投资组合的收益率后,在计算因子收益率时,使用的则是这些投资组合收益率的简单平均——无论是多头还是空头,不同投资组合之间都是等权重配置。这种处理方式正是学术界构建因子投资组合时的惯例。唯一的例外是Carhart四因子模型中的动量因子,该因子采用单变量排序,且多空两个投资组合均采用等权重构造。
+sE[SMB]+hE[HML],其中SMB和HML被用来代表因子收益率,而相应的因子暴露由s和h表示。在本书中,为了使不同因子模型的数学符号具有一致性,仍然使用β和R加下标来表示不同因子的暴露和收益率。
[2]颇具讽刺意味的是,使用回归预测得到的预期投资和预期收益率之间呈现正相关(虽然不显著),这和从DDM推导的预期投资和预期收益率之间的负相关相互矛盾。这也成为后来Hou et al.(2019b)抨击Fama and French(2015)的原因之一。
[3]Fama and French(2015)中还给出了其他的排序方法,但是最常用的仍然是 $2 \times 3$ 排序。
[4]例如,其中一个异象变量是净营业资产,然而它的计算方法是净营业资产和总资产之比。
[5]在介绍研究动机时,Stambaugh and Yuan(2017)指出该研究的出发点是找到一个能解释更多异象的多因子模型。在构建因子时,该文将11个异象分成两组,并通过综合排序的方式构建因子。这种做法无疑有助于解释更多的异象,但同时也更容易出现过拟合。
[6]这两个变量和Stambaugh and Yuan(2017)使用的11个异象变量中的两个有异曲同工之妙。
[7]Post-Earnings-Announcement-Drift,PEAD。在6.3.5节中会对盈余惯性进行了更多说明。
4.2 A股中被定价的因子
本书3.2到3.8节介绍了一些主流因子,并在A股市场上使用排序法对它们进行了检验。虽然前文通过和市值的双重排序排除了小市值的影响,但它依然无法完全规避目标因子在其他因子上的暴露。为此,本节使用Fama-MacBeth回归进一步检验上述因子中有哪些在A股中真正被定价,即可以获得显著的超额收益。
4.2.1 Fama-MacBeth回归实证设定
依照2.3节的介绍,在进行Fama-MacBeth回归时,除去市场因子,本书将使用公司特征作为因子暴露值。这意味着除市值外,将用每期截面上公司特征指标的实际取值。对于市值,由于削弱市值分布右偏的影响,将用对数市值代替市值作为因子暴露。这种做法也符合学术界的惯例。对于市场因子,本书使用滚动252个交易日窗口时序回归计算个股的 $\beta$ 作为其在市场因子上的暴露。在Fama-MacBeth回归中,在每个月使用当期公司特征作为解释变量,使用个股t+1月的收益率作为被解释变量,通过截面回归计算因子的收益率。具体步骤请参考2.2.4节。在每期回归时,股票的选取遵循和第3章一样的数据处理原则。
在给出结果之前,还有另外两个设定需要说明。第一,本节实证在Fama-MacBeth回归中加入了截距项,以控制模型设定偏误问题。第二,无论是学术界还是业界,在进行回归时,往往对作为解释变量的因子暴露在截面上进行剔除异常值以及标准化两步处理。经标准化后,所有因子暴露在截面上的标准差均为1,这有利于直接对比不同因子的风险溢价。不过本节的实证中仅对因子暴露进行剔除异常值处理,不进行标准化处理[1],但行文中会说明在这种情况下如何比较不同因子的收益率。
4.2.2 Fama-MacBeth回归结果
表4.3给出了针对A股市场的Fama-MacBeth回归结果。概括来说,表中结果与第3章中排序法结果基本一致,符合预期,下面具体讨论。
表4.3 Fama-MacBeth回归结果
| 因子 | 公司特征 | 月均收益率(%) | 因子暴露标准差 | 影响系数(%) |
| 市场 | 市场β | -0.17 (-0.44) | 0.26 | -0.04 |
| 规模 | 对数市值 | -0.52 (-3.68) | 1.02 | -0.53 |
| 价值 | BM | 1.88 (3.40) | 0.24 | 0.45 |
| 动量 | t-12到t-1总收益率 | 0.33 (1.30) | 0.61 | 0.20 |
| 盈利 | ROE(TTM) | 2.36 (4.75) | 0.12 | 0.28 |
| 投资 | 总资产增长率 | 0.10 (0.72) | 0.33 | 0.03 |
| 异常换手率 | 异常换手率 | -1.13 (-7.75) | 0.61 | -0.69 |
括号内为经Newey-West调整后t-值。
首先来看 $t$ -值。无论是按照传统的2.0(或-2.0),还是按照如今更被学术界接纳的3.0(或-3.0)为阈值[2],规模、价值、盈利以及换手率因子的月均收益率都非常显著,因此它们是被定价的因子。需要说明的是,规模和换手率因子的 $t$ -值分别为-3.68和-7.75,说明因子暴露越高的股票收益率越低,因而和小市值效应以及低换手率效应一致。另一方面,市场、动量以及投资因子的月均收益率均不显著。其中,市场因子的月均收益率为负,这与Black CAPM模型相符合;动量因子的月均收益率虽不显著,但仍然大于零;最后投资因子的月均收益率为正(虽然 $t$ -值仅有0.72,非常不显著),说明总资产增长率高的公司比总资产增长率低的公司的收益率更高,这与从经济学理论导出的投资和收益率之间的负相关不符。
接下来看看因子的月均收益率。由于在回归中没有对因子暴露进行标准化,因而收益率的绝对大小会受到因子暴露(即公司指标)标准差的影响,造成不同因子的收益率并不直接可比。为此,可以使用Bali et al.(2016)介绍的影响系数(impact coefficient)的概念。影响系数的定义为因子的收益率与因子暴露标准差的乘积,它的意义为当其他条件不变,而资产在目标因子上的暴露增加一个标准差时,其预期收益率的变化大小。以规模因子为例,其月均收益率为 $-0.52\%$ 、因子暴露标准差为1.02,因此影响系数为 $-0.53\%$ 。表4.3的第四列汇报了不同因子的影响系数。在被定价的四个因子中,换手率和规模因子的影响系数(绝对值)最高、价值因子紧随其后。盈利因子的影响系数虽然只有 $0.28\%$ ,但由于它的标准误很低,因此十分显著( $t$ -值高达4.75)。
本节和第3章的实证结果说明,规模、价值、盈利以及换手率在A股市场中被定价。在实际因子投资中,可以考虑从这四个维度构建因子,对A股市场进行异象研究。
[1]本书7.1节将对因子暴露在实践中的处理做进一步介绍。
[2]关于 $t$ -值阈值的讨论,详见6.1.5节。
4.3 多因子模型比较:来自A股的例子
本节通过一个简单的例子说明如何使用2.5节介绍的GRS检验和 $\alpha$ 检验比较两个多因子模型。需要明确的是,本节论述的重点在于如何应用相关的计量经济学方法比较模型,而不是对比两个模型孰优孰劣。
4.3.1 两个模型
为了使实证结果对A股市场最具借鉴意义和研究价值,入选的第一个多因子模型正是Liu et al.(2019)针对A股市场提出的三因子模型。该文于2019年发表于金融学顶级期刊Journal of Financial Economics,参照Fama-French三因子模型,提出了适合A股市场的三因子模型[1]。中国版三因子模型同样包括市场、价值和规模三因子。然而,该文针对A股市场做了两个特别的处理,使得他们提出的模型更加符合中国股市[2]。第一,该文规避了中国股市的壳价值污染问题。由于A股的IPO发审制度不健全,造成优秀企业在A股上市成本高、时间长。在这种情况下,有些企业则选择“弯道超车”,通过收购市值非常低的上市公司来借壳上市。上述情况使得A股市场中市值最小的一部分股票具有很好的“壳价值”。它们的收益率很大程度上和壳价值挂钩,且远远偏离这些公司的基本面,这就是壳价值污染问题。壳价值的存在对A股的实证资产定价研究和因子投资均带来了挑战。为了降低壳价值污染的影响,Liu et al.(2019)在实证中剔除了市值最低的30%的股票。其次,与Fama-French三因子不同,该文采用EP取代BM作为构建价值因子的排序变量,使用EP和市值的双重排序构建了价值因子。如果说针对壳价值污染而做的处理无可厚非,那么使用EP取代BM来构造价值因子则并没有那么令人信服,因为它几乎全部是来自实证方面的考虑,即在该文的实证中,EP比BM更能显著地解释股票预期收益率的截面差异。
为什么说上述选择并不十分令人信服呢?回顾本书3.4节和3.6节关于价值和盈利因子的实证结果可知,BM在小市值中的作用要远远高于在大市值中的作用;另一方面,在A股中使用ROE为变量构建的盈利因子在小市值中的表现显著弱于其在大市值中的表现。由于 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ ,因此当市值最低的 $30\%$ 的股票因壳价值污染问题被剔除,而仅保留其他大市值的股票时,BM的效果就会较使用全部股票时变差,而ROE和EP的效果则会较使用全部股票时变得更好。此消彼长,这就不难理解为什么在Liu et al.(2019)一文中EP比BM更能解释股票的预期收益。
近年来学术界也有一些针对A股市场的研究表明BM和EP之间各有千秋,并没有哪个显著优于另一个。举例来说,Cakici et al.(2017)和Hsu et al.(2018)分别以1994年到2011年和2008年到2016年为实证区间,均发现在上述区间内BM比EP更能预测股票的预期收益率。Qiao(2019)则使用了自2000年到2017年的实证窗
口,发现BM在整个窗口内都能获得显著的绝对收益以及CAPM- $\alpha$ ;然而EP则仅当市值最低的 $30\%$ 股票被剔除之后才能获得显著收益。最后,来自MSCI的报告Rao and Gupta(2019)以2000到2019这二十年为研究区间(和本书一样),分析了BM和EP在前后两个十年(即2000到2009以及2010到2019)的表现,发现在前一个十年,BM显著优于EP,而后一个十年则是EP胜出。
抛开实证结果,从金融学理论上,Liu et al.(2019)指出单纯地使用EP来取代BM,并利用前者构建价值因子并不合理。该文从DDM出发分析了BM及ROE与股票预期收益率之间的相关性。虽然 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ ,但二者的作用不应该仅由单一EP来代替;反而是EP在A股市场的表现恰恰得益于 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 这个关系。为此,Liu et al.(2019)主张仍然使用BM而非EP构建价值因子,并在Liu et al.(2019)三因子模型的基础上加入了ROE代表的盈利因子,得到市场、价值、规模以及盈利的四因子模型。这个四因子模型就是本节模型比较时考虑的第二个模型[3]。
4.3.2 BM、ROE与预期收益
在通过实证比较上述两个多因子模型之前,本节首先从公司估值的角度解释一下为什么BM与ROE和股票的预期收益密切相关,这将帮助读者理解为什么在多因子模型中加入利用BM和ROE构建的价值和盈利因子是合理的。在“因子大战”(见6.2节)硝烟弥漫的今天,Fama and French(2018)警告说多因子模型背后的每个因子都应该有理论支撑。一旦缺乏理论,那么对多因子模型的研究就会演变成一场纯粹的数据挖掘,而不能帮助人们更好地理解市场。
关于BM和ROE与预期收益率的关系,Hou et al.(2019b)从DDM出发并利用单期预期收益率进行了精彩的论述。根据定义,某股票的单期收益率满足(为了数学符号的简洁性,以下略去代表股票的下标 $i$ ):
$$ M _ {t} = \frac {E _ {t} \left[ D _ {t + 1} \right] + E _ {t} \left[ M _ {t + 1} \right]}{1 + E _ {t} \left[ r _ {t + 1} \right]} \tag {4.33} $$
式中 $M_{t}$ 是该股票在 $t$ 时刻的市值, $D_{t+1}$ 是 $t+1$ 期的分红, $r_{t+1}$ 则表示 $t$ 到 $t+1$ 之间股票的收益率, 期望符号的下标 $t$ 表示根据 $t$ 时刻的已有信息计算条件期望。此外, 由净盈余关系 (clean surplus relation) 可知分红是利润和账面价值变动之差, 即:
$$ \mathrm {D} _ {t + 1} = \mathrm {Y} _ {t + 1} - \mathrm {d B} _ {t + 1} \tag {4.34} $$
其中 $Y_{t+1}$ 是 $t+1$ 期的利润, $dB_{t+1}$ 是 $t$ 到 $t+1$ 期的账面价值变动。将(4.34)中 $D_{t+1}$ 的表达式代入(4.33)可得:
$$ M _ {t} = \frac {E _ {t} \left[ Y _ {t + 1} - d B _ {t + 1} \right] + E _ {t} \left[ M _ {t + 1} \right]}{1 + E _ {t} \left[ r _ {t + 1} \right]} \tag {4.35} $$
将(4.35)两侧同时除以 $t$ 时刻的账面价值 $B_{t}$ 有:
$$ \frac {M _ {t}}{B _ {t}} = \frac {\mathrm {E} _ {t} \left[ \frac {Y _ {t + 1}}{B _ {t}} \right] - \mathrm {E} _ {t} \left[ \frac {d B _ {t + 1}}{B _ {t}} \right] + \mathrm {E} _ {t} \left[ \frac {M _ {t + 1}}{B _ {t}} \right]}{1 + \mathrm {E} _ {t} [ r _ {t + 1} ]} \tag {4.36} $$
从式(4.36)可推导出BM和ROE各自与单期预期收益率 $\mathrm{Et}[r_{t + 1}]$ 之间的关系:
(1) 当(4.36)中除了 $M_{t} 、 B_{t}$ 以及 $\mathrm{E}{t}[r{t+1}]$ 的其他变量保持不变时,更高的 $B_{t} / M_{t}$ (BM)对应着更高的预期收益率 $\mathrm{E}{t}[r{t+1}]$ ,因此BM和预期收益率之间正相关;
(2) 当(4.36)中除了 $Y_{t+1} 、 B_t$ 以及 $\mathrm{E}t[r{t+1}]$ 的其他变量保持不变时,更高的 $\mathrm{E}t[Y{t+1} / B_t]$ 对应着更高的预期收益率 $\mathrm{E}t[r{t+1}]$ 。由于 $\mathrm{E}t[Y{t+1} / B_t]$ 正是未来的预期ROE,因此它和预期收益率之间正相关。
需要说明的是,在因子投资中,未来预期ROE是未知的,已知的仅仅是过往的ROE。但Zhang(2017)的研究发现上市公司历史ROE是未来预期ROE的一个靠谱预测,因此可以近似认为历史ROE和预期收益率之间正相关。综合以上两点可知,从(4.36)中可以推导出BM和ROE都可以用来构建因子、预测股票的收益率。另一方面,正如前文反复强调的, $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 这个关系表明EP与BM和ROE紧密相连。因此,既然BM、ROE和预期收益率正相关,那么EP显然和预期收益率正相关。然而,仅仅使用EP代替BM来构造价值因子,并舍弃ROE代表的盈利维度仍然存在两个问题。首先,Penman and Reggiani(2018)针对美股的研究表明,为了更准确地对公司估值,在BM、EP和ROE这三个变量中应该考虑两个,仅考虑一个会丢失一些重要的信息。第二,仅从实证角度出发,由 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 可知EP和ROE正相关,因此使用EP构造的价值因子在盈利维度上有无法避免的暴露,这会提升价值因子的表现,使得以EP构造的价值因子不够纯粹。基于上述两点考虑,Liu et al.(2019)认为分别使用BM和ROE构造价值和盈利因子要比仅使用EP构造价值因子更合理。
4.3.3 模型比较的实证结果
为比较4.3.1节提及的两个多因子模型,首先需要在本书的实证周期内复现它们,即构建每个模型的因子。为此,本书采用尽可能贴近原始论文的方式构建因子。除市场因子外,Liu et al.(2019)以市值和EP为变量,并依照Fama and French(1993)的方式,通过 $2 \times 3$ 独立双重排序构建了他们的规模和价值因子。在每月末,对于股票池中的股票,使用市值的中位数将它们划分成小市值组(S)和大市值组(B),同时使用EP的 $30\%$ 和 $70\%$ 分位数将它们划分成价值组(V,EP在 $70\%$ 分位数之上)、中间组(M,EP在 $30\%$ 和 $70\%$ 分位数之间)和成长组(G,EP在 $30\%$ 分位数之下)。使用上述划分得到的六个投资组合(依照惯例,每个投资组合内采用市值加权),Liu et al.(2019)三因子模型中的规模和价值因子分别为:
$$ \begin{array}{l} \mathrm {C H N - S M B} = \frac {1}{3} (\mathrm {S / V + S / M + S / G}) - \frac {1}{3} (\mathrm {B / V + B / M + B / G}) (4.37) \ \mathrm {C H N - V M G} = \frac {1}{2} (\mathrm {S} / \mathrm {V} + \mathrm {B} / \mathrm {V}) - \frac {1}{2} (\mathrm {S} / \mathrm {G} + \mathrm {B} / \mathrm {G}) (4.38) \ \end{array} $$
式中CHN-SMB和CHN-VMG分别代表Liu et al.(2019)的规模和价值因子,其中前缀CHN源于该文的标题,即Size and value in China。因此,书中采用CHN前缀代表该文针对A股市场提出的因子,也以此来和Liu et al.(2019)四因子模型中的因子加以区分。
为了构建Liu et al.(2019)的四因子模型,本书采用Fama and French(2015)的方法,依次使用BM以及ROE(TTM)与市值进行 $2 \times 3$ 双重排序。首先来看价值因子。在每月末,对于股票池中的股票,使用市值的中位数将它们划分成小市值组(S)和大市值组(B),同时使用BM的 $30\%$ 和 $70\%$ 分位数将它们划分成价值组(H,BM在 $70\%$ 分位数之上)、中间组(M,BM在 $30\%$ 和 $70\%$ 分位数之间)和成长组(L,BM在 $30\%$ 分位数之下)。使用上述划分,四因子模型中的价值因子定义为:
$$ \mathrm {L S L - H M L} = \frac {1}{2} (\mathrm {S / H + B / H}) - \frac {1}{2} (\mathrm {S / L + B / L}) \tag {4.39} $$
对于盈利因子,在每月末按市值将股票划分成小市值组(S)和大市值组(B),同时根据ROE(TTM)的 $30\%$ 和 $70\%$ 分位数将它们划分成高盈利组(R,ROE(TTM)在 $70\%$ 分位数之上)、中性组(N,ROE(TTM)在 $30\%$ 和 $70\%$ 分位数之间)和低盈利组(W,ROE(TTM)在 $30\%$ 分位数之下)。使用上述划分,四因子模型中的盈利因子为:
$$ \mathrm {L S L - R M W} = \frac {1}{2} (\mathrm {S / R + B / R}) - \frac {1}{2} (\mathrm {S / W + B / W}) \tag {4.40} $$
最后来看规模因子。与Fama-French五因子类似,由于分别使用BM和ROE(TTM)与市值双重排序,因此在构建规模因子时综合使用上述划分得到的小市值和大市值组合。具体来说,四因子模型中规模因子的定义为:
$$ \mathrm {L S L - S M B} = \frac {1}{2} \left(\mathrm {S M B} _ {\mathrm {B M}} + \mathrm {S M B} _ {\mathrm {R O E}}\right) \tag {4.41} $$
其中 $\mathrm{SMB}_{\mathrm{BM}} = \frac{1}{3} (\mathrm{S / H + S / M + S / L}) - \frac{1}{3} (\mathrm{B / H + B / M + B / L})$ (4.42)
$$ \mathrm {S M B} _ {\mathrm {R O E}} = \frac {1}{3} (\mathrm {S} / \mathrm {R} + \mathrm {S} / \mathrm {N} + \mathrm {S} / \mathrm {W}) - \frac {1}{3} (\mathrm {B} / \mathrm {R} + \mathrm {B} / \mathrm {N} + \mathrm {B} / \mathrm {W}) \tag {4.43} $$
在式(4.39)~式(4.41)中,前缀LSL代表Liu et al.(2019)一文三位作者姓氏的首字母。最后需要说明的是,Liu et al.(2019)一文从壳价值污染的角度出发在其实证研究中剔除了市值最小的 $30\%$ 的股票。然而在本节的实证中,出于结果稳健性的考量,将同时考虑不剔除以及剔除的情况。
表4.4给出了CHN-SMB、CHN-VMG、LSL-SMB、LSL-HML以及LSL-RMW这5个因子每月的收益率(Panel A和Panel B分别为全部股票和剔除市值最低的30%股票的情况)以及收益率的相关系数(Panel C对角线右上角为全部股票时因子之间的相关系数;对角线左下角为剔除市值最低的30%股票后因子之间的相关系数)。上述结果清晰地反映出三点:(1)两个版本的规模因子高度相关(在两种情况下的相关系数均为0.98,这符合它们的定义)。然而,对比式(4.37)和式
(4.41)可知,两个模型中的规模因子在构建上有一定的区别,这也造成了它们的收益率有所不同。而无论是否排除小市值股票,LSL-SMB的月均收益率均低于CHN-SMB。有意思的是,当剔除市值最低的 $30\%$ 股票之后,CHNSMB和LSL-SMB均不再显著( $t$ -值分别为1.94和1.21)[4]。(2)Liu et al.(2019)通过EP构建的价值因子(CNH-VMG)和Liu et al.(2019)通过ROE(TTM)构建的盈利因子(LSL-RMW)高度相关。在全部股票中,这两个因子的相关系数为0.85;当剔除市值最低的 $30\%$ 股票后,这两个因子的相关系数仍有0.74。这种相关性充分体现了 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 所示的EP和ROE的内在关联,也说明Liu et al.(2019)版的价值因子在盈利维度上有很高的暴露,因此它并不是一个纯粹的价值因子。另一方面,使用BM构建的LSL-HML价值因子和盈利因子的相关性仅为-0.08(全部股票)或-0.18(剔除市值最低的 $30\%$ 股票后)。(3)对于全部股票,LSL-RMW盈利因子并不显著( $t$ -值为1.82);而当剔除了市值最低的 $30\%$ 股票后,该因子的月均收益率和结果的显著性均提高( $t$ -值上升至2.38)。这一结果和3.6节中关于盈利因子的实证结果相符。
表4.4 两模型中风格因子的月均收益率和相关系数
| Panel A: 月均收益率 (%),全部股票 | |||||
| CHN-SMB | CHN-VMG | LSL-SMB | LSL-HML | LSL-RMW | |
| 1.01 | 0.83 | 0.75 | 0.82 | 0.39 | |
| (3.24) | (3.71) | (2.28) | (3.24) | (1.82) | |
| Panel B: 月均收益率 (%),剔除市值最低的 30% 股票 | |||||
| CHN-SMB | CHN-VMG | LSL-SMB | LSL-HML | LSL-RMW | |
| 0.57 | 0.91 | 0.37 | 0.78 | 0.52 | |
| (1.94) | (4.03) | (1.21) | (2.86) | (2.38) | |
| Panel C: 相关系数 | |||||
| CHN-SMB | CHN-VMG | LSL-SMB | LSL-HML | LSL-RMW | |
| CHN-SMB | -0.69 | 0.98 | -0.19 | -0.68 | |
| CHN-VMG | -0.63 | -0.77 | 0.39 | 0.85 | |
| LSL-SMB | 0.98 | -0.72 | -0.31 | -0.68 | |
| LSL-HML | -0.20 | 0.47 | -0.33 | -0.08 | |
| LSL-RMW | -0.62 | 0.74 | -0.59 | -0.18 | |
在Panel A和Panel B中,括号内为经Newey-West调整后的t-值。Panel C中对角线右上角为全部股票时因子之间的相关系数,对角线左下角为剔除市值最低的 $30\%$ 股票后因子之间的相关系数。
下面通过2.5节介绍的α检验和GRS检验来比较这两个多因子模型。为了进行α检验,本书选择Liu et al.(2019)一文所使用的异象作为测试资产,检验这两个多因子模型对它们收益率的解释能力。表4.5对它们进行了总结。对于每个异象,使用相应的异象变量,通过单变量排序法构建多空对冲的投资组合作为该异象的投资组合,并使用异象投资组合的收益率作为被解释变量,考察其能否获得给定多因子模型无法解释的显著超额收益。在时序回归求解每个异象的α收益率的过程中,本书首先通过在整个实证期内进行一次时序回归计算每个异象的超额收益α及其t-值,作为检验的依据。此外,考虑到A股市场在本书实证期跨度的20年内发生了很多结构性变化,因此也采用滚动60个月进行时序回归。这意味着对于每个异象,时序回归结果得到一组α的时间序列(以及这些α的t-值的时间序列)。最终使用该α时间序列的均值作为该异象收益率中无法被多因子模型解释的部分,并使用t-值的时序均值作为最终的t-值检验该α的显著性。这种方法可以被视为整个实
证期内回归结果的稳健性分析。
表4.5 用于比较两个多因子模型的异象
| 异象变量 | 定义 |
| 市现率 | 股票价格与每股现金流量的比率 |
| 净经营资产 | (股东权益+金融负债-金融资产)/总资产,使用最新财报数据计算 |
| 总资产增幅 | 年报披露的总资产的同比增幅 |
| 应计利润 | (过去12个月的营业利润-过去12个月的净经营性现金流)/过去4个季度的平均总资产 |
| MAX | 过去21个交易日内5个最高日收益率的均值① |
| 1个月波动率 | 过去21个交易日日收益率的标准差 |
| 1个月异常换手率 | 过去21个交易日日均换手率和过去252个交易日日均换手率之比 |
| 12个月换手率 | 过去252个交易日的日均换手率 |
| 非流动性 | 过去21个交易日的日均非流动性指标② |
| 反转 | 过去21个交易日的累计收益 |
①该定义出自Asness et al.(2020),可在一定程度上规避A股涨跌停板限制的影响。
②非流动性指标根据Amihud(2002)计算。
下面来看检验结果。表4.6给出了当整个实证期内进行一次回归时,不同异象在两个多因子模型下各自的超额收益,其中Panel A为考虑全部股票的情况,Panel B为剔除了市值最低的30%股票的情况。若以t-值小于2.0为依据来判断,当考虑全部股票时,这两个模型均能解释大部分异象。Liu et al.(2019)提出的三因子模型仅无法解释净经营资产(t-值为2.09)和1个月异常换手率异象(t-值为2.45);而根据Liu et al.(2019)引出的四因子模型无法解释市现率(t-值为2.02)、1个月异常换手率(t-值为2.99)以及非流动性异象(t-值为3.57)。若以t-值小于3.0为依据来判断[5],三因子模型能够解释全部异象,而四因子模型能够解释除非流动性异象之外的其余9个异象。当市值最低的30%股票被剔除之后,上述定性的结论没有发生变化。若依t-值<2.0来判断,两个模型均无法解释1个月异常换手率和非流动性异象;若依t-值<3.0来判断,两个模型均无法解释1个月异常换手率异象,此外四因子模型也无法解释非流动性异象。
表4.6 异象的月均超额收益(%)
Panel A: 全部股票
| 异象变量 | 三因子模型 | 四因子模型 | ||
| α | t-值 | α | t-值 | |
| 市现率 | 0.27 | 1.17 | 0.56 | 2.02 |
| 净经营资产 | 0.55 | 2.09 | 0.39 | 1.43 |
| 总资产增幅 | 0.09 | 0.39 | 0.08 | 0.47 |
| 应计利润 | 0.27 | 0.93 | 0.31 | 1.24 |
| MAX | 0.20 | 0.50 | 0.34 | 0.93 |
| 1个月波动率 | 0.11 | 0.28 | 0.24 | 0.65 |
| 1个月异常换手率 | 1.02 | 2.45 | 1.31 | 2.99 |
| 12个月换手率 | 0.05 | 0.14 | 0.05 | 0.15 |
| 非流动性 | 0.37 | 1.94 | 0.59 | 3.57 |
| 反转 | -0.02 | -0.05 | 0.10 | 0.26 |
Panel B:剔除市值最低的 $30\%$ 股票
| 异象变量 | 三因子模型 | 四因子模型 | ||
| α | t-值 | α | t-值 | |
| 市现率 | 0.26 | 1.18 | 0.41 | 1.69 |
| 净经营资产 | 0.51 | 1.85 | 0.28 | 1.12 |
| 总资产增幅 | 0.01 | 0.03 | 0.05 | 0.27 |
| 应计利润 | 0.21 | 0.79 | 0.34 | 1.48 |
| MAX | 0.23 | 0.63 | 0.33 | 0.92 |
| 1个月波动率 | 0.10 | 0.29 | 0.13 | 0.35 |
| 1个月异常换手率 | 1.28 | 3.13 | 1.38 | 3.13 |
| 12个月换手率 | 0.12 | 0.38 | 0.01 | 0.03 |
| 非流动性 | 0.56 | 2.89 | 0.63 | 3.62 |
| 反转 | 0.29 | 0.77 | 0.33 | 0.86 |
t-值经Newey-West调整。
表4.7对单个异象的检验结果进行了总结,并以此作为比较两个多因子模型的依据。表中共有四个评价指标:Avg. $|\alpha|$ 为全部10个异象在给定定价模型下超额收益绝对值的均值,Avg. $|t$ -值为对应的 $t$ -值绝对值的均值,而#( $|t$ -值 $\geq 2.0$ )和#( $|t$ -值 $\geq 3.0$ )分别表示 $t$ -值绝对值超过2.0和3.0的异象个数。结果显示,无论是考虑全部股票还是剔除市值最低的 $30\%$ 股票后,且无论考虑哪个评价指标,三因子模型均不差于四因子模型。举例来说,当考虑全部股票时,这10个异象对于三因子模型的平均超额收益绝对值仅为 $0.30\%$ ;当使用四因子模型时,这个数值上升至 $0.40\%$ 。此外,无论是 $t$ -值绝对值超过2.0和3.0的异象的个数,三因子模型也都优于四因子模型。当剔除市值最低的 $30\%$ 的股票后,上述结果基本保持一致,唯一的区别是 $t$ -值绝对值超过2.0的异象个数对两个模型来说是一样的。以上述结果来评价,包含通过EP构造价值因子的三因子模型似乎优于Liu et al.(2019)所主张的四因子模型(包含围绕BM和ROE构建的价值和盈利因子)。但不可否认的是,这二者之间的差异是非常细微的,总体来说它们都能解释大部分异象。
表4.7 $\alpha$ 检验结果
Panel A: 全部股票
| Avg. |α| (%) | Avg. |t-值| | #(|t-值| ≥ 2.0) | #(|t-值| ≥ 3.0) | |
| 三因子模型 | 0.30 | 0.99 | 2 | 0 |
| 四因子模型 | 0.40 | 1.37 | 3 | 1 |
Panel B: 剔除市值最低的 $30\%$ 股票
| Avg. |α| (%) | Avg. |t-值| | #(|t-值| ≥ 2.0) | #(|t-值| ≥ 3.0) | |
| 三因子模型 | 0.36 | 1.19 | 2 | 1 |
| 四因子模型 | 0.39 | 1.35 | 2 | 2 |
作为稳健性分析,表4.8给出了采用滚动60月窗口回归的检验结果。无论是否剔除小市值股票,Liu et al.(2019)三因子模型均能解释全部的异象,即所有异象 $t$ -值的绝对值均小于2.0。对于四因子模型来说,它仅当考虑全部股票时无法解释非流动性异象( $t$ -值为2.42)。表4.9给出了汇总的结果。当考虑全部股票时,由于 $|\alpha|$ 均值和 $|t$ -值均值都更低,因而三因子模型优于四因子模型;而颇有意思的是,当剔除市值最低的 $30\%$ 的股票后,上述结论发生了逆转——四因子模型下的平均 $|\alpha|$ 和平均 $|t$ -值都要低于三因子模型。
虽然在不同情景下得到的结果略有差异,但综合表4.6到表4.9所示的α检验结果来说,这两个多因子模型解释异象的能力可谓旗鼓相当、难分伯仲。下面继续进行GRS检验。为此,使用两个因子模型中除市场因子外的风格因子,即三因子模型中的CHN-SMB和CHN-VMG以及四因子模型中的LSL-SMB、LSL-HML和LSL-RMW,互为模型和测试资产、依照公式(2.16)计算F-统计量并进行检验。
表4.8 异象的月均超额收益,滚动60个月窗口回归(%)
Panel A: 全部股票
| 异象变量 | 三因子模型 | 四因子模型 | ||
| α | t-值 | α | t-值 | |
| 市现率 | 0.27 | 0.59 | 0.45 | 0.73 |
| 净经营资产 | 0.77 | 1.54 | 0.74 | 1.54 |
| 总资产增幅 | 0.25 | 0.79 | 0.29 | 0.99 |
| 应计利润 | 0.44 | 0.85 | 0.33 | 0.62 |
| MAX | 0.22 | 0.35 | 0.12 | 0.17 |
| 1个月波动率 | -0.03 | -0.08 | 0.01 | -0.08① |
| 1个月异常换手率 | 1.14 | 1.39 | 1.21 | 1.42 |
| 12个月换手率 | 0.03 | 0.16 | 0.14 | 0.35 |
| 非流动性 | 0.53 | 1.70 | 0.73 | 2.42 |
| 反转 | -0.05 | 0.11 | -0.12 | -0.01 |
Panel B: 剔除市值最低的 $30\%$ 股票
| 异象变量 | 三因子模型 | 四因子模型 | ||
| α | t-值 | α | t-值 | |
| 市现率 | 0.21 | 0.49 | 0.29 | 0.48 |
| 净经营资产 | 0.82 | 1.58 | 0.71 | 1.43 |
| 总资产增幅 | 0.25 | 0.69 | 0.34 | 0.98 |
| 应计利润 | 0.43 | 0.85 | 0.45 | 0.86 |
| MAX | 0.16 | 0.25 | 0.04 | 0.04 |
| 1个月波动率 | -0.06 | -0.14 | -0.02 | -0.14 |
| 1个月异常换手率 | 1.25 | 1.71 | 1.15 | 1.41 |
| 12个月换手率 | 0.19 | 0.52 | 0.14 | 0.38 |
| 非流动性 | 0.56 | 1.75 | 0.59 | 1.90 |
| 反转 | 0.29 | 0.47 | 0.01 | 0.18 |
①由于表中汇报的 $\alpha$ 和 $t$ -值分别为多个回归的均值,因此当异象的超额收益接近零的时候,可能会出现 $\alpha$ 均值和 $t$ -值均值符号不一致的现象。当考虑全部股票时,1个月波动率异象在四因子模型下的超额收益,以及反转异象在三因子模型下的超额收益都是这样的例子。
由于本书考察的实证区间长达20年,因此作为稳健性分析,以下在GRS检验时也分别考虑了四个不同的时间段。它们为实证区间的前十年(2000/01/01至2009/12/31);实证区间的后十年(2010/01/01至2019/12/31);整个实证期(2000/01/01至2019/12/31);以及Liu et al.(2019)一文使用的区间(2000/01/01至2016/12/31)。首先来看考虑全部股票的情况。表4.10中的Panel A到Panel D分别给出了上述四个区间的GRS检验结果。
表4.9 $\alpha$ 检验结果,滚动60个月窗口回归
| Panel A: 全部股票 | ||||
| Avg. |α| (%) | Avg. |t-值| | #(|t-值| ≥ 2.0) | #(|t-值| ≥ 3.0) | |
| 三因子模型 | 0.37 | 0.76 | 0 | 0 |
| 四因子模型 | 0.41 | 0.83 | 1 | 0 |
| Panel B: 剔除市值最低的 30% 股票 | ||||
| Avg. |α| (%) | Avg. |t-值| | #(|t-值| ≥ 2.0) | #(|t-值| ≥ 3.0) | |
| 三因子模型 | 0.42 | 0.84 | 0 | 0 |
| 四因子模型 | 0.37 | 0.78 | 0 | 0 |
表4.10 GRS检验结果(全部股票)
| Panel A: 2000/01/01 ~ 2009/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 3.67(0.03) | |
| CHN-SMB/CHN-VMG | 4.24(0.01) | |
| Panel B: 2010/01/01 ~ 2019/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 0.81(0.44) | |
| CHN-SMB/CHN-VMG | 1.53(0.21) | |
| Panel C: 2000/01/01 ~ 2019/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 3.52(0.03) | |
| CHN-SMB/CHN-VMG | 0.83(0.47) | |
| Panel D: 2000/01/01 ~ 2016/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 4.65(0.01) | |
| CHN-SMB/CHN-VMG | 0.54(0.66) | |
括号内为 $F$ -统计量的 $p$ -值。
在第一个十年,两个模型互相无法解释对方。当使用LSL-SMB、LSL-HML以及LSLRMW为模型、CHN-SMB和CHN-VMG为资产时, $F$ -统计量为3.67,其 $p$ -值为0.03;当把二者调换位置之后, $F$ -统计量为4.24,其 $p$ -值为0.01。然而,与第一个十年截然不同的是,当考察实证期的后一个十年时,GRS检验结果显示两个模型可以互相解释彼此。 $F$ -统计量分别为0.81和1.53,均不显著。当考察整个区间时,这两个模型之间的表现分出了差异。Liu et al.(2019)使用市值和EP构造的CHNSMB和CHN-VMG因子能够很好地解释Liu et al.(2019)的三个风格因子( $F$ -统计量为0.83, $p$ -值为0.47)。而另一方面,当Liu et al.(2019)的三个风格因子被选为模型时,CHN-SMB和CHN-VMG两个资产联合起来可以获得显著的超额收益( $F$ -统计量为3.52, $p$ -值为0.03)。这个结论在最后一个实证区间,即2000/01/01至2016/12/31,同样得到了确认。从GRS检验结果来看,似乎Liu et al.(2019)三因子模型要优于Liu et al.(2019)四因子模型。然而,实证窗口内前后十年检验结果的差异值得更深入思考。
表4.11报告了前后两个十年内,上述五个因子的月均收益率和它们的t-值,从中可以得到一些有意思的发现。先来看Liu et al.(2019)中的三个风格因子。在第一个十年,以BM构建的价值因子非常显著,月均收益率高达 $1.35\%$ 。与之形成鲜
明对比的是盈利因子的月均收益仅有 $0.30\%$ ,非常不显著。此外,由于规模因子是通过综合使用市值与BM以及ROE(TTM)的分组构建的,因此其月均收益率也只有 $0.55\%$ ,也不显著。而在第二个十年内,由于A股市场结构发生的变化,市场变得越来越理性和有效,机构投资者的比例上升,盈利因子变得显著;但以BM构建的价值因子却不再“好使”。综合来说,在前后各十年里,Liu et al.(2019)的三个因子中总是“断了至少一条腿”。反观Liu et al.(2019)中的两个风格因子,它们在前后各十年里都非常显著。
表4.11 不同区间内因子月均收益率(%)
| Panel A: 2000/01/01 ~ 2009/12/31 | ||||
| CHN-SMB | CHN-VMG | LSL-SMB | LSL-HML | LSL-RMW |
| 1.00 | 1.06 | 0.55 | 1.36 | 0.30 |
| (2.16) | (3.13) | (1.19) | (4.28) | (0.81) |
| Panel B: 2010/01/01 ~ 2019/12/31 | ||||
| CHN-SMB | CHN-VMG | LSL-SMB | LSL-HML | LSL-RMW |
| 1.02 | 0.59 | 0.94 | 0.28 | 0.48 |
| (2.51) | (2.12) | (2.12) | (0.78) | (2.26) |
括号内为经Newey-West调整后的t-值。
由于A股市场中显著的规模效应,CHN-SMB在两个区间内均显著并不令人意外。而为了搞清楚为什么CHN-VMG也能一直显著,则需要回到 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 这个式子。这个关系说明EP和BM以及ROE高度相关。从它可以推断出,通过EP构建的价值因子CHN-VMG和通过BM和ROE(TTM)构建的价值LSL-HML以及盈利LSL-RMW因子有很高的相关性。从表4.4的Panel C给出的相关系数中,已经能够证实上述结论。为了进一步分析,图4.8给出了通过60个月滚动窗口OLS回归估计的CHN-VMG因子在LSL-HML和LSL-RMW上的暴露。从中不难看出,CHN-VMG在这两个因子上均有非常稳定且较大的暴露。回顾表4.11的结果,在实证期的前十年,LSL-HML的月均收益率很高;而在实证期的后十年,LSL-RMW则变得显著。得益于这两个因子在不同时期的表现以及CHN-VMG在这两个因子上持续的高暴露,CHN-VMG在整个二十年的实证期内的月均收益率是显著的,因为它始终反映出以BM代表的价值和以ROE代表的盈利两方面的风险溢价。毫无疑问,不同因子之间的相互关联,以及因子在不同时期的表现会影响GRS检验中 $F$ -统计量的取值,并最终产生了表4.10所示的结果。
表4.12给出了剔除市值最低的 $30\%$ 股票之后的GRS检验结果。在整个实证期内,两个模型可以相互解释,难分高下。但有意思的是,无论是单独考虑前一个十年还是后一个十年,根据GRS结果判断,四因子模型都是更好的模型。对于上述结果,可以使用类似的方法进行分析。出于对篇幅的考虑,书中不再进行更多的解读。
表4.12 GRS检验结果(剔除市值最低的30%股票)
| Panel A: 2000/01/01 ~ 2009/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 1.49(0.23) | |
| CHN-SMB/CHN-VMG | 4.31(0.01) | |
| Panel B: 2010/01/01 ~ 2019/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 1.43(0.24) | |
| CHN-SMB/CHN-VMG | 4.11(0.01) | |
| Panel C: 2000/01/01 ~ 2019/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 0.73(0.48) | |
| CHN-SMB/CHN-VMG | 1.99(0.12) | |
| Panel D: 2000/01/01 ~ 2016/12/31 | ||
| 测试资产模型 | CHN-SMB/CHN-VMG | LSL-SMB/LSL-HML/LSL-RMW |
| LSL-SMB/LSL-HML/LSL-RMW | 1.13(0.33) | |
| CHN-SMB/CHN-VMG | 1.11(0.35) | |
括号内为 $F$ -统计量的 $p$ -值。

图4.8 CHN-VMG对LSL-HML和LSL-RMW的暴露(全部股票)
综合本节 $\alpha$ 和GRS检验的结果,虽然能够从两个模型中选出一个优胜,然而以上花费了不少篇幅的论述则希望向读者传递以下两点信息。第一,实证资产定价的研究很容易踏入数据窥探的错误[6],即不同的实证窗口会出现不同的结果,人们
会有意或无意地选择有利于自己结论的实证区间进行分析。第二,就一个多因子模型到底应该包含哪些因子而言,正如Fama and French(2018)所倡导的那样,与在实证数据中谁更能解释谁相比,每个因子背后代表的经济学或金融学含义是否清晰、合理则重要得多。至于三因子和四因子模型中到底哪个更好,不妨留给读者去评判和选择。
[1]除三因子模型外,Liu et al.(2019)也通过加入换手率因子构建了四因子模型。由3.8节和4.2节的结果可知,换手率因子在A股市场十分显著,但本节暂不将其考虑在内。
[2]或者说更符合中国股市的实际情况。
[3]严谨地说,Liu et al.(2019)首先对传统BM指标进行了改造,在账面价值的基础上加入了研发费用(R&D)和销售及管理费用(SG&A)以更好地反映公司的估值,然后使用改进后的BM变量构建价值因子。由于这并非本节实证的重点,因此在本书中仍将使用传统的BM变量。
[4]Liu et al.(2019)一文于2018/07/02投稿,其实证区间止于2016/12/31,“幸运地”避开了规模因子失效的区间。
[5]关于将 $t$ -值阈值从2.0提高到3.0的原因,请见本书第6.1节。
[6]本书6.1节对此进行了解读。
4.4 多因子模型的简约性
从数学上来说,如果仅以能否解释异象来评判多因子模型的能力,那么随着人们在时序回归的右侧加入越来越多的因子——即模型包含越来越多的因子,该模型一定能够(在实证区间内)解释越来越多的异象。但从本章介绍的七个多因子模型来说,它们的因子个数均在3到5个之间,都是非常有限的。这背后遵循的就是简约性原则(The Law of Parsimony)。
虽然在不同多因子模型中,因子个数的差异不大,但有些因子的构建用到了大量的变量。更多的变量意味着模型更高的复杂度,而这也造成了因子模型解释力度上的差异。在2018年美国金融协会年会上,Daniel et al.(2020)的作者之一Lin Sun报告了Daniel-Hirshleifer-Sun三因子模型,并探讨了模型复杂度和模型解释异象的效果之间的关系,颇有新意。为此,他们提出了两个简约指数(记为简约指数I和简约指数II),通过惩罚因子个数以及用来构造因子的变量个数来计算模型复杂度。
其中,简约指数I的定义为:
简约指数 $\mathrm{I} = 0$ -模型中所有因子用到的全部变量之和 (4.44)
在上述定义中,有两点值得特别说明。第一,由定义可知简约指数I的取值为负,其数值越接近零说明模型越简单,其数值越低说明模型越复杂。第二,如果一个变量被用于模型的多个因子中,则需要多次计算它,而非仅仅计算一次。
举个简单的例子,Fama-French三因子中包含市场、规模和价值三个因子。市场因子是市场组合的超额收益,无须任何变量,因此对简约指数I没有贡献。规模和价值因子分别采用市值和BM双重排序构建,即这两个因子都用到了上述两个变量。按照式(4.44)的定义,市值和BM都将被计算两次。最终,市场、规模和价值三因子用到的变量分别为0、2和2,因此Fama-French三因子模型的简约指数I为-4。再来看一个复杂一些的例子,在Stambaugh-Yuan四因子模型中,两位作者分别使用市值以及11个异象变量(共12个变量)构建了规模、管理和表现因子。其中,管理因子用到了市值和6个异象变量(一共7个变量),表现因子用到了市值和5个异象变量(一共6个变量),而规模因子则用到了市值和全部11个异象变量(一共12个变量)。最终,Stambaugh-Yuan四因子模型的简约指数I为-25=(0-0-12-7-6)。
再来看看简约指数II,它的定义为:
在上述定义中,同样有两点值得注意。其中第一点和简约指数I的第一点相同,即简约指数II的取值也为负,其数值越接近零说明模型越简单,其数值越低说明模型越复杂。第二点则和简约指数I不同。在计算中,即使一个变量被用于模型的多个因子中,它也仅会被计算一次,而非多次。回顾Fama-French三因子模型和Stambaugh-Yuan四因子模型两个例子,前者包含市场、规模和价值三因子,使用了市值和BM两个变量,因此其简约指数II为-5。反观后者,它包括市场、规模、管理和表现四个因子,使用了市值和11个异象变量,因此其简约指数II为-16(=0-4-12)。
表4.13列出了本章介绍的七个多因子模型的两个简约指数。为了考察模型复杂度和模型解释力度的关系,Lin Sun使用CAPM以及上述模型检验了34个异象,并以0.05显著性水平下异象个数作为模型解释力度。图4.9绘制了显著异象个数和简约指数的关系。
从图4.9中可以清晰地看到,随着模型复杂度的提升(表现为简约指数I或II的取值更小),模型的解释力度上升(体现为0.05显著性下的异象变少)。这个结论符合预期,它也再次强调了不同因子模型之间的好坏并无定论。人们总能通过增加模型复杂度来提升模型(样本内)的解释效果,因此需要在模型复杂度和样本内的解释力度之间取舍。在简约法则的指导思想下,一个优秀的多因子模型应通常有较少的因子,此外构建这些因子所需要的变量个数也不应该太多,而使用者则应该尽可能搞清楚每一个因子背后代表的风险。6.2.3节将进一步阐述不同多因子模型之间的比较。
表4.13 4.1节介绍的多因子模型的简约指数
| 模型 | 简称 | 简约指数Ⅰ | 简约指数Ⅱ |
| Fama-French 三因子 | FF3 | -4 | -5 |
| Carhart 四因子 | C4 | -6 | -7 |
| Novy-Marx 四因子 | NM4 | -9 | -9 |
| Fama-French 五因子 | FF5 | -10 | -9 |
| Hou-Xue-Zhang 四因子 | HXZ4 | -9 | -7 |
| Stambaugh-Yuan 四因子 | SY4 | -25 | -16 |
| Daniel-Hirshleifer-Sun 三因子 | BF3 | -4 | -6 |

图4.9 多因子模型复杂度和0.05显著性水平下异象个数
