第7章 因子投资实践
本章共分为8节,从不同角度系统地解读业界的因子投资实践,为读者更好地进行因子投资打下坚实的基础。其中7.1节、7.2节和7.3节将分别从收益率模型、风险模型和投资组合优化三个部分阐述主动管理中如何利用多因子模型作为一个量化工具(quantitative tool)来获取超过基准的收益。这三部分是所有关于因子投资材料的必备内容。本章的亮点包括以下几方面。
7.1节首先通过对术语的解读,阐明了业界常挂在口边的“阿尔发因子”和学术界的多因子模型式(1.3)之间的关系。在此基础上,对如何筛选优秀的预测变量进行了系统的说明。7.2节的内容关注风险模型。除了在截面上预测预期收益率,多因子模型的另一个作用是在时序上研究股票收益率的波动,并通过降维方便地求出股票的协方差矩阵。这部分内容以著名的Barra模型为例,成体系地阐述如何构建一个优秀的风险因子模型,从而在事前准确地预测股票收益率的协方差矩阵。接下来,7.3节将目光转向投资组合优化。业界无论是公募还是私募、无论是买方还是卖方,各家都有自有(proprietary)收益模型,而对于风险模型则一般使用现成的商业模型。由于收益模型和风险模型中的因子不同,造成了两个模型之间的错位。如果不加处理,那么这种错位将导致投资组合优化给出错误的结果。关于错位问题,海外业界在近年来提出了很多修正方法,然而却尚未得到国内的重视。本节的介绍将填补这方面的空白。除此之外,7.3节还将说明不同目标函数之间的等价条件,让读者在选择不同的目标函数时能够有据可依。
7.4节将非常细致地介绍因子指数和Smart Beta投资的相关内容。如果说将多因子模型视作量化工具是主动管理人获取超额收益的法宝,那么Smart Beta的普及毫无疑问是普通投资者享受因子投资盛宴的利器。因为无论是通过复杂数学模型和优化得到最优的投资组合,还是仅仅通过排序法透明、低成本地复制因子投资组合,其本质都是利用了因子预测股票收益率的能力。学术界几十年来关于因子和异象的研究为Smart Beta的蓬勃发展奠定了坚实的基础。
接下来的7.5节将介绍一个“烫手的山芋”——因子择时。进行因子投资,因子择时是一个绕不开的话题。但大量基于实证数据的研究表明,样本外因子择时成功(即战胜等权重配置)的难度都非常高。因此,本节的目标并非不切实际地告
诉读者某种择时的“独门绝技”,而是把研究因子择时的体系娓娓道来,供读者参考。
除了获取更高收益或控制风险外,多因子模型的另一个重要作用就是分析主动投资的业绩表现。在多因子模型普及之前,这个任务似乎无法可依,然而多因子模型的出现让它迎刃而解。7.6节和7.7节将分别以风格分析和风险归因为研究对象,说明如何使用多因子模型对主动投资业绩的收益率和风险进行归因,这有助于投资者了解和掌握一支基金的投资风格和风险控制水平。
本章的最后一节是对因子投资的展望,包括两部分内容。7.8.1节将介绍近年来非常火的一个概念:另类数据。随着量价和财务数据被过度使用,很多因子的表现变得越来越不尽如人意。这使得人们将目光转向了潜在的新的收益源,即另类数据。然而另类数据真的像人们想象的那样是一片蓝海、“即插即用”吗?本节将会给出讨论和思考。最后7.8.2节将介绍如何使用因子进行大类资产配置。随着对因子和资产关系理解的加深,业界现已普遍认为不同大类的资产(例如股票、债券、商品、外汇、房地产等)的收益率背后都是由底层的一些公共因子所驱动的。因此多因子模型的研究可以被完美地应用于大类资产的配置中,并从资产配置思维转变到因子配置思维。这就是7.8.2节要讨论的问题。
7.1 收益率模型:获取“阿尔法”
在使用多因子模型作为量化工具来获取超额收益的实践中,收益率模型是最重要的模块。顾名思义,收益率模型就是为了预测收益率。业界很多量化研究员的主要工作正是集中于此。本节的目标就是把开发收益率模型时应注意的问题阐释清楚。
7.1.1 基本术语
在正式开始介绍之前,有必要阐明接下来要用到的基本术语。收益率模型的作用是预测股票的收益率,从而获得超过基准的超额收益。在主动投资中,通常把全市场指数或者某个宽基指数的收益率选为基准。开发收益率模型的目标就是找到能够预测股票收益率的变量,这些变量往往是通过股票的量价或者财务数据计算的指标。在海外业界,这些变量有一个贴切的名字:return predictors,即收益率预测变量。由于收益率模型的作用是获得相对基准的超额收益,而超额收益通常由 $\alpha$ 表示,因此国内业界有时也把这些预测变量称为“阿尔法因子”。然而,在本书基于式(1.3)的统一视角下,“阿尔法因子”这个称呼是不准确,甚至错误的,其中存在两个问题。
为了说明这两个问题,考虑以下的例子。第一,由于和收益率呈正相关,账面市值比(BM)常被拿来作为预测变量放在收益模型中。第二,特质性波动率异象[1]的收益率无法被定价模型解释。因此,特质性波动率(IVOL)也是一个优秀的预测变量。在这两个例子中,BM和IVOL都是业界口中的“阿尔法因子”。
下面来看第一个问题。首先,在本书围绕式(1.3)的统一视角下没有“阿尔法因子”这个概念。而如果将“阿尔法因子”拆成“阿尔法”和“因子”两个词,它们在本书的术语中指的也并非预测变量。回到上述例子。BM是构建价值因子的变量,使用它构建的投资组合是价值因子;IVOL是构建特质性波动率的变量,通过它构建的投资组合是特质性波动率异象。根据1.1.3节的说明,价值因子被称为定价因子,特质性波动率异象则被称为异象因子,而BM和IVOL分别是构建这两个因子的变量。学术界在实证资产定价研究中会严谨地区分这两类因子,且会区分因子和构建因子的变量。由于本书的术语遵循了学术界的惯例,因此“阿尔法”或“因子”在本书的术语中代表的是异象或者因子这些投资组合,而非它们背后的变量。这和业界使用“阿尔法因子”指代变量不同。
再看第二个问题。回顾BM和IVOL的例子,前者是构建价值因子的变量,而后者是构建特质性波动率异象的变量。这两个例子说明收益率预测变量既可以对应式(1.3)右侧的 $\beta^{\prime} \lambda$ 部分(如BM),又可以对应式(1.3)右侧的 $\alpha$ 部分(如
IVOL)。而“阿尔法因子”由于强调“阿尔法”,似乎仅仅对应α部分,而忽略像BM这样也能够预测股票收益率的变量,但这显然不是业界的做法[2]。业界关心所有能够预测股票收益率的变量(无论它们在学术界看来是一个因子变量还是一个异象变量),因为只要某个变量能够区分高收益和低收益股票,就可以通过它来选股并获取超额收益。
总结一下上述讨论。第一,本书遵循学术界的惯例,因此“阿尔法”和“因子”指代的是异象和因子投资组合,而非它们背后的变量;反观业界使用“阿尔法因子”则是指代变量。第二,在式(1.3)的视角下,收益模型中的预测变量既可以是异象变量(对应 $\alpha$ ),又可以是因子变量(对应 $\beta'\lambda$ ),而“阿尔法因子”一词有强调“阿尔法”即异象变量之意。基于上述原因,下文将不会使用“阿尔法因子”这个称呼,而是使用(收益)预测变量表示收益率模型的研究对象。
其实,哪种术语惯例更好是见仁见智的问题。以上的讨论并非强调学术界的术语比业界的称呼更合理,反之亦然。然而,由于因子投资包含的内容十分丰富,研究和实践因子投资的人更是数不胜数,因此一个人口中的“因子”未必是另一个人口中的“因子”。本节一开篇之所以花费不小的篇幅强调术语,是希望帮助刚接触因子投资的读者厘清不同的概念和定义,使读者在学习因子投资时不因术语的杂乱而困惑。
7.1.2 寻找预测变量
寻找收益率预测变量是主动管理的核心所在。在业界,量化研究员的主要工作就是开发“阿尔法”模型,除了维护已有的预测变量,还得不断学习、与时俱进,不断寻找新的预测变量。在这方面,可以从以下三个方面入手:发现新异象、改进已有预测变量以及使用另类数据。
第一个方向,从常见的行情数据和公司财务出发,寻找尚未被发现的变量。这类尝试在二三十年前相对容易,如今随着异象挖掘越来越深入,要找到全新的异象愈发困难,这从近年来讨论新异象的论文越来越少也可以看出端倪。
第二个方向,改进已有预测变量。很多时候,已有的变量虽然有效,但在构造方法上仍存在提升和优化空间。例如,6.7.4节讨论的ROA,可以将其分解为效率和效用两部分,从而提升异象的收益率。另外还有一些变量,随着社会和经济的发展慢慢变得不再合理,因此也需要改造。这其中最典型的例子要数BM。很多新经济(如很多科技公司)投入大量的研发费用,但它们并没有体现在净资产中;同理,广告支出对公司商业形象和未来收入会产生持续影响,也没有考虑进净资产。因此,对BM的一个改进思路就是将广告和研发支出加回净资产,以它们的总和作为分子计算BM。改进后的BM变量比起原始BM能够获得更高的超额收益(Liu et al.2019)。
第三个方向,利用另类数据,寻找尚未被开垦的宝藏。传统的量价数据和财务数据,已经被挖掘到了山穷水尽的田地。受益于数据存储和计算的快捷,研究员们将目光投向了另类数据。另类数据的含义非常宽泛,只要和传统数据不同,只要可能存在新的信息,均会受到重视。常见另类数据包括交易社区数据、微观数据、ESG数据[3]、电商数据以及卫星和气象数据等,本书7.8.1节将会对另类数据
做更多讨论。以ESG数据为例,它从环境、社会和公司治理等角度关注具有长期可持续发展的公司,近年发展迅速,越来越受到投资者的青睐。
7.1.3 挑选预测变量
随着数据的丰富和计算的廉价,越来越多的预测变量被挖掘出来[4]。然而,预测变量的个数也并非越多越好,且也并非越复杂越有用。是否将一个新的预测变量纳入已有的收益率模型,需要一套合理且明确的标准。理想的收益预测变量应满足以下六大标准:逻辑性(intuitiveness)、持续性(persistence)、信息增量性(information increasement)、稳健性(robustness)、可投资性(investability)和普适性(pervasiveness),它们的具体解释见表7.1。从想法产生到进入应用,只有满足上述六个条件,才可能成为一个有用的预测变量。
表7.1 收益预测变量应满足的六个标准
| 标准 | 定义 |
| 逻辑性 | 要有合理的逻辑,无论是从风险视角,还是从行为金融学视角 |
| 持续性 | 有效且长期有效,即使被公开发表,也并未失效 |
| 信息增量性 | 要有差异性,不能被已有的预测变量解释,能够对预测收益率带来独立的信息增量 |
| 稳健性 | 定义对参数不敏感,经得起稳健性检验 |
| 可投资性 | 收益不能只停留在纸面上,应具有较高可投资性,交易成本可控 |
| 普适性 | 广泛存在于不同的资产类别或不同国家的同一类资产中 |
1. 逻辑性
由于多重假设检验的问题(6.1.5节),有时仅凭运气也能针对历史数据(也称为样本内数据)找出一些看上去能够预测收益率的变量,然而它们在样本外却不再有效。为了降低甚至是排除这种干扰,逻辑性就是寻找预测变量时最重要的标准。如果没有底层的逻辑,再漂亮的结果都没有灵魂。
根据学术界多年的研究可知,预测变量背后的逻辑可以从风险补偿和错误定价两方面解释。前者是经典金融学的角度,认为如果一个异象能够获得超额收益,它有可能承担了某种(未知)的系统性风险,而超额收益是对风险的补偿。后者从行为金融学的角度,认为人的行为偏差以及套利限制的综合作用导致错误定价的出现,且不会迅速消失。如果从上述两个方面都无法解释,那么某个预测变量很可能仅仅是针对样本内的数据窥探导致。至于如何检验该变量的原因是风险补偿、错误定价还是数据窥探,6.5节进行了详细的介绍。
2.持续性
仅有理论逻辑并不够,还要看实证数据是否支撑该理论。如果通过实证分析发现该变量确实能够预测未来收益率,那么它就是有效的。例如,很多针对美股研究出来的预测变量到了A股都出现了水土不服的现象。这背后很大程度上和两国股市中投资者结构不同有关。因此,实证结果能否支撑逻辑至关重要。在评价有效性时,常用的步骤包括:IC测试、投资组合排序法以及发表前后检验等。
IC是Information Coefficient的缩写,其中文名为信息系数,是主动管理领域最喜欢用的指标。IC衡量预测变量的预测能力,其定义通常为 $t + 1$ 时刻的预测收益率与真实收益率在截面上的相关系数。在实际应用中, $t + 1$ 时刻的预测收益率往往由 $t$ 时刻的预测变量代替,因此IC的定义为 $t$ 时刻预测变量和 $t + 1$ 时刻股票收益率在截面上的相关系数[5]:
$$ \mathrm {I C} = \operatorname {c o r r} \left(z _ {i t}, \mathrm {R} _ {i t + 1}\right) \tag {7.1} $$
式中 $z_{it}$ 为 $t$ 时刻股票 $i$ 的预测变量取值, $R_{it+1}$ 为该股票在 $t+1$ 时刻的收益率。IC衡量了预测变量所含的未来收益率信息含量,由定义可知其取值范围是-1到1,绝对值越高表示预测能力越强。根据经验研究,若按日频收益率来评价,IC高于 $2\%$ 就是优秀的预测变量。除了看IC绝对值,其他相关的指标还包括信息率(Information Ratio,IR)、IC绝对值大于 $2\%$ 的比例和IC的 $t$ -值等,详细计算见表7.2。
表7.2 与IC相关的评价指标
| 指标 | 计算方法 | 含义 |
| IC | corr(zit,Rit+1) | 变量信息含量 |
| IR | IC均值/IC标准差 | 预测能力的稳定性 |
| |IC|≥2% | IC序列绝对值大于2%的比例 | 预测能力强弱 |
| t-值 | IC均值的t-值 | IC是否显著 |
投资组合排序法是学术界构建并检验异象的常见手段,因此它自然而然地被业界拿来检验预测变量。使用预测变量作为排序变量,通过单变量或者和其他控制变量一起进行多重排序、构建投资组合。之后通过时序回归检验该组合能否获得相对基准模型的超额收益,如果答案是肯定的,那么就称该预测变量有效。本书2.4节对此有过详细讨论,故不再赘述。最后,预测变量虽然可能在样本内有效,但其在样本外失效风险也值得警惕。每个能够预测未来收益率的变量都代表着市场在某方面的非有效性,如果使用该变量的人越来越多,市场在这方面就会越来越有效,导致该变量失效。
3. 信息增量性
在收益率模型中,预测变量的多少并非必然的追求,最重要的是检验每一个变量是否对于预测未来收益率有增量信息。当一个新的变量被挖掘出来后,如果逻辑上讲得通且有效性也不错,那么它能否带来增量信息就是下一个衡量标准。在这方面,变量相关性、条件排序以及Fama-MacBech回归都是常见的方法。
变量相关性指的是不同预测变量之间的相关系数。如果新的变量和已有变量相关性很低,表明它可能特立独行,因而更有可能提供增量信息。相反,如果它和已有的变量相关性很高,那么其很可能只是一个“影子”罢了。条件排序指的是2.1.3节介绍的条件双重检验,它也是十分常用的方法。首先按照某个已有变量将股票分组,再针对每组内的股票使用新的预测变量将股票分组,考察在控制了第一排序变量之后,新的预测变量能否预测股票的收益率。当然,条件双重排序虽然简单直观,但它的不足是只能同时考虑两个变量。为了同时考虑多个变量,可采用2.2.4节介绍的Fama-MacBeth回归。它可以同时控制多个已有变量的影响,检验新的预测变量对预测收益率的增量贡献。如果新的预测变量的回归系数非常显著,那么它就是一个好的预测变量。
从变量之间的相关性还能够引出业界的另一种常见处理方式——正交化(或中性化)。考虑两个相关的变量 $A$ 和 $B$ ,且变量 $A$ 是一个优秀的预测变量,而变量 $B$ 虽然能解释股票收益率的波动但通过它选股却无法获得超额收益[6]。这二者之间的相关性使得用 $A$ 预测股票收益率时会受到 $B$ 的影响。由于 $B$ 对于预测收益率没有贡献,因此人们希望把它对 $A$ 的干扰排除,这时就会对 $A$ 进行正交化处理。在股票截面上以 $B$ 作为解释变量,以 $A$ 作为被解释变量进行回归,得到 $A$ 的残差并用残差代替原始变量 $A$ 作为预测变量。由于 $A$ 的残差与 $B$ 正交,因此利用它预测收益率时便不再受到 $B$ 的影响。在业界的因子投资中,通常使用行业哑变量和市值变量作为风险因子变量,将原始预测变量进行正交化处理,得出的残差被称为行业和市值中性的预测变量。
4. 稳健性
稳健性衡量的是预测变量对构造方法或参数是否敏感,以及在不同的实证区间内表现是否一致。在不改变预测变量逻辑的前提下,若重新定义构造方法,或者改变研究区间,它均能显著地预测收益率,那么则称其稳健性很好。相反,如果预测结果大相径庭,说明该变量十分脆弱。稳健性检验主要从三个角度入手:参数、算法和样本。
参数指的是在定义变量时所采用的设定。以动量变量为例,学术上常用过去12个月的收益率(剔除最近1个月)作为选股的变量。在这个定义中,12就是一个参数设定。假如将12换成13或是11,如果动量变量在新的参数下表现差异不大,就说明其稳定性好。但如果参数稍微改变就导致预测性的大幅变化,这时就有理由怀疑挖掘变量时是否过拟合了。算法指的是对同一个变量的不同计算方法。仍以动量变量为例,常见的定义是使用原始的收益率计算动量。如果把它换成风险调整后收益就相当于改变了计算方法。稳健性好的预测变量在不同算法下应该有相似表现。最后,样本指的是将整个研究区间划分成不同的子区间,在不同的区间下进行测试。划分样本有多种方式,例如可以按10年为窗口划分区间,也可以按照商业周期划分样本,还可以按变量被发表前后分为样本内和样本外。一个优秀的预测变量在不同区间内的表现虽然存在差异,但总体来看都有不俗的表现。
5. 可投资性
业界同仁总爱用“阿尔法只存在于论文中”这样的话来调侃学术界找到的各种异象。这背后折射出的现象是:从研究异象到最终在实际交易中获取超额收益,这之间还需要有一大步要走。想要把纸面上的收益转化为真实的实盘收益,必须考虑信息衰减、换手频率以及交易成本等几个问题。
正如新鲜的食物具有保质期,一旦过了期限口感和营养就开始下降一样,变量预测未来收益率的能力也具有时效性。随着时间的流逝,其信息含量不断衰减,预测能力也越来越差。变量的信息衰减,又叫信息时间尺度(information horizon),反映了预测变量固有的行为特征。为了衡量其衰减速率,Grinold and Kahn(1999)定义了半衰期指标,即信息衰减一半时所需要的时间。在实际应用时,以IC衡量变量的信息含量,计算t时刻变量值 $z_{it}$ 和滞后s期收益率 $R_{it + s + 1}$ 之间的IC。滞后IC下降到原始IC一半所用的时间即为半衰期。从数据来源上来看,基于高频量价数据构造的预测变量有效期较短,而使用财务数据构造的基本面变量的保质期则更长。信息衰减决定了使用该变量交易时的换仓频率和策略容量。一般来说,衰减速度快往往需要较高的换仓频率,才能追上衰减的速度并有效利用变
量的预测能力。然而这么做的代价是很高的换手率。除非收益非常可观,否则往往难以覆盖由此造成的高昂的交易成本。另外,对于衰减快的预测变量,就算其获取的超额收益能够覆盖成本的损耗,其容量往往也较低,难以承受较大的资金量。在实际投资中,需要在信息利用效率和调仓频率之间权衡。
除了信息衰减,同样需要考虑的还包括市场冲击成本。如果新变量选出来的股票流动性很差,则隐形的冲击成本就会比较高,造成超额收益看得到却拿不着。在这方面,比较典型的就是Amihud(2002)计算的非流动性指标(IILIQ),它看起来让人兴奋,实则很难交易。ILLIQ可以理解为单位成交额对应的涨跌,可以用来衡量股票的流动水平,其值越大,流动性越差,能获得的非流动性溢价也就越高。
6. 普适性
普适性是考察预测变量的最后一个标准。具有普适性的变量能够经受起不同市场的检验,广泛存在于各个国家和资产类型中。这其中的优秀代表要数价值和动量。Asness et al.(2013)在美国、英国、日本、欧洲等成熟股票市场,以及股票、债券、商品期货及外汇等资产类型中,均发现了明显的价值和动量效应。
7.1.4 收益率预测
一旦有了预测变量,接下来就是通过它们预测收益率,并最终选股。这个过程涉及的步骤包括确定投资范围、剔除预测变量异常值和预测收益率几部分。在预测收益率时又包括非参数化预测和参数化预测。下面依次说明。
1. 确定投资范围
投资范围的确定包括原始股票池和优化股票池两步。原始股票池限定了最原始的投资范围,指明可供选择的股票有哪些。普通投资者在选择股票时几乎不受限制,只要在相应的板块开了股票账户,便可以交易任何一支股票,因此普通投资者的投资范围是全市场。但对于行业基金产品,例如医药基金,其选股范围只能限制在医药行业内,因而便买不了、也不会买其他行业上市公司的股票。最后,对于指数增强产品来说,例如中证500增强基金,其投资范围就天然限定了在中证500指数的成分股中挑选股票,如果买入了沪深300指数的成分股,便被视作越线。常见的原始股票池范围如表7.3所示。
表7.3 原始股票池范围
| 投资范围 | 举例 |
| 全部A股 | 沪深两市主板、中小板、创业板和科创板股票均可交易 |
| 指数成分股 | 中证500指数成分股和沪深300指数成分股 |
| 行业成分股 | 医药类股票、房地产类股票和国防军工类股票 |
确定了原始股票池后便进入第二步,对其进行优化。在初始投资范围的基础上,为了防止掉坑踩雷,通常会进一步剔除掉有缺陷的股票(黑名单),得到更加干净的股票池子。从黑名单的来源上,可以分成三类:低流动性股票、高风险
股票和大概率跑输股票。
首先来看低流动性股票。一般来说,在控制其他因素后,股票收益率会随着流动性的降低而增加。也就是说,如果愿意承担流动性风险的话,会获得非流动性溢价(Amihud 2002,Pastor and Stambaugh 2003)。但是流动性差的股票冲击成本高,市场容量有限,并不适合机构资金运作。因此,很多投资机构将非流动性视为一个风险因子,在构造组合时将流动性极低的股票剔除。举例来说,中证指数在很多指数编制方案中都引入了流动性剔除规则(见表7.4)。
再来看看高风险类股票,这类股票在3.1节有所提及,包括待退市股、风险警示股、净资产为负股以及次新股。由于上述股票潜在的风险较大,可能带来巨大亏损,因此在指数编制时需要剔除,基金合同中也明令禁投。除了这些常见的高风险标签之外,投资者也可以自行定义其他高风险类股票,例如“高商誉类股票”和“高负债股票”等。
最后,长期大概率跑输大盘的股票,即具有负的超额收益率,可以在选股时事先剔除。根据经验,有三类股票应该给予考虑,它们是:从量价交易特征上看,具有高短期动量、高换手率和高波动的股票(即投机股);从公司基本面上来看,估值高而盈利差的股票(即低性价比股);从事件驱动角度看,发生持续负向风险事件(如股东减持和财务造假等)的股票。
表7.4 中证指数编制方案中对流动性的规定
| 指数 | 举例 |
| 中证沪港深红利低波动指数 | 对非ST、*ST股票以及非暂停上市A股股票,按照最近一年(新股为上市以来)的A股日均成交金额由高到低排名,剔除排名后20%的股票 |
| 中证中信稳健成长策略指数 | 过去60个交易日的日均成交金额不低于1000万元 |
| 中证港股通红利低波动指数 | 剔除样本空间内过去一年日均成交金额低于4000万港元的股票 |
| 中证香港质量成长指数 | 过去一年日均成交金额大于2000万港元 |
2. 剔除预测变量异常值
不同的预测变量暗含了不同的信息,数值差异越大表明信息差异越大。但需要警惕的是,变量值只是股票某一个特征的代理变量,应满足一个合理的分布区间。在计算时由于数据质量问题和计算方式的选择,可能会造成异常值,给后续研究带来干扰。这时就需要对预测变量在股票截面上的异常值进行处理。这么做的目的一方面是为了排除数据错误,另一方面让数据的分布更加均匀。剔除异常值的方法较多,常见的有缩尾法、三倍标准差法和中位数法。
缩尾法(winsorization)最简单也最常见,是学术论文中应用最为普遍的方法。缩尾法又被称为固定比例法,即按照变量从小到大进行排序,将小于 $p\%$ 分位数和大于 $1 - p\%$ 分位数的指标值剔除(或者用临界点值替代)。缩尾法虽然简单易用,在学术论文中也是标准方法,但依然存在较多缺陷。首先,对于某些指标(如异常换手率),异常值并不常见,强行使用缩尾法会将原本合理的数据删除。其次,对于异常值很多的指标,如果临界点取得较小,会造成异常值剔得不干净。最后,对于分布不对称的指标,异常大和异常小数量差异较大,因而在分布的左尾和右尾采用同样百分比确定临界值也不恰当。
另一种常见的方法是三倍标准差法。在概率分布中,标准差反映了分布的离散程度。对一个满足正态分布的随机变量而言,其取值落入均值左右一倍标准差内的概率是 $68.3\%$ ,落在两倍标准差内的概率是 $95.4\%$ ,落在三倍标准差内的概率是 $99.7\%$ 。因此随机变量的取值落在三倍标准差之外的概率非常小,不足 $0.3\%$ 。受到上述启发,均值方差法将距离均值超过 $3\sigma$ 视为小概率事件,若取值满足这一条件,则被视为异常值。均值方差法比较直观易懂,考虑了数据的波动情况,在数据满足正态分布或者接近正态分布时,具有较好的识别异常值效果。然而,正所谓“成也萧何,败也萧何”,当数据偏离异常值较大时,均值方差方法可能就会出现偏差,难以达到理想的效果。除此之外,由于均值和方差在计算时本身也会用到全部样本数据,即异常值会影响均值和标准差的计算。若部分异常值特别大,导致 $\sigma$ 值很大,则距离均值 $\pm 3\sigma$ 的范围就会很宽,造成看起来是异常值但却无法识别到的窘境。
最后一种常见去异常值的方法是绝对中位差(median absolute deviation,简称MAD)法。考虑到样本均值和标准差不够稳健,容易受到异常值的影响,因此将均值用中位数代替,将标准差用绝对中位差代替,这样就得到了MAD法。中位数(Median)又称中值,是按顺序排列的一组数据中居于中间位置的数,它不受数据分布的极大或极小值影响。令 $X_{i}$ 代表股票 $i$ 的某预测变量的取值,令 $X^{\mathrm{m}}$ 代表 $X_{i}$ 的中位数,则绝对中位差(MAD)的定义为:
$$ \mathrm {M A D} = \text {m e d i a n} \left(\left| X _ {t} - X ^ {m} \right|\right) \tag {7.2} $$
该式的含义是,用原数据减去中位数后得到新数据序列,然后将该序列取绝对值后再找出中位数即为MAD。一般来说,在描述数据离散程度时,标准差和MAD并非1比1的关系,因此需要给MAD乘以一个系数。考虑到当随机变量服从正态分布时,1标准差约为1.4826倍的绝对中位差,因此将式(7.2)中的MAD乘以系数1.4826得到最终的偏离幅度,记为 $\mathrm{MAD_e}$ 。对于任意 $X_i$ ,如果它偏离中位数 $X^m$ 的距离(左右两侧)超过 $3 \times \mathrm{MAD_e}$ ,则被称为异常值,需剔除或用 $X^m \pm 3 \times \mathrm{MAD_e}$ 之一代替。相比于均值和标准差,无论是中位数和绝对中位差都更能适应数据中的异常值,少量的异常值不会干扰到异常值的识别,从而提高异常值的识别准确度。但是当异常值较多时,这种方法也仍然会出现识别盲区,无法排除所有异常值。
3.非参数化预测
一旦选定了股票池并剔除了预测变量异常值之后,接下来就使用预测变量选股。首先来看非参数化预测的方法,包括条件选股和排序打分两种。由于这两种方法对于变量和收益率之间的具体关系不做假设,而仅是利用二者之间的单调相关性,故而称为非参数法。
条件选股法非常常见,大多数量化平台和行情软件都提供该功能模块。条件选股只需要简单的两步:(1)确定预测变量(即选股指标,例如BM、ROE和EPS变化率等);(2)对于每一个变量,设定一个筛选条件(例如BM>0.5和EPS变化率>10%),选出所有满足条件的股票。举个例子,假设投资者想要买入“估值低并且盈利强”的股票,并使用BM和ROE分别作为衡量价值和盈利的变量。在每个月月末,用如下两个条件进行筛选:(1)BM>1/3;(2)ROE(TTM)>10%。选择出来的股票等权重持有并每月调仓。在不考虑成本的情况下,该选股策略的累计收益率如图7.1所示。

图7.1 以BM和ROE(TTM)为变量条件选股的累计收益率
条件选股法简单直接,许多传奇基金经理的选股方法均可描述成条件选股[7],但它的不足也很明显,在使用时需要注意以下问题。第一,选股条件不能过多或过少。若条件太多,满足所有条件的股票可能很少甚至不存在;若条件太少,筛选出来的股票又太多,对资金少的投资者来说会在交易层面造成困难。第二,条件选股往往造成持股数量在时序上非常不稳定。第三,由于需要给每个预测变量设置一个阈值,因此发生过拟合的可能性较高。第四,非参数化的条件选股结果往往难以和投资组合优化模型相融合,因而无法实施更精确的组合管理和风险控制。
另一个非参数化预测方法是排序打分法。在该方法中,使用每个预测变量分别对每只股票排序,排序时遵循“排名和预期收益正相关”的原则,因此排名靠前的股票得分高,未来预期收益率也更高。按照每个变量排序后,将所有变量上的得分加总便得到股票的总分,并从中选出总分最高的 $N_h$ 支。依然以BM和ROE(TTM)为预测变量,在每月月末选择总分最高的50支股票等权重配置。该方法的累计收益率如图7.2所示。
排序打分法能较好地解决条件选股法的缺陷。它能同时考虑多个指标,且选股数量能够保证稳定和可控,参数过度拟合嫌疑也更低。其缺点是基础的排序打分法假定每个变量的权重相同,不考虑预测变量预测能力的差异以及预测能力的变化。同样的问题在条件选股法中也依然存在。确定预测变量之间的权重属于因子择时的范畴,将在7.5节讨论。

图7.2 以BM和ROE(TTM)为变量、采用排序打分法选股的累计收益率
4. 参数化预测
除上述非参数化方法,线性回归模型也常被用于收益率的预测。在线性回归模型中,解释变量是预测变量,而被解释变量则是股票收益率。由于不同的预测变量量纲不统一(比如BM和对数市值),因此通常先对每个预测变量进行标准化处理,得到标准化得分。该得分通常被称为Z-Score[8],其计算公式为:
$$ \mathrm {Z - S c o r e} = \frac {\text {变 量} - \text {变 量 均 值}}{\text {变 量 标 准 差}} \tag {7.3} $$
其中变量均值和变量标准差均使用t期股票池中的所有股票在该变量上的取值计算,因而是截面统计量。得到单预测变量的标准化分数后,就可以构建回归模型预测收益率了。由于通常使用多个预测变量,因此在回归时也有两种处理方式。第一种方式是将所有变量加总,使每支股票得到一个综合得分,然后用该综合得分作为解释变量并通过一元回归来预测收益率。第二种方式则是将不同的变量视作多个解释变量,通过多元回归来预测收益率。这两种方法各有千秋,但一元回归由于其简单和易于理解,因而被更广泛地用在投资组合优化中(Chincarini and Kim 2006)。
为进行一元回归,首先需要得到股票在全部预测变量上的综合得分。为此,将每个变量的Z-Score按某个权重求和即可:
$$ \text {综 合} \mathrm {Z - S c o r e} = \sum_ {k = 1} ^ {K} \omega_ {k} \times \mathrm {Z - S c o r e} _ {k} \tag {7.4} $$
式中 $\omega_{k}$ 为变量 $k$ 的权重。理论上,变量的权重应和它们预测未来收益率的能力成正比。然而在实践中,等权重配置所有变量往往就是很好的选择。偏离等权重配置就相当于预测变量之间的择时。具体可以参考7.5节的做法。需要说明的是,按照式(7.4)计算出来的 $t$ 期每支股票的综合Z-Score虽然仍然满足截面均值为0(因为每个单一的Z-Scorek的均值都是0),但其截面标准差通常不再为1,而是小于1。因此,需要对式(7.4)计算出的综合Z-Score最后再进行一次标准化处理,使得其截面标准差为1。
从上述讨论中延伸一步,便引出另外一个常见的问题。在开发收益率模型时,人们往往从不同的维度(比如估值、盈利、成长性、安全性等)寻找预测变量,而在每个维度内,为了预测水平的稳健性又会使用多个细分的变量。在这种情况下,将不同维度下的细分预测变量都一股脑塞入式(7.4)计算综合Z-Score并不科学。更合理的做法是按照层级处理,即先将属于每个维度的细分变量综合,得到该维度的Z-Score;然后再将几个维度的Z-Score汇总,得到最终的综合Z-Score。这种层级处理方法在学术界和业界非常普遍。举例来说,Asness et al.(2019)在构建公司质量因子时,就采用了该方法。他们首先使用资产毛利率(GPOA)、净资产收益率(ROE)、资产收益率(ROA)等计算盈利维度的Z-Score,用毛利润五年增长率、ROE五年增长率、ROA五年增长率等计算成长维度的Z-Score,用BAB因子(Frazzini and Pedersen 2014)、杠杆(总负债与总资产之比)、ROE标准差等计算安全性维度的Z-Score。最后,盈利、成长、安全三个维度的Z-Score汇总得到了每支股票的综合Z-Score,就得到了质量因子的变量。
有了综合Z-Score,接下来就是将其转化为收益率预测。为此,要考虑以下一元截面回归模型:
$$ R _ {i t} = c _ {t} + b _ {t} z _ {i t - 1} + \varepsilon_ {i t}, i = 1, \dots , N \tag {7.5} $$
式中 $z_{it-1}$ 表示 $t-1$ 时刻(即 $t$ 期期初)股票 $i$ 的综合 Z-Score。使用OLS即可对模型 (7.5) 进行参数估计,求出 $\hat{c}_t$ 和 $\hat{b}_t$ 。由于上述OLS回归在每个 $t$ 期进行,因此一旦有了 $\hat{c}_t$ 和 $\hat{b}_t$ 的时间序列 ${\hat{b}_1, \dots, \hat{b}_t}$ 和 ${\hat{c}_1, \dots, \hat{c}_t}$ ,便可利用它们来预测 $t+1$ 时刻的收益率。通常的做法是使用最近 $T$ 个参数 $b$ 和 $c$ 的估计值各自取平均值( $T$ 的大小和预测收益率的频率有关。以预测月频收益率为例, $T$ 的取值往往为 12、24 或 36,代表利用过去 12、24 或 36 个月的参数估计值),并将均值视作 $t+1$ 期参数的估计:
$$ \tilde {c} _ {t + 1} = \frac {1}{T} \sum_ {i = t - T + 1} ^ {t} \hat {c} _ {i} \tag {7.6} $$
$$ \tilde {b} _ {t + 1} = \frac {1}{T} \sum_ {i = t - T + 1} ^ {t} \hat {b} _ {i} \tag {7.7} $$
得到 $\tilde{c}{t+1}$ 和 $\tilde{b}{t+1}$ 之后,将它们代入模型(7.5)并使用 $t$ 时刻最新的综合Z-Score,即可预测 $t+1$ 时刻的收益率(预测值记为 $\tilde{R}_{it+1}$ ):
$$ \tilde {R} _ {i t + 1} = \tilde {c} _ {t + 1} + \tilde {b} _ {t + 1} z _ {i t} \tag {7.8} $$
除上述每期截面回归再取均值估计下期参数外,另一种常见的做法是使用截至 $t$ 时刻的最近的 $T$ 期收益率数据,以及与它们对应的滞后一期的综合Z-Score数据进行面板回归(panel regression)。将面板回归得到的系数直接作为 $\tilde{c}{t+1}$ 和 $\tilde{b}{t+1}$ ,并代入式(7.8)预测 $t+1$ 的收益率。
模型(7.5)和主动管理中关于超额收益的著名经验法则也密切相关。将模型(7.5)等号左右两侧同时减去基准的收益率(记为 $R_{Bt}$ ):
$$ R _ {i t} - R _ {B t} = \left(c _ {t} - R _ {B t}\right) + b _ {t} z _ {i t - 1} + \varepsilon_ {i t} \tag {7.9} $$
由上述关系可知,系数 $b_{t}$ 不受影响。定义 $\alpha_{it} = R_{it} - R_{Bt}$ 表示超额收益,并用符号 $c_{t}'$ 代替 $c_{t} - R_{Bt}$ 得到:
$$ \alpha_ {i t} = c _ {t} ^ {\prime} + b _ {t} z _ {i t - 1} + \varepsilon_ {i t} \tag {7.10} $$
式(7.10)的OLS估计量为:
$$ \hat {b} _ {t} = \frac {\operatorname {c o v} \left(z _ {i t - 1} , \alpha_ {i t}\right)}{\operatorname {v a r} \left(z _ {i t - 1}\right)} \tag {7.11} $$
$$ \hat {c} _ {t} ^ {\prime} = \bar {\alpha} _ {t} - \hat {b} _ {t} \bar {z} _ {t - 1} \tag {7.12} $$
其中 $\bar{\alpha}{t} = \frac{1}{N}\sum{i=1}^{N}\alpha_{it}, \bar{z}{t-1} = \frac{1}{N}\sum{i=1}^{N}z_{it-1}$ 。由于Z-Score的均值为 $0 (\bar{z}{t-1} = 0)$ ,因此 $\hat{c}{t}' = \bar{\alpha}{t}$ 。将 $\hat{b}{t}$ 和 $\hat{c}_{t}'$ 代入(7.10)计算超额收益的估计值:
$$ \hat {\alpha} _ {i t} = \bar {\alpha} _ {t} + \frac {\operatorname {c o v} \left(z _ {i t - 1} , \alpha_ {i t}\right)}{\operatorname {v a r} \left(z _ {i t - 1}\right)} z _ {i t - 1} \tag {7.13} $$
式(7.13)中等号右侧第一项是所有股票超额收益在截面上的均值,这一项对所有股票来说是一样的(且如果基准是一个等权重指数,则这一项将严格为零),因此对个股超额收益的预测仅取决于等号右边的第二项。利用方差和协方差的定义将第二项进行简单的代数运算可得:
$$ \begin{array}{l} \frac {\operatorname {c o v} \left(z _ {i t - 1} , \alpha_ {i t}\right)}{\operatorname {v a r} \left(z _ {i t - 1}\right)} z _ {i t - 1} (7.14) \ \Rightarrow \quad \frac {\rho \left(z _ {i t - 1} , \alpha_ {i t}\right) \sigma \left(\alpha_ {i t}\right) \sigma \left(z _ {i t - 1}\right)}{\sigma \left(z _ {i t - 1}\right) \sigma \left(z _ {i t - 1}\right)} z _ {i t - 1} (7.15) \ \Rightarrow \quad \frac {\rho \left(z _ {i t - 1} , \alpha_ {i t}\right) \sigma \left(\alpha_ {i t}\right)}{\sigma \left(z _ {i t - 1}\right)} z _ {i t - 1} (7.16) \ \end{array} $$
其中 $\rho (z_{it - 1},\alpha_{it})$ 为 $z_{it - 1}$ 和 $\alpha_{it}$ 的相关系数。且由于 $z_{it - 1}$ 是Z-Score,其标准差为1。将式(7.16)进一步化简并得到关于 $\alpha$ 的关系:
$$ \hat {\alpha} _ {i t} \approx \rho \left(z _ {i t - 1}, \alpha_ {i t}\right) \times \sigma \left(\alpha_ {i t}\right) \times z _ {i t - 1} \tag {7.17} $$
上式中右侧第一项是IC,第二项是超额收益的截面波动率,第三项是Z-Score。式(7.17)所示的超额收益与IC×波动率×Score的关系正是Grinold(1994)提出的著名的超额收益经验法则,也就是α三要素公式。
[1]即特质性波动率低的股票的预期收益率更高。具体解释和针对A股的实证结果见5.3节。
[2]像BM、ROE这些用来构建价值和盈利因子的变量也被广泛地应用于收益模型。
[3]ESG全称为environmental, social and corporate governance,即环境、社会和公司治理。它们是衡量公司或企业投资的可持续性和社会影响的三个核心因素。
[4]曾经有私募路演时声称配置了3000多个“阿尔法因子”,引来阵阵拍案称奇。
[5]为了消除预测变量分布不均匀的影响,有时也会使用Spearman秩相关系数代替Pearson相关系数。当采用前者时,IC又被称为rank IC,即秩信息系数。
[6]和“阿尔法因子”相对应,这种变量常被业界称作“风险因子”。
[7]Chincarini and Kim(2006)介绍了包括Josef Lakonishok、Peter Lynch和Joseph Piotroski等30余位传奇基金经理的选股逻辑。
[8]这也是为什么在式(7.1)中使用 $z_{it}$ 表示变量值。
7.2 风险模型:以Barra为例
风险模型是使用多因子模型进行主动投资管理中的另一个重要模块,其重要性不亚于收益率模型。正如1.1.4节解释的那样,通过多因子模型可以实现降维,方便地计算股票的协方差矩阵,并以此作为投资组合风险控制的依据。式(1.6)给出了股票协方差矩阵和因子协方差矩阵的关系。为方便下文的讨论,这里再给出一次:
$$ \Sigma = \beta \Sigma_ {\lambda} \beta^ {\prime} + \Sigma_ {\varepsilon} \tag {7.18} $$
其中 $\beta = [\beta_{1},\beta_{2},\dots ,\beta_{N}]^{\prime}$ 是 $N\times K$ 因子暴露矩阵; $\Sigma$ ( $N$ 阶矩阵)、 $\Sigma_{\lambda}$ ( $K$ 阶矩阵)以及 $\Sigma_{\varepsilon}$ ( $N$ 阶矩阵)分别为股票的协方差矩阵、因子的协方差矩阵以及随机扰动的协方差矩阵。由于股票收益率中随机扰动相互独立,因此 $\Sigma_{\varepsilon}$ 是对角阵。
在因子投资中,有一些多因子模型的目的并非解释资产预期收益的截面差异,而是为了通过式(7.18)和各种统计学手段准确地估计资产协方差矩阵 $\Sigma$ 。鉴于此,业界更倾向于称它们为风险模型。在这些模型之中,Barra模型无疑是最著名的。它在全世界不同国家的股票市场因地制宜地推出了多因子模型,并通过几代模型的迭代和统计手段的升级,在事前估计 $\Sigma$ 方面做了很多努力。本节介绍Barra针对中国A股市场推出的CNE5多因子模型[1]。
7.2.1 Barra多因子模型
CNE5模型中包含一个国家因子, $P$ 个行业因子(记为 $I_{1}, \cdots, I_{P}$ )以及 $Q$ 个风格因子(记为 $S_{1}, \cdots, S_{Q}$ )。令 $K = 1 + P + Q$ ,表示一共有 $K$ 个因子。在 $t$ 时刻,该多因子模型为:
$$ \begin{array}{l} \left[ \begin{array}{c} R _ {1 t} ^ {e} \ R _ {2 t} ^ {e} \ \vdots \ R _ {N t} ^ {e} \end{array} \right] = \left[ \begin{array}{l} 1 \ 1 \ \vdots \ 1 \end{array} \right] \lambda_ {C t} + \left[ \begin{array}{c} \beta_ {1 t - 1} ^ {I _ {1}} \ \beta_ {2 t - 1} ^ {I _ {1}} \ \vdots \ \beta_ {N t - 1} ^ {I _ {1}} \end{array} \right] \lambda_ {I _ {1} t} + \dots + \left[ \begin{array}{c} \beta_ {1 t - 1} ^ {I _ {P}} \ \beta_ {2 t - 1} ^ {I _ {P}} \ \vdots \ \beta_ {N t - 1} ^ {I _ {P}} \end{array} \right] \lambda_ {I _ {P} t} \tag {7.19} \ + \left[ \begin{array}{c} \beta_ {1 t - 1} ^ {S _ {1}} \ \beta_ {2 t - 1} ^ {S _ {1}} \ \vdots \ \beta_ {N t - 1} ^ {S _ {1}} \end{array} \right] \lambda_ {S _ {1} t} + \dots + \left[ \begin{array}{c} \beta_ {1 t - 1} ^ {S _ {Q}} \ \beta_ {2 t - 1} ^ {S _ {Q}} \ \vdots \ \beta_ {N t - 1} ^ {S _ {Q}} \end{array} \right] \lambda_ {S _ {Q} t} + \left[ \begin{array}{c} u _ {1 t} \ u _ {2 t} \ \vdots \ u _ {N t} \end{array} \right] \ \end{array} $$
式中 $R_{it}^{e}$ 是t时刻股票i(相对无风险收益率)的超额收益; $\beta_{it-1}^{I_p}$ 是t-1(即t期期初)股票i在行业 $I_p$ 上的因子暴露(假设一个公司在任何时刻只能属于一个行业,那么 $\beta_{it-1}^{I_p}$ 的取值为0或者1); $\beta_{it-1}^{S_q}$ 是t-1(t期期初)股票i在风格因子 $S_q$ 上的因子暴露; $u_{it}$ 为t时刻股票i在收益率中的随机扰动,也被称为特质性收益率; $\lambda_{Ct}$ 为t时刻国家因子的收益率; $\lambda_{I_p t}$ 为t时刻行业因子 $I_p$ 的收益率; $\lambda_{S_q t}$ 为t时刻风格因子 $S_q$ 的收益率。此外,在上述模型中,所有股票在国家因子上的暴露都是1。
在模型(7.19)中,t时刻股票收益率以及t-1时刻股票的因子暴露已知,采用加权最小二乘法(weighted least squares,WLS)估计t时刻的因子收益率。因此,模型(7.19)的本质正是Fama-MacBeth截面回归。在求解模型(7.19)时,需要注意的是国家因子的因子暴露和P个行业的因子暴露之间存在共线性。国家因子的因子暴露向量可以表达为P个行业因子的因子暴露向量的线性组合,但会造成模型(7.19)的解不唯一。为此,对行业因子的因子收益率作如下限制:
$$ s _ {I _ {1}} \lambda_ {I _ {1} t} + s _ {I _ {2}} \lambda_ {I _ {2} t} + \dots + s _ {I _ {P}} \lambda_ {I _ {P} t} = 0 \tag {7.20} $$
其中 $s_{I_p}$ 是所有属于行业 $I_p$ 的股票按市值计算出的权重之和。
Barra多因子模型的另一个特点是风格因子暴露的确定。首先,该模型直接使用公司特征,而非时序回归系数,并以此作为因子暴露的原始值[2]。举例来说。如果使用BM构建价值因子,则股票 $t-1$ 时刻的BM指标取值就作为其在该因子上的因子暴露的原始值。接下来,对原始值进行标准化处理,包括去均值和除以标准差两步。对于前者,假设市场组合在任何风格因子上都应该是中性的,即暴露为零。因此,对于任意因子,去均值的处理是使用因子暴露原始值减去因子暴露的市值加权。去均值后,因子暴露满足:
$$ \sum_ {i = 1} ^ {N} s _ {i} \beta_ {i t - 1} ^ {S _ {q}} = 0, \quad q = 1, \dots , Q \tag {7.21} $$
式中 $s_i$ 代表股票 $i$ 的市值权重。之后,将经过式(7.21)处理的风格因子暴露在截面上除以其标准差,就完成了对风格因子的因子暴露的标准化。
较之Barra针对中国市场的早期模型,CNE5模型最大的差异是加入了国家因子。国家因子投资组合的实质正是按市值加权的市场组合。这一结论可以通过以下推导证明。令 $R_{Mt}^{e}$ 表示t时刻市场组合的超额收益。因为 $s_i$ 是股票i的市值权重,因此以 $s_i$ 为权重构建的投资组合就是市场组合。将 $R_{Mt}^{e}$ 作为资产代入模型(7.19),并利用式(7.20)及式(7.21)推导可知:
$$ \begin{array}{l} R _ {M t} ^ {e} = \lambda_ {C t} + \sum_ {p = 1} ^ {P} \beta_ {M t - 1} ^ {I _ {p}} \lambda_ {I _ {p} t} + \sum_ {q = 1} ^ {Q} \beta_ {M t - 1} ^ {S _ {q}} \lambda_ {S _ {q} t} + u _ {M t} \ = \lambda_ {C t} + \sum_ {p = 1} ^ {P} \left(\sum_ {i = 1} ^ {N} s _ {i} \beta_ {i t - 1} ^ {I _ {p}}\right) \lambda_ {I _ {p} t} + \sum_ {q = 1} ^ {Q} \left(\sum_ {i = 1} ^ {N} s _ {i} \beta_ {i t - 1} ^ {S _ {q}}\right) \lambda_ {S _ {q} t} + \sum_ {i = 1} ^ {N} s _ {i} u _ {i t} \ = \lambda_ {C t} + \sum_ {p = 1} ^ {P} s _ {I _ {p}} \lambda_ {I _ {p} t} + \sum_ {q = 1} ^ {Q} 0 \times \lambda_ {S _ {q} t} + \sum_ {i = 1} ^ {N} s _ {i} u _ {i t} \tag {7.22} \ = \lambda_ {C t} + 0 + 0 + \sum_ {i = 1} ^ {N} s _ {i} u _ {i t} \ \approx \lambda_ {C t} \ \end{array} $$
在上述推导中,式(7.22)右侧中间两项变为0,分别用到了式(7.20)和式(7.21)这两个条件的设定。最后,式中 $\sum_{i=1}^{N} s_i u_{it}$ 是所有股票特质性收益的加权平均,由于它的值近似等于零,因此上述推导表明 $R_{Mt}^e \approx \lambda_{Ct}$ 。国家因子收益率近似等于市场组合的超额收益,意味着国家因子组合近似地等价于市场组合。这就是国家因子的本质。从数学上说,由于CNE5模型假设所有股票在国家因子上的暴露均为1,因此在截面回归时,国家因子实际上起到了截距项的作用。
7.2.2 模型求解
Barra模型的求解仅仅是在每个t期进行截面回归,通过WLS估计求因子收益率和特质性收益率,因此使用任何编程语言都可以方便求解。然而,正如2.2.3节所解释的那样,在多元回归求解因子收益率的同时也得到了每个因子的投资组合。与使用排序法构建的因子投资组合相比,多元回归得到的因子投资组合因其优秀的特征而被称为纯因子投资组合(pure factor portfolio)。搞懂纯因子投资组合的性质有助于更好地理解该模型。本节和7.2.3节将对此进行详细说明。本节首先来看模型的求解。
Menchero and Lee(2015)给出了求解模型(7.19)的简要步骤。为了方便起见,将模型(7.19)用向量和矩阵表示。此外,为了简化数学表达,在本节的推导中略去时间下标 $t$ 以及 $t-1$ 。使用向量和矩阵,模型(7.19)变为:
$$ R ^ {e} = \beta \lambda + u \tag {7.23} $$
式中 $\beta$ 是 $N \times K$ 因子暴露矩阵:
$$ \boldsymbol {\beta} = \left[ \begin{array}{c c c c c c c} 1 & \beta_ {1} ^ {I _ {1}} & \dots & \beta_ {1} ^ {I _ {P}} & \beta_ {1} ^ {S _ {1}} & \dots & \beta_ {1} ^ {S _ {Q}} \ 1 & \beta_ {2} ^ {I _ {1}} & \dots & \beta_ {2} ^ {I _ {P}} & \beta_ {2} ^ {S _ {1}} & \dots & \beta_ {2} ^ {S _ {Q}} \ \vdots & \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \ 1 & \beta_ {N} ^ {I _ {1}} & \dots & \beta_ {N} ^ {I _ {P}} & \beta_ {N} ^ {S _ {1}} & \dots & \beta_ {N} ^ {S _ {Q}} \end{array} \right] \tag {7.24} $$
令 $\Omega$ 为全部因子的纯因子投资组合权重矩阵,即它是 $K\times N$ 矩阵,在第 $k$ 行为因子 $k$ 的纯因子投资组合中所有 $N$ 支股票的权重。由于使用了WLS估计,因此在求解因子收益率以及纯因子组合时,需要指定回归权重矩阵(regression weight matrix)。为此,Barra模型假设个股特值性收益率的方差和其市值平方根成反比,并选择了如下回归权重矩阵 $W$
$$ \boldsymbol {W} = \left[ \begin{array}{c c c c} \frac {\sqrt {s _ {1}}}{\sum_ {i = 1} ^ {N} \sqrt {s _ {i}}} & 0 & \dots & 0 \ 0 & \frac {\sqrt {s _ {2}}}{\sum_ {i = 1} ^ {N} \sqrt {s _ {i}}} & \dots & 0 \ \vdots & \vdots & \ddots & \vdots \ 0 & 0 & \dots & \frac {\sqrt {s _ {N}}}{\sum_ {i = 1} ^ {N} \sqrt {s _ {i}}} \end{array} \right] \tag {7.25} $$
求解模型(7.19)的另外一个难点是约束条件式(7.20)。为此,需要构建代表该约束的约束矩阵 $C$ 。由于仅有一个约束条件,因此 $K$ 个因子收益率之间的约束关系可以表达为(Ruud 2000):
$$ \left[ \begin{array}{l} \lambda_ {C} \ \lambda_ {I _ {1}} \ \vdots \ \lambda_ {I _ {P}} \ \lambda_ {S _ {1}} \ \vdots \ \lambda_ {S _ {Q}} \end{array} \right] = \left[ \begin{array}{c c c c c c c c} 1 & 0 & 0 & \dots & 0 & 0 & \dots & 0 \ 0 & 1 & 0 & \dots & 0 & 0 & \dots & 0 \ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \ 0 & - \frac {s _ {I _ {1}}}{s _ {I _ {P}}} & - \frac {s _ {I _ {2}}}{s _ {I _ {P}}} & \dots & - \frac {s _ {I _ {P - 1}}}{s _ {I _ {P}}} & 0 & \dots & 0 \ 0 & 0 & 0 & \dots & 0 & 1 & \dots & 0 \ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \ 0 & 0 & 0 & \dots & 0 & 0 & \dots & 1 \end{array} \right] \left[ \begin{array}{l} \lambda_ {C} \ \lambda_ {I _ {1}} \ \vdots \ \lambda_ {I _ {P - 1}} \ \lambda_ {S _ {1}} \ \vdots \ \lambda_ {S _ {Q}} \end{array} \right] + \left[ \begin{array}{l} 0 \ 0 \ \vdots \ 0 \ 0 \ \vdots \ 0 \end{array} \right] \tag {7.26} $$
式(7.26)中等号右边的矩阵就是约束矩阵 $C$ ,它是 $K \times (K - 1)$ 矩阵(这是因为 $K$ 个因子收益率之间有一个约束条件)。在构造 $C$ 时,将 $\lambda_{I_P}$ 用其他行业收益率的线性组合来表达。
有了 $W$ 以及 $C$ 之后,利用带约束条件的最小二乘法求解即可得到纯因子投资组合的股票权重矩阵 $\Omega$ :
$$ \Omega = C \left(C ^ {\prime} \beta^ {\prime} W \beta C\right) ^ {- 1} C ^ {\prime} \beta^ {\prime} W \tag {7.27} $$
由前文可知, $\Omega$ 的第 $k$ 行代表着因子 $k$ 的纯因子投资组合中所有股票的权重。因此,在得到 $\Omega$ 之后,便可方便地计算出每个因子 $t$ 期的收益率:
$$ \lambda_ {k t} = \sum_ {i = 1} ^ {N} \omega_ {k i} R _ {i t} ^ {e}, k = 1, \dots , K \tag {7.28} $$
式中 $\omega_{ki}$ 为矩阵 $\Omega$ 中第 $k$ 行、第 $i$ 个元素。将 $\lambda_{kt} (k = 1, \dots, K)$ 代入模型(7.19)中则可求出每支股票 $i$ 的特质性收益率。以上就是模型求解的过程。
7.2.3 纯因子投资组合
7.2.2节的求解得到了所有因子的投资组合权重矩阵 $\Omega$ 。该矩阵的每一行都是 $N$
维向量, 第 $k$ 行 $\left[\omega_{k1}, \omega_{k2}, \cdots, \omega_{kN}\right]$ 即为因子 $k$ 的纯因子投资组合中 $N$ 支股票的权重。将 $\Omega$ 和股票的因子权重矩阵 $\beta$ 相乘, 得到新的矩阵 $\Omega \beta$ 。由于 $\Omega$ 是 $K \times N$ 矩阵, 而 $\beta$ 是 $N \times K$ 矩阵, 因此 $\Omega \beta$ 是 $K$ 阶矩阵, 它的第 $k$ 行代表因子 $k$ 的纯因子投资组合在全部 $K$ 个因子上的暴露。假设 $K$ 个因子按照国家因子、 $P$ 个行业因子以及 $Q$ 个风格因子的顺序排列, 则矩阵 $\Omega \beta$ 满足如下性质:
$$ \boldsymbol {\Omega} \beta = \left[ \begin{array}{c c} \boldsymbol {D} _ {(1 + P) \times (1 + P)} & \boldsymbol {0} _ {(1 + P) \times Q} \ \boldsymbol {0} _ {Q \times (1 + P)} & \boldsymbol {I} _ {Q \times Q} \end{array} \right] \tag {7.29} $$
式中子矩阵的下标代表阶数。首先来看式(7.29)中容易的部分。其右上角零矩阵 $0_{(1 + P) \times Q}$ 说明国家因子和 $P$ 个行业因子的纯因子投资组合在所有 $Q$ 个风格因子上的暴露均为零;其左下角的零矩阵 $0_{Q \times (1 + P)}$ 说明 $Q$ 个风格因子的纯因子投资组合在国家和行业因子上的暴露均为零;其右下角的单位阵 $I_{Q \times Q}$ 说明每个风格因子的纯因子组合对自己有1个单位的暴露,而对其他风格因子的暴露均为零。结合 $0_{Q \times (1 + P)}$ 和 $I_{Q \times Q}$ 可知,任何一个风格因子的纯因子组合在除了它自己以外的所有因子上均无暴露。
然后来看式(7.29)中左上角的子矩阵 $D_{(1 + P)\times (1 + P)}$ 。它表示国家和行业因子的纯因子组合在该因子上的暴露。通过以下一个示例来说明。假设有1个国家因子、27个申万一级行业因子以及11个风格因子(共39个因子)。根据式(7.27)求解矩阵 $\Omega$ ,并最终得到 $\Omega \beta$ ,以及其左上角的子矩阵 $D_{(1 + P)\times (1 + P)}$ 。由于因子数量太多,难以完整而清晰地展示,以下对 $D_{(1 + P)\times (1 + P)}$ 的展示略去中间一部分:
$$ \left[ \begin{array}{c c c c c c c c c c} 1 & 0. 0 3 & 0. 0 2 & 0. 0 6 & 0. 0 1 & \dots & 0. 0 2 & 0. 0 1 & 0. 0 3 & 0. 0 5 \ 0 & 0. 9 7 & - 0. 0 2 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & - 0. 0 3 & - 0. 0 5 \ 0 & - 0. 0 3 & 0. 9 8 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & - 0. 0 3 & - 0. 0 5 \ 0 & - 0. 0 3 & - 0. 0 2 & 0. 9 4 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & - 0. 0 3 & - 0. 0 5 \ \vdots & \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots & \vdots \ 0 & - 0. 0 3 & - 0. 0 2 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & 0. 9 9 & - 0. 0 3 & - 0. 0 5 \ 0 & - 0. 0 3 & - 0. 0 2 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & 0. 9 7 & - 0. 0 5 \ 0 & - 0. 0 3 & - 0. 0 2 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & - 0. 0 3 & 0. 9 5 \end{array} \right] \tag {7.30} $$
在式(7.30)中,第一行为国家因子投资组合在国家和行业因子上的暴露。观察数值不难发现,国家因子对其自身的暴露(第一列)为1。此外,由于它近似等于市场组合,而市场组合天然包含了所有行业,因此国家因子组合在每个行业上也都有一定程度的暴露。比如,国家因子在行业1上的暴露为0.03,在行业2上的暴露为0.02,以此类推。
再来看看行业因子。以第二行为例,它表示行业1的纯因子投资组合在国家和行业因子上的暴露。为了解释它,令 $I_{l}$ 表示所有属于行业1的股票的集合,并考虑如下多空对冲的投资组合(记为 $P I_{1}$ )。 $P I_{1}$ 的多头组合为按权重 $\sum_{i\in \mathcal{I}{1}}\omega{i} = 1$ 配置所有属于行业1的股票; $P I_{1}$ 的空头组合按同样资金量配置国家因子组合。由个股的行业暴露定义可知(属于某行业则暴露为1,否则为0), $P I_{1}$ 的多头组合在国家因子和行业因子上的暴露为:
$$ \left[ \begin{array}{l l l l l l l l l l} 1 & 1 & 0 & 0 & 0 & \dots & 0 & 0 & 0 & 0 \end{array} \right] \tag {7.31} $$
式中第一个1表示该多头组合在国家因子上的暴露。由于所有股票在国家因子上的暴露均为1,因此 $\sum_{i\in I_1}\omega_i = 1$ 保证了多头组合在国家因子上的暴露为1。另外, $PI_1$ 的空头组合是国家因子组合,其暴露为:
$$ \left[ \begin{array}{l l l l l l l l l} 1 & 0. 0 3 & 0. 0 2 & 0. 0 6 & 0. 0 1 & \dots & 0. 0 2 & 0. 0 1 & 0. 0 3 & 0. 0 5 \end{array} \right] \tag {7.32} $$
最终, $PI_{1}$ 组合的净暴露是多头暴露式(7.31)与空头暴露式(7.32)之差:
$$ \left[ \begin{array}{l l l l l l l l l} 0 & 0. 9 7 & - 0. 0 2 & - 0. 0 6 & - 0. 0 1 & \dots & - 0. 0 2 & - 0. 0 1 & - 0. 0 3 & - 0. 0 5 \end{array} \right] \tag {7.33} $$
观察式(7.33)和式(7.30)的第二行,二者完全一致,说明行业1因子的纯因子投资组合在国家和行业因子上的暴露和 $PI_{1}$ 相同。通过这个例子归纳可知,行业纯因子投资组合的本质就是 $100\%$ 做多该行业,并同时 $100\%$ 做空国家因子投资组合得到的对冲组合(具体组合的权重由截面多元回归求解模型(7.27)决定)。由于国家因子近似等于市场组合,因此该纯因子投资组合在业务上有着非常清晰的含义,它代表该行业相对市场组合的超额收益。
最后,观察 $D_{(1 + P)\times (1 + P)}$ 的第一列并结合子矩阵 $\mathbf{0}{Q\times (1 + P)}$ 可知,行业和风格因子的纯因子投资组合在国家因子上的暴露均为零。对于因子 $k$ ,其纯因子投资组合中股票 $i$ 的权重为 $\omega{ki}$ 。该投资组合在国家因子上的暴露为 $\sum_{i = 1}^{N}1\times \omega_{ki} = \sum_{i = 1}^{N}\omega_{ki}$ 。因此,在国家因子上的暴露为零意味着 $\sum_{i = 1}^{N}\omega_{ki} = 0$ ,即该组合中所有股票的权重之和为零,意味着它是资金中性的。因此,行业和风格因子的纯因子投资组合均是资金中性的。以下总结了不同因子纯因子投资组合的特征:
- 由式(7.22)可知,国家因子的纯因子投资组合就是近似的市场组合,它是纯多头组合。该组合在国家因子上暴露为1,在所有行业上有正的暴露,在所有风格因子上的暴露为零。
- 行业因子的纯因子投资组合是资金中性的。对于行业 $I_{p}$ ,该组合 $100\%$ 做多该行业, $100\%$ 做空国家因子投资组合,反映了行业相对市场组合的超额收益,且该组合在所有风格因子上的暴露为零。
- 风格因子的纯因子投资组合同样是资金中性的。对于风格因子 $q$ , 它的纯因子投资组合仅在该因子上有 1 个单位的暴露, 在其他行业和风格因子上均没有暴露, 而投资组合依靠暴露在该因子之下来获得这个风险因子的超额收益。
7.2.4 协方差矩阵求解及调整
风险多因子模型的核心目标是为了计算个股的协方差矩阵 $\Sigma$ 。事前对 $\Sigma$ 的准确估计对于风险管理以及投资组合优化至关重要。一旦得到因子收益率序列以及个股的特质性收益率序列,就可以利用式(7.18)计算出个股的协方差矩阵:
$$ \Sigma = \beta \Sigma_ {\lambda} \beta^ {\prime} + \Sigma_ {\varepsilon} $$
在上式中,除了因子暴露矩阵 $\beta$ 已知以外,因子协方差矩阵 $\Sigma_{\lambda}$ 和个股特质性收益率的协方差矩阵(非对角线上元素为0) $\Sigma_{\varepsilon}$ 均需要估计,而 $\Sigma$ 的准确性取决于 $\Sigma_{\lambda}$ 和 $\Sigma_{\varepsilon}$ 的准确性。通过求解模型(7.19)可以得到因子收益率和特质性收益率的时间序列。对于任何时刻 $t$ ,可以用给定的时间窗口、使用 $t$ 时刻之间的历史收益率序列计算因子收益率的样本协方差矩阵(记为 $\hat{\Sigma}{\lambda}$ )和特质性收益率的样本协方差矩阵(记为 $\hat{\Sigma}{\varepsilon}$ ),它们是 $\Sigma_{\lambda}$ 和 $\Sigma_{\varepsilon}$ 的最简单估计。
然而,大量实证经验显示,使用历史数据计算难以得到协方差矩阵的准确估计,因此需要通过不同的统计手段分别对 $\hat{\Sigma}{\lambda}$ 和 $\hat{\Sigma}{\varepsilon}$ 进行了调整。在诸多调整手段中,最重要的是对 $\hat{\Sigma}{\lambda}$ 采用的特征因子调整法,以及对 $\hat{\Sigma}{\varepsilon}$ 采用的贝叶斯收缩法[3]。为介绍这两种方法,首先需说明偏差统计(Bias statistic)量这个概念,因为上述两种调整均以降低偏差统计量为目标。
1. 偏差统计量
偏差统计量是评估风险模型准确性的一个常用指标(Menchero et al.2011),它用来衡量风险预测值和风险实际值之间的误差。如果这二者之间有显著误差,则认为风险预测是有偏的,故这个统计量称为偏差统计量。令 $R_{it}$ 为资产 $i$ 在 $t$ 期的收益率, $\sigma_{it}$ 是 $t$ 期期初的估计值。定义 $b_{it}$ 如下:
$$ b _ {i t} = \frac {R _ {i t}}{\sigma_ {i t}} \tag {7.34} $$
$b_{it}$ 的含义是将 $R_{it}$ 用 $\sigma_{it}$ 标准化。假设一共有 $T$ 期数据, 则将有 $T$ 个 $b_{it}$ 。利用它们定义资产 $i$ 的偏差统计量 $B_{i}$ :
$$ B _ {i} = \sqrt {\frac {1}{T - 1} \sum_ {t = 1} ^ {T} \left(b _ {i t} - \bar {b} _ {i}\right) ^ {2}} \tag {7.35} $$
式中 $\bar{b}{i}$ 是 $b{it}$ 的均值。如果事前风险 $\sigma_{it}$ 预测准确,则标准化后的收益率 $b_{it}$ 的标准差将为1。假设资产收益率 $R_{it}$ 符合正态分布且事前风险预测准确,当 $T$ 足够大时, $B_{i}$ 也应满足正态分布,且其 $95\%$ 的置信区间为:
$$ B _ {i} \in \left[ 1 - \sqrt {2 / T}, 1 + \sqrt {2 / T} \right] \tag {7.36} $$
如果 $B_{i}$ 不在上述范围内,则可以认为事前风险 $\sigma_{it}$ 估计不准确。搞清楚了偏差统计量,接下来就看看针对因子收益率协方差矩阵的特征因子调整法。
2. 特征因子调整法
前文曾反复强调过,从风险角度来说,多因子模型的作用是利用资产和因子收益率之间的关系,实现数学上的降维,方便地计算个股的协方差矩阵 $\Sigma$ 。人们之所以希望知道 $\Sigma$ ,是因为它是投资组合优化中必不可少的输入之一。在实际投资
中,人们根据不同的目标函数使用 $\Sigma$ 构建最优组合。比如常见的最小方差组合,又比如大名鼎鼎的均值—方差模型都要用到 $\Sigma$ 。
假设按某个给定目标函数求出的最优投资组合中股票的权重向量为 $\omega$ , 则利用 $\omega$ 和 $\Sigma$ 可以计算出该投资组合的方差 $\sigma_{p}^{2} = \omega^{\prime} \Sigma \omega$ 。一个自然而然的问题就是 $\sigma_{p}$ 是否准确。换句话说, 该最优投资组合的偏差统计量是否显著地偏离 1.0 。如果这个问题的答案是否定的, 则说明最优投资组合的事前风险估计是不准确的, 这将极大影响该组合的表现。由 $\Sigma$ 的定义式 (7.18) 可知, 个股协方差矩阵可以分解为因子协方差矩阵 $\Sigma_{\lambda}$ 和个股特质性收益率协方差矩阵 $\Sigma_{\varepsilon}$ 两部分。由于模型假设特质性收益率之间相互独立(即 $\Sigma_{\varepsilon}$ 是对角阵), 因此 $\sigma_{p}^{2}$ 是否准确在很大程度上取决于 $\omega^{\prime} \beta \Sigma_{\lambda} \beta^{\prime} \omega$ 。
定义 $\omega_{\lambda} \equiv (\omega' \beta)'$ , 则 $\omega' \beta \Sigma_{\lambda} \beta' \omega$ 可以简化表达为 $\omega_{\lambda}' \Sigma_{\lambda} \omega_{\lambda}$ 。 $\omega'{\lambda} \Sigma{\lambda} \omega_{\lambda}$ 的意义是, 把因子的纯因子组合当作资产, 按某种“最优”权重 $\omega_{\lambda}$ 配置这些资产, 得到投资组合的方差。 $\sigma_{p}^{2}$ 很大程度上依赖于这些因子资产的某种最优组合的方差, 因此可以将对个股最优组合偏差统计量的关注, 转移到对因子的最优投资组合的偏差统计量的关注上来。如果 $\omega_{\lambda}' \Sigma_{\lambda} \omega_{\lambda}$ 并非准确的事前风险估计, 则个股最优投资组合方差的事前风险估计也不会准确。那么, 使用历史数据计算 $\hat{\Sigma}{\lambda}$ 是否为真实因子协方差矩阵 $\Sigma{\lambda}$ 的准确估计呢? 接下来的分析将指出, 这个问题的答案是否定的。首先, 对 $\hat{\Sigma}_{\lambda}$ 进行特征分解 (且利用它是对称矩阵的性质):
$$ \hat {\boldsymbol {\Sigma}} _ {\lambda} = \boldsymbol {U} \boldsymbol {D} \boldsymbol {U} ^ {\prime} \tag {7.37} $$
式中 $U$ 是 $\hat{\Sigma}{\lambda}$ 的特征向量矩阵, $U$ 的第 $i$ 列是 $\hat{\Sigma}{\lambda}$ 的第 $i$ 个特征向量; $D$ 是对角阵, 对角线上的元素为对应的特征值。利用 $\hat{\Sigma}_{\lambda}$ 是对称矩阵的性质可知, $U$ 是正交矩阵, 即 $U^{-1} = U'$ 。为了解释 $U$ 和 $D$ 的含义, 将式 (7.37) 变形得到:
$$ \boldsymbol {U} ^ {\prime} \hat {\boldsymbol {\Sigma}} _ {\lambda} \boldsymbol {U} = \boldsymbol {D} \tag {7.38} $$
对于每个特征向量,如果把因子投资组合视作资产,以特征向量中第 $k$ 个元素作为因子 $k$ 的权重就得到了一个特殊的投资组合,即特征因子投资组合(eigenfactor portfolio)。由于 $U$ 中有 $K$ 个特征向量,因此共有 $K$ 个特征因子组合。特征向量相互正交保证了这些投资组合相互独立、协方差为零。且由式(7.38)可知,对角阵 $D$ 对角线上的元素正是 $K$ 个特征因子组合的方差。
由于 $U$ 是正交矩阵,因此这些特征因子组合构成了一组正交基。当以这 $K$ 个因子作为资产时,它们的任意一组权重 $\omega_{\lambda}$ 都可以表达成这组正交基的线性组合。因此, $\omega_{\lambda}^{\prime} \Sigma_{\lambda} \omega_{\lambda}$ 的事前风险估计 $\omega_{\lambda}^{\prime} \hat{\Sigma}{\lambda} \omega{\lambda}$ 是否准确取决于这 $K$ 个特征因子组合方差的事前风险估计是否准确。然而,研究表明这些特征因子组合的偏差统计量并非都接近 1.0,而和组合的方差成反比,即特征因子组合的事前方差估计越小,其事后偏差统计量越大,且显著高于 1.0。该实证结果说明对于该特征因子组合,事前方差估计非常不准确。既然特征因子组合的事前方差估计不准确,可想而知 $\omega_{\lambda}^{\prime} \hat{\Sigma}{\lambda} \omega{\lambda}$ 也不准确,因此个股的某个最优组合的方差的事前估计也难以准确。为了解决这个问题,Menchero et al.(2011)提出了特征因子调整法,它能够有效消除特征因子组合方差事前估计的偏差,使得事后偏差统计量接近 1.0。
特征因子调整法的核心是自助法(bootstrap)。该方法将样本因子协方差矩阵 $\hat{\Sigma}_{\lambda}$ 视为“总体”,并以它作为数据生成过程(data generating process)的已知参数,通过模拟(simulation)计算出该参数下的“样本”协方差矩阵,记为
$\tilde{\Sigma}{\lambda}$ 。使用 $\hat{\Sigma}{\lambda}$ 和 $\tilde{\Sigma}{\lambda}$ 分别求出对~应的特征因子协方差矩阵 $D$ 和 $\tilde{D}$ 。由自助法的性质可知, $\tilde{D}$ 和 $D$ 之间的偏差近似等于 $D$ 和真实但未知的特征因子协方差矩阵之间的偏差。使用该偏差来调整 $D$ 并进而计算 $\hat{\Sigma}{\lambda}$ 就可以得到真实协方差矩阵 $\Sigma_{\lambda}$ 的更好的估计。下面来看具体步骤。
(1) 对因子样本协方差矩阵 $\hat{\Sigma}{\lambda}$ 进行特征分解得到特征向量矩阵 $U$ 和对角矩阵 $D$ 。
(2) 令 $D(k)$ 表示 $D$ 对角线上的第 $k$ 个元素。对于特征因子组合 $k$ , 假设其收益率满足正态分布 $N(0, D(k))$ 。在第 $m$ 次模拟中, 使用该分布生成全部 $T$ 期样本, 作为特征因子 $k$ 的收益率序列。对全部 $K$ 个特征因子进行上述操作得到 $K \times T$ 收益率矩阵, 记为 $b{m}$ 。使用 $b_{m}$ 和 $U$ 计算出因子收益率矩阵 $\tilde{\lambda}_{m}$ :
$$ \tilde {\boldsymbol {\lambda}} _ {m} = \boldsymbol {U} \boldsymbol {b} _ {m} \tag {7.39} $$
式中下标 $m$ 表示第 $m$ 次模拟。
(3) 计算因子收益率 $\tilde{\lambda}{m}$ 的“样本”协方差矩阵 $\tilde{\Sigma}{\lambda_{m}}$ :
$$ \tilde {\boldsymbol {\Sigma}} _ {\lambda m} = \operatorname {c o v} \left(\tilde {\boldsymbol {\lambda}} _ {m}, \tilde {\boldsymbol {\lambda}} _ {m}\right) \tag {7.40} $$
(4) 对 $\tilde{\Sigma}{\lambda m}$ 进行特征分解, 得到对应的特征向量矩阵 $\tilde{U}{m}$ 和对角阵 $\tilde{D}{m}$ 。
(5) 由于“真实”的协方差矩阵 $\hat{\boldsymbol{\Sigma}}{\lambda}$ 已知, 利用它和 $\tilde{U}{m}$ 求出“真实”的特征因子协方差矩阵, 记为 $D{m}$ :
$$ \boldsymbol {D} _ {m} = \tilde {\boldsymbol {U}} _ {m} ^ {\prime} \hat {\boldsymbol {\Sigma}} _ {\lambda} \tilde {\boldsymbol {U}} _ {m} \tag {7.41} $$
(6) 将上述(2)到(5)步重复 $M$ 次。在每次模拟中,对给定的特征因子 $k$ ,比较 $D_{m}$ 和 $\tilde{D}_{m}$ 对角线上第 $k$ 个元素的差异,取全部 $M$ 次模拟差异的均值,按照
(7.42)
式中 $D_{m}(k)$ 和 $\tilde{D}{m}(k)$ 分别表示 $D{m}$ 和 $\tilde{D}_{m}$ 对角线上第 $k$ 个元素。
(7)在模拟中假设收益率满足正态分布以及平稳性。然而在真实世界中,实际的收益率序列无法很好地满足上述两点。为此,需要在偏差式(7.42)的基础上对其进行额外的缩放,以应对经验波动率偏误。缩放后,特征因子 $k$ 的偏差 $\nu_{s}(k)$ 为:
$$ v _ {s} (k) = a (v (k) - 1) + 1 \tag {7.43} $$
式中 $a$ 是经验系数, 取值通常在 $1 \sim 2$ 之间。
(8) 第(7)步得到的 $v_{s}(k)$ 就是特征因子 $k$ 的方差修正系数。利用 $v_{s}(k)$ 修正 $\hat{\Sigma}_{\lambda}$ 的对角矩阵 $D$ ,并利用特征向量矩阵 $U$ 反推出修正后的因子协方差矩阵:
$$ D _ {0} = \boldsymbol {\nu} ^ {2} D \tag {7.44} $$
$$ \hat {\boldsymbol {\Sigma}} _ {\lambda 0} = \boldsymbol {U} \boldsymbol {D} _ {0} \boldsymbol {U} ^ {\prime} \tag {7.45} $$
其中 $v^{2}$ 是 $K$ 阶对角阵, 其对角线上的第 $k$ 个元素为 $v_{s}(k)$ ; $\hat{\Sigma}_{\lambda 0}$ 则代表经特征因子调整法修正过的因子协方差矩阵。
3. 贝叶斯收缩
贝叶斯收缩(Bayesian shrinkage)是一种常见的统计手段,其含义是利用贝叶斯框架将先验和新息结合起来得到后验。在业界,贝叶斯收缩被广泛地应用于预期收益率和协方差矩阵的估计上。例如,大名鼎鼎的Black-Litterman资产配置模型就是将贝叶斯收缩作用于预期收益率预测上的应用(Black and Litterman 1992)。又比如,Ledoit and Wolf(2003)将贝叶斯收缩应用到协方差矩阵的估计上,取得了很好的效果。
回到关注的问题,实证数据显示特质性波动率(即特质性收益率的标准差)在样本外的持续性很差,说明样本协方差矩阵 $\hat{\Sigma}_{\varepsilon}$ 并不是很好的估计。具体来说,将所有股票按照样本特质性波动率的大小分成十档,并计算每档的平均偏差统计量。对于特质性波动率小的档,偏差统计量显著大于1.0,说明使用历史数据计算的样本特质性波动率低估了这些股票在样本外的事后特质性波动率;而对于特质性波动率大的档,偏差统计量显著小于1.0,说明样本特质性波动率高估了这些股票在样本外的事后特质性波动率。既然使用样本数据得到的估计不准,那么考虑通过贝叶斯收缩使用先验来对其进行矫正。先验就是人们对特质性波动率的先验判断,将先验和样本数据线性组合在一起就得到后验协方差矩阵的估计。这个过程可以视作使样本波动率数据向先验靠拢,这就是“收缩”一词的含义。
为了得到先验,首先将全部股票按市值分成十档。令 $s_i$ 表示股票 $i$ 的市值、 $\hat{\sigma}_i^i$ 表示股票 $i$ 的样本特质性波动率(上标 $i$ 代表特质性)。对于任意给定的市值档 $g$ ,利用 $s_i$ 计算股票 $i$ 在该档内的权重:
$$ \omega_ {i} = \frac {s _ {i}}{\sum_ {j \in \mathcal {M} _ {g}} s _ {j}} \tag {7.46} $$
式中 $M_{\mathrm{g}}$ 表示市值档 $\mathbf{g}$ 包含的全部股票。以 $\omega_{i}$ 为权重,计算 $M_{\mathrm{g}}$ 内全部股票的特质性波动率加权平均:
$$ \bar {\sigma} _ {g} ^ {i} = \sum_ {i \in \mathcal {M} _ {g}} \omega_ {i} \hat {\sigma} _ {i} ^ {i} \tag {7.47} $$
对于所有属于 $M_{g}$ 的股票, 使用经式 (7.47) 计算出的 $\bar{\sigma}_{g}^{i}$ 作为它们特质性波动率
的先验。有了先验和样本波动率,利用贝叶斯收缩将它们结合,得到股票 $i$ 的后验特质性波动率:
$$ \hat {\sigma} _ {i} ^ {b s} = \eta_ {i} \bar {\sigma} _ {g} ^ {i} + (1 - \eta_ {i}) \hat {\sigma} _ {i} \tag {7.48} $$
上式中等式左侧就是收缩后股票 $i$ 的特质性波动率(上标 $bs$ 代表贝叶斯收缩),等式右侧的第一项中的 $\eta_{i}$ 是在收缩时赋予先验的权重(称为收缩强度系数)。 $\eta_{i}$ 的表达式为:
$$ \eta_ {i} = \frac {q \left| \hat {\sigma} _ {i} - \bar {\sigma} _ {g} ^ {i} \right|}{\left(\frac {1}{N _ {g}} \sum_ {j \in \mathcal {M} _ {g}} \left(\hat {\sigma} _ {j} - \bar {\sigma} _ {g} ^ {i}\right) ^ {2}\right) ^ {1 / 2} + q \left| \hat {\sigma} _ {i} - \bar {\sigma} _ {g} ^ {i} \right|} \tag {7.49} $$
式中 $q$ 是一个经验压缩系数, $N_{g}$ 是 $M_{g}$ 中股票的个数。式(7.49)中的分子以及分母中的第二项的 $|\hat{\sigma}{i} - \bar{\sigma}{g}^{i}|$ 表示了股票 $i$ 的样本特质性波动率和其先验之间的偏离程度; 而式(7.49)分母中的第一项是 $M_{g}$ 中所有股票的样本特质性波动率和其先验偏离程度的标准差, 它是这些股票平均偏离程度的度量。最终的压缩权重 $\eta_{i}$ 就由这两个偏离程度(以及经验系数 $q$ )决定:
- $|\hat{\sigma}i - \bar{\sigma}_g^i |$ 越大,说明股票i的样本特质性波动率和先验的偏离越大,因此倾向于相信先验而非样本波动率,所以赋予先验的权重 $\eta{i}$ 越大。
- $|\hat{\sigma}i - \bar{\sigma}_g^i |$ 越小, 说明股票 $i$ 的样本特质性波动率和先验的偏离越小, 因此倾向于相信样本波动率而非先验, 所以赋予先验的权重 $\eta{i}$ 越小。
最后,在式(7.49)中唯一剩下的就是要确定经验系数 $q$ 。由于贝叶斯收缩的目标是降低个股特质性波动率的偏差统计量,因此通过综合考虑所有个股特质性波动率收缩前后偏差统计量的改进来找到合适的 $q$ 值。
作为风险模型,Barra模型在业界得到了广泛的使用和认可,因此整个7.2节也花了相当多的篇幅对其进行介绍。然而需要强调的是,任何模型都需要假设,模型本身也并无好坏之分。Barra模型仅是众多风险模型中的一个选择。随着学术界和业界研究的推进,很多估计资产协方差矩阵的新方法也应运而生。因子投资的践行者应该持有开放的心态,不断学习和吸收新的知识,争取在实际投资中能更好地控制风险。
[1]Barra已经被明晟(MSCI)收购。明晟于2018年8月月底推出了最新一代的中国模型CNE6。
[2]本书2.3节详细阐述了如何确定因子暴露。
[3]除此之外,为了消除因子收益率和特质性收益率的时序相关性,Barra模型中在计算样本协方差矩阵 $\hat{\Sigma}{\lambda}$ 和 $\hat{\Sigma}{\epsilon}$ 时进行了Newey-West调整。关于这点的介绍可见公众号“川总写量化”的文章《协方差矩阵的Newey-West调整》。
[4]公众号“川总写量化”的文章《Black-Litterman模型——贝叶斯框架下的资产配置利器》对此有详细的解读。
7.3 投资组合优化
有了收益模型和风险模型,主动管理的下一步就是将二者结合在一起,进行投资组合优化,以获得更高的风险调整后收益。介绍投资组合优化就是本节的内容。
7.3.1 错位的收益与风险模型
7.1节和7.2节两节分别介绍了预测收益率的收益模型和计算资产协方差矩阵的风险模型。在因子投资中,基金经理往往将二者结合起来,进行投资组合优化。这时,如果收益率模型中的预测变量和风险模型中构建因子的变量不完全匹配,就会出现收益和风险模型的错位(misalignment)。错位会在优化过程中造成负面影响,使得计算出的最优组合在因子的暴露上偏离使用者的本意,影响组合的风险收益特征。
在实际因子投资中,这种错位十分常见。对于大多数基金经理来说,他们都有独门的收益模型。而在风险模型方面,很多人选择采购第三方提供的商用多因子模型,比如Barra模型。由于独有收益模型中的预测变量无法与风险因子模型中的因子变量完全一致,因而造成了两个模型的错位。在投资组合优化过程中减弱甚至消除这种错位就显得格外重要。Lee and Stefan (2008)、Bender et al. (2009) 以及 Karels and Sun (2013) 等在这方面做过很多研究。下面先来看看收益和风险模型的错位会产生什么问题。
假设投资者使用某收益模型来获取相对基准的超额收益(记为 $R^{\alpha}$ ),该超额收益可以被视作股票在收益预测变量上暴露的某个线性组合(为简化数学表达,省略时间下标):
$$ R ^ {\alpha} = \beta_ {\alpha} \omega \quad (7. 5 0) $$
式中下标 $\alpha$ 表示收益模型; $\beta_{\alpha}$ 为股票在收益变量上的暴露矩阵。另外,投资者使用如下风险多因子模型计算股票的协方差矩阵:
$$ R ^ {e} = \beta_ {R} \lambda_ {R} + \varepsilon_ {R} \tag {7.51} $$
式中下标 $R$ 表示风险模型。由风险模型可知,股票的协方差矩阵为:
$$ \boldsymbol {\Sigma} = \boldsymbol {\beta} _ {R} \boldsymbol {\Sigma} _ {R} \boldsymbol {\beta} _ {R} ^ {\prime} + \boldsymbol {\Sigma} _ {s} \tag {7.52} $$
式中 $\Sigma_{R}$ 为因子收益率的协方差矩阵, $\Sigma_{s}$ 为特质性收益率 $\varepsilon_{R}$ 的协方差矩阵。收益和风险模型错位意味着式(7.50)中的暴露 $\beta_{\alpha}$ 和式(7.51)中的暴露 $\beta_{R}$ 不同。
在投资组合优化中,最常见的自标函数是Markowitz(1952)的均值—方差模型,它在最大化收益的同时对波动进行惩罚:
$$ \max _ {\boldsymbol {\omega}} \left(\boldsymbol {R} ^ {\alpha}\right) ^ {\prime} \boldsymbol {\omega} - \frac {\zeta}{2} \boldsymbol {\omega} ^ {\prime} \boldsymbol {\Sigma} \boldsymbol {\omega} \tag {7.53} $$
其中 $\zeta$ 是风险厌恶系数。在实际中,最优化目标函数式(7.53)的同时还会加入特定的约束条件。7.3.4节将会对约束条件进行详细介绍。接下来仅以最简单的无约束优化说明收益和风险因子模型错位造成的问题。
由于收益模型和风险模型的错位, $R_{\alpha}$ 可以被分解成两个部分。其中一部分是 $R^{\alpha}$ 在由 $K$ 个风险因子构成的超平面内的投影,另一部分是垂直于该超平面的残差。在数学上,上述分解可以表述为:
$$ \boldsymbol {R} ^ {\alpha} = \boldsymbol {\beta} _ {R} \left(\boldsymbol {\beta} _ {R} ^ {\prime} \boldsymbol {\beta} _ {R}\right) ^ {- 1} \boldsymbol {\beta} _ {R} ^ {\prime} \boldsymbol {R} ^ {\alpha} + \left(\boldsymbol {I} - \boldsymbol {\beta} _ {R} \left(\boldsymbol {\beta} _ {R} ^ {\prime} \boldsymbol {\beta} _ {R}\right) ^ {- 1} \boldsymbol {\beta} _ {R} ^ {\prime}\right) \boldsymbol {R} ^ {\alpha} \tag {7.54} $$
为简化表达, 定义 $R_{R}^{\alpha} \equiv \beta_{R} \left(\beta_{R}^{\prime} \beta_{R}\right)^{-1} \beta_{R}^{\prime} R^{\alpha}$ 和 $R_{\perp}^{\alpha} \equiv \left(I - \beta_{R} \left(\beta_{R}^{\prime} \beta_{R}\right)^{-1} \beta_{R}^{\prime}\right) R^{\alpha}$ , 并使用它们分别代表式 (7.54) 右侧两部分。当以式 (7.53) 为目标进行最优化时, 由 $R^{\alpha}$ 的分解可知,求解最优的股票权重 $\omega$ 将受到 $R_{R}^{\alpha}$ 和 $R_{\perp}^{\alpha}$ 这两个方向的影响, 最优的权重将是这种共同影响的结果。由于 $\mu_{\perp}$ 与风险因子所张成的超平面垂直, 即 $\beta_{R}^{\prime} R_{\perp}^{\alpha} = 0$ , 因此从风险模型的角度来看, $R_{\perp}^{\alpha}$ 没有任何风险。这将使得最优化过程过度倾向于 $R_{\perp}^{\alpha}$ , 这就是模型错位造成的问题。下面从数学上进一步说明。
式(7.53)的无约束最优解为 $\omega^{\star} = \frac{1}{\zeta}\Sigma^{-1}R^{\alpha}$ 。将式(7.54)代入最优解(并假设所有股票的特质性风险相同)可得:
$$ \omega^ {\star} = \frac {1}{\zeta \sigma_ {s} ^ {2}} \boldsymbol {R} _ {\perp} ^ {\alpha} + \frac {1}{\zeta \sigma_ {s} ^ {2}} \left(\boldsymbol {I} - \beta_ {R} \left(\beta_ {R} ^ {\prime} \beta_ {R} + \sigma_ {s} ^ {2} \Sigma_ {R} ^ {- 1}\right) ^ {- 1} \beta_ {R} ^ {\prime}\right) \boldsymbol {R} _ {R} ^ {\alpha} \tag {7.55} $$
式中 $\sigma_{s}$ 是股票的特质性波动率。式(7.55)说明最优权重 $\omega^{*}$ 由两部分组成,第一部分和 $R_{\perp}^{\alpha}$ 有关,第二部分和 $R_{R}^{\alpha}$ 有关,它是这二者的加权平均。一方面,由于 $R_{\perp}^{\alpha}$ 在风险因子上的暴露为零,因此由 $R_{\perp}^{\alpha}$ 的系数可知,对于这部分收益率,最优化过程仅对股票的特质性风险进行了惩罚。而另一方面,由 $R_{R}^{\alpha}$ 的系数可知,对于这部分收益率,最优化过程同时对因子风险和特质性风险两者进行了惩罚。从上述对比可以看出,收益和风险因子模型的错位使得最优化过程误认为 $R_{\perp}^{\alpha}$ 没有风险,因此赋予其更高的权重。在投资中“盈亏同源”, $R_{\perp}^{\alpha}$ 纵然是风险模型(7.51)无法解释的收益,也绝非没有风险。因此,模型的错位造成这部分收益率的风险被低估,从而影响最优化的结果。正确评估 $R_{\perp}^{\alpha}$ 的风险并对其惩罚就是需要解决的问题。
解决模型错位问题的思路主要有两个:(1)调整风险模型;(2)改进投资组合优化过程。首先说前者,它又由简到繁分为以下几种方法:
(1) 对于 $\beta_{\alpha}$ 和 $\beta_{R}$ 中相似的列(相似的暴露代表相近的因子),从风险模型
(7.51) 中剔除相应的因子。在实际操作中, 可将 $\beta_{R}$ 矩阵中的某些列全部设成 0 。
(2) 对风险模型和收益模型中相似的因子, 使用收益模型中的因子暴露替代风险模型中对应的因子暴露, 即使用 $\beta_{\alpha}$ 中的某一列替换 $\beta_{R}$ 中对应的列。
(3)使用收益模型中的因子,以及风险模型中和上述因子无关的因子,联合起来构成一个全新的风险因子模型。此方法与第二种方法的差别是,前者仅是因子暴露间的替换,而不涉及因子收益率本身。本方法则使用具有差异的因子构建全新的风险因子模型。调整风险模型虽然很直接,但在实际中也会受到不少的限制。比如当风险模型来自第三方的商用模型时,就难以对其进行改动。此外,从以上描述可知,对风险因子的改造首先需要识别收益和风险模型之间相近的因子,但如何定义相近的因子却十分模糊,因此容易引入未知的不确定性。因此,上述方法虽然提供了很好的思路,但实际的作用却很有限。更好的降低错位的方法则是直接对投资组合优化进行改进。
既然收益和风险模型的错位会导致最优化高估 $R_{\perp}^{\alpha}$ 的权重,因此一个自然的想法就是在优化问题中对 $R_{\perp}^{\alpha}$ 进行额外的惩罚。Bender et al.(2009)最先提出了这种改进思路,并将优化问题的目标函数由式(7.53)改为:
$$ \max _ {\boldsymbol {\omega}} \left(\boldsymbol {R} ^ {\alpha}\right) ^ {\prime} \boldsymbol {\omega} - \frac {\zeta}{2} \boldsymbol {\omega} ^ {\prime} \boldsymbol {\Sigma} \boldsymbol {\omega} - \theta \left(\boldsymbol {\omega} ^ {\prime} \boldsymbol {R} _ {\perp} ^ {\alpha}\right) ^ {2} \tag {7.56} $$
式中 $\theta$ 是非负系数,而新加入的 $-\theta (\omega^{\prime}R_{\perp}^{\alpha})^{2}$ 则代表了对 $R_{\perp}^{\alpha}$ 的惩罚。这种做法也带来了一个新的问题,即如何确定系数 $\theta$ 。首先考虑最简单的情况,即风险因子无法解释的收益 $R_{\perp}^{\alpha}$ 是纯噪声。这听上去似乎不可思议,但如果收益模型和风险模型中的因子非常接近,这种情况就有可能出现。当 $R_{\perp}^{\alpha}$ 是纯噪声时,显然不希望优化过程赋予其任何权重,因此 $\theta$ 的取值应该足够大。然而,更一般的情况是 $R_{\perp}^{\alpha}$ 绝非纯噪声。每个基金经理都有独门的预测收益率的变量,它们可以获得风险因子模型无法解释的收益率,因此 $R_{\perp}^{\alpha}$ 代表了正收益。然而,虽然 $R_{\perp}^{\alpha}$ 无法被风险因子模型解释,但并不意味着它没有风险[2]。在这种情况下, $\theta$ 应该和 $R_{\perp}^{\alpha}$ 的风险成正比。
本节对投资组合优化中潜在的收益和风险模型错位问题进行了介绍,希望能够引起因子投资使用者的思考。忽视这个问题将给优化结果引入未知的不确定性,影响投资组合的事后风险收益特征。在国内相关因子投资的研究中,例如券商金融工程报告中,使用不同的收益和风险模型十分常见,却没有对错位问题进行任何处理,说明该问题尚未得到足够的重视。收益和风险模型错位对实际因子投资的定量影响值得持续关注。
如果收益和风险模型相同,则不存在错位的问题。接下来的7.3.2节将以此为前提讨论几种常见的投资组合优化目标函数。
7.3.2 目标函数
为了介绍投资组合优化中常见的目标函数,令 $\mu$ 表示股票相对无风险收益的超额收益, $\Sigma$ 代表股票的协方差矩。以 $\mu$ 和 $\Sigma$ 作为输入,最著名的目标函数当属均值
一方差模型。
1. 均值—方差优化
均值—方差优化的目标函数为:
$$ \max _ {\omega} \mu^ {\prime} \omega - \frac {\zeta}{2} \omega^ {\prime} \Sigma \omega \tag {7.57} $$
其中 $\zeta$ 是风险厌恶系数。当不考虑任何约束时,式(7.57)的最优解为:
$$ \omega_ {\mathrm {m v o}} = (\zeta \Sigma) ^ {- 1} \mu \tag {7.58} $$
假设在实际投资中要求所有股票的权重之和为1(即 $\sum_{i=1}^{N} \omega_i = 1$ ),则加入此约束条件的最优解仅和式(7.58)相差一个缩放系数,因而可以写为:
$$ \omega_ {\mathrm {m v o}} ^ {\infty} \Sigma^ {- 1} \mu \tag {7.59} $$
均值—方差最优化的好处是同时考虑收益和风险。对于给定的风险(表示为投资组合的波动率),该组合能够获得最高的预期收益;对于给定的预期收益,该组合能够满足最低的风险。这些性质使得均值—方差优化备受关注。然而,这种方法的缺点是最优投资组合 $\omega_{\mathrm{mvo}}$ 对输入参数 $\mu$ 和 $\Sigma$ 非常敏感。往往参数的细微变化都会造成最优权重的巨大波动。众所周知,股票的预期收益率是难以预测的,因此该方法对参数敏感的缺点使得它在实际投资中也没少被人诟病。
为了避免使用 $\mu$ ,其他仅以 $\Sigma$ 为输入参数的目标函数相继被提出。仅使用 $\Sigma$ 构造目标函数也可以规避7.3.1节谈到的错位问题,但这并不意味着收益模型就不再重要。事实上,人们可以使用收益模型预测股票的收益率,并通过无参数预测挑出预测值高的股票。然后,针对这些股票不再区分其收益率差异,而仅使用它们的协方差矩阵为输入参数构造目标函数,并进行优化。当仅使用 $\Sigma$ 为参数时,主流的目标函数包括最小方差、最大多样化以及风险平价。
2. 最小方差
顾名思义,最小方差(minimum variance)就是要使最终投资组合的方差最小。其目标函数为:
$$ \min _ {\omega} \omega^ {\prime} \Sigma \omega \tag {7.60} $$
其最优解满足:
$$ \omega_ {\mathrm {m v}} ^ {\infty} \Sigma^ {- 1} 1 \tag {7.61} $$
3. 最大多样化
令 $\sigma = [\sigma_{1},\sigma_{2},\dots,\sigma_{N}]'$ 代表股票收益率的标准差向量。最大多样化(maximum diversification)的目标是最大化股票线性加权波动率与投资组合波动率之比。这个比值越大,说明该投资组合中股票的多样化(分散化)越充分。此方法的目标
函数为:
$$ \max _ {\omega} \frac {\omega^ {\prime} \sigma}{\sqrt {\omega^ {\prime} \Sigma \omega}} \tag {7.62} $$
式(7.62)的最优解满足(Clarke et al. 2013):
$$ \omega_ {\mathrm {m d}} \propto \boldsymbol {\Sigma} ^ {- 1} \boldsymbol {\sigma} \tag {7.63} $$
4. 风险平价
2005年,PanAgora资产管理公司的Edward Qian首次提出了风险平价(risk parity)的概念(Qian 2005)。随后,这一概念因桥水(Bridgewater)基金的全天候(all weather)策略而发扬光大。从经济含义上说,全天候策略的核心是将投资组合的风险平均地暴露在不同的经济环境中,从而对冲市场环境的风险,使得未来无论处于哪一种经济环境中,该投资组合的风险都是可控的。
从资产组合优化的数学含义上说,风险平价的意义是让投资组合中的资产对组合的风险贡献相等,因此该最优组合又被称为等风险贡献(equal risk contribution)组合。令 $\sigma_{p}$ 代表投资组合的波动率,则等风险贡献意味着:
$$ \omega_ {i} \frac {\partial \sigma_ {p}}{\partial \omega_ {i}} = \omega_ {j} \frac {\partial \sigma_ {p}}{\partial \omega_ {j}}, \forall i, j \tag {7.64} $$
式中 $\omega_{i}$ 为股票 $i$ 的权重。将式(7.64)转化为数学优化问题可得:
$$ \min _ {\boldsymbol {\omega}} \sum_ {i = 1} ^ {N} \left[ \omega_ {i} - \frac {\sigma_ {p} ^ {2}}{(\boldsymbol {\Sigma} \boldsymbol {\omega}) _ {i} N} \right] ^ {2} \tag {7.65} $$
其中 $(\Sigma \omega){i}$ 表示向量 $\Sigma \omega$ 中第 $i$ 个元素,即一个标量。一般情况下,式(7.65)并无“优雅”的解析解,而需要通过数值方法求出。然而,若所有资产两两相关系数均相等时,Maillard et al.(2010)指出在 $\sum{i=1}^{N} \omega_{i} = 1$ 的约束下,式(7.65)的最优解满足:
$$ \omega_ {\mathrm {r p}, i} = \frac {\sigma_ {i} ^ {- 1}}{\sum_ {j = 1} ^ {N} \sigma_ {j} ^ {- 1}} \tag {7.66} $$
需要说明的是,对于配置股票来说,所有股票两两相关系数相同这个假设难以成立,因此在该假设下的最优解似乎有些不切实际。但作为资产配置中最重要的方法之一,风险平价常被用于大类资产配置和计算不同类资产的最优权重。在这种情景下,资产两两相关系数均相等这个假设往往可以被接受。比起单纯使用历史数据来估计相关系数,这种假设往往可以产生更具稳健性的最优配置结果。
7.3.3 不同目标函数的比较
在投资组合优化中,由于预期收益率难以预测以及优化结果对其的敏感性,人们往往退而求其次,仅使用协方差矩阵 $\Sigma$ 为输入参数构建不同的目标函数。无论采用哪种方法,其目标都是该投资组合在事后能获得尽可能高的风险调整后收益。因此,一个很自然的问题就是在资产预期收益率 $\mu_{i}$ 以及风险(包括波动率 $\sigma_{i}$ 和相关系数 $\rho_{ij}$ )满足特定的条件时,通过其他目标函数得到的最优配置权重是否等价于均值一方差优化的最优权重。本节针对7.3.2节提到的最小方差、最大多样化以及风险平价三个目标函数,就这一问题进行简单论述。
首先,比较均值—方差优化的最优解式(7.59)和最小方差最优解式(7.61)可知,当所有资产的收益率 $\mu_{i}$ 均相等时,最小方差优化等价于均值—方差优化。接下来,比较(7.59)和最大多样化最优解式(7.63)可知,当所有资产的收益率 $\mu_{i}$ 与波动率 $\sigma_{i}$ 之比相同(即 $\mu_{i} / \sigma_{i} = \mu_{j} / \sigma_{j}$ )时,最大多样化优化等价于均值—方差优化。最后,Leote de Carvalho et al.(2012)指出风险平价最优解式(7.66)和均值—方差优化等价的条件是:(1) $\mu_{i} / \sigma_{i} = \mu_{j} / \sigma_{j}, \forall i, j$ ;(2)所有资产两两相关系数均相等。
与上述几种投资组合优化不同的是,在实际投资中经常用到的另一种配置方法其实无须用到任何优化,这种方法就是等权重(简单平均)。顾名思义,等权重就是所有资产权重一样,它无须用到 $\mu$ 或 $\Sigma$ 。在 $\sum_{i=1}^{N} \omega_i = 1$ 的约束下,其权重配置满足 $\omega_{\mathrm{ew}} = [1/N, \cdots, 1/N]'$ 。当以下三个条件满足时,等权重便等价于均值—方差优化:(1) $\mu_i / \sigma_i = \mu_j / \sigma_j, \forall i, j$ ;(2)所有资产两两相关系数均相等;(3) $\sigma_i = \sigma_j, \forall i, j$ ,即所有资产的波动率相同。表7.5总结了上述几种配置方法和均值—方差优化的等价条件。
表7.5 不同配置方法与均值—方差优化的等价条件
| 配置方法 | 等价条件 |
| 最小方差 | μi=μj, ∀i,j |
| 最大多样化 | μi/σi=μi/σj, ∀i,j |
| 风险平价 | μi/σi=μi/σj, ∀i,j; ρij=ρ, ∀i,j |
| 等权重 | μi/σi=μi/σj, ∀i,j; ρij=ρ, ∀i,j; σi=σj, ∀i,j |
从表7.5不难看出,除了最小方差之外,其他三种方法的等价条件依次增多。接下来通过构建一系列实验,并以最苛刻的等价条件开始,再逐一放松约束,以此展现这三种方法的配置结果和均值—方差优化配置结果的差异。稍后会单独比较最小方差和均值—方差优化。由于等权重配置方法需要三个条件才等价于均值—方差优化,因此一共考虑以下四个实验。
(1) 实验一满足三个条件: $\mu_{i} / \sigma_{i} = \mu_{i} / \sigma_{j}, \forall i, j; \rho_{ij} = \rho, \forall i, j; \sigma_{i} = \sigma_{j}, \forall i, j$ 。
(2) 实验二满足两个条件: $\mu_{i} / \sigma_{i} = \mu_{i} / \sigma_{j}, \forall i, j; \rho_{ij} = \rho, \forall i, j$ 。
(3) 实验三满足一个条件: $\mu_{i} / \sigma_{i} = \mu_{i} / \sigma_{j}, \forall i, j$ 。
(4) 实验四以上三个条件均不满足。
每个实验中包含三个假想资产,作为实验输入给定它们的 $\mu_{i} 、 \sigma_{i}$ 以及两两相关
系数 $\rho_{ij}$ , 考察不同资产配置方法得到的最优配置权重(所有方法均需要满足约束 $\sum_{i=1}^{N} \omega_{i} = 1$ )以及夏普比率。其实验结果如表7.6所示。
结果表明,当相应的等价条件满足时,不同方法和均值—方差优化的配置权重相同。然而,随着等价条件逐一去除,等权重、风险平价以及最大多样化依次在与均值—方差优化的比较中败下阵来。毫无疑问,参数的准确估计对资产配置结果是至关重要的。等权重只是一种无法(准确)估计参数时的无奈之举。一旦有了任何关于 $\mu_{i}$ 、 $\sigma_{i}$ 、 $\rho_{ij}$ 的靠谱信息都应该充分利用,并合理对未知参数可能满足的条件进行假设,从而选择最合适的资产配置目标函数。
最后来看看最小方差和均值—方差优化权重的比较。表7.7给出了对比结果。在两组实验中,由于只改变了 $\mu_{i}$ 的取值而协方差矩阵不变,因此最小方差给出了相同的配置结果。但是仅当所有资产 $\mu_{i}$ 相同时,最小方差才和均值—方差优化等价。
表7.6 等权重、风险平价、最大多样化、均值—方差优化权重的比较
| 条件 | 参数 | 等权重 | 风险平价 | 最大多样化 | 均值-方差优化 |
| 相同 μ/σ | μi/σi: | ωew = [0.33,0.33,0.33]' | ωrp = [0.33,0.33,0.33]' | ωmd = [.33,.33,.33]' | ωmvo = [0.33,0.33,0.33]' |
| 相同 ρ | 0.5,0.5,0.5 | 夏普比率 = 0.79 | 夏普比率 = .79 | 夏普比率 = 0.79 | 夏普比率 = 0.79 |
| 相同 σ | ρij=.1 | ωew = [0.33,0.33,0.33]' | ωrp = [0.55,0.27,0.18]' | ωmd = [0.55,0.27,0.18]' | ωmvo = [0.55,0.27,0.18]' |
| σi:0.1,0.1,0.1 | |||||
| μi/σi: | |||||
| 相同 μ/σ | 0.5,0.5,0.5 | ωew = [0.33,0.33,0.33]' | ωrp = [0.58,0.26,0.16]' | ωmd = [0.63,0.25,0.13]' | ωmvo = [0.63,0.25,0.13]' |
| 相同 ρ | ρij=0.1 | 夏普比率 = 0.75 | 夏普比率 = 0.79 | 夏普比率 = 0.79 | 夏普比率 = 0.79 |
| σi:0.1,0.2,0.3 | |||||
| μi/σi: | |||||
| 0.5,0.5,0.5 | ωew = [0.33,0.33,0.33]' | ωrp = [0.58,0.26,0.16]' | ωmd = [0.63,0.25,0.13]' | ωmvo = [0.63,0.25,0.13]' | |
| 相同 μ/σ | ρ12=0.1,ρ13=0.2,ρ23=0.5 | 夏普比率 = 0.65 | 夏普比率 = 0.70 | 夏普比率 = 0.71 | 夏普比率 = 0.71 |
| σi:0.1,0.2,0.3 | |||||
| μi/σi: | |||||
| 0.6,0.4,0.3 | ωew = [0.33,0.33,0.33]' | ωrp = [0.57,0.26,0.17]' | ωmd = [0.60,0.24,0.16]' | ωmvo = [0.77,0.19,0.04]' | |
| 均不满足 | ρ12=ρ13=0.2,ρ23=0.4 | 夏普比率 = 0.50 | 夏普比率 = 0.61 | 夏普比率 = 0.63 | 夏普比率 = 0.67 |
| σi:0.1,0.2,0.3 |
表7.7 最小方差与均值—方差优化权重的比较
| 条件 | 参数 | 最小方差 | 均值-方差优化 |
| 相同μ | μi:0.1,0.1,0.1σi:0.1,0.1,0.1ρ12=ρ23=0.1,ρ13=0.2 | ωmv=[0.80,0.17,0.03']夏普比率=1.08 | ωmvo=[0.80,0.17,0.03']夏普比率=1.08 |
| 不同μ | μi:0.05,0.1,0.15σi:0.1,0.1,0.1ρ12=ρ23=0.1,ρ13=0.2 | ωmv=[0.80,0.17,0.03']夏普比率=0.67 | ωmvo=[0.53,0.29,0.18']夏普比率=0.77 |
7.3.4 约束条件
7.3.2节和7.3.3节介绍了投资组合优化中常见的目标函数,以及它们之间的等价关系。其中每一个目标函数都有其适用条件,优势和劣势并存,具体采用哪种取决于应用场景。为了直观比较不同目标函数的差异,前面的讨论仅涉及最简单的无约束优化问题。然而在实际交易中,在使用上述目标函数时都要配合必要的约束条件,以实现不同机构或资金的风险偏好。投资组合优化中常见的约束条件包括:(1)卖空约束;(2)杠杆约束;(3)上下限约束;(4)换手率约束;(5)持仓数量约束;(6)因子暴露约束;(7)跟踪误差约束。下面依次说明。
1. 卖空约束
在现实中,很多机构都会受到卖空限制,即要求投资组合中股票的权重大于等于0。卖空约束的表达式如下:
$$ \omega \geq 0 \quad (7. 6 7) $$
其中 $\omega$ 为组合中股票的权重向量。
2. 杠杆约束
杠杆约束的意思是,在实际组合构造时,为了使资金利用率最大化,所有股票权重之和必须为1。这一约束的数学表达式为:
$$ \omega^ {\prime} 1 = 1 \quad (7. 6 8) $$
3. 上下限约束
在投资中,分散化能够有效降低投资组合风险。且由因子的定义可知,它代表了一揽子股票的共性收益。因此,无论使用非参数化预测还是参数化预测,挑选出来的股票个数都不应该过少。只有这样,不同股票的特质性收益率才可能相互抵消,投资组合才更可能反映出股票收益率中的共性部分(即因子收益率)。如果持仓过度集中于少量个股,则不利于剔除特质性收益率的影响,若遇到尾部风险事件容易造成较大损失。为实现这个目标,可采用限制股票最小权重和最大权重的方法,对股票持仓比例的上下限进行约束:
$$ L \leq \omega \leq U \quad (7. 6 9) $$
其中 $L$ 和 $U$ 分别为股票权重下限和上限向量。
除了对个股权重的约束之外,有时还会对行业或板块进行限制,使得持仓不要过分集中在同一类型股票。此时,可以通过限制行业或板块所有股票权重之和来达到目的:
$$ l _ {p} \leqslant \sum_ {i \in \mathcal {I} _ {p}} \omega_ {i} \leqslant u _ {p} \tag {7.70} $$
其中 $I_{p}$ 表示属于行业或板块 $p$ 的股票的集合; $l_{p}$ 和 $u_{p}$ 分别为权重的上下限。
一般来说,对于相对收益选股策略,行业往往是一个重要的风险来源,因而主动管理人会希望规避该风险。这时可以通过约束条件限制投资组合中的行业分
布和基准中行业分布的相同,从而实现行业中性化。该约束条件的表达式为:
$$ H _ {\omega} = h \quad (7. 7 1) $$
其中 $H$ 为 $P \times N$ 矩阵( $P$ 为行业数量, $N$ 为股票数量)。 $H$ 中每一个元素都是一个哑变量,如果股票 $i$ 属于行业 $p$ ,则该矩阵中的第 $p$ 行第 $i$ 列个元素的取值为1,否则为0。另外,该约束中 $h$ 为 $P$ 维向量,表示基准指数中各个行业的权重。
4. 换手率约束
由7.1.3节的介绍可知,信息衰减是收益率预测变量必须面对的问题,而应对它的办法之一就是提高投资组合再平衡的频率。然而,这么做往往以更高的换手率为代价,意味着更高的交易成本。为此,换手率约束也是投资组合优化中必不可少的一环,尤其是对于资金量规模大的策略来说更为重要,正所谓船大难掉头。对于单个股票,换手率约束可以表达为:
$$ \left| \omega_ {i} - \omega_ {i} ^ {0} \right| \leqslant \phi_ {i} \tag {7.72} $$
式中 $\omega_{i}^{0}$ 为进行投资组合优化再平衡之前股票 $i$ 的权重, $\phi_{i}$ 为股票 $i$ 权重变化的上限。如果要对整个投资组合换手率进行约束,则约束条件为:
$$ \sum_ {i = 1} ^ {N} \left| \omega_ {i} - \omega_ {i} ^ {0} \right| \leqslant \Phi \tag {7.73} $$
式中 $\Phi$ 为整个投资组合中所有股票权重变化的上限。
5. 持仓数量约束
一个股票组合具体持有多少支股票,取决于股票池、资金大小和风控要求。如果股票数量太少,则不够分散,资金容量也有限;如果数量太多,会损失一定的灵活性,因子暴露程度也会减弱。为了权衡利弊,在构造投资组合时,可对持仓数量进行一些约束,使其保持在某个范围内。令哑变量 $\delta_{i}$ 表示投资组合中是否包括股票 $i$ ,即:
$$ \delta_ {i} = \left{ \begin{array}{l l} 1 & \text {若} \omega_ {i} > 0 \ 0 & \text {若} \omega_ {i} = 0 \end{array} \right. \tag {7.74} $$
接下来,利用 $\delta_{i}$ 构建持仓数量约束:
$$ N ^ {L} \leqslant \sum_ {i = 1} ^ {N} \delta_ {i} \leqslant N ^ {U} \tag {7.75} $$
其中 $N^L$ 和 $N^U$ 分别为持仓数量的上下限。
6. 因子暴露约束
在因子投资中,不同因子的风险收益特征千差万别。有的因子长期溢价不高,波动却比较大,它们在截面维度下解释股票预期收益截面差异时用处不大,但却能在时序维度解释股票收益率的波动。这类因子常常被视为风险因子,比如Barra多因子模型中的国家和行业因子。因此,在设计投资组合时,为了减少投资组合收益率的波动,经常控制它在风险因子上的暴露。这一目标可通过因子暴露约束实现:
$$ \beta_ {k} ^ {L} \leqslant \sum_ {i = 1} ^ {N} \beta_ {i k} \omega_ {i} \leqslant \beta_ {k} ^ {U} \tag {7.76} $$
式中 $\beta_{ik}$ 为股票 $i$ 在因子 $k$ 上的暴露,因此 $\sum_{i=1}^{N} \omega_i \beta_{ik}$ 为投资组合在因子 $k$ 上的暴露。该约束的含义是,投资组合在因子 $k$ 上的暴露被限制在下限 $\beta_k^L$ 和上限 $\beta_k^U$ 之间。
在式(7.76)中,还可以将股票权重换成主动权重,即相对于基准的权重。令 $\omega_{i}^{B}$ 表示股票 $i$ 在基准组合中的权重,则主动权重为 $\omega_{i} - \omega_{i}^{B}$ 。此时,因子暴露约束条件变为:
$$ \beta_ {k} ^ {L} \leqslant \sum_ {i = 1} ^ {N} \left(\omega_ {i} - \omega_ {i} ^ {B}\right) \beta_ {i k} \leqslant \beta_ {k} ^ {U} \tag {7.77} $$
它的含义为投资组合在因子 $k$ 上的主动暴露需要被约束在某个范围内。在这种情况下,若令 $\beta_{k}^{L} = \beta_{k}^{U} = 0$ 则表示要求投资组合在因子 $k$ 上的暴露和基准指数相同。这种组合又被称作关于因子 $k$ 的风格中性组合。风格中性组合在业界的应用非常广泛。
7. 跟踪误差约束
对于指数增强策略而言,评价业绩的一个重要指标就是跟踪误差(tracking error)。跟踪误差指的是策略相对于基准的主动收益的波动率。跟踪误差越大,说明策略收益率与基准收益率之间的差异越不稳定。为了减少跟踪误差,可在投资组合优化中加入跟踪误差约束。令 $\omega$ 和 $\omega^{\mathrm{B}}$ 分别代表股票在投资组合和基准组合中的权重向量, $\Sigma$ 代表股票的协方差矩阵,则跟踪误差约束为:
$$ \left(\omega - \omega^ {B}\right) ^ {\prime} \Sigma \left(\omega - \omega^ {B}\right) ^ {1 / 2} \leq \sigma_ {\mathrm {T E}} \tag {7.78} $$
式中 $\sigma_{\mathrm{TE}}$ 表示能够容忍的最大跟踪误差水平。
以上介绍了七种常见的约束条件。在实际投资组合优化中,应根据实际的配置目标和需求选择合适的约束条件,再配合选定的目标函数以求解最优的股票权重。需要说明的是,当考虑了上述各种线性或非线性的约束条件之后,投资组合优化问题往往不再有解析解,因而需要采用数值方法求解。当投资组合的股票数量较多时,通过数值解法找到全局最优解往往也极具挑战性,且约束条件的参数如果选择不当甚至会出现无解的情况,这时可考虑按照约束条件的优先级来适当调整。
7.3.5 交易成本模型
除了约束条件,交易成本也是造成理论和实际结果有差异的重要因素。本节简要介绍交易成本模型。交易成本一般分为两种:显性成本和隐性成本,前者包括交易费用和买卖价差,后者主要指的是市场冲击成本。由7.3.4节的介绍可知,通过添加换手率约束可以间接控制交易成本,尤其是降低交易产生的费用。然而,由于过高的交易成本会侵蚀收益,因此更加精细的方式是通过对交易成本建模,将其作为惩罚项加入目标函数之中,实现收益和成本的均衡。两种常见的成本模型包括线性成本函数和二次成本函数。
1. 线性成本函数
线性成本函数简单直接。假设股票 $i$ 的成本为权重变化的固定比例 $c_{i}$ , 因此投
(7.79) 资组合的成本函数为: $\mathrm{TC}(\omega) = \sum_{i=1}^{N} c_i |\omega_i - \omega_i^0|$
2.二次成本函数
线性成本函数虽然简单,但它假设每支股票每笔交易的成本比例均一样,并没有考虑对市场的冲击程度,因此不够精细。二次成本函数,顾名思义,它在线性成本函数的基础上引入一个二次项,用来反映交易权重变化越大冲击成本越高:
$$ \mathrm {T C} (\boldsymbol {\omega}) = \sum_ {i = 1} ^ {N} c _ {i} | \omega_ {i} - \omega_ {i} ^ {0} | + \sum_ {i = 1} ^ {N} d _ {i} \left(\omega_ {i} - \omega_ {i} ^ {0}\right) ^ {2} \tag {7.80} $$
以上仅简要介绍了这两种最简单的交易成本模型,对它们更详细的说明可参考相关文献(如Lobo et al.2007, Kopman and Liu 2011, Hedayati et al.2018, Chen et al.2019等)。当选定了成本模型TC( $\omega$ )之后,将其作为惩罚项代入目标函数。令 $\max_{\omega} f(u, \Sigma, \theta, \omega)$ 表示原始目标函数,则考虑了成本之后的目标函数变为:
$$ \max _ {\boldsymbol {\omega}} f (\boldsymbol {u}, \boldsymbol {\Sigma}, \boldsymbol {\theta}, \boldsymbol {\omega}) - \gamma_ {\mathrm {T C}} \mathrm {T C} (\boldsymbol {\omega}) \tag {7.81} $$
式中 $\gamma_{\mathrm{TC}}$ 为交易成本的惩罚系数。使用式(7.81)所示的目标函数,再辅以必要的约束条件,通过优化问题求解可以获得最优的股票权重。
[1]例如,风险模型包含通过过去12个月累计收益计算的动量因子,而收益模型中的动量变量则依照学术界惯例滞后了1个月,这种差异使得 $\beta_{\alpha}$ 和 $\beta_{R}$ 中对动量变量的暴露很接近。
[2]如果它确实没有风险,而是纯收益,那也就不用惩罚了。
7.4 Smart Beta: 因子投资的捷径
多因子模型(1.3)的核心是解释股票预期收益和因子预期收益之间的关系。利用这种关系,人们在投资中便能做到有据可依,有的放矢,找到股票收益率背后的驱动力(即那些长期来看有溢价的因子)并通过暴露在这些驱动力上获取超额收益。
以此为目标,专业机构投资者可依照7.1节到7.3节的内容,在投资组合优化的整体框架下进行主动投资,而在这个过程中多因子模型为专业投资者提供了一种数量化工具。仍以账面市值比(BM)和特质性波动率(IVOL)为例,用它们预测收益率均能获得相对于市场指数的超额收益,即为优秀的收益率预测变量。主动管理人会以它们为出发点,经过收益预测、风险控制、组合优化等构建投资组合。但无论在这个过程中所涉及的数学模型或者运算多么复杂,最终的投资组合一定是以某种最优的权重利用了BM和IVOL预测收益率的能力。
那么,对于不具备专业技能的普通投资者来说,是否意味着无法利用它们战胜市场呢?答案是否定的。
为了回答这个问题,让我们换一下看问题的角度。虽然在主动管理人眼中,BM和IVOL是预测超额收益的变量,但在式(1.3)中,BM也同时被用来构建价值因子,而IVOL也同时被用来构建特质性波动率异象,因此只需通过投资组合排序法便能够轻松地构建它们的投资组合。通过投资这两个投资组合也就相当于利用了BM和IVOL预测股票收益率的能力。从这个意义上说,虽然主动管理通过复杂数学优化得到的投资组合和上述按排序法构建的投资组合中股票的权重会有区别,但它们在本质上并无差异。所以,哪怕不使用复杂的数学工具,普通投资者也可以通过投资有显著溢价的定价因子或异象因子的投资组合来获取超额收益。而这正是学术界关于多因子模型的研究成果对普通投资者的最大价值——学术研究揭示了那些能够获得显著溢价的定价因子和异象因子。
当然,在实际应用中,投资者仍然会面临一些问题,比如学术界的因子投资组合都是多空对冲且资金量中性的理论型组合。由于实际中的各种限制[1],它们并不具备可投资性。因此,如何使理论中的因子投资组合落地成真正可交易的投资组合就是必须要解决的问题,而其中的关键就是因子指数化(factor indexing)。与把多因子模型视作数量化工具而进行主动投资不同,因子指数化的目标是把具有显著超额收益的因子,以高暴露、高可投资性和低成本为目标加工为投资组合[2]。依照业界的惯例,这种以因子指数化组合为标的投资才被称为因子投资(factor investing)。
近年来,因子指数化的概念早已深入人心,越来越多的机构将因子指数化,
并且跟踪不同因子指数的基金产品也越来越多,使得普通投资者也能享用因子投资盛宴。这些因子类基金,还有一个高大上的名字——Smart Beta基金。专业的事情交给专业的人士去做,通过直接买卖或申赎这类基金,投资者就可以免除中间的繁复步骤,也可以避免落入各种陷阱的危害,剩下简单和美好。然而,不用亲自设计和交易因子组合,并不意味着投资者就变成了一个懒人。Smart Beta虽然是因子投资的捷径,但俗话说“世界上最快的捷径就是不走捷径”,要做好Smart Beta投资仍然有大量功课要做。本节将和你一起,抽丝剥茧,讲清楚Smart Beta的前世今生。
7.4.1 因子指数和Smart Beta
1. 概念定义
都说互联网行业喜欢造词,其实金融行业也一样。在Smart Beta这个名字中,第一个词Smart是一个形容词,是“聪明的”之意;而第二个词Beta则代表了式(1.3)中的β,表示因子暴露之意。简单来说,这两个词放在一起得到的Smart Beta就表示挑选有风险溢价的因子(Smart部分)并通过暴露在其上(Beta部分)来获取超过基准的收益。
有人说Smart Beta是一次行业革命,也有人说这是在故弄玄虚。类似的称呼还有很多,比如Systematic Beta、Alternative Beta、Style Beta和Strategic Beta[3],有时让人“傻傻分不清楚”。正如一千个读者眼里有一千个哈姆雷特,不同机构对Smart Beta的具体定义也不尽相同。表7.8梳理了一些知名机构对Smart Beta的定义,从中提炼出共同点,就能够更好地定义和理解Smart Beta概念。
表7.8 各机构的Smart Beta定义
| 机构 | 定义 |
| 富达基金(Fidelity) | 和传统的市值加权指数相比,Smart Beta使用一个或多个因子构造指数,试图增加收益、减少风险和成本,以及增加组合多样性。 |
| 贝莱德(BlackRock) | Smart Beta通过明确的规则编制因子暴露指数,以便基金公司低成本地进行复制,从而增强组合收益和降低组合风险。 |
| 景顺(Invesco) | 通过一些事先定义的规则和公式编制指数,以在常见的风险因子上有所暴露,主要有两个特点:(1)组合权重偏离市值加权;(2)透明的规则。 |
| 先锋(Vanguard) | 偏离市值加权的另类加权方法,以获得不同的风险和收益结果,即为Smart Beta。 |
续表
| 机构 | 定义 |
| 锐联(Research Affiliate) | 不同于市值加权,Smart Beta 基于股票因子或特征,系统地选择、加权和再平衡组合持仓,以增加组合价值。 |
| 晨星(MorningStar) | 和传统的市值加权不同,Smart Beta 选择在一个或多个因子上有所暴露,从而增强收益或者平衡波动。 |
| 明晟(MSCI) | 选择具有学术支撑的股票特征,以明确规则和透明方式编制Smart Beta 指数,并捕捉长期超额回报。这些指数具有实施简单和可复制性高的特点,具有主动和被动双重优势。 |
| 富时罗素(FTSE Russell) | Smart Beta 使用各种方法确定指数成分和权重,而不是像传统那样用市值进行加权,这些方法反映了各种学术上公认的风险或收益驱动因素,可以帮助投资者在实现特定目标时获得更多控制权。 |
| 标普道琼斯(S&P Dow Jones) | 使用透明和明确的规则编制另类加权指数,以捕获因子风险溢价。 |
| Wealthfront | 相比市值加权,Smart Beta 采用多个因子得到更智能的权重,以增加预期回报。 |
| Betterment | 在同一资产或不同资产内,通过一系列明确定义的因子,以获得目标收益和组合分散化。Smart Beta 偏离了市值加权,介于主动投资和被动投资之间。 |
表7.8中涉及的机构包括资产管理公司、指数编制商、数据资讯公司和智能投资顾问等。它们的业务和客户差异较大,因此对Smart Beta的定义也存在区别。尽管如此,还是能够从中总结出Smart Beta的如下要素:(1)偏离传统的市值加权宽基指数;(2)规则清晰和透明,可复制性强;(3)主动在一个或多个因子上暴露;(4)追求增强收益或降低风险。
综合上述信息,本书可以将Smart Beta定义如下:在某类资产内,以更高的收益或更低的风险为目标,针对一个或多个具有风险溢价的因子来确定投资组合持仓及权重。由此可见,Smart Beta选择通过主动偏离传统的市值加权指数,以获得更好的投资结果。在资产管理领域有两个对立的流派:被动投资和主动投资。而Smart Beta被认为介于二者之间(如图7.3所示)。
被动投资认为市场是有效的,想要持续获得战胜市场的超额收益十分困难,因此最好的投资方式就是持有市场组合。该组合以股票市值作为加权依据,市值越高权重越大。被动投资有诸多优点,包括容量较大、易于实施以及成本较低等。不过,业界对被动投资的批判之声也不绝于耳。例如Arnott and West(2006)认为市值加权组合高估了成长股,低估了价值股,并不是一种理想的投资方式。

图7.3 被动投资、主动投资和Smart Beta的关系
和被动投资相反,主动投资认为市场并非完全有效,只要找对了方法就能击败市场,获取超额收益。在这方面,选股和择时是两个重要的思路。选股以在股票截面上选出未来预期收益率更高的股票为目标,而择时则以在时序上判断市场整体涨跌从而动态控制仓位为研究对象。无论是选股还是择时,具体方法仁者见仁,智者见智。主动投资的目的是通过获得更高的收益和(或者)降低投资组合的风险(例如降低最大回撤)来击败市场指数。和被动投资相比,主动投资方法更加主观,也不够公开透明,且换手率较高,可复制性较低。
从Smart Beta的特点和定义可知,它兼具两种投资流派的基因,属于“中间派”。一方面,Smart Beta规则透明清晰,易于复制和成本较低,属于典型的指数化投资,这和传统的被动投资如出一辙;另一方面,它选择在特定的因子上有所暴露,主动偏离指数加权方式,以获得更高收益或更低波动,这又和主动投资方式十分接近。表7.9将被动投资、主动投资和Smart Beta进行了对比[4]。
表7.9 被动投资、主动投资和Smart Beta对比
| 特点 | 被动投资 | 主动投资 | Smart Beta |
| 风格暴露 | 低 | 高 | 高 |
| 潜在收益 | 低 | 高 | 中 |
| 换手率 | 低 | 中偏高 | 中偏低 |
| 容量 | 高 | 中偏低 | 中偏高 |
| 透明性 | 高 | 低 | 高 |
| 费用 | 低 | 高 | 中偏低 |
| 复制难度 | 低 | 高 | 低 |
2. 选择因子
既然要以因子投资组合为投资标,那么第一步就是选择合适的因子。在这方面,学术界大量研究发现的诸多定价和异象因子都为业界提供了巨大的启发。从大类来说,使用最广泛的因子集中于以下几类:价值、质量、低波动、动量、股利以及规模等。表7.10给出了这些大类因子在Smart Beta实践中的定义;表7.11列举了明晟、标普道琼斯、富时罗素、锐联和中证指数这些有代表性的指数公司所使用的大类因子。
表7.10 Smart Beta中常见的大类因子
| 因子 | 定义 |
| 价值 | 由于便宜的股票长期强于高估的股票,利用市净率、市盈率以及EBITDA/EV等估值指标,捕获价值溢价(Value Premium)。 |
| 质量 | 高质量(基本面好)的公司要比低质量的公司更有优势;从盈利能力、成长能力和财务安全等方面获取质量溢价(Quality Premium)。 |
| 低波动 | 低风险异象广泛存在,使用波动率、特质性波动率或市场β等风险指标,获取低波动溢价(Low Volatility Premium)。 |
| 动量 | 强者恒强,弱者恒弱,通过选择过去12个月(剔除最近1个月)总收益高的股票,获取动量溢价(Momentum Premium)。 |
| 股利 | 持续稳定的股利表明盈利稳定和现金流充沛,通过选择股息率持续和稳定的公司,获得股息溢价(Yield Premium)。 |
| 规模 | 市值小的公司长期明显跑赢市值大的公司,用市值衡量公司规模并选股,获得规模(小市值)溢价(Size Premium)。 |
表7.11 有代表性的指数公司所使用的大类因子
| 明晟 | 标普道琼斯 | 富时罗素 | 锐联 | 中证指数 |
| 价值 | 增强价值 | 价值 | 价值 | 价值 |
| 质量 | 质量 | 质量 | 质量 | 质量 |
| 动量 | 低波动 | 低波动 | 低波动 | 低波动 |
| 股利 | 动量 | 动量 | 动量 | 动量 |
| 规模 | 股利 | 收益型 | 红利 | |
| 规模 | 规模 | 规模 |
对投资者来说,在选择因子时,除了熟悉和了解因子的历史表现以外,更加关心的自然是因子在未来能否继续获得风险溢价。为此,就必须搞清楚因子获取超额收益的内在驱动力,否则即便它在历史上有效现在也枉然。本书6.5节详细论述了因子背后的原因,其中合理的原因包括风险补偿和错误定价,错误的原因则是样本内的数据窥探。此外,第3章在介绍主流(定价)因子时也详细剖析了每个因子。在选择因子时应注重每个因子背后的逻辑,唯有如此才能帮助人们判断因子所获得的收益是否是可持续的,只有可持续的因子才有被配置的价值。
搞懂因子成因的另一个好处是,它能够帮助人们在因子表现不好的时候依然对其抱有信心并坚持使用它。在这方面,价值因子无疑是一个鲜活的例子。自2017年四季度开始,价值因子在美股上连续跑输标普500指数。很多配置了价值因子的对冲基金以及机构投资者都因为其弱势的表现而“很受伤”,而首当其冲的无疑要数AQR。这家全球知名的量化型对冲基金的市场中性策略是基于多因子构建的,而价值因子是其中重要的组成部分。该策略自2017年四季度以来持续跑输基准指数以及同类策略。面对该因子如此低迷的表现,AQR的领航人Clifford Asness(他是Eugene Fama近二十年来最得意的门生)发表了一篇长达23页,字数超过17000字的文章(Asness 2018)深刻分析了价值因子走弱背后的原因。但更重要的是,这篇文章也通过客观的数据分析指出,价值因子背后的逻辑依然不变,因而从长期来看其表现可期,不应该仅仅因为短期的低迷表现而被放弃。
上面这个例子同样说明,因子的表现是具有周期性的。它们能否获得超额收益与宏观经济、商业周期以及投资者情绪有关。如表7.12所示,根据Ung and
Luk(2016)的研究,质量和动量在市场上涨、经济扩张和市场乐观时有较好的表现,质量、低波和股利在下跌市场、经济收缩和市场悲观时表现更胜一筹。虽然因子收益率存在周期性,但不同因子间的收益率存在较低的相关性,使得它们在一定程度上互补,“东方不亮西方亮”。
表7.12 因子表现与市场周期、商业周期以及投资者情绪
| 价值 | 质量 | 低波动 | 动量 | 股利 | 规模 | ||
| 市场周期 | 牛市 | ↑ | ↓ | ↑ | |||
| 熊市 | ↑ | ↑ | ↑ | ||||
| 恢复期 | ↑ | ↓ | ↓ | ↑ | ↑ | ||
| 商业周期 | 扩张 | ↑ | ↑ | ↓ | |||
| 收缩 | ↓ | ↑ | ↑ | ↓ | ↑ | ||
| 投资者情绪 | 乐观 | ↑ | ↑ | ↓ | ↑ | ↓ | ↑ |
| 悲观 | ↓ | ↑ | ↑ | ↑ | ↓ |
3. 指数编制
在编制因子指数时,因子暴露和可投资性是必须考虑的两个因素。然而,这二者天生矛盾,获得高的因子暴露是通过牺牲可投资性得到的,反之亦然,因而必须在它们之间权衡和取舍。可投资性是指目标因子的投资组合中股票的仓位是否合理,该组合的换手率和交易成本是否符合实际,进入该组合的股票是否有足够的流动性,该投资组合能承担的资金量(即因子的容量)是否足够大等。图7.4中金字塔描绘了五种因子指数化方法,自上而下,它们的因子暴露越来越低、可投资性越来越高。

图7.4 不同的因子指数化方法
- 纯因子指数:位于金字塔顶端的是纯因子指数。纯因子指数是为了正确定量计算因子的收益和风险而从纯数学的角度构建的。构建时没有考虑任何可投资性的约束,其可投资性非常低(例如Barra模型中的因子)。它满足对目标因子有1个单位的暴露,对其他因子没有暴露[7]。
- 多空因子指数:金字塔的第二层是多空对冲的因子指数,这类指数通常是资金量中性的。比如Fama-French三因子模型中的规模和价值因子的组合就是这一类的代表。构建这类指数的常见方法是排序法。该方法对目标因子仍然有很高的因
子暴露,但也不可避免地暴露于其他因子上,不过这种方法构建的投资组合较纯因子组合有一定的可投资性。
- 高暴露因子指数:金字塔的第三层是高暴露因子指数。它所处的位置表明其在一定程度上实现了因子暴露和可投资性之间的平衡。在构建该指数时会同时考虑因子暴露和可投资性的约束条件(如低换手率、高流动性、高容量)。这类指数的构造方法主要包括筛选法和优化法。在前者中,首先依照因子暴露的高低,从所有股票中筛选出一个子集,然后按某种权重将这些股票配置在一起。在后者中,以因子暴露和组合风险为目标函数,在各种可投资性约束下进行求解,得到高暴露因子指数。除此之外,这类指数通常为纯多头组合,因此较前两种方法来说,它具有更高的可投资性。
- 高容量因子指数:金字塔的第四层为高容量因子指数。它在高暴露指数的基础上,为了获得更好的可投资性而进一步降低了因子暴露。这种方法并不对股票进行筛选,而是包括所有股票池中的股票。但在决定股票权重时,此方法同时考虑股票在该因子上的暴露高低以及股票自身的市值大小。通过这两方面的综合评判来最终决定每支股票在这类指数中的权重。
- 市场指数(基准):金字塔的底层是基准,即市场指数。市场指数是按照股票市值加权构建的指数,它是唯一的、纯粹的反应被动投资的指数。由于股票按照市值加权,因此市场指数有着最高的可投资性。此外,由于它是基准,通常认为它对所有(风格)因子的暴露都是零。
因子指数一般由指数公司编制并发布,资管机构需要获取授权才能发行产品。Smart Beta的编制方案可以直接从指数公司网站上下载,只要愿意任何人均能复现指数,尽显透明原则。和宽基指数相比,Smart Beta的编制略微复杂一些,在股票选择或加权方式上别具一格,以求实现因子暴露。
一般来说,因子指数可以通过两种方式确定因子暴露:权重模式和排序模式。权重模式放弃市值加权,采用另类加权方式,间接在因子上产生暴露,这类指数往往被称为另类加权指数(alternatively weighted indexes),典型的例子包括等权重指数、最小方差指数和基本面加权指数,分别偏向规模、低波动和质量因子。排序模式更加直接,用一个或多个因子指标进行排序打分,选择得分最强的N支股票进入组合,这类指数常被称为因子指数(factor indexes)。中证500质量指数就是后者的一个例子,它从中证500样本股中选取100支盈利能力较强、盈利可持续、现金流量较为充沛且兼具成长性的股票作为指数样本股。当然,人们也可以将两者进行结合,用因子指标从投资范围中选择目标股票,再通过另类加权方式确定最终权重。
下面以明晟质量指数(MSCI 2014)为例,介绍Smart Beta指数的设计流程,使读者对其有一个基本的感知。Smart Beta指数的编制主要包括四个步骤:确定股票范围、计算因子得分、选择具体股票和确定成分权重。首先,需要明确投资范围,对于明晟质量指数,其只能在NASDAQ、NYSE以及AMEX三大交易所上市的股票中选择。
其次,计算投资范围内所有股票的因子得分。具体来说,明晟质量指数考虑三个基本面变量:净资产收益率(ROE)、权益负债率(D/E)和盈利增长稳定性。对于股票 $i$ 在变量 $j$ 上的取值,先使用缩尾处理剔除原始数据中的异常值,然后
在截面上计算其标准化的Z-Score:
$$ z _ {i j} = \frac {x _ {i j} - E [ x _ {i j} ]}{\sigma \left(x _ {i j}\right)} \tag {7.82} $$
盈利稳定性以及债务负债率底层逻辑和预期收益率负相关,因此这两个指标的得分需要乘以-1。得到股票在这三个变量上的得分后,将其取平均就得到股票在其上的综合得分 $Z_{i}$ ,最终的股票 $i$ 质量得分 $Q_{i}$ 由式(7.83)得到:
$$ Q _ {i} = \left{ \begin{array}{l l} 1 + Z _ {i} & \text {若} Z _ {i} > 0 \ (1 - Z _ {i}) ^ {- 1} & \text {若} Z _ {i} < 0 \end{array} \right. \tag {7.83} $$
将投资范围内所有股票按照质量得分降序排列,选择排名靠前的N支股票入选质量指数的成分股。最后一步是确定每个成分股的权重。明晟质量指数成分权重由质量得分和股票市值共同决定,既能保证因子暴露足够高,又能保证容量足够大。这种权重方式也被称为市值调整法(market capitalization scaling)。令 $s_i$ 代表股票i的市值,使用市值和质量得分的乘积计算权重如下:
$$ \omega_ {i} = \frac {s _ {i} Q _ {i}}{\sum_ {j \in \mathcal {I}} s _ {j} Q _ {j}} \tag {7.84} $$
式中 $I$ 为选出的 $N$ 支股票的集合。该方法融合了市值和质量因子变量,因而在流动性和因子暴露之间达到了某种平衡。
7.4.2 为什么要投资Smart Beta
通过和被动投资与主动投资的对比可知,Smart Beta兼具两类投资方式的良性基因,这也是人们选择Smart Beta的原因所在。总结起来,选择Smart Beta有如下四个理由:增加收益、降低风险、节约费用和增加透明度。
1. 增加收益
被动投资主要捕捉市场风险溢价,收益来源较为单一;主动投资收益来源虽然较为多元化,但是却难以区分管理人的能力和运气。Smart Beta具有明确的因子暴露,可以从价值、质量和动量等多个角度获取风险溢价。因此,如果将宽基指数基金或者主动管理基金换成Smart Beta产品,能够获得确切透明的收益增厚。
下面以传统的60/40股债组合为例展示Smart Beta对收益率的增强效果。在本书关于Smart Beta的所有实证中,宽基指数和因子指数均使用三位作者自己维护的BetaPlus 1000指数系列[8]。在投资实务中,60/40股债组合是最常见的分散化策略,该策略将 $60\%$ 投资股票资产,剩下的 $40\%$ 投资国债。如果将 $60\%$ 的权重平均分配给6个Smart Beta指数,能显著增强60/40组合的表现。图7.5展示了传统60/40组合和Smart Beta增强60/40组合的累计收益。前者年化收益率 $6.68\%$ ,年化夏普比率为0.48;后者年化收益率为 $9.11\%$ ,年化夏普比率为0.60。将Smart Beta加入60/40组合
中确实能够明显提升业绩表现。

图7.5 使用Smart Beta增强收益示例
2. 降低风险
除了增强组合收益,Smart Beta还能降低组合风险。一方面,配置不同的因子使得风险来源更加多样,增加了组合的分散性。仍以增强版60/40组合为例,将宽基指数替换为6个不同类型的单因子指数后,投资组合的最大回撤比原始组合下降了 $2.13\%$ 。另一方面,通过Smart Beta可以聚焦到低波动和质量等防御类型因子上,进一步降低投资组合的风险。图7.6对比了防御版本的60/40组合和原始组合的回撤时间序列。在防御版本中,其中股票资产的 $30\%$ 分配给质量因子, $30\%$ 分配给低波动因子。由于高质量和低波动具有较好的回撤保护功能,防御版本的60/40组合波动明显降低。

图7.6 使用Smart Beta降低风险示例
3.节约费用
相对于主动型基金,Smart Beta换手率和管理费用均较低,能节约更多的费用,“省到即赚到”。使用2015年到2019年普通股票型基金数据,图7.7展示了主动
股票型基金换手率和业绩的关系。其中横轴为五年平均换手率,纵轴代表周度选股能力[9]。可以看到,换手率和阿尔法成倒U形,即随着换手率的提升,基金的超额收益先升后降。选择换手率更低的Smart Beta基金,能节省不少交易费用。

图7.7 换手率与选股能力
如果说交易费用和冲击成本看不到摸不着,那么管理费用则是投资者可以直接看得到的。图7.8展示了主动型基金、指数增强基金、被动型指数基金和Smart Beta ETF的管理费率统计[10]。与普通股票和指数增强型基金相比,Smart Beta的费率要低很多。

图7.8 不同类基金的管理费率
4. 增加透明度
和被动指数投资相比,主动投资取决于投资经理的主观判断,由此会带来委托代理问题。首先,由于激励机制和考核制度,基金经理的目标不一定是投资人利益最大化,而是自身利益最大化。比如为了追求短期目标,基金经理倾向于选择彩票型股票(高波动、高贝塔或正偏度),而彩票型股票往往被高估[11]。其次,由于投资框架不成熟,抑或基金经理变更,会带来风格漂移,致使业绩持续
性较差。例如,根据界面新闻的统计,国内基金经理人均任职年限仅为1.72年[12]。最后,基金经理也是人,只要是人都会存在认知和行为偏差,如过度自信、锚定效应、处置效应和选择性偏差等,这也会给基金管理带来不确定性。
Smart Beta能有效地解决上面三个问题,透明度可以和宽基指数媲美。首先,由于Smart Beta也是指数化投资,跟踪误差是考核的重要指标,所以基金经理不会也没有动机偏离基准指数;其次,Smart Beta在设计之时,就已经明确了风格暴露特征,并且规则清晰透明,不会受到基金经理情绪的影响,也不会因基金经理的离职而偏离设计初衷。
7.4.3 如何投资Smart Beta
前面介绍了什么是Smart Beta,以及为什么要关注Smart Beta。“光说不练假把式”,本节就来讨论在Smart Beta实际操作时需要考虑的问题,内容包括目前国内外Smart Beta概况、投资Smart Beta流程、基金评价标准以及交易拥挤度等。
1. Smart Beta市场一览
Smart Beta在美国已经发展非常成熟,资产规模持续增长。截至2019年年末,美国Smart Beta ETFs数量已超过900支,合计管理规模高达9826.9亿美元[13]。表7.13展示了其中管理规模最大的10支Smart Beta ETF。它们均由知名机构发行,2019年平均管理规模为370.9亿美元,涵盖的因子包括价值、成长、股利和低波动等,其中价值、成长和股利分别有3支,表明这三类策略目前是最受欢迎的Smart Beta ETFs。从这10支ETF发行年份来看,早在2000年就有4支产品成立,已经持续管理运营超过20年。
表7.13 美国市场中规模最大的10支Smart Beta ETFs
| 名称 | 发行公司 | 跟踪指数 | 发行年份 | 管理 规模① | 类型 |
| Vanguard Value ETF | 先锋 | GRSP US Large Value Index | 2004 | 558 | 价值 |
| iShares Russell 1000 Growth ETF | 贝莱德 | Russell 1000 Growth Index | 2000 | 489 | 成长 |
| Vanguard Growth ETF | 先锋 | CRSP US Large Growth Index | 2004 | 459 | 成长 |
| iShares Russell 1000 Value ETF | 贝莱德 | Russell 1000 Value Index | 2000 | 422 | 价值 |
| Vanguard Dividend Appreciation ETF | 先锋 | NASDAQ US Dividend Achievers Select Index | 2006 | 415 | 红利 |
| iShares Edge MSCI Min Vol USA ETF | 贝莱德 | MSCI USA Minimun Volatility Index | 2011 | 369 | 低波动 |
| Vanguard High Dividend Yield ETF | 先锋 | FTSE High Dividend Yield Index | 2006 | 301 | 股利 |
| iShare S&P 500 Growth | 贝莱德 | S&P 500 Growth Index | 2000 | 278 | 成长 |
| iShare S&P 500 Value | 贝莱德 | S&P 500 Value Index | 2000 | 219 | 价值 |
| SPDR S&P Dividend ETF | 道富环球投资 管理 | S&P High Yield Dividend Aristocrats Index | 2005 | 199 | 红利 |
尽管Smart Beta在美国发展如火如荼,但它在国内依然是一个比较时髦的东西。2006年,华泰博瑞基金率先发行上市了上证红利ETF,这也是国内首支Smart Beta基金。虽然起步比较早,但国内Smart Beta仍然只是初试锋芒,无论是投资理念还是产品规模都处于起步阶段。
图7.9展示了国内Smart Beta ETFs每年发行数量和管理规模。截至2020年一季度,国内Smart Beta ETFs数量为30支,合计规模为169.62亿元。相较于2018年之前,2019年可谓Smart Beta ETFs发行的大年,数量和管理规模均有明显增长。表7.14总结了国内市场中当前所有Smart Beta产品,涵盖红利、质量、低波动、价值、规模(小市值)、成长和多因子等,从类型上来看已经非常丰富。其中,红利和质量类的产品规模最大,两者管理规模之和为104亿元,占总数的 $61.55\%$ ,是国内投资者最钟爱的两类因子;其次是低波和多因子,总管理规模为46.31亿元,占比 $27.30\%$ ,前四大类型管理规模占比接近 $90\%$ 。从管理费来看,绝大多数基金每年收取 $0.5\%$ 的费用,最小值为 $0.15\%$ ,平均值为 $0.45\%$ ,和主动管理基金动辄 $1\%$ 以上的管理费相比,非常吸引人。


图7.9 国内Smart Beta ETFs每年发行数量与管理规模
表7.14 中国市场中的Smart Beta ETFs
| 代码 | 名称 | 跟踪指数 | 成立日 | 管理费 (%) | 管理 规模① | 类型 |
| 510880.OF | 华泰柏瑞红利 ETF | 上证红利 | 2006/11/17 | 0.50 | 30.69 | 红利 |
| 159905.OF | 工银瑞信深证红利 ETF | 深证红利 | 2010/11/05 | 0.50 | 18.33 | 红利 |
| 159910.OF | 嘉实深证基本面 120 ETF | 深证 F120 | 2011/08/01 | 0.50 | 14.64 | 质量 |
| 510890.OF | 兴业上证红利低波动 ETF | 上红低波 | 2019/04/22 | 0.50 | 13.51 | 低波动 |
| 159916.OF | 建信深证基本面 60 ETF | 深证 F60 | 2011/09/08 | 0.50 | 10.07 | 质量 |
| 515180.OF | 易方达中证红利 ETF | 中证红利 | 2019/11/26 | 0.15 | 9.94 | 红利 |
| 515590.OF | 前海开源中证 500 等权重 ETF | 500 等权重 | 2019/11/14 | 0.15 | 8.36 | 等权重 |
| 512750.OF | 嘉实中证锐联基本面 50 ETF | 基本面 50 | 2019/05/23 | 0.50 | 8.07 | 质量 |
| 512040.OF | 富国中证价值 ETF | 国信价值 | 2018/11/07 | 0.60 | 5.61 | 价值 |
| 515520.OF | 大成 MSCI 中国 A 股质优价值 100 ETF | MSCI 中国 A 股 质优价值 100 | 2019/09/26 | 0.50 | 5.32 | 多因子 |
| 159966.OF | 华夏创业板低波蓝筹 ETF | 创业蓝筹 | 2019/06/14 | 0.50 | 5.32 | 低波动 |
| 515450.OF | 南方标普中国 A 股大盘红利低 波 50 ETF | 标普中国 A 股大 盘红利低波 50 | 2020/01/17 | 0.50 | 4.74 | 多因子 |
| 512530.OF | 建信沪深 300 红利 ETF | 沪深 300 红利 | 2019/08/23 | 0.50 | 3.60 | 红利 |
| 515080.OF | 招商中证红利 ETF | 中证红利 | 2019/11/28 | 0.20 | 3.54 | 红利 |
| 515300.OF | 嘉实沪深 300 红利低波动 ETF | 300 红利 LV | 2019/08/08 | 0.50 | 3.28 | 多因子 |
| 515890.OF | 博时中证红利 ETF | 中证红利 | 2020/03/20 | 0.15 | 3.12 | 红利 |
| 515570.OF | 山西证券中证红利潜力 ETF | 红利潜力 | 2020/01/17 | 0.50 | 2.64 | 多因子 |
| 512260.OF | 华安中证 500 行业中性低波动 ETF | 500SNLV | 2018/11/30 | 0.50 | 2.57 | 低波动 |
| 515510.OF | 嘉实中证 500 成长估值 ETF | 500 成长估值 | 2020/03/16 | 0.50 | 2.36 | 多因子 |
| 512390.OF | 平安 MSCI 中国 A 股低波动 ETF | MSCI 中国 A 股 国际低波(美元) | 2018/06/07 | 0.50 | 2.27 | 低波动 |
| 515690.OF | 鹏华中证高股息龙头 ETF | 股息龙头全收益 | 2020/03/20 | 0.20 | 2.23 | 红利 |
| 512890.OF | 华泰柏瑞红利低波动 ETF | 红利低波 | 2018/12/19 | 0.50 | 2.16 | 多因子 |
| 510030.OF | 华宝上证 180 价值 ETF | 180 价值 | 2010/04/23 | 0.50 | 1.74 | 价值 |
| 159967.OF | 华夏创业板动量成长 ETF | 创成长 | 2019/06/21 | 0.50 | 1.49 | 多因子 |
| 159906.OF | 大成深证成长 40 ETF | 成长 40 | 2010/12/21 | 0.50 | 1.40 | 成长 |
| 510430.OF | 银华上证 50 等权重 ETF | 50 等权重 | 2012/08/23 | 0.50 | 0.92 | 等权重 |
| 159913.OF | 交银深证 300 价值 ETF | 深证价值 | 2011/09/22 | 0.50 | 0.75 | 价值 |
| 512270.OF | 华安沪深 300 行业中性低波动 ETF | 300SNLV | 2019/03/07 | 0.50 | 0.65 | 低波 |
| 512590.OF | 浦银安盛中证高股息 ETF | CS 高股息 | 2019/01/29 | 0.50 | 0.17 | 红利 |
| 512790.OF | 华安中证民企成长 ETF | 民企成长 | 2019/07/26 | 0.50 | 0.13 | 成长 |
①规模单位:亿元,数据为截至2020年一季度末。
2. 筛选流程
面对形形色色的Smart Beta基金,如何选择也需要一些技巧,通常可按照以下三个步骤进行。
(1)明确投资目标。首先,要明确选择Smart Beta的动机是什么,即为什么要将Smart Beta纳入组合。对于长期投资,增强收益可能是第一要务;对于应对短期市场波动,降低风险可能是首要目标。
(2)确定因子暴露。在明确了投资目标以后,需要找到相匹配的因子,这需要对不同类型Smart Beta的特性有大致了解。例如,如果以获取高收益为目的,那么应该选择进攻型的基金,如小市值和高成长的;如果想要降低组合波动,可以选择防御类型的因子,如低波动和高质量的。
(3) 加入已有组合。如果同一类Smart Beta有多个基金, 则需要从因子暴露程度和管理费用两个角度进行综合考虑。暴露程度和风险溢价正相关, 直接决定
了投资目标的实现效果;管理费用则是要付出的成本,省下来的都是收益。因此,应选择暴露高且性价比高的基金。
3. 基金评价
中医讲究望闻问切,西医关注检验指标。和中医西医一样,在评价一支Smart Beta基金时,也需要一套指标体系。如果单纯看一下收益率和最大回撤,未免太过粗糙了。评价一支Smart Beta基金时,可以从两类数据入手:净值序列和持仓明细。前者主要从业绩表现角度,考察收益和风险情况,后者则基于详细的持仓数据,评估其组合持仓特征、可投资性、因子暴露和收益风险来源。
从净值序列的角度窥探一支基金,可以获得一些最基础的测量指标。
- 收益类指标(例如年化收益率)衡量历史获利能力,往往越高越好。
·风险类指标(例如最大回撤)主要反映未来收益的不确定性或潜在的损失,通常越低越好。 - 风险调整后收益指标(例如夏普比率)同时考虑收益和风险,分子一般是收益类指标,分母一般是风险类指标。这类指标代表单位风险所获得的(超额)收益,因此越大越好。
如果要深入剖析基金,则需要做得更多。利用具体的持仓明细,可以对基金进行更深入的剖析。
- 组合特征,主要对具体持仓股票有直观了解。例如质量类基金,往往具有持仓市值大、盈利高和波动率低的特点。
- 因子暴露程度,用来衡量组合相对基准的因子暴露,暴露程度决定了风险和收益来源。在评价一支Smart Beta基金时,其在目标因子上的暴露越高越好。
- 可投资性则主要衡量持仓容量和分散能力,容量越小越容易造成拥挤,持仓越集中非系统性风险越大。以组合换手率为例,通常来说不要太大,否则会带来交易费用的损耗,在市场发生突变事件时也容易造成“踩踏”。
- 风格和风险归因分析(见7.6节和7.7节),将收益和风险来源进行分解,从源头上知悉每个行业或者因子的贡献程度。
基金评价是一项浩大工程,单一视角很容易盲人摸象,唯有从多个角度分析,方能“知人知面且知心”,详细指标见图7.10。

图7.10 Smart Beta基金评价指标
4. 拥挤度
在重大节假日期间,景区如果不限制人流量会导致过度拥挤带来安全隐患,因子投资也是一样。如果某类因子受到投资者的追捧,就会带来大量的资金流入,造成因子过度拥挤。其潜在的影响是,如果投资者偏好和情绪突然变化,资金就会疯狂地流出,导致发生“踩踏事故”,给因子的表现蒙上阴影。
如果能在“踩踏”发生之前提前预警,则有可能减少不必要的损失。海外很多机构已经意识到这个问题,基于资金流向、股票持仓和因子表现等数据,开发了各种各样的因子拥挤度计算模型,用来指导投资决策。本书6.6.2节从因子样本外失效的视角对MSCI开发的因子拥挤度模型进行过介绍,此处不再赘述。除此之外,一家名为Factor Research的研究机构也提出过关于因子拥挤度的模型。因子通常处于拥挤、正常和宽松三种状态之一。Factor Research研究指出因子大约在 $90\%$ 的时间均处于正常状态,而处于拥挤和宽松的时间各占 $5\%$ ,并不常见。
Factor Research从估值、波动性、相关性、动量和因子离散度几个角度,等权重合成了综合拥挤度指标。图7.11展示了在美股市场中因子拥挤度和因子未来风险之间的关系。无论考虑未来1个月、3个月、6个月还是12个月,当因子拥挤度高时,因子未来的回撤和波动均更大,反之当拥挤度较低时,其未来回撤和波动均更小。从因子风险管理的角度来看,当一个因子处于拥挤状态时,需格外小心谨慎。


图7.11 因子拥挤度与因子未来风险
7.4.4 应用实践
本节从实际投资问题出发,介绍Smart Beta的应用场景和案例。
1. 构造因子指数
Smart Beta基金需要跟踪某一个因子指数,因子指数一般由专业的指数公司编制并发布,国外的典型代表有明晟、富时罗素、标普道琼斯和锐联,国内主要是具有官方性质的中证指数有限公司和深圳证券信息公司。一些证券公司以及第三方机构也有涉及。在接下来的Smart Beta应用实践中,为了让数据样本更多,也为了更加灵活地开展测试,本书采用三位作者自己设计的指数进行实证研究,所用到的指数包括BetaPlus 1000指数和系列因子指数。
BetaPlus 1000指数对标罗素1000。它包含A股中总市值最大的1000支股票,代表了全市场90%的股票市值,它是实证中的基准指数。在BetaPlus 1000指数的基础上,同时构造价值、质量、红利、动量、低波动和规模(小市值)共六大类因子指数。BetaPlus 1000指数以及6个因子指数均是综合考虑可投资性和高因子暴露的纯多头组合,具体编制方案见本书配套网站[14]。表7.15汇总了上述7个指数在2000-01-01到2019-12-31之间的历史表现。其中,BetaPlus 1000指数年化收益率为7.24%,年化波动率为27.63%,和Wind全A指数的表现非常接近。另外,6个因子指数年化收益率和夏普比率均优于BetaPlus 1000指数,说明因子暴露获得了货真价实的溢价。其中表现最好的是质量和价值指数,说明依赖基本面信息的价值投资在A股长期表现更好。令人有些意外的是,规模(小市值)指数表现一般。这似乎有违常识,但它主要是由样本空间和加权方式导致的。在所有因子指数中表现最差的是动量指数,仅微弱地跑赢基准,这与A股市场中反转效应太强有关。
表7.15 BetaPlus指数风险收益特征
| BetaPlus 1000 | BetaPlus 价值 | BetaPlus 质量 | BetaPlus 低波动 | BetaPlus 动量 | BetaPlus 红利 | BetaPlus 规模 | |
| 年化收益率(%) | 7.24 | 13.14 | 13.70 | 10.86 | 7.65 | 10.66 | 9.50 |
| 年化波动率(%) | 27.64 | 29.34 | 27.82 | 28.17 | 29.97 | 27.15 | 33.53 |
| 夏普比率(年化) | 0.39 | 0.57 | 0.60 | 0.51 | 0.40 | 0.51 | 0.44 |
| 最大回撤(%) | -68.92 | -67.11 | -66.77 | -66.25 | -72.68 | -64.47 | -67.49 |
表7.16展示了不同因子指数相对基准BetaPlus 1000的月频超额收益率之间的相关系数[15],可以发现几个有意思的现象。首先,价值和红利因子相关性较高。其原因是股息率计算方式为每股股利除以每股价格,本质上也可以将其看作一个价值指标。价值及红利与动量因子的相关性显著为负,这符合理论和常识,因为动量强的股票估值也会得到提升。质量和低波动因子的相关性为负,表明两者虽然同为防御类因子,但仍然展现出不同的收益特征。最后,规模和红利因子的相关性为-0.51,原因是股息率和公司市值呈正相关,而小公司往往处于成长期,分红派息的比例往往较低。
前文曾提到,因子指数的高换手率不等于高回报,反而会由于交易费用的提升侵蚀收益,图7.12展示了BetaPlus 1000指数系列的月度换手率分布。可以看到宽基指数BetaPlus 1000月换手率最低,均值为 $6.83\%$ ,市场容量也最大;质量和红利在所有因子指数中换手率最低,这和财报数据披露频率低有关;估值指标由会计数据和交易价格得到,月换手率为 $18.8\%$ ;其次是低波动和小市值,月均值约为 $20\%$ ;由于受行情变化影响最大,换手率最高的是动量因子,高达 $32.9\%$ 。
表7.16 BetaPlus因子指数超额收益相关系数
| BetaPlus 价值 | BetaPlus 质量 | BetaPlus 低波动 | BetaPlus 动量 | BetaPlus 红利 | BetaPlus 规模 | |
| BetaPlus 价值 | 1.00 | -0.16 | 0.43 | -0.30 | 0.36 | -0.02 |
| BetaPlus 质量 | 1.00 | -0.22 | 0.44 | -0.37 | 0.09 | |
| BetaPlus 低波动 | 1.00 | -0.39 | 0.22 | 0.00 | ||
| BetaPlus 动量 | 1.00 | -0.50 | 0.05 | |||
| BetaPlus 红利 | 1.00 | -0.51 | ||||
| BetaPlus 规模 | 1.00 |

图7.12 BetaPlus因子指数月度换手率
接下来看一下BetaPlus指数的胜率[16],这和目前流行的定投策略息息相关。最简单的定投策略指的是,按照固定的频率(如每月)投入固定金额的资金,购买某一支宽基指数基金。对于定投策略来讲,指数走势长期向上和投资者长期坚持持有是成功的前提,它淡化了择时和选股的作用。实证结果显示,BetaPlus因子指数的月胜率均高于作为基准的BetaPlus 1000指数。此外,图7.13展示了持有因子指数1年、2年、3年、4年、5年、7年以及10年的胜率。可以看到,持有期越长,胜率越高,当持有期超过7年时胜率高达 $90\%$ 以上。这个结果表明,选择具有更高收益和胜率的因子指数进行定投比选择投资宽基指数更佳。

图7.13 BetaPlus因子指数胜率
2. 混合还是整合
以上的实证结果是针对单一因子指数进行的。在Smart Beta投资中,不要把鸡蛋放在一个篮子里的理念同样适用。如果要想收益来源更加多样化,可以选择投资多个因子指数。将多个单一因子进行结合,有两种方法:混合法(mix)和整合法(integrate)。混合法把每个因子视为独立个体,每个因子独立选股互不影响,因而可以将每个因子理解为一个子基金或子账户,通过持有多个单因子Smart Beta即可达到分散的目的。整合法是在选股时,整体考虑股票在多个因子上的综合表
现,按照综合表现高低选股。这样只需要选择一支多因子基金,就可以实现多样化配置。
两种方法各有特点。混合法简单直观,单个组合能最大限度地暴露在目标因子上,就像选择在某一学科有专长的学生一样,不用考虑其综合成绩。然而,由于因子之间较低的相关性,不同单因子组合持有的股票重合度低,导致总体持仓数量较多,从而使得最终的组合效率较低。此外,由于持有多个单一基金,如何确定每支基金的权重也是一个问题。整合法需要同时考虑股票在多个因子的综合暴露情况,就像升学考试一样,总体成绩好才会进入好的学校。同时,由于只需要投资一支基金,资金门槛较低,并且不需要考虑底层因子权重分配问题。然而,由于仅投资一支基金,投资者无法灵活地对因子暴露进行动态调整,这是整合法最大的缺点。关于两种方法孰优孰劣,业界尚未有统一的观点。Bender and Wang(2016)利用1993年至2015年间美股市场价值、质量、低波动和动量因子的数据,发现无论是年化收益、夏普比率还是信息比率,整合法的表现都显著优于混合法。而在另一项研究中,Chow et al.(2018)指出Smart Beta产品却更多地使用混合法(混合法与整合法的比例大致为5:3)。基于1968年至2016年间近50年的数据,他们发现虽然整合法的夏普比率高于混合法,但前者有着更高的持股集中度和换手率,这两点使得其可投资性大打折扣。Ghayur et al.(2018)认为,为了比较两种方法,需要对二者的因子暴露进行匹配。当因子暴露和主动风险较低时,混合法占优;当因子暴露和主动风险较高时,整合法则是更好的选择。因此,哪种方法更好要取决于投资目标和应用场景。
以下利用BetaPlus因子数据进行混合法和整合法的对比。在每个月月末,等权重持有6个因子指数组合,得到混合法组合;整合法组合则在选股层面实施,即在每月月末,将每支股票在6个因子指数上的得分加总,选择得分最高的200支股票(即1000支的前1/5),并按照自由流通市值加权。表7.17和图7.14展示了两种方法的效果。混合法和整合法均能稳定战胜基准组合。两种方法相比,整合法表现更优,年化收益率高 $1.49\%$ ,年化夏普比率高0.06,但不足之处是其最大回撤也要略微高一些。
表7.17 整合法和混合法的风险收益特征
| 混合法 | 整合法 | BetaPlus 1000 | |
| 年化收益率(%) | 11.23 | 12.72 | 7.24 |
| 年化波动率(%) | 28.36 | 27.36 | 27.64 |
| 夏普比率(年化) | 0.52 | 0.58 | 0.39 |
| 最大回撤(%) | -67.01 | -68.55 | -68.92 |
3. 因子配置权重
前文在对比因子整合法和混合法时,混合法使用了等权重的方式,给予每个因子指数相同的权重。如同配置股票一样,配置因子也可以用多种加权方式,将逻辑各异的多个因子通过某种方式进行结合,以期得到一个收益风险比更优的多因子配置组合。常见的因子配置方法包括简单多样化(等权重)、波动率倒数、风险平价、最大分散度和因子动量加权。表7.18总结了它们的金融学假设、实现方法以及相应的数学公式。
除了简单多样化这种被动的静态配置方法以外,其他四种配置方法都需要输
入更多的信息,包括波动率、因子之间的相关性或者过去的表现。表7.19给出了这五种配置方法的表现。结果显示,它们的差别并不是很大,简单多样化已经非常优秀,而更加复杂的方法也并没有带来明显的提升。

图7.14 混合法与整合法的累计收益率曲线
表7.18 因子配置方法
| 金融学假设 | 实现方法 | 数学公式 | |
| 简单多样化 | 不预测因子未来表现,等权重配置 | 所有因子的权重相同 | ωk=1/K |
| 波动率倒数 | 绝对收益率的波动率更低的因子能提升组合的风险收益特征 | 按因子绝对收益率的波动率的倒数赋权 | ωk≈1/σk |
| 风险平价 | 平摊不同因子的风险贡献,从风险角度实现多样化配置 | 每个因子对投资组合的边际风险贡献相同 | ωi∂σp/∂ωi=ωj∂σp/∂ωj |
| 最大分散度 | 追求组合的分散性 | 选择因子权重使得组合的分散比率最大化 | arg max ω′σ/√ωΣ′ω |
| 因子动量加权 | 因子的历史表现在未来会持续 | 以因子过去一段时间相对基准的表现作为权重 | ωk≈μk/σk |
表中, $\sigma_{p}$ 表示投资组合的波动率; $\sigma$ 和 $\Sigma$ 分别为因子组合收益率的标准差向量和协方差矩阵; $\tilde{\mu}{k}$ 和 $\tilde{\sigma}{k}$ 分别为因子 $k$ 超过基准的平均收益和其波动率。
这个结果并不意外,一方面因为被配置的因子指数本身的风险收益差异并不大(表7.15);另一方面则因为复杂的方法需要更多的参数,而使用历史数据估计参数有很大的误差。由于这两方面的原因,复杂配置方法无法显著战胜简单多样化配置方法也就不难理解。上述结果和DeMiguel et al.(2009)针对美股的实证结果相吻合。因子指数的不同配置权重方案,本质上也属于因子择时或轮动,是否有效目前尚没有明确的答案。
表7.19 不同因子配置方法的实证结果
| 简单多样化 | 波动率倒数 | 风险平价 | 最大分散度 | 因子动量加权 | BetaPlus1000 | |
| 年化收益率(%) | 11.23 | 11.40 | 11.40 | 11.03 | 11.89 | 7.24 |
| 年化波动率(%) | 28.36 | 28.25 | 28.24 | 28.07 | 28.43 | 27.64 |
| 夏普比率(年化) | 0.52 | 0.52 | 0.53 | 0.51 | 0.54 | 0.39 |
| 最大回撤(%) | -67.01 | -66.99 | -66.98 | -66.88 | -66.93 | -68.92 |
4. 通过择时选择因子
在不同的市场状态下,不同因子的表现往往存在差异(表7.12)。图7.15中以双均线系统作为择时判断依据将A股市场状态进行了划分。其中,当1个月均线向上突破6个月均线时,标为上涨市;相反,当1个月均线向下跌破6个月均线时,标为下跌市。虽然均线系统存在滞后性,但总体来看符合预期。图7.16统计了BetaPlus质量和BetaPlus价值两个指数在上涨和下跌市场中表现的差异。在上涨行情中,价值指数的表现优于质量指数;而反观在下跌行情中,质量指数的表现无疑更加亮眼,展现出优秀的防御能力。

图7.15 A股不同市场状态划分
基于上面的统计结果,可根据市场状态来对BetaPlus质量和BetaPlus价值指数进行战术资产配置(tactical asset allocation,TAA),以求在上涨行情中拥有更多的进攻性,在下跌行情中拥有更好的防御性。具体来说,当1个月均线上穿6个月均线时,持有价值指数;当1个月均线下穿6个月均线时,持有质量指数。结果见图7.17和表7.20。TAA配置组合年化收益率为 $13.98\%$ ,相比于BetaPlus价值和BetaPlus质量单一指数,它实现了更高的收益;另外,相比于BetaPlus 1000基准组合,其最大回撤则更低。7.5节将进一步探讨因子择时。

图7.16 BetaPlus质量与BetaPlus价值指数在不同市场状态下的表现

图7.17 BetaPlus质量与BetaPlus价值指数择时
表7.20 BetaPlus质量与BetaPlus价值指数择时的风险收益特征
| BetaPlus 价值 | BetaPlus 质量 | TAA 组合 | BetaPlus 1000 | |
| 年化收益率(%) | 13.14 | 13.70 | 13.98 | 7.24 |
| 年化波动率(%) | 29.34 | 27.82 | 29.43 | 27.64 |
| 夏普比率(年化) | 0.57 | 0.60 | 0.59 | 0.39 |
| 最大回撤(%) | -67.11 | -66.77 | -68.61 | -68.92 |
7.4.5 更多讨论
以上关于Smart Beta的讨论和实证结果主要集中在权益类资产内。事实上,Smart Beta涉及的资产类型非常广泛。在定义Smart Beta时曾强调“在某类资产内”这个定语,这里资产可以包括权益、债券、商品和货币等任意一大类资产。
由于众多因子具有普适特征,因而在多个资产类型中均存在溢价,而这个特点也是如今海外业界从资产配置转向因子配置的基础。以AQR的因子体系为例,他们发现价值、动量、利差和防御因子广泛存在于各类资产中。表7.21总结了在不同资产类别下,用于构建每个因子的变量。以价值因子为例,在股票资产中,就是选择被低估的股票(高BM)来持有。在其他资产中的定义方法也类似,即将资产价格和某个锚定点进行比较,越大说明越被高估,越低说明越被低估。其中,利率债的锚定就是预期通胀,而商品的锚定就是5年前的价格。
表7.21 AQR因子体系
| 价值 | 动量 | 利差 | 防御 | |
| 股票 | BM | 过去12个月收益率(剔除最近1个月) | 预期股息率 | 市场β和质量 |
| 利率债 | 实际利率 | 过去12个月收益率(剔除最近1个月) | 期限利差 | 相对GDP加权指数的β |
| 货币 | 实际汇率 | 过去12个月收益率(剔除最近1个月) | 3个月存款利率 | |
| 商品 | 过去5年总收益率 | 过去12个月收益率(剔除最近1个月) | 展期收益率 |
因子变量的具体定义和计算方式见Asness et al.(2015)。
虽然Smart Beta优点很多,但其在实际落地时仍然面临不少挑战。一方面,Smart Beta底层基于因子投资,因子被曝光后存在减弱甚至失效的风险;另一方面,随着因子投资理念的深入,越来越多的资金涌入Smart Beta领域,造成因子过于拥挤。关于因子效果减弱和过度拥挤,本书6.6节有过详细讨论,此处不再赘述。
如今,因子投资的理念深入人心。然而,如果因子收益率仅仅是学术界的数学游戏或者发论文的噱头而不具备可投资性,那么它们将对投资实践毫无价值。可喜的是,因子指数化和Smart Beta为科学践行因子投资提供了高效且低成本的手段。当然,想要在现实中赚取因子收益率,还需要要通过完善的市场风险对冲机制以及丰富的指数投资金融工具来配合。在这些方面,发达国家市场要比新兴市场更加成熟。随着A股市场变得更加开放和有效,传统意义上的主动超额收益α部分逐渐被蚕食。一旦α变得足够小而无法匹配,为了挖掘它而付出的成本更高时(对于投资者来说就是高昂的管理费),低成本的Smart Beta将会变得更加吸引人。
[1]股票多空组合在实际应用时可能遇到一系列麻烦,包括产品限制卖空、股票无法融券、卖空成本较高、无法使用杠杆以及融券期限与持仓不匹配等问题。
[2]比如业界常见的价值因子指数和低波动因子指数就很好地反映了学术界以BM和IVOL为代表的关于价值因子和低波动异象方面的研究。
[3]这些术语没有严格区分,界限比较模糊,泛指偏离宽基指数而有因子偏向的策略。
[4]Smart Beta在权益类资产中最为常见,也是其他资产的发展趋势。
[5]国内往往将这类因子称为红利因子。
[6]除正文中提及的六大类因子外,还有一些其他类的因子(例如成长因子)也受到了越来越多的关注,但本书并未将它们纳入讨论之列。
[7]纯因子投资组合的作用是正确计算因子收益率,从而通过模型推导出个股收益率之间的协方差矩阵。虽然它不具备可投资性,但在风险管理和归因中有着非常重要的作用。
[8]BetaPlus的寓意为下一代beta、更好的beta以及更聪明的beta,其中文名为贝塔加。BetaPlus 1000系列指数的具体数据说明见7.4.4节。本书配套网站提供BetaPlus 1000系列指数的数据下载。
[9]选股能力依据Treynor and Mazuy(1966)的二次市场超额收益模型计算: $E[R] - R_f = \alpha + \beta$ ( $E[R_M] - R_f + \gamma$ ( $E[R_M] - R_f$ )2。其中 $E[R]$ 为基金复权净值增长率均值。该模型中的 $\alpha$ 代表基金经理的选股能力, $\gamma$ 代表基金经理的择时能力。
[10]在本书参考的基金数据统计口径下,被动型指数基金中包含很多主题基金,且它们的管理费率往往比Smart Beta ETF的管理费用更高。因此图7.8中被动股票型基金的管理费率高于Smart Beta ETF的管理费率。
[11]Frazzini and Pedersen(2014)检验了不同杠杆约束程度投资者对高β股票的偏好,发现约束较多的投资者(如共同基金和个人投资)会倾向于持有高β股票。
[12]数据来源于新闻《基金经理似流水,平均任职不到两年》。
[13]数据摘自中证指数Smart Beta ETF发展报告。
[14]需要说明的是,根据业界Smart Beta指数编制惯例,BetaPlus系列指数中股票的加权方式为流通市值加权。这和本书第3到5章的研究实证中采用总市值加权不同。采用总市值加权是学术界研究因子和异象时的惯例。
[15]由于BetaPlus因子指数均是纯多头组合,因此它们的收益率都和BetaPlus 1000基准指数有很高的相关性,如果直接计算因子指数绝对收益率的相关系数难以看出它们的差异,因此计算了它们超额收益的相关系数。因子指数的超额收益为其绝对收益和BetaPlus 1000指数收益的差值。
[16]胜率的定义为,当投资者买入某个指数并持有一段时间后,该指数累计收益大于0的概率。
7.5 因子择时
无论是使用多因子模型作为数量化工具来预测收益率(阿尔法因子),还是通过因子指数化(Smart Beta)进行因子投资获得超额收益,因子择时(factor timing)都是一个绕不开的话题。由于股票的收益率由因子的收益率驱动,而因子收益率在时序上有波动性,因此因子择时的美好愿景就是在因子收益率高的时候赋予它更高的权重,而在因子收益率低的时候赋予它更低的权重。由于金融领域数据信噪比极低,时序上可利用的相关性非常有限,所以这件事听上去就十分艰难。但学术界和业界都对因子择时十分着迷,只因择时成功的吸引力太强。
虽然理想很“丰满”,但现实很“骨感”,要成为先知显然不可能,因此只能通过各种科学方法对因子在时序上的表现进行合理预测,这也是因子择时研究的对象,而其目标就是战胜等权重配置因子获得的收益率。因子择时,既可以来自主观判断,也可以基于量化建模,而两者都需要寻找影响因子未来收益的因素,即因子的因子。综合学术界和业界的相关研究,影响因子未来收益率的因素大致可以分为五类,如表7.22所示。其中前三类因素和因子自身的表现有关,而后两个因素则来自外部环境。
表7.22 用于因子择时的因素
| 因素 | 典型代理变量 | 含义 |
| 因子估值 | 价值价差(value spread) | 衡量因子的估值水平 |
| 因子动量 | 过去12个月累计收益率 | 衡量因子过去一段时间的表现 |
| 因子波动 | 因子收益率的波动率 | 衡量因子的风险水平 |
| 市场状态 | 市场情绪:波动性、流动性和趋势性 | 衡量市场所处的某一个状态 |
| 宏观环境 | 经济增长、通货膨胀、利率水平等 | 因子的宏观驱动因素 |
7.5.1 按因子估值择时
一个资产当前估值是高还是低,取决于价格偏离真实价值的程度,这个真实价值即估值锚点。价格围绕价值波动,具有均值回复特征,如果价格高于这个锚点则被高估,预期收益为负;如果价格低于这个锚点则被低估,预期收益为正。一般来说,人们比较熟悉的是股票估值,例如学术文献常用BM作为代理指标。而在其他资产类型中,也可以定义相似的指标。Asness et al.(2013)定义了国家指数、国债、商品期货和外汇等的估值因子,Israel et al.(2018)定义了公司债的估值因子。那么,因子的投资组合同样身为一种资产,如何判断其估值高低呢?
Gordon(1962)模型,把股票预期收益分解成每股收益( $E / P$ )加上预期盈利增长 $(g)$ :
$$ E [ R ] = E / P + g \quad (7. 8 5) $$
由于因子投资组合仅是一揽子股票,因此对价值因子多头和空头代表的价值股和成长股组合也分别如法炮制,分解投资组合的收益率:
$$ E \left[ R _ {\text {v a l u e}} \right] = E / P _ {\text {v a l u e}} + g _ {\text {v a l u e}} \tag {7.86} $$
$$ E \left[ R _ {\text {g r o w t h}} \right] = E / P _ {\text {g r o w t h}} + g _ {\text {g r o w t h}} \tag {7.87} $$
利用上述分解,价值因子的收益率可以被拆解为:
$$ E \left[ R _ {\text {v a l u e}} \right] - E \left[ R _ {\text {g r o w t h}} \right] = \left(E / P _ {\text {v a l u e}} - E / P _ {\text {g r o w t h}}\right) - \left(g _ {\text {g r o w t h}} - g _ {\text {v a l u e}}\right) \tag {7.88} $$
其中 $E / P_{\text {value}} - E / P_{\text {growth}}$ 被称为价值价差(value spread), $g_{\text {growth}} - g_{\text {value}}$ 被称为成长价差(growth spread),价值因子的收益率由这两项同时决定。从定义不难看出,价值价差反映了该因子中价值组(多头)相对于成长组(空头)的便宜程度。当价值价差很高时,说明因子的估值相对较低。学术界将上述研究拓展到其他因子,使用因子多空两头的价值价差来衡量其估值水平。除 $E / P$ 外,在实际应用中也常常使用BM等指标描述多空两头的估值,且在计算价值价差时,除了进行减法,有时也会采用除法计算多空两头估值的比值[2]。
基于上述分析,在实际应用中可根据因子的估值高低来调整权重。令 $\mathrm{VS}{kt}$ 代表因子 $k$ 在 $t$ 时刻的价值价差; $\mathrm{VS}{kt}^{\text {mean }}$ 、 $\mathrm{VS}{kt}^{\text {max }}$ 及 $\mathrm{VS}{kt}^{\text {min }}$ 分别代表该因子在过去36个月内价值价差的均值、最大值和最小值。根据Asness et al.(2017)的算法,因子权重为:
$$ \omega_ {k t} ^ {\text {r a w}} = 1 + \frac {\mathrm {V S} _ {k t} - \mathrm {V S} _ {k t} ^ {\text {m e a n}}}{\mathrm {V S} _ {k t} ^ {\text {m a x}} - \mathrm {V S} _ {k t} ^ {\text {m i n}}} \tag {7.89} $$
$$ \omega_ {k t} = \frac {\omega_ {k t} ^ {\text {r a w}}}{\sum_ {j = 1} ^ {K} \omega_ {j t} ^ {\text {r a w}}} \tag {7.90} $$
从以上定义不难看出,它反映的是因子当前的估值相对于过去36个月估值的位置,并据此可以调整因子权重。如果当前估值较高(价值价差小),则低配该因子;如果估值较低(价值价差大),则超配该因子。按因子的估值择时听上去合情合理,但Asness et al.(2017)的研究表明按因子估值择时的超额收益和价值因子本身在时序上的表现有很高的相关性。这意味着,一旦价值因子表现不好,那么按照估值择时也不会有好的表现。自2008年金融危机之后,美股市场的价值因子指数持续跑输市场本身,这无疑对按因子估值择时提出了巨大的挑战。
7.5.2 按因子动量择时
正如大量研究发现动量效应存在于不同国家和不同大类资产上一样,已有的研究也发现,无论在时序上还是在横截面上,因子的表现也存在动量效应。Arnott et al.(2019)使用1963年到2016年的美国股市数据,计算了51个因子收益率序
列,并构造了截面因子动量组合。每月月末,他们计算所有因子过去T个月的收益率,并做多最高的8个因子,做空最低的8个因子,并持有H个月。结果表明,因子动量能获得显著大于0的收益率。以1个月动量和1个月持有期为例,原始因子动量能获得 $10.49\%$ 的年化收益率。此外,因子动量并没有像动量因子那样发生崩溃(momentum crash),且在2000年以后表现依然很好。
Ehsani and Linnainmaa(2019)的研究则更进了一步。该文使用公开可得的22个因子数据,除了研究因子横截面动量,还将因子时序动量考虑进来,得到的结论也更加合理。Gupta and Kelly(2019)使用更大的样本数据(美国、欧洲和亚太市场)研究了65个因子的因子动量,得到了和前者相似的结论。此外,该文还发现按因子动量高低来配置不同因子的策略和截面动量因子本身有很强的相关性。因子动量的有效性对于因子择时的启发是给予动量较强的因子更高的权重,反之给予动量较弱的因子更低的权重,从而实现强者恒强、弱者恒弱。例如业界目前比较流行的按照IC高低计算因子权重,本质上就属于按因子动量择时。
7.5.3 按因子波动择时
如果说按因子动量择时是从收益率的角度确定权重,那么因子择时的另外一个角度就是因子的风险。在这种方法下,往往不对因子收益率做任何假设,而仅仅利用因子收益率的波动率和相关性。常见的因子波动加权方法包括最小方差、风险平价和波动率倒数加权。
最小方差的目标是使得整个因子组合风险最小,其在最小方差前沿上具有唯一性,处于前沿最左侧。风险平价最早由Qian(2005)提出,从风险的角度进行均衡配置,以追求所有证券对组合的风险贡献相同。世界著名的对冲基金桥水(Bridgewater)的全天候基金就采用了风险平价模型,因其常年的优异表现使得这种配置方法被发扬光大。波动率倒数加权是风险平价的特殊形式,是AQR在进行因子研究时常用的工具,例如Asness et al.(2015)在汇总多个风格因子时就用的该方法。波动率倒数加权比较简单,直接用因子波动率进行加权,给予低(高)波动因子更多(少)的权重,其表达式为:
$$ \omega_ {k} = \frac {1 / \sigma_ {k}}{\sum_ {j = 1} ^ {K} 1 / \sigma_ {j}} \tag {7.91} $$
式中 $\sigma_{k}$ 为因子 $k$ 的波动率。波动率倒数加权由于只需要考虑每个因子的风险,而不需要对它们之间的相关性进行估计,因此也被称为朴素风险平价。波动率倒数加权是风险平价的简化形式,当资产收益率之间的相关系数相等时,波动率倒数加权等同于风险平价。从波动的视角决定因子权重,主要出发点是降低风险和回撤。Rabener(2018)对比了在风险平价和等权重两种方式下的因子表现,发现前者的最大回撤要明显小于后者的;但从收益的角度来看,并没有明确的结论。
7.5.4 按市场情绪择时
本书6.4节详细介绍了对市场情绪的衡量以及它和异象的关系。与使用因子本
身相关的指标来择时不同,市场情绪从资本市场的不同特征观察因子表现。市场情绪也被称为投资者情绪,用来反映市场整体的乐观或悲观程度。通过刻画情绪状态,来反映投资者的风险偏好水平,从而预测市场和因子未来的表现。
Baker and Wurgler(2006)详细讨论了市场情绪和因子表现之间的关系。一般来说,在市场情绪较为乐观时,投资者会偏爱具有进攻性质的股票,例如小盘股、新股和成长股;在市场情绪较为悲观时,投资者会偏爱具有防御性质的股票,例如低波动和基本面好的股票。正是因为在乐观时过度追逐进攻型股票,在悲观时过度追逐防御型股票,所以导致这些股票的价格被推至较高水平,过分高估会带来未来预期收益降低。因此在乐观时期之后,进攻型股票表现得不及防御型股票;相反,在悲观时期之后,防御型股票表现得不及进攻型股票。
再来看一个简单的例子。Ung and Luk(2016)用波动率指数(VIX)来衡量投资者情绪,将市场划分为三种状态:乐观、中性和悲观。然后统计在不同状态下价值、质量、低波动、动量、股利、规模等因子的表现,见表7.23。
可以看到,在市场乐观时,价值和动量因子表现较好,低波动因子超额收益率为负;在市场中性状态时,动量因子效果优秀;在市场悲观时,低波动、质量和股利等防御因子异常优秀,年超额收益率均超过 $10\%$ ,而此时动量因子效果较差。如果能有效预测市场波动率水平,在高波动市场中高配价值和动量,在低波动市场中高配质量和低波动,大概率能获得更令人满意的结果。
表7.23 不同市场情绪下因子指数相对标普500指数的表现
| Panel A: 相对标普500年化超额收益 (%) | ||||||
| 价值 | 质量 | 低波动 | 动量 | 股利 | 规模 | |
| 乐观 | 4.85 | 2.40 | -2.60 | -1.20 | 3.80 | 1.94 |
| 中性 | 2.76 | 2.00 | -2.50 | 2.10 | 5.27 | 1.50 |
| 悲观 | 1.42 | 10.30 | 15.20 | 13.40 | -11.01 | 4.03 |
| Panel B: 超额收益大于0的概率 (%) | ||||||
| 价值 | 质量 | 低波动 | 动量 | 股利 | 规模 | |
| 乐观 | 62.50 | 54.20 | 37.50 | 45.80 | 56.25 | 54.17 |
| 中性 | 56.25 | 60.40 | 47.90 | 52.10 | 54.17 | 52.08 |
| 悲观 | 43.75 | 66.70 | 68.80 | 62.50 | 43.75 | 43.75 |
7.5.5 按宏观因素择时
宏观因素是指影响企业生产经营的经济、政治、社会和自然环境等因素。经济因素,包括经济周期、利率水平、货币供给和流动水平等;政治因素,比较典型就是选举周期;社会因素,比如2020年新型冠状病毒的冲击;自然环境包括全球气候和自然灾害等。宏观因素数量巨多,传导关系错综复杂,和因子表现之间的关系也充满了神秘色彩。哪些宏观经济变量和股票因子表现有关呢?为此,Bender et al.(2018)考虑将一系列经济变量作为预测因子,详见表7.24。
表7.24 影响因子表现的宏观经济变量
| 变量 | 定义 |
| 信用利差 | 高等级公司债到期收益率—低等级公司债到期收益率 |
| TED 利差 | 3 个月同业拆借利率—3 个月国债利率 |
| 期限利差 | 20 年国债到期收益率—3 个月国债利率 |
| 货币增长 | 基础货币同比增长率(通胀调整) |
| M1 增长 | M1 同比增长率(通胀调整) |
| M2 增长 | M2 同比增长率(通胀调整) |
| GDP 增长 | GDP 同比增长率 |
| 消费增长 | 个人消费同比增长率 |
| 固定投资增长 | 个人固定投资同比增长率 |
| 经常项目增长 | 经常项目同比增长率(通胀调整) |
| 单位产出增长 | 非农企业每小时产出同比增长率(通胀调整) |
| 企业利润增长 | 企业利润同比增长率(通胀调整) |
| 破产增长 | 申请破产数量同比增长率 |
| 产能增长 | 产能利用率同比增长率 |
| 国债发行 | 国债发行同比增长率(通胀调整) |
| 消费信贷增长 | 消费信贷同比增长率(通胀调整) |
| 储蓄率 | 个人储蓄占个人可支配收入的百分比 |
| 消费信心增长 | 消费者信心指数同比增长率 |
| 个人收入增长 | 个人收入增长同比增长率(通胀调整) |
| CPI | 消费者价格指数 |
| PPI | 生产者物价指数 |
| CPI 变化 | CPI 同比变化 |
| PPI 变化 | PPI 同比变化 |
| 失业率 | 失业率 |
| 失业增长 | 首次申请失业救济人数的四周平均值同比增长率 |
通过对宏观经济变量和因子表现的研究,Bender et al.(2018)发现比较明显的规律包括:(1)期限利差和盈利因子呈高度负相关,且持仓时间越长负相关性越高,这表明利率上升不利于企业盈利;(2)当持仓超过6个月时,TED和期限利差两个因子对价值、盈利、投资有相当强的预测能力;(3)当持仓在1年以上时,单位产出增长率、个人储蓄率、CPI和PPI四个指标与价值和投资因子具有较强的相关性。
此外,Ung and Luk(2016)研究了因子在不同商业周期下的表现,其中商业周期划分标准来自美国国家经济研究局结果见表7.25。可以看到,价值因子具有顺周期特征,其在经济扩张时具有正的超额收益,在经济收缩时表现较差;质量因子无论在哪种状态下均具有正的超额收益,由于盈利更强且更加稳定,在经济收缩时表现更好;动量因子也具有顺周期特征,在经济扩张时“谈笑风生”,故在经济收缩时“一蹶不振”;规模因子在两种状态下均表现不错,可能是因为小市值股票具有良好的灵活性;低波动因子具有典型的逆周期特征,在经济扩张时并不起眼,一旦经济变差就崭露头角,是对冲经济下行的利器。
表7.25 不同商业周期下因子指数相对标普500指数的表现
| Panel A: 相对标普500年化超额收益 (%) | ||||||
| 价值 | 质量 | 低波动 | 动量 | 股利 | 规模 | |
| 扩张 | 3.41 | 3.50 | 0.00 | 3.90 | 2.21 | 1.77 |
| 收缩 | -1.16 | 6.10 | 9.50 | 2.10 | -2.29 | 4.75 |
| Panel B: 超额收益大于0的概率 (%) | ||||||
| 价值 | 质量 | 低波动 | 动量 | 股利 | 规模 | |
| 扩张 | 56.07 | 58.90 | 47.70 | 53.30 | 52.80 | 49.53 |
| 收缩 | 46.15 | 73.10 | 69.20 | 50.00 | 50.00 | 61.54 |
7.5.6 因子择时很难
虽然以上几节分门别类地介绍了用来进行因子择时的不同因素,但找到影响因素和成功择时却是两码事。和市场择时(market timing)一样,因子择时是否可行面临着巨大争议,目前尚无统一结论。Bender et al.(2018)认为虽然因子择时理论上可行,但也指出了择时研究可能面临的陷阱和风险:(1)预测因素和因子收益之间的关系是动态变化的;(2)挑选的指标有数据窥探和幸存者偏差嫌疑;(3)由于部分数据存在事后修正,因此实证研究存在使用未来数据的风险。
投资公司Newfound Research在择时方面也有很多深入研究。他们认为,虽然因子估值和因子动量择时具有一定的效果,但是考虑成本以后,再和不择时相比就优势尽失;使用商业周期相关的数据进行因子择时,更像是过度拟合数据。如果等权重持有多个因子组合,其胜率则已经很高,尤其是在持有时间较长的情况下,要战胜等权重非常困难。类似地,Dichtl et al.(2020)探讨了使用不同权重方法配置因子的效果,并发现虽然因子能够明显提升传统宽基指数的表现,但要在因子之间动态分配权重以获得更加优良的结果却很困难。和简单的等权重方法相比,无论基于风险相关的方法,还是基于收益相关的方法,均难以带来更高的附加值。对于因子择时,也许正如DeMiguel et al.(2009)指出的那样,各种优化方法都很难超越简单多样化(等权重配置)。
[1]也称作因子轮动(factor rotation)。
[2]Ilmanen et al.(2015)比较了两种计算价值价差的方法,发现二者相关性较高,但在极端情况下会有差异,各有优缺点。
7.6 风格分析
顾名思义,风格分析旨在对一个投资组合的投资风格进行研判。风格分析与业绩归因有着密切的关系,二者都旨在更好地理解投资组合的收益来源,而多因子模型在风格分析方面大有可为。业绩归因与风格分析的起源,都与资产组合分析有着密切的关系。从业绩归因角度看,Brinson et al.(1991)表明,资产配置决定着资产组合的大部分收益波动,而风格分析则为人们提供了理解投资组合收益来源的另一个视角。
7.6.1 经典风格分析
Sharpe(1992)开启了风格分析研究的大门。具体来说,Sharpe(1992)考察的是基于收益的风格分析,即通过利用资产或资产组合的收益率序列对因子收益率进行回归来得到相应的风格暴露。与此相对应的是基于持仓的风格分析,即先获取持仓资产的风格暴露,再依据持仓权重加总得到资产组合的风格暴露(Daniel et al.1997)。基于持仓的风格分析往往更加准确,但它依赖于完整的持仓数据。由于完整的持仓数据并不容易得到,因此基于收益的风格分析在实践中得到了更广泛的应用,而这也是本节的重点。接下来均用风格分析指代基于收益的风格分析。
Sharpe(1992)提出的风格分析表达式和一般的多因子模型并无差异:
$$ R _ {i t} = \beta_ {i 1} \lambda_ {1 t} + \beta_ {i 2} \lambda_ {2 t} + \dots + \beta_ {i k} \lambda_ {k t} + \varepsilon_ {i t} \tag {7.92} $$
其中 $R_{it}$ 为 $t$ 期资产 $i$ 的收益, $\lambda_{kt}$ 为 $t$ 期因子 $k$ 的收益, $\beta_{ik}$ 为资产 $i$ 在因子 $k$ 上的暴露,而随机扰动项 $\varepsilon_{it}$ 为在 $t$ 期资产 $i$ 的收益率中无法被上述因子解释的部分。需要说明的是,由于所有收益率及因子暴露在事前均是未知的,因此风格分析和业绩归因一样,也属于事后分析方法。在上述模型中,由于Sharpe(1992)假设不同资产的残差收益互不相关,因此资产收益的相关性完全由因子的相关性和资产对因子的暴露所决定。此外,该模型允许 $\varepsilon_{it}$ 的均值不为零。
虽然模型(7.92)看上去和多因子模型并无差异,但Sharpe(1992)在提出风格分析时,对其做了很多约束,而这些约束在如今看来太过严格。首先,纳入风格分析模型(7.92)的因子必须满足“不重不漏”(mutually exclusive and collectively exhaustive,MECE)原则。在这个限制下,所有股票按照不同的风格被划分到其所属的特定因子投资组合之内。换句话说,在该模型中,每支股票属于且仅属于某一个因子,而不能同时出现在多个因子的投资组合之中。其次,该模型规定任何资产对模型(7.92)中所有因子的暴露之和必须为 $100\%$ 。最后,考虑到现实中
卖空往往很困难,因此它还加入了禁止卖空约束。由于每个因子投资组合都是纯多头组合,卖空约束意味着资产对每个因子的暴露必须非负。
Sharpe(1992)风格分析模型(7.92)不仅可以用于分析单一资产的表现,也可以用来分析投资组合的表现。关于对该模型的进一步理解,以下三点值得思考。第一,上述约束对模型(7.92)的求解也带来了额外的困难。若没有禁止卖空约束,则可以通过线性回归求解风格暴露。然而,卖空约束的加入使得该模型的求解变成了非线性的二次规划问题,这增加了求解的复杂度。第二,风格分析旨在找到一个静态风格组合,使其能够最好地接近资产在样本期内的真实表现,帮助人们解释资产的表现。考虑到投资者可能在样本期内有较为频繁的交易活动,上述风格分析的性质就很重要。只要可以找到一个静态风格组合足够接近其投资组合的真实表现,便可以很好地解释它,而无须过度关注投资者的交易行为。第三,风格分析将一项资产的收益分解为风格暴露带来的系统性部分和与风格无关的扰动项,后者经常被称作相对前述静态风格组合的跟踪误差,但其均值则不一定为零。对 $\varepsilon_{it}$ 进行统计检验,就可以得到关于投资者是否有良好投资能力的更多信息。
为了说明该模型的具体应用,Sharpe(1992)通过一个12因子模型对先锋基金发行的一支开放式基金进行了风格分析。在这12个因子中有4个股票风格因子,即大盘价值股、大盘成长股、中盘股和小盘股,并使用相应的风格指数来代表这些不同的风格因子组合(这也是风格分析中的典型做法)。显然,上述划分是满足“不重不漏”原则的,且每支股票只属于单一因子。从分析结果来看,当没有卖空限制时,该基金对大盘价值股的暴露非常高,约为 $110\%$ ,同时它对中盘股和国际债券有非常显著的负暴露。当添加卖空约束后,结果表明该基金在大盘价值股和小盘股上有较高暴露,二者可以很好地解释该基金的表现。
在实际使用Sharpe(1992)的模型进行风格分析时,如何选择作为因子的风格指数是必须解决的问题。由于不同指数提供商对于同一风格可能有不同的定义,因此来自不同指数商的风格指数很可能有很大差异。以价值因子为例,某个指数提供商可能选择有高账面市值比的股票来构建价值风格指数,而其他提供商则会用那些账面市值比、盈利市值比和股息率综合评分较高的股票来构建价值指数。这两种价值指数在某些时期的表现差异可能会较大,导致基于它们的风格分析得出不同的结论。基于这个原因,Buetow et al.(2000)悲观地认为,虽然Sharpe(1992)风格分析的逻辑毫无问题,但它在实践中却难以有效地应用。另外,该风格分析的两个约束也加剧了这一问题。首先,该模型要求对不同风格的暴露之和总是等于 $100\%$ ,这一约束可能会扭曲估计结果。其次,该模型要求作为解释变量的风格因子之间是互斥且完备的。这意味着一旦选择纳入价值风格,就必须相应地纳入成长风格。当人们希望考虑的风格越来越多时,模型需要纳入的风格因子将呈指数增长。例如,以常见的规模(大中小盘)和价值/平衡/成长风格为例,要满足“不重不漏”原则,则需要在模型中加入9个风格因子;一旦人们想要考虑更多的风格类型,这种方法注定会遇到不小的挑战。
7.6.2 基于多空因子的风格分析
鉴于Sharpe(1992)模型遇到的种种挑战,人们提出了另外一种风格分析,即基于多空因子的风格分析。这种风格分析的模型如下:
$$ R _ {i t} - R _ {B t} = \beta_ {i 1} \lambda_ {1 t} + \beta_ {i 2} \lambda_ {2 t} + \dots + \beta_ {i K} \lambda_ {K t} + \varepsilon_ {i t} \tag {7.93} $$
其中 $R_{Bt}$ 为基准指数的收益(通常选择市场指数作为基准指数)。这一转变有两个额外的好处:首先,由于考虑的是超额收益,因此不再需要风格暴露之和为 $100\%$ 的约束;其次,模型(7.93)允许使用多空因子组合而非纯多头风格指数作为因子,这可以规避经典风格分析遇到的问题。
进一步,将模型(7.93)等号左侧的基准指数(相对无风险利率)的超额收益移到模型右边作为解释变量,则模型(7.93)就变为人们熟悉的多因子模型形式:
$$ R _ {i t} ^ {e} = \alpha_ {i} + \beta_ {i, m} R _ {M t} ^ {e} + \beta_ {i 1} \lambda_ {1 t} + \beta_ {i 2} \lambda_ {2 t} + \dots + \beta_ {i K} \lambda_ {K t} + \tilde {\varepsilon} _ {i t} \tag {7.94} $$
其中 $R_{it}^{e}$ 和 $R_{Mt}^{e}$ 分别为资产 $i$ 和市场基准指数(相对于无风险利率)的超额收益, $a_{i}$ 为在资产 $i$ 的收益率中无法被因子解释的部分的均值, $\tilde{\varepsilon}_{it}$ 为均值为零的随机扰动。模型(7.94)正是实证资产定价和因子投资中最常见的定价模型。这也是为什么多因子模型可以被用来进行风格归因。本书第4章4.1节介绍的经典Fama-French三因子和五因子模型、Hou-Xue-Zhang四因子模型等都是典型的代表。
在实践中,基于多因子定价模型的因子分析早有大量应用,一个典型例子是基金业绩分析。Carhart(1997)指出动量对于解释公募基金的表现非常有帮助,并用Fama-French三因子和动量因子构建了Carhart四因子模型,发现该模型可以有效解释大部分股票型基金(不包括持续表现不佳的基金)的业绩。此外该文还发现,相比表现最差的基金,表现最好的基金在规模和动量因子上有着更高的暴露,而这两者在价值因子暴露上则没有显著差异。上述风格差异使优异基金比落后基金每月多产生 $0.67\%$ 的超额收益,该差异要远大于它们 $\alpha$ 的差异(仅为每月 $0.29\%$ )。毫无疑问,风格暴露对于资产或投资组合的总体表现有着显著影响。这意味着在分析资产或投资组合的收益时,除考察 $\alpha$ 以外,也需要对风格分析给予足够的关注。
此外,投资组合分析中很重要的一点是考察其风格的稳定性。在这方面,可以利用滚动回归估计投资组合的时变风格暴露,并通过分析因子暴露的时间序列进行风格稳定性分析。如果投资组合对某个(些)风格因子的暴露在短时间内发生剧烈变化,或其暴露较大的几类风格因子频繁发生变化,则可能预示着投资组合的风格并不稳定。最后,虽然模型(7.94)形式上与模型(7.92)的经典框架稍有不同,但风格分析的核心作用仍是一致的,即找到一组能够最好地解释投资组合表现的静态风格因子。
7.6.3 实例:巴菲特的投资风格
谈到风格分析实例,一个最佳的研究对象自然是股神巴菲特(WarrenBuffett)。他在过去50年间实现了接近20%的年化收益。巴菲特承价值投资的代表BenjaminGraham(格雷厄姆),非常注重股票的购买价格(安全性)。与此同时,他也逐渐发展了自己的投资风格,特别是对质量的高度重视。巴菲特是否真的具有这样的投资风格?相关风格因子是否可以很好地解释巴菲特的优异业绩?
这些都是非常引人关注的问题。
Frazzini et al.(2018)针对上述问题进行了富有成效的工作。该文基于1976年至2011年间伯克希尔哈撒韦公司的股价及投资组合的数据对巴菲特的业绩进行了详细的风格分析,并有以下几点重要发现。首先,在此期间巴菲特获得了 $19.0\%$ 的年化收益和0.76的年化夏普比率,业绩优异且有持续性。与此同时,巴菲特的相对业绩也非常优异。巴菲特的业绩优于任何一支存续时间达到30年的股票或共同基金。而即便同1976年至2011年间存在过的任何股票或公募基金相比,巴菲特的业绩也是非常顶尖的。其次,常见的多因子模型并不能解释巴菲特的优异表现。例如,在使用Carhart四因子模型进行风格分析时,巴菲特的投资组合仍可获取高达 $12.1\%$ 的年化超额收益( $t$ -值为3.19,高度显著)。
之所以出现上述结果是因为在常见的多因子模型中并无针对上市公司的质量高低而构建的质量因子,导致已有因子无法很好地反映巴菲特的选股风格。为了更好地分析巴菲特的选股风格,Frazzini et al.(2018)在Carhart四因子模型中加入了Asness et al.(2019)提出的质量(quality minus junk,QMJ)因子和Frazzini and Pedersen(2014)提出的代表低风险的低β(betting against beta,BAB)因子。当使用这6个因子对巴菲特的收益率进行风格归因后,其组合的α消失了。在这个基础上,该文基于对巴菲特组合的风格分析,构建了一个仿巴菲特风格组合——即有着与巴菲特的投资组合相同的风格暴露和波动率的假想组合。该仿巴菲特组合甚至有着比巴菲特更为优异的表现[2]。风格分析结果显示,质量因子和低β因子的加入能够更有效地体现巴菲特的投资风格,因此可以说传统意义上的买入便宜股的价值投资并非巴菲特的标签,而高质量投资才更能代表他的风格。需要强调的是,上述事后风格分析并不代表巴菲特不厉害。恰恰相反,他在数十年前便构建起了极为卓越的投资风格,并通过对杠杆的极致利用持续获得了优异的回报,是真正样本外的奇迹。
除了上述关于巴菲特的例子,Hou et al.(2019a)一文使用Hou-Xue-Zhang四因子模型(也被称为 $q$ -因子模型)和Hou et al.(2020)提出的增强版 $q$ -因子模型(简称 $q^5$ 模型[3])对一些经典的价值投资策略(表7.26)进行了风格分析。
表7.26 Hou et al. (2019a) 进行风格分析的价值投资策略
| 策略 | 出处 |
| 内在价值策略 | Frankel and Lee (1998) |
| F-Score | Piotroski (2000) |
| 神奇公式 | Greenblatt(2006, 2010) |
| 质量因子 | Asness et al. (2019) |
| 无先验的基本面分析① | Bartram and Grinblatt (2018) |
| 期望收益策略 | Penman and Zhu (2014, 2019) |
①该策略的英文原名为agnostic fundamental analysis,简称AFA,直译为“不可知论的基本面分析”。其中agnostic一词的中文意思为“不可知论的”,在此代表真实的基本面价值是不可知的。其意为不假设任何金融学知识,仅是从统计学的角度衡量公司的基本面价值。
其中,内在价值策略依据历史数据或分析师通过预测来估计公司的内在价值,并买入那些内在价值相对于股价较高(从而被低估)的公司。F-Score(见5.1.2节)是一个综合性因子,从盈利能力、资本结构和运营效率三个方面对公司
质量进行综合性评估。神奇公式则主要由两个指标构成:净有形资产回报率(分子为息税前利润,分母为净流动资产与净固定资产之和)和盈利回报率(息税前利润与企业价值之比)。质量因子则由盈利能力、成长性和安全性三个维度复合而成。同Frankel and Lee(1998)类似,Bartram and Grinblatt(2018)的AFA策略也着重于买入内在价值相对股价较高的公司。但有所不同的是,后者将企业的内在价值与财务数据相关联,通过公司市值对16个来自资产负债表的指标、11个来自利润表的指标,以及1个来自现金流量表的指标的截面回归来估计公司的内在价值,然后计算内在价值相对价格的偏离幅度并据此选股。从上述描述可知,Bartram and Grinblatt(2018)关注的是通过其他公司隐含的企业内在价值。最后,Penman and Zhu(2019)指出股票的下期预期收益(1-period ahead expected return)与公司的预期盈利及预期盈利增长有关,并用8个指标[4]来估计预期盈利和预期盈利增长,然后构建选股策略。
Hou et al.(2019a)使用多空对冲组合代表上述每一个策略,并检验该组合是否能够获得 $q$ 和 $q^{5}$ 模型无法解释的超额收益,以及该组合在模型所包含的风格因子上是否有显著的暴露。表7.27总结了检验结果[5]。对于绝大多数价值投资策略, $q$ 和(或) $q^{5}$ 模型中的因子均能较好地解释它们的收益率,说明这些策略的风格可以被这些因子解释。具体结果详见表7.27,文中不再赘述。
表7.27 价值投资策略风格分析结果
| 策略 | 风格分析 |
| 内在价值策略 | 内在价值策略在q和q5模型下均没有显著的α;其多空对冲组合在投资因子上有显著的正暴露。从金融学角度来说,这是符合逻辑的,因为股票内在价值同账面价值的增长有关,而账面价值的增长与投资因子密切相关 |
| F-Score | F-Score在q和q5模型下均没有显著的α;其多空对冲组合对盈利因子有显著正暴露,同时对市场组合和规模因子有较显著的负暴露。由于盈利能力是F-Score的一个重要维度,因此上述风格分析结果符合预期 |
| 神奇公式 | 神奇公式在q和q5模型下均没有显著的α;它对于盈利因子有高度显著的正暴露,而对于市场组合有显著的负暴露。由于神奇公式的两个维度都与盈利能力有关,因此它对盈利因子有显著的正暴露符合预期。除此之外,神奇公式对q5模型中的预期投资增长因子也有显著的正暴露,因此q5模型比q-因子模型能够更好地解释神奇公式策略 |
| 质量因子 | 质量因子在q-因子模型下能够获得显著的α,但在q5模型下能够很好地解释其收益率。从风格暴露来看,质量因子对q5模型中的盈利和预期投资增长因子有显著的正暴露,对市场组合、规模和投资因子有显著的负暴露。考虑质量因子由盈利、成长、安全性等多个维度复合而成,上述风格暴露与其构造逻辑相一致① |
| 无先验的基本面分析 | 无先验的基本面分析策略在q和q5模型下均没有显著的α。从风格暴露来看,投资因子和规模因子起着决定性作用,多空对冲组合对前者有显著的正暴露,对后者则有显著的负暴露。此外,当控制了市值后,该策略对盈利因子和期望投资增长因子分别有显著的负暴露和正暴露 |
| 期望收益策略 | 期望收益策略在q-因子模型下能够获得显著的α,但其超额收益在q5模型下不再显著;它对盈利和预期投资增长因子有显著的正暴露,对规模和投资因子有显著的负暴露。上述风格特征与质量因子十分接近。由于该策略的基础指标覆盖盈利能力、投资和估值等多个维度,因此其风格暴露与质量因子相似是符合预期的 |
①Asness et al.(2019)将质量因子定义为由盈利能力、成长性和安全性这三个维度构成的复合因子。而早期的Asness et al.(2013)还考虑了额外的股息率维度。Hou et al.(2019a)也考察了上述质量因子的定义,并得到了基本一致的结论。
除此之外,Hou et al.(2019a)也以 $q$ 和 $q^{5}$ 模型为基准对巴菲特的投资收益进行了分析,并将结果与Frazzini et al.(2018)的六因子模型归因结果进行了对比。在1976年至2017年之间(即Frazzini et al.2018采用的实证区间), $q$ -因子模型和六因子模型都能够较好地解释巴菲特在此期间的业绩,且伯克希尔哈撒韦股票对盈利和投资因子都有显著的正暴露。但当把实证区间拓宽到1968年至2018年时,使用不同模型的风格分析结果出现了差异,且所有模型均无法很好地解释巴菲特的表现。当采用 $q$ 、 $q^{5}$ 及六因子模型时,巴菲特的超额收益率分别为每月 $0.64\%$ ( $t$ -值为2.44)、 $0.77\%$ ( $t$ -值为2.67)以及 $0.61\%$ ( $t$ -值为2.08)。关于为何上述模型均无法很好地解释巴菲特的表现,其背后的原因可能有二。第一个原因可以归因于巴菲特的投资分析能力,例如对公司预期盈利和增长有更好的估计。第二个原因则可能与因子模型的不完善有关。像员工培训、研发、管理质量等与企业未来盈利和成长性密切相关的因素可能对解释巴菲特的选股结果至关重要,但它们均由于难以度量而未被这些模型考虑。
上面这个例子传递出来的另外一个信息是,人们总可以挑选不同的多因子模型对目标投资组合或资产进行风格分析。以上述 $q^{5}$ 和六因子模型来说,无论均值一方差张成检验还是GRS检验都无法分出“胜负”,它们都能提供对方无法包含的信息,都是在风格分析实践中有用的多因子模型。风格分析可谓是从一个新的角度来看待和应用多因子定价模型,不仅关注资产或投资组合相对于定价模型的 $\alpha$ 显著性,还考察其对哪些风格因子有显著的暴露,以及风格暴露是否符合逻辑推论。科学的风格分析让人们不仅可以更好地理解资产和投资组合的表现,也能对其收益来源有更为透彻的理解,并对其未来表现形成更合理的预期。
[1]William Sharpe也因为这篇文章的重要贡献于2015年获得Wharton-Jacobs Levy Prize。该奖项为表彰量化金融创新性研究而设立,由宾夕法尼亚大学沃顿商学院的Jacobs Levy Center每两年颁发一次。与其他奖项不同,它十分看重研究的实践应用价值。
[2]需要说明的是,仿巴菲特风格组合没有考虑交易费用。
[3]q5模型在q-因子模型的基础上加入了预期投资增长因子。关于q-因子模型和q5模型的详细说明分别见4.1.5节和6.2.2节。
[4]这8个指标包括盈利市值比(EP)、账面市值比(BM)、总资产收益率(ROA)、应计项目(Accruals)、投资、净营运资产变化(ΔNOA)、净外部融资和净股票发行。
[5]对于每个价值投资策略,Hou et al.(2019a)分别使用单变量排序,以及和市值一起的双变量排序构建投资组合。表7.27介绍了双重排序的结果。
7.7 风险归因
除了风格分析,多因子模型同样能在对投资组合进行风险归因(risk attribution)时发挥巨大的作用。从定义出发,既然每个因子都代表资产收益中的某种驱动力,那么投资组合的风险和它在不同因子上的暴露以及因子本身的波动就密切相关。从该思路出发,Menchero and Davis(2011)提出了对投资组合风险归因的一个简洁、直观的式子:风险=暴露×波动率×相关性。这个公式被称为风险的“三要素”公式。
为介绍风险归因方法,假设投资组合的收益率 $R$ 可以表示为 $M$ 个收益源的线性组合:
$$ R = \sum_ {m = 1} ^ {M} x _ {m} r _ {m} \tag {7.95} $$
式中 $x_{m}$ 是投资组合在收益源 $m$ 上的暴露, $r_{m}$ 是收益源 $m$ 的收益率。为简化表达, 式 (7.95) 中省略了时间下标。在多因子模型中, 不同的因子和个股的特质性收益率就是不同的收益源。接下来, 暂时把因子或特质性收益这些收益源一视同仁,使用式 (7.95) 介绍风险归因的方法, 以便读者理解。在介绍风险三要素公式之前, 作为铺垫, 首先来看另外两种常见的风险归因方法。
7.7.1 两种传统风险归因方法
第一种方法是独立考虑每个收益源对投资组合的风险贡献。对于收益源 $m$ ,由(7.95)可知,它对投资组合的收益率贡献为 $x_{m} r_{m}$ ,因此其风险贡献为 $\sigma(x_{m} r_{m})$ 。这种方法先计算收益源的收益率 $r_{m}$ 自身的风险,再把它按比例计算到投资组合收益率的风险中。这种做法虽然直观,但是它没有考虑收益源与投资组合之间的相关性——收益源与投资组合的相关性越高,它对投资组合的风险贡献度越大。此外,收益源各自独立的风险加在一起并不等于投资组合的风险,即:
$$ \sigma (R) \neq \sum_ {m = 1} ^ {M} \sigma \left(x _ {m} r _ {m}\right) \tag {7.96} $$
式中 $\sigma (R)$ 为投资组合的风险。因此,投资组合的风险无法被收益源的独立风险之和所解释。
contribution to risk, MCR), 它由如下的偏导数定义:
$$ \mathrm {M C R} _ {m} = \frac {\partial \sigma (R)}{\partial x _ {m}} \tag {7.97} $$
在这种解释下,投资组合对收益源 $m$ 的风险暴露每增加 $\Delta x_{m}$ ,投资组合的风险 $\sigma (R)$ 便增加 $\mathrm{MCR}_m\Delta x_m$ 。比较第一种方法,这种方法的优点是投资组合的风险等于所有收益源的边际风险贡献之和[1]:
$$ \sigma (R) = \sum_ {m = 1} ^ {M} x _ {m} \mathrm {M C R} _ {m} \tag {7.98} $$
式(7.98)意味着投资组合的风险可以完全被边际风险所解释,这是此种方法最大的优点。然而,它的缺点是人们很难从业务层面理解偏导数——每个收益源到底对投资组合的风险有多少贡献?风险和偏导数又有什么关系?诸如此类的问题很难直观地回答。
7.7.2 风险的三要素
由于上述两种传统方法在解释投资组合的风险 $\sigma (R)$ 时都不理想,Menchero and Davis(2011)提出了投资组合的风险归因三要素公式。该公式可由如下推导得出:
$$ \begin{array}{l} \sigma (R) \sigma (R) = \operatorname {c o v} (R, R) \ = \sum_ {m = 1} ^ {M} \operatorname {c o v} \left(x _ {m} r _ {m}, R\right) \ = \sum_ {m = 1} ^ {M} x _ {m} \operatorname {c o v} \left(r _ {m}, R\right) \tag {7.99} \ = \sum_ {m = 1} ^ {M} x _ {m} \sigma (R) \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \end{array} $$
将式(7.99)两边同时除以 $\sigma (R)$ 就得到风险归因三要素公式:
$$ \sigma (R) = \sum_ {m = 1} ^ {M} x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \tag {7.100} $$
由式(7.100)可知,投资组合的风险和暴露、波动性及相关性三要素有关:
-
暴露 $x_{m}$ :它衡量投资组合对每个收益源的暴露大小。这完全由基金经理来决定,充分地反映了基金经理的投资偏好。值得说明的是,投资组合对于收益源的暴露值没有任何符号上的限制,即它既可以为正也可以为负。优秀的基金经理会通过对特定收益源采取负的暴露来对冲投资组合在其他收益源上的风险,从而降低投资组合整体的风险。
-
波动性 $\sigma\left(r_{m}\right)$ :它代表的是收益源 $m$ 的收益率 $r_{m}$ 的波动。由于投资组合暴露在不同的收益源之中,那么某个收益源的收益率的波动越大,它对投资组合风险的贡献程度(可以是正向也可以是负向,取决于暴露的符号)也越大。
- 相关性 $\rho\left(r_{m}, R\right)$ : 它是收益源 $m$ 和投资组合收益率之间的相关系数。二者的相关性越高, 投资组合收益率受收益源 $m$ 波动影响的确定性就越大。
由上述说明可知,风险归因三要素式(7.100)的含义是:如果投资组合在该收益源上的暴露越大,收益源的收益率自身的波动越大;收益源的收益率和投资组合收益率的相关性越高,则该收益源对投资组合的风险的贡献就越大。此外,投资组合的风险 $\sigma(R)$ 可以完全被所有收益源的风险 $\sigma(r_m)$ 按式(7.100)分解。
在解释投资组合的风险时,三要素公式较前述两种传统方法有明显的优势。第一种方法将收益源与投资组合隔绝开来,不考虑收益源与投资组合的相关性,也不考虑收益源之间的相关性,无法正确地解释收益源对 $\sigma (R)$ 的贡献。另外,对比第二种方法中 $\sigma (R)$ 的计算式(7.98)及三要素式(7.100)易知 $\mathrm{MCR}_m = \sigma (r_m)\rho (r_m,R)$ 。这可以由如下推导验证:
$$ \operatorname {v a r} (R) = \sum_ {m = 1} ^ {M} x _ {m} \operatorname {c o v} \left(r _ {m}, R\right) = \sum_ {m = 1} ^ {M} x _ {m} \operatorname {c o v} \left(r _ {m}, \sum_ {n = 1} ^ {M} x _ {n} r _ {n}\right) = \sum_ {n = 1} ^ {M} \sum_ {m = 1} ^ {M} x _ {n} x _ {m} \operatorname {c o v} \left(r _ {m}, r _ {n}\right) \tag {7.101} $$
式(7.101)两边同时对 $x_{m}$ 求偏导数,并利用链式法则及协方差公式的定义有:
$$ \begin{array}{l} 2 \sigma (R) \frac {\partial \sigma (R)}{\partial x _ {m}} = 2 \sum_ {n = 1} ^ {M} x _ {n} \operatorname {c o v} \left(r _ {m}, r _ {n}\right) \ \Rightarrow \quad \sigma (R) \frac {\partial \sigma (R)}{\partial x _ {m}} = \operatorname {c o v} \left(r _ {m}, \sum_ {n = 1} ^ {M} x _ {n} r _ {n}\right) \tag {7.102} \ \Rightarrow \quad \sigma (R) \mathrm {M C R} _ {m} = \operatorname {c o v} \left(r _ {m}, R\right) \ \Rightarrow \quad \sigma (R) \mathrm {M C R} _ {m} = \sigma (R) \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \Rightarrow \quad \mathrm {M C R} _ {m} = \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \end{array} $$
可见,收益源 $m$ 的边际风险贡献 $\mathrm{MCR}_m$ 等于其自身的波动 $\sigma (r_m)$ 乘以它和投资组合收益率的相关系数 $\rho (r_m, R)$ 。比起偏导数的解释, $\sigma (r_m)$ 与 $\rho (r_m, R)$ 乘积的解释要更加清晰。此外,这种对 $\mathrm{MCR}_m$ 的分解可以为基金经理提供更好的判断方法。
举个例子,假设两个收益源的边际风险贡献都是 $1\%$ (且投资组合对这两个收益源的暴露相同),基于MCR的解释方法无法区分它们。进一步假设第一个收益源1自身的波动为 $10\%$ ,它与投资组合的相关系数为 $0.1(10\% \times 0.1 = 1\%)$ ;第二个收益源2自身的波动为 $2\%$ ,它与投资组合的相关系数为 $0.5(2\% \times 0.5 = 1\%)$ 。
$\mathrm{MCR}{m} = \sigma \left(r{m}\right) \rho \left(r_{m}, R\right)$ 说明,虽然 $\mathrm{MCR}{m}$ 相同,但是收益源1自身有更大的波动。这虽然并不意味着收益源1更加危险(因为这两个收益源的边际风险贡献相同),但是也不要忘记,所有的这些参数都是根据历史数据估计得到的。由于收益率自身的波动比收益率之间的协方差更容易估计,因此收益源1对投资组合的风险的影响很有可能比收益源2更大。此外,如果基金经理想要排除投资组合对这两个收益源中某一个的暴露,仅仅依靠 $\mathrm{MCR}{m}$ 是不够的, $\sigma \left(r_{m}\right)$ 与 $\rho \left(r_{m}, R\right)$ 为他提供了更多的依据。
7.7.3 从风险角度看收益相关性
风险三要素式(7.100)不仅为风险归因提供了依据,而且还为理解收益之间的相关性提供了全新的视角。三要素公式说明,收益源和投资组合的相关性 $\rho (r_m,R)$ 对风险贡献至关重要,而 $\rho (r_m,R)$ 又和不同收益源之间的相关性有着千丝万缕的联系。
在通常情况下,用来构建投资组合的收益源之间难以满足完全独立的条件,而是或多或少存在相关性(可以是正相关也可以是负相关)。例如在多因子模型中的大部分因子虽然相关性很低,但也不是相互独立的。收益源 $m$ 和 $n$ 的收益率之间的相关性可以由它们的相关系数 $\rho(r_m, r_n)$ 表示。风险三要素式(7.100)为解读 $\rho(r_m, R)$ 和 $\rho(r_m, r_n)$ 的关系提供了全新的思路。通过简单的数学推导可知:
$$ \begin{array}{l} \rho (r _ {m}, R) = \frac {\operatorname {c o v} (r _ {m} , R)}{\sigma (r _ {m}) \sigma (R)} \ = \frac {\operatorname {c o v} \left(r _ {m} , \sum_ {n = 1} ^ {M} x _ {n} r _ {n}\right)}{\sigma \left(r _ {m}\right) \sigma (R)} (7.103) \ = \sum_ {n = 1} ^ {M} x _ {n} \frac {\operatorname {c o v} \left(r _ {m} , r _ {n}\right)}{\sigma \left(r _ {m}\right) \sigma (R)} (7.103) \ = \sum_ {n = 1} ^ {M} x _ {n} \left[ \frac {\sigma \left(r _ {n}\right)}{\sigma (R)} \right] \rho \left(r _ {m}, r _ {n}\right) \ \end{array} $$
式(7.103)说明任何一个收益源 $m$ 和投资组合的相关性 $\rho$ ( $r_m, R$ )都等于该收益源与收益源 $n$ 的相关性 $\rho$ ( $r_m, r_n$ )以权重 $x_n$ ( $\sigma(r_n) / \sigma(R)$ )相加之和。收益源 $n$ 对 $\rho$ ( $r_m, R$ )的贡献度取决于投资组合对收益源 $n$ 的暴露程度 $x_n$ 、收益源 $n$ 对投资组合的相对波动率 $\sigma(r_n) / \sigma(R)$ ,以及收益源 $n$ 与 $m$ 之间的相关性 $\rho$ ( $r_m, r_n$ )。
只有当 $x_{n}$ 足够大、 $r_{n}$ 的波动与 $R$ 的波动有可比性、 $r_{n}$ 与 $r_{m}$ 高度相关,三个条件同时满足时,收益源 $n$ 才足以影响收益源 $m$ 与投资组合的相关性。通过比较不同收益源的 $x_{n} \left( \sigma \left( r_{n} \right) / \sigma (R) \right)$ $\rho \left( r_{m}, r_{n} \right)$ ,就可以方便地判断哪个收益源 $n$ 对 $\rho \left( r_{m}, R \right)$ 的贡献最大。这可以为基金经理控制投资组合的风险提供新的思路。
在理想情况下,如果投资组合的收益可以完全被若干个收益源解释,且这些收益源之间都是不相关的,即对于不同 $m$ 和 $n$ 都有 $\rho(r_m, r_n) = 0$ ,在这种情况下(并利用 $\rho(r_m, r_m) = 1$ ),式(7.103)简化为:
$$ \rho \left(r _ {m}, R\right) = x _ {m} \frac {\sigma \left(r _ {m}\right)}{\sigma (R)} \Rightarrow \sigma (R) = \frac {x _ {m} \sigma \left(r _ {m}\right)}{\rho \left(r _ {m} , R\right)}, \forall m \tag {7.104} $$
乍一看, 这似乎与三要素式 (7.100) 矛盾, 但在简单计算后不难验证式 (7.104) 与式 (7.100) 是一致的。将 (7.104) 两边同时乘以 $\rho\left(r_{m}, R\right)$ 2 得到:
$$ \sigma (R) \rho \left(r _ {m}, R\right) ^ {2} = x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right), \forall m \tag {7.105} $$
由于式(7.105)对每个收益源 $m$ 都成立,因此将所有收益源相加并经过简单的推导便可以得到风险三要素式(7.100):
$$ \begin{array}{l} \sum_ {m = 1} ^ {M} \sigma (R) \rho \left(r _ {m}, R\right) ^ {2} = \sum_ {m = 1} ^ {M} x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \Rightarrow \left(\sum_ {m = 1} ^ {M} \rho \left(r _ {m}, R\right) ^ {2}\right) \sigma (R) = \sum_ {m = 1} ^ {M} x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \Rightarrow \quad 1 \times \sigma (R) = \sum_ {m = 1} ^ {M} x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \ \Rightarrow \quad \sigma (R) = \sum_ {m = 1} ^ {M} x _ {m} \sigma \left(r _ {m}\right) \rho \left(r _ {m}, R\right) \end{array} \tag {7.106} $$
在上面的推导中, $\sum_{m=1}^{M} \rho (r_{m}, R)^{2} = 1$ 利用了可决系数 $R^{2}$ 的性质。由于假设所有的收益源都是不相关的, 即 $\rho \left(r_{m}, r_{n}\right) = 0$ , 在这种情况下 $R^{2}$ 等于投资组合收益率与每一个风险源收益率的相关系数的平方和, 即 $\sum_{m=1}^{M} \rho (r_{m}, R)^{2} = R^{2}$ 。此外, 根据假设, 投资组合的收益率完全由这些收益源解释, 因此 $R^{2} = 1$ 。结合上述两点, 最终有
$$ \sum_ {m = 1} ^ {M} \rho (r _ {m}, R) ^ {2} = 1 。 $$
7.7.4 将三要素公式应用于多因子模型
下面把收益源用多因子模型中的因子代替,利用风险三要素公式给出风险归因表达式。假设在风险归因的投资组合中包含N支股票。由给定的多因子模型可知,每支股票的(超额)收益率可以分解为因子和其特质性收益的线性组合(为了简化表达,省略时间下标):
$$ R _ {i} ^ {e} = \sum_ {k = 1} ^ {K} \beta_ {i k} \lambda_ {k} + \varepsilon_ {i} \tag {7.107} $$
进一步,假设在目标投资组合中,股票 $i$ 的权重为 $\omega_{i}$ ,则该投资组合的超额收益率是这些股票收益率的加权之和:
$$ R ^ {e} = \sum_ {i = 1} ^ {N} \omega_ {i} \left(\sum_ {k = 1} ^ {K} \beta_ {i k} \lambda_ {k} + \varepsilon_ {i}\right) = \sum_ {k = 1} ^ {K} \left(\sum_ {i = 1} ^ {N} \omega_ {i} \beta_ {i k}\right) \lambda_ {k} + \sum_ {i = 1} ^ {N} \omega_ {i} \varepsilon_ {i} = \sum_ {k = 1} ^ {K} \beta_ {k} \lambda_ {k} + \sum_ {i = 1} ^ {N} \omega_ {i} \varepsilon_ {i} \tag {7.108} $$
式中 $\beta_{k} = \sum_{i=1}^{N} \omega_{i} \beta_{ik}$ 表示投资组合在因子 $k$ 上的暴露,它是包含个股在该因子上暴露的加权之和。对式(7.108)直接运用风险三要素公式便可方便地求出该投资组合的风险归因:
$$ \sigma (R ^ {e}) = \underbrace {\sum_ {k = 1} ^ {K} \beta_ {k} \sigma (\lambda_ {k}) \rho (\lambda_ {k} , R ^ {e})} _ {\text {因 子 贡 献 的 风 险}} + \underbrace {\sum_ {i = 1} ^ {N} \omega_ {i} \sigma (\varepsilon_ {i}) \rho (\varepsilon_ {i} , R ^ {e})} _ {\text {个 股 特 质 性 贡 献 的 风 险}} \tag {7.109} $$
可见,投资组合的风险由因子代表的系统性风险和个股特质性风险两部分组成。个股特质性风险源于个股的特质性收益率,它是因子无法解释的部分。在使用多因子模型进行风险归因时,需同时考虑以上两部分,才能正确地对投资组合进行风险归因。
[1]在下文介绍三要素公式时将会给出这个式子的推导。
7.8 因子投资展望
本节通过两方面展望因子投资未来的发展趋势。其中,7.8.1节介绍另类数据在因子投资中的作用。如今随着那些早已家喻户晓的因子被越来越多的人使用,很多因子的预期收益逐年降低(比如价值因子)。面对这种局面,人们开始从尚未被过度使用的数据源中寻找构造因子的灵感,这些数据源就是另类数据。然而,另类数据是否像想象中一样好使呢?7.8.1节将给出讨论和答案。接下来的7.8.2节将介绍如何使用因子进行大类资产配置。资产配置从来都是投资中的重要课题,而随着对因子和资产关系理解的加深,业界现在已广泛接受的观点是不同类的资产的收益率也都是被底层的有限个因子驱动的。在这个认知下,海外业界也已逐步从资产配置转型到因子配置。7.8.2节将就这个话题展开讨论。
7.8.1 另类数据
美国时间2018年10月25日,困境中的Tesla(特斯拉)股票取得 $9.14\%$ 的大涨,只因为在前一个交易日盘后发布的2018财年三季度财报大超华尔街预期。财报显示,Tesla的爆款车型Model 3的产量在过去一个季度较之前几乎翻番,这无疑给投资人注入了一剂强心针,也引得市场一片狂欢。
面对Model 3产量的大增和股票大涨反映出的市场信心,最高兴的人当属Tesla 的掌门人Elon Musk。然而,除了Musk,同样高兴的恐怕还有另外一群人,他们就是另类数据公司Thasos以及它的很多对冲基金客户。因为在Tesla发布三季度财报 之前,这群人大概早就凭借着信息优势预判到了这一点并提前布局。Thasos是怎么做到的?
他们在一张在线地图上环绕Tesla位于美国加利福尼亚州Fremont占地370英亩的工厂创建了一个数字围栏,以隔离从Tesla工厂范围内发出的智能手机的位置信号。Thasos租赁了通过智能手机APP收集到的数万亿个地理坐标的数据库,并使用电脑程序密切监测从Tesla工厂中发出的手机信号。利用手机信号量,他们发现从2018年6月到10月,Tesla工厂夜间轮班时间增加了 $30\%$ ,因此推断Tesla的产能得到了极大的提高。Thasos将这个数据分享给了它的一些对冲基金客户。毫无疑问,这一数据发挥了巨大的作用。它是将另类数据应用于二级市场投资的一个经典案例。
其实,另类数据并非什么新鲜概念。在几十年前,当人们仅通过量价数据进行交易的时候,财务报表数据就是另类数据;当财务数据被广泛使用后,分析师一致预期就是另类数据;当分析师一致预期家喻户晓之后,网络舆情数据就成了另类数据;当人们对网络舆情不再陌生之后,非结构化的文本数据就变成了另类
数据……
随着通过已有数据源构建因子并进行交易变得越来越“拥挤”,获得的超额收益越来越少,人们自然而然地将视线和希望转向新的另类数据上,希望通过独门数据源挖出新的“阿尔法因子”。这种迫切的需求也让另类数据在近几年得到了飞速的发展。来自AlternativeData.org的数据显示,另类数据提供商的数量在最近五年出现了激增。每当人们接触到新的数据源的时候,通常的反应都是“两眼发光”。诚然,在市场变得更加有效的今天,新的数据源无疑是尚未被过度使用的“净土”,充满了潜在的机会。但是,另类数据真的像人们想象的那样前景一片光明吗?是否任意一个新的数据源都能拿过来加工出一个靠谱的因子?另类数据能否成为二级市场的“银色子弹”?面对这些问题,海外业界不乏争议之声,有多少人支持就有多少人反对。下面就来探讨关于另类数据的五点思考。
1. 技术和数据需匹配
关于另类数据的第一点思考是新的数据类型需要相应的分析技术。当仅有价格和交易量数据的时候,传统的技术分析就能发挥很大的作用。然而,这些技术分析对结构化的会计报表数据却难有作为。为此,相应的分析手段也应运而生,比如多因子模型,而寻找因子本身可以算是一种模式识别。如今,如果想要分析非结构化文本数据以及更一般的多媒体数据,则需要更高级的技术,如自然语言处理和广义人工智能。图7.18展示了不同数据类型和分析技术之间的对应关系。随着另类数据的发展,数据类型越来越复杂,这就要求使用者具备相应的分析技术,否则将无法发挥数据的优势。这对管理人和投资者都提出了更高的要求。

图7.18 不同数据类型和分析技术之间的对应关系
随着另类数据量的爆发,另一个需要面对的问题则是维数灾难。以预测股票收益率为例,另类数据代表着不同的自变量。由于股票的样本数据就那么多,随着自变量的增加,股票样本数据在这些变量构成的空间内将会越来越稀疏。参数的激增使得预测模型存在更高的过拟合风险,且预测的偏差(bias)和方差(variance)都会变大。
此外,在使用不同另类数据构建因子时应注意避免6.1.5节介绍的多重假设检验问题。当使用大量不同另类数据集构建的因子分析同样的股票数据时,总会出现仅仅因为运气就十分显著的因子。这就要求人们从统计手段上要尽可能排除这种“幸运因子”,此外在金融业务上也需要真正理解另类数据和未来预期收益率之间的逻辑。这便引出了对另类数据的第二点思考——使用另类数据需要很强的专业知识(domain knowledge)。
2. 需要专业知识
全新的数据是一把“双刃剑”。一方面,因为还没有人用过,所以它不存在“拥挤”的问题;另一方面,如果使用者不具备该数据分析所要求的专业知识,那很可能不知道从何处下手。在人们的想象中,另类数据也许是这样的:有令人兴奋的“故事”,而且是已经被数据供应商处理好的结构化数据,能够直接拿来当成因子去预测资产收益率。然而在现实中,另类数据更像是在一个没人去过的地方发现了一座山。而这座山里有没有矿、从哪里开始挖、到底能挖出什么,更多的要看使用者自己的本事。
在海外业界,实力充沛的大型资产管理公司具备足够的人才储备,往往自己进行数据分析(in house analysis)。此外,另类数据供应商也会推出一些听上去十分有希望的应用场景来推销数据。除了买方、卖方,市场上也涌现出了第三方研究机构,投资者会委托他们进行另类数据的研究。
对于另类数据的使用者来说,使用供应商或者第三方提供的加工后的数据无疑是最方便的。但这种做法存在的问题是,这些应用场景会被卖给很多不同的使用者。这会增加另类数据的拥挤度,降低其在未来获取收益的能力。因此,对于使用者来说,掌握专业知识——包括另类数据的产生、背后的业务流程、金融学的含义等——无疑至关重要。唯有此,才能掌握研究的主动权,并更有可能挖出“独门”的收益率预测变量。
在这方面,Lee et al.(2019)是一篇值得借鉴的文章。该文针对美股,使用专利数据创造性地构建了科技关联度指标,获得了其他常见因子无法解释的超额收益。这个想法需要对专利数据背后代表的业务逻辑,以及公司之间的关联有深刻的认识。如果没有这种专业知识,只是把专利数据拿来简单地统计哪个公司专利多、哪个公司专利少,恐怕难以持续获得可观的超额收益。
3. 数据是否无偏
关于另类数据的第三点思考是,数据的生成(采集)过程是否无偏(unbiased),能否很好地代表总体。为了说明这一点,不妨来看一个例子。Green et al.(2019)使用Glassdoor.com数据研究了员工评价与股票收益率之间的关系[1]。Glassdoor.com提供了员工对公司的综合评价和五个标准化评价指标,包括职业机会、薪酬福利、工作/生活平衡度、高层管理、企业文化与价值,所有评价皆为1至5星。
为了研究员工评价和股票收益率的关系,Green et al.(2019)依据员工评价变化高低将股票分为三组,并通过最高组和最低组之差构建了该因子。理论上,员工评价变高,意味着经济环境及公司前景很可能在变好,在其他条件相同的情况下,公司应有更好的表现,因此预期收益率更高。实证结果支持了他们的猜想。
无论等权重还是市值加权,该因子都能够获得显著的超额收益。此外,高、低评价变化组合的主要特征基本一致,动量也非常接近,而员工评价变化平均相差超过1星,这意味着其他常见因子无法解释公司评价。这一点也进一步被Fama-MacBeth回归结果所验证:无论单变量回归,还是控制不同的公司特征,员工评价变化都有显著的超额收益。
虽然上述发现十分有趣,但Glassdoor.com的数据是否合理仍然存疑:员工评价数据是否无偏呢?是否是可信的?事实上,该网站的数据存在以下一些潜在问题。
(1)没有员工认证系统。这意味着任何人可以在任何时间对任何公司进行评价,而没有机制来保证这个人确实是或曾是该公司的员工。
(2) 人们更容易在对雇主不满时发表 (负面) 评价。
(3)人们往往过度夸大感受。Glassdoor.com上有很多1星和5星的评价。
(4)评分体系本身并无科学依据。Glassdoor.com并没有明确说明每个星级到底代表什么。评分者可根据主观感受任意地选择1星到5星。工资不错?5星!餐厅免费?5星!免费健身房?5星!……5星可以代表任何事,但显然不是所有的5星和股票收益率的关系都是一致的。人们不知道每个5星背后到底意味着什么。
(5)有些雇主有奖励机制,鼓励员工提交5星评价。曾经有一个公司大概有1.5星左右,后来管理层发话,如果员工仅发布经管理层审批后通过的留言,那么将得到250美元的奖励。这个公司后来的评分上升至4.2星。
这些问题说明,Glassdoor.com的数据的无偏性令人担忧。除此之外,对该数据的另一个猜想是涉及公司的行业分布是否均匀?比如,互联网或者科技公司的员工更容易也更愿意参与网上评价,而传统制造业企业的员工则没那么热衷于此事。如果行业分布不均,那么相关研究结果将会由于没有控制行业影响而大打折扣。
4. 历史样本数据较短
对于大多数另类数据来说,一个不得不面对的问题是数据长度往往很短。通常来说,另类数据集的历史数据长度一般是5年以内(2到3年很常见),5年以上就是很长的了。历史数据太短会加剧多重检假设验问题造成的影响,造成拟合度提高。
Bailey and Lopez de Prado(2012)的研究发现,数据长度越短则越容易出现过拟合。举个例子,假设数据无法预测收益率。该研究发现,如果数据的长度仅有2年,则仅需要通过7个检验就能发现一个夏普比率为1.0的策略;而如果将数据的长度增加到5年,达到同样的效果则需要45个检验。因此,数据长度越短,越容易出现过拟合。在这个时候,如果没有对另类数据背后逻辑的认知,则难以辨别找到的因子是否真的有效。
5. 检验增量贡献
关于另类数据的最后一点思考是检验其对预测收益率是否有增量贡献。例如Liew and Budavari(2017)使用Tweet情绪数据,在Fama-French五因子基础上加入了第六个因子,并指出该因子能在五因子之外解释个股收益率的时序波动[2]。
人们之所以使用另类数据,是希望它们能够提供传统数据源无法解释的超额收益。如果绕了一大圈后发现,另类数据背后的收益率驱动和已有因子相同,那么它就没有提供额外的价值。在投资中,多样化被认为是唯一的“免费的午餐”,同样的道理对数据也成立。只有当另类数据和现有数据尽可能不相关,它才有可能捕捉到其他收益源之外的收益,并提高投资组合的风险调整后收益。
以上就是对另类数据的五点思考。最后,简单总结一下另类数据的四大主流数据来源,包括网络抓取、情绪、卫星数据以及消费数据。
金融行业数据服务机构Greenwich Associates的研究表明,网络抓取的数据是目前使用最广泛的另类数据。网络抓取意为从目标网站收集数据,以获取有关品牌、公司和企业活动的信息。这其中,最热门的数据包括职位发布和公司评价,它们能够为公司的前景提供一定的线索。此外,有关产品排名和促销活动的数据也极具价值,人们可以从中找寻公司表现的蛛丝马迹。情绪数据则代表了另一大类的常见另类数据。像社交媒体、新闻流、公司公告这些自不必说了,已经有很多相关的研究。除此之外,海外也开始对上市公司的财报电话会议记录进行文本分析,捕捉高管在讨论财务结果时的用词和语言,以此推断公司的前景。在这方面,相较于中文,英文有较大的优势,可操作性要高不少。卫星数据听上去很玄幻,但在所有头部另类数据提供商的样例中几乎都能找到它的身影。比如,卫星图像数据会被用来跟踪船只、监测农作物、探测港口和油田的活动、推断大宗商品的库存等。最后,信用卡和借记卡的交易数据中也存在巨大的价值。在海外,一些另类数据商网罗了很多消费者,他们同意分享其消费数据。这类数据可以被用来追踪零售行业的收入,通过更细的粒度及更高的频率来预测相关公司的基本面。通常,这类数据的可获得性比较低且非常昂贵。
在传统因子变得越来越拥挤的今天,另类数据的出现无疑为因子投资注入了新的活力。我们应该客观地认识另类数据的特点,使用科学的分析方法,并抱有正确的预期,或许另类数据在因子投资中或大有可为。据来自AlternativeData.org的统计数据显示,海外买方在购买另类数据上的支出在最近几年逐年增长,说明业界对另类数据越来越重视。我们也有理由对另类数据的未来充满希望。
7.8.2 用因子实现大类资产配置
随着因子投资的概念深入人心,因子的概念也已经从最初股票的风格因子演进到进行大类资产配置的有效手段。这其中的含义是,虽然金融市场中有各种各样的资产,比如股票、债券、外汇、大宗商品、房地产等,但这些看上去完全不同的大类资产的收益率其实也是被底层有限个因子来驱动的。举例来说,以前人们会把债券当作一类资产进行配置。如今,债券则被视作在利率(rates)、信用(credits)及通货膨胀(inflation)这些更本质的收益驱动力(即因子)上有不同程度的暴露。因此,配置最本质的因子比其配置大类资产能够更好地实现多样化,提高投资组合的风险调整后收益。近年来,海外的众多大机构在这方面做了很多积累。
需要特别说明的是,在确定底层因子时,并不需要刻意去为每一类资产找出一个或多个暴露的因子。事实上,有些资产类别本身也可以同时被视为底层因子。举例来说,海外很多机构普遍认可把股票、大宗商品等资产本身作为底层因子。在具体使用时,底层因子的选择因人而异。但一般来说,这些因子通常包括发达市场股票、新兴市场股票、大宗商品、实际利率、通货膨胀、信用、房地产、非流动性等。在使用上述因子进行大类资产配置时,有两个问题需要格外注意:(1)构建因子模拟组合;(2)抵御因子的尾部风险。
在上述因子中,利率、通胀、信用等并非具体某一类资产。为了配置它们,首先需要构建因子模拟投资组合。构建因子模拟组合的大致思路和本书第2章的说明并无太大区别。对于任意给定的因子,构建其模拟投资组合的核心思想就是找到最能受其影响的资产(即暴露最大),然后通过这些资产的收益率来衡量该因子的收益率。表7.28简要介绍了上述因子的因子模拟投资组合。需要强调的是,表7.28仅仅是为了起到示例作用,在实际应用时应根据具体情况精细地为每个因子构建因子模拟投资组合。
表7.28 不同因子的因子模拟投资组合示例
| 因子 | 因子模拟投资组合 |
| 发达市场股票 | 做多:发达市场股票指数(例如MSCI World Index) |
| 做空:现金 | |
| 新兴市场股票 | 做多:新兴市场股票指数(例如MSCI World EM Index) |
| 做空:发达市场股票指数 | |
| 大宗商品 | 做多:全球商品指数(例如Bloomberg Commodity Index) |
| 做空:现金 | |
| 实际利率 | 做多:一篮子主权通胀挂钩债券(sovereign inflation-linked bonds) |
| 做空:现金 | |
| 通货膨胀 | 做多:一篮子主权债券 |
| 做空:期限匹配的一篮子主权通胀挂钩债券 | |
| 信用 | 做多:投资级企业债券 |
| 做空:政府债券 | |
| 房地产 | 做多:房地产投资信托基金 |
| 做空:现金 | |
| 非流动性 | 做多:流动性差的股票① |
| 做空:流动性好的股票 |
① 流动性可根据Amihud(2002)的方法计算。
有了因子模拟投资组合,就可以通过它们进行合理的资产配置,使得最终的投资组合以最优的权重暴露在这些底层因子上。从经济学含义上说,这些底层因子的相关性很低。从配置方法论来说,使用简单多样化配置往往就可以在实际中取得不错的效果。当然,这并不妨碍使用其他更复杂的配置方法。一般来说,由于因子的收益率难以预测,因此可以采用仅使用因子协方差矩阵为输入的配置方法,如风险平价等。前文7.3.2节已对不同的资产配置目标函数做过介绍。
任何资产都有周期性,在宏观经济周期的不同阶段而有不同的表现。而配置不同底层资产的本意是通过分散化投资,让投资组合适应不同的经济周期,“穿越
牛熊”。然而,最近几年投资者都能从全球市场上明显感受到,无论不同的大类资产,还是更底层的一些因子,它们的相关性——尤其是下行时的相关性——变得越来越高。每当发生冲击全球经济的黑天鹅事件时,就很难有资产或因子能够“独善其身”,而普遍会出现大跌。由于大跌代表着收益率分布的左尾,因此同时大跌也被称为尾部相关性陡然上升。全球市场颇为艰难的2020年就是很好的例子。
面对这种情况,一个自然的想法就是如何抵御因子尾部相关性上升对投资组合的伤害,即如何抵御因子的尾部风险。针对这个问题,贝莱德(BlackRock)提出了防御性因子择时(defensive factor timing)的理念(Fergis et al.2019)。防御性因子择时的目的是降低风险。与传统的为了预测收益率而进行的择时不同,防御性因子择时关注的是因子的协方差矩阵,即风险。它是一个低频事件,其唯一的目的就是规避巨大的市场风险,降低黑天鹅事件对投资组合的冲击。
一般来说,极端市场风险可能来自以下三个方面:(1)市场风险偏好的骤降;(2)不同因子之间的相关性激增,从而无法实现预期的分散化;(3)某些因子变得极度昂贵[3]。为此,需要通过一定的量化手段来监测并鉴别上述三种情况是否发生。一旦出现一种或多种情况,便通过降低仓位来有效地保护投资组合免受极端事件的冲击。由于前两种风险对于防御性因子择时的重要性远超过因子估值本身,以下对它们进行简要介绍。
首先来看看市场风险偏好骤降。通常来说,高风险意味着高收益。因此,可以使用因子收益率和波动率的秩相关系数来定量计算风险容忍指标(risktolerance indicator,RTI)。使用秩相关系数背后的依据是市场风险偏好的高低可以由不同资产的收益率和它的风险水平的一致程度所反应。当风险偏好高时,高风险资产应该比低风险资产有更高的收益率;当风险偏好低时,高风险资产应比低风险资产有更大的跌幅。秩相关系数的优势是考察收益率和波动率的单调相关性,而不假设变量之间的线性或非线性关系。令 $q(R)$ 和 $q(\sigma)$ 分别代表不同因子收益率和波动率的排序序列,则RTI的定义为:
$$ \mathrm {R T I} = \operatorname {c o r r} (q (R), q (\sigma)) \tag {7.110} $$
由式(7.110)可知RTI的取值范围是-1到1之间,其值越大说明风险偏好越高,越小说明风险偏好越低。对RTI指标的实证结果显示,其在2008年全球金融危机以及2010年和2012年欧洲主权债务危机时都给出了明确的警示信号。
接下来看看如何监测因子相关性激增风险。为此,可采用多样化比例(diversification ratio,DR)指标,它是各因子自身波动率按其权重的加权与投资组合波动率之比:
$$ \mathrm {D R} = \frac {\sum w _ {i} \sigma_ {i}}{\sigma_ {p}} \tag {7.111} $$
DR的值越大说明因子之间的相关性越小,越能够分散风险;越小则意味着因子之间的相关性越大。
使用DR、以(7.110)定义的RTI,以及因子估值,防御性因子择时在最近十年的几次全球性金融危机中都保护了投资组合。举例来说,从2012年第二季度开
始,由希腊和西班牙引发的一系列问题使得全球市场的神经极度紧绷。RTI指标从当年4月底的20%骤降至6月中旬的-60%。在这种大环境下,防御性因子择时在2012年5月将投资组合的仓位降低20%,直至同年8月RTI恢复到0%的水平才重新提高到之前的仓位。此外,2013年夏天,时任美联储主席的伯南克宣布美联储将会逐渐削减购债规模。在听到这个消息后,投资者开始疯狂抛售债券,债市收益率大幅上行,而债券价格的下跌也传导至其他资产,导致不同类资产的下跌。这一事件被称为“减码恐慌(taper tantrum)”。在这期间,RTI指标虽然没有什么表现,但DR指标发挥了作用。它的急跌显示出因子之间的相关性迅速提升,从而启动了防御性因子择时。自2013年6月,投资组合的仓位被降低20%以抵御风险,直至同年9月DR恢复到之前的水平,仓位才提高到基准水平。这两个例子有效地说明了从多维度度量风险的优势,即同时使用多个低相关的风控指标对于抵御风险至关重要。
如今,使用因子进行大类资产配置已经逐渐成为海外市场的主流做法。本节介绍的两个问题——构建因子模拟投资组合和抵御因子尾部风险——是在投资中成功践行上述做法的关键。除了这两个关键,传统因子投资中的各种要素,包括是否以及如何预测因子收益率、计算因子的风险、配置因子,也依然至关重要,需要使用科学的方法进行研究和实践。和传统的因子投资一样,用因子进行大类资产配置其成功的关键也在各种细节之中。
[1]公众号“因子动物园”的文章《乌合之众or群众的智慧:员工评价与股票收益》对该文进行了详细介绍。
[2]不过有意思的是,该文并没有研究该因子在解释个股预期收益率截面差异上的作用。
[3]即因子估值过高说明已有大量资金涌入。
后记
感谢你看到这里!
本书共分为7章,围绕着第1章提出的“统一视角”探讨了因子投资的方方面面。而它们合在一起,其实是为了回答同一个问题:什么是因子投资?希望看过本书之后,你已找到了属于自己的答案。写到这里,已经无须再对因子投资这个话题进行总结,但不妨让我们借这个机会介绍一下创作本书背后的心路历程。
我们三位作者为公众号“川总写量化”“因子动物园”的创作者。我们在这两个公众号上均创作了大量关于因子投资的高质量的内容,得到了学术界和业界的肯定。而我们三个人也通过写作而结识、相互熟悉,并最终认可彼此的能力和研究态度。在我们平时的研究和实践因子投资中,会查阅大量海外顶级期刊上的论文及这方面的专著。在感慨外文文献科学且务实的同时,也对国内尚未有关于因子投资的综述性书籍而感到遗憾。为了弥补这个遗憾,我们一拍即合决定将和因子投资有关的内容系统地整合并辅以全新的实证分析,最终就有了这本《因子投资:方法与实践》。我们的愿景非常简单,即深度解读因子投资的方法论,并提供针对A股市场进行高质量、可复制且完全独立性的实证研究结果。希望这本书能够让正在因子投资这条道路上前行的小伙伴们少走些弯路。
在写作中,全书力争做到内容翔实、语言紧凑。为了呈现因子投资领域过去几十年来的发展历程,也为了让本书读者在今后的研究和实践中有迹可循,书中引用了因子投资和实证资产定价领域在过去五十年内不同时期发表的402篇代表性期刊论文,这些文章截至2020年4月30日谷歌学术(Google Scholar)的总引用量为737065次,平均每篇被引用1833次(被引用量的中位数为489),足见它们的重要程度。图后记.1给出了这些论文发表的年限分布(按照5年窗口统计,例如2020代表2016至2020这5年内发表的论文),可以看出这些论文整个因子投资发展的贯穿历史,而这也是本书内容与时俱进的证明。

图后记.1 书中引用的金融领域期刊论文分布
作为对你的感谢,本书在最后还放了两个“彩蛋”。第一个“彩蛋”是附录,它以理解资产价格为题,提纲挈领地介绍了过去50年学术界在资产定价方面的研究脉络。它的主要参考文献是诺贝尔奖学术委员会为介绍2013年诺贝尔经济学奖获得者Eugene Fama、Lars Peter Hansen及Robert Shiller三位教授的贡献而撰写的综述。这篇综述非常精彩,让人常读常新。带着本书介绍的实证资产定价和因子投资的方法论,相信你能够从中进一步感受到相关研究成果的精妙之处。
作为第二个“彩蛋”,我们想在此推荐三本和因子投资密切相关的经典书籍。
- 第一本是Bali et al.(2016),书名为Empirical Asset Pricing:The Cross Section of Stock Returns。从题目就可以看出,它关注的是影响股票收益横截面差异的经典因子和研究方法,而这正是因子投资的研究主题。该书的作者是Turan Bali、Robert Engle及Scott Murray。其中第一位是实证资产定价领域的著名学者。而第二位Engle更无须介绍,他是著名的计量经济学家,凭借对波动率建模的ARCH模型获得了2003年诺贝尔经济学奖。该书获得了Eugene Fama、John Campbell、Kenneth French等大咖的联袂推荐。
全书共18章,包括两个截然不同的部分。第一部分用简练的语言清晰地交代了基本的描述性统计分析方法,以及因子投资中的两个核心工具:投资组合排序检验和Fama-MacBeth回归分析。随后第二部分便转向了美股实证研究,逐一对市场β、规模、价值、特质性波动率等经典异象进行基于美股市场的实证分析。最后,该书以对投资者情绪、投资者注意力,以及作者自己所关注的彩票偏好等近年新兴的研究主题的综述进行收尾。这本书逻辑清晰、内容翔实,且写作语言朴实而流畅,阅读体验非常好,即便是对因子投资毫无基础的人也能很容易上手,是实证资产定价领域不可多得的佳作。
- 第二本是Cochrane(2005),书名为Asset Pricing。它的作者John Cochrane是资产定价乃至金融领域的顶级学者,也曾是美国金融协会主席。这本书曾获得Paul A. Samuelson Awardfor Outstanding Scholarly Writing on Lifelong Financial Security,足见其重要性。
与Bali et al.(2016)不同,这本书偏重于资产定价理论。它涵盖了与资产定
价相关的各种理论、模型和计量经济学方法,其中多因子模型及其检验仅仅是一小部分。最为精妙的是,全书的论述都围绕着资产定价中的一个最基本的公式——无套利定价公式——展开,行文逻辑清晰而严谨。在这本书中,Cochrane教授将资产定价的宏大画卷以及不同理论之间的相互关联清晰地展现在读者面前。虽然书中有大量的数学推导,但Cochrane教授对数学公式的驾驭能力极大地降低了读者理解它们的难度。除此之外,这本书的配套教学视频也被芝加哥大学免费发布到互联网上。在课程中,Cochrane教授的讲授十分生动、到位,学习该课程也非常有助于理解各种定价模型背后的数学公式。这本书值得任何对资产定价感兴趣的人认真读、仔细读、反复读。
- 第三本是Lee and So(2015),书名为Alphanumeric: The Information Underpinnings of Market Efficiency,作者是Charles Lee和Eric So。其中Lee教授是学术界和业界的双料大咖——他曾任Barclays Global Investors Equity Research的全球负责人,如今在斯坦福大学商学院任教,是著名的会计学教授,并在行为金融学领域颇有建树。该书一经面世,便收到来自学术界和业界的赞誉无数。
这本书的主标题是Alphanumeric一词,中文翻译为“阿尔法经济学”。这个词的前半部分是Alpha(阿尔法),代表着市场中的超额收益α,而后半部分Nomics则指的是获取超额收益背后的经济学,它囊括了信息套利背后涉及的成本和动机。全书共分为6章,分别阐述了市场非有效性、噪声交易者、投资者情绪、基本面分析、套利成本以及异象研究方法几个方面,从信息套利的角度对市场的非有效性以及如何利用这种非有效性获取超额收益进行了深入的剖析和解读,涵盖了学术界关于市场有效性、行为金融学及基本面分析的大量研究。对于想要通过行为金融学挖掘并利用市场的非有效性、构建投资策略战胜市场的读者来说,这本书不容错过[3]。
以上三本书就是我们送给你的第二个“彩蛋”了。希望它们能够帮助你拓宽视野、提升专业技能,更好地在因子投资领域“畅游”。
好了,是时候和你道别了。在最后我们想说,关于因子投资,《因子投资:方法与实践》不是终点,而是起点。希望在不远的将来,能够看到更多关于A股市场的客观、严谨且富有深度的研究成果。若本书能为实现上述目标做出些许贡献,那将是我们最大的鼓舞和慰藉。
[1]作为一本工具书,全书的文风是偏严肃的,使得三位作者“有趣的灵魂”无处安放。感兴趣的读者请移步相关的公众号。相比于本书,公众号中的文风要活泼得多。
[2]这里只统计属于因子投资和实证资产定价领域的论文(不包含专著或专著中的章节)。除上述领域以外,书中同时涉及来自统计学(例如多重假设检验、Newey-West和White估计量等)、心理学(如前景理论、心理账户理论等)等方面的重要论文,但在统计参考文献时并未将它们包括在内。此外,在统计中只考虑正式发表的论文,对于早期研究手稿或未能发表的论文不予考虑,以避免重复统计。
[3]Lee and So(2015)的中文版《阿尔法经济学:赢取资本超额收益的法则》于2019年出版,译者为中国人民大学商学院张然教授,她是国内基本面量化投资的代表性学者之一。公众号“川总写量化”的文章《阿尔法经济学》对中文版做过精彩点评。
附录A 理解资产价格
2013年,诺贝尔经济学奖被授予Eugene Fama、Lars Peter Hansen及Robert Shiller三位教授,以表彰他们在实证资产定价领域的卓越贡献。暂且抛开Lars Peter Hansen在关于定价模型检验的计量经济学方法论方面的突出贡献不说,诺贝尔奖被同时授予Fama和Shiller实在是意料之外,但却又在情理之中。令人感到意外的是,Fama和Shiller分别为有效市场假说之父和行为金融学的先驱,他们就市场是否有效持完全对立的态度。而又在情理之中的是,他们及Hansen的研究成果奠定了人们理解资产价格的基础——价格波动受到理性和人的行为的共同影响。在笔者看来,诺贝尔奖委员会的这个决定是科学的胜利,是人类在探究市场真相道路上坚实的一步。
为了普及三位教授的研究成果,诺贝尔奖学术委员会特地编撰了一篇题为理解资产价格(Understanding asset prices)的科普性文章(Economic Sciences Prize Committee of the Royal Swedish Academy of Sciences 2013)。该文以他们三个人的研究成果为主线,系统而全面地梳理了学术界在过去50年里在理解资产价格和收益率方面发现的重要成果。由于多因子模型是资产定价的一个组成部分,因此强烈推荐对因子投资感兴趣的读者仔细阅读这篇综述。本书的最后简要梳理该文的重点,供各位参考。
1 无套利定价公式 $P = E[mx]$
这一切始于 $P = E[mx]$ 。
假设在 $t$ 时刻,资产 $i$ 的价格是 $P_{it}$ ;在 $t + 1$ 时刻,资产处于某种资产状态 $s$ ,其发生的概率为 $\pi_{t + 1}(s)$ ,且在该状态下,资产的支付额和对应的折现因子分别为 $x_{it + 1}(s)$ 和 $m_{t + 1}(s)$ 。由无套利约束(absence of arbitrage opportunities)可知, $P_{it}$ 满足以下关系(无套利意味着左右两端必须相等):
$$ P _ {i t} = \sum_ {s} \pi_ {t + 1} (s) m _ {t + 1} (s) x _ {i t + 1} (s) \tag {A1} $$
利用数学中的期望符号 $E(\cdot)$ ,可以把上式写成更加“喜闻乐见”的形式:
$$ P _ {i t} = E _ {t} \left[ m _ {t + 1} x _ {i t + 1} \right] \tag {A2} $$
其中的 $m$ 被称作随机折现因子(stochastic discount factor); $E_{t}$ 意味着在 $t$ 时刻对状态变量 $s$ 的概率空间求期望。这个公式称作无套利定价公式(no-arbitrage pricing formula),它正是资产定价的基础。接下来的故事就从 $P = E[mx]$ 讲起。
2 短期不可预测性
首先来看短期的情况。
假设两个非常近的时点。在这之间,无风险收益率近似为零,且因为时间很短,因而可以假设折现因子 $m$ 在不同状态下的变化不大。在这些假设下, $m$ 近似等于1。进一步而言,假设未来的支付等于出售该资产的价格,因此由 $P = E[mx]$ 可知:
$$ P _ {t} = E _ {T} \left[ P _ {t + 1} \right] \quad (\mathrm {A} 3) $$
上式意味着短期内价格的上升或下降是随机的,收益率难以预测。在检验短期内能否预测方面,Fama做出了重大的贡献,主要包括以下两个方面。第一方面是对收益率序列的直接统计检验。虽然在Fama之前,有诸如Samuelson(1965)和Mandelbrot(1966)这样的开创性研究,但Fama无疑是系统性研究收益率统计特性的第一人——他在其1963年的博士论文(后于1965年全文发表在Journal of Business上)中使用序列相关性检验、游程检验(runs test)及过滤准则检验(filter test,即使用特定的规则对收益率序列过滤,然后考察其是否能战胜买入持有)检验了短期收益率无法预测,这对后续的相关研究产生了巨大的影响。在收益率的不可预测下,有效市场这个概念也应运而生。
Fama对市场有效性的最大贡献来自Fama(1970)提出的联合假说(joint hypothesis)问题。它指的是为了检验市场有效性,首先要有一个正确的资产定价模型。只有知道了在模型给出的均衡状态下资产的预期收益率,才有可能正确地检验市场是否有效。此外,Fama(1970)还对有效市场假说的三种形式,即弱式(weak)效率、半强式(semi-strong)效率及强式(strong)效率进行了讨论。
Fama的第二个贡献是和他的学生在Fama et al.(1969)一文中首次提出了事件研究(event study)的方法,该文是事件分析的开山鼻祖。事件分析的对象是和资产价格相关的新息(事件)发生前后的资产价格“行为”。Fama et al.(1969)为此提出了开创新性方法论,主要包括三个方面。
(1)将市场的收益率从个股的收益率中排除,将个股异常收益率(abnormal return)作为研究重点,从而剔除市场时序波动的影响。
(2)在时间轴上,将事件发生的时刻记为时刻0,事件发生之前则在时刻0的左侧,事件发生之后则在时刻0的右侧。考察股票异常收益率在事件发生前、发生时及发生后的变化。
(3) 任何事件在个股上是否发生及发生的时间都是不同的,而由于(2)中
对时间轴的统一处理,就可以把所有个股的同类事件在截面上取平均并观察整体的效果。这可以消除个股对事件的特质性波动,从而考察事件对股票异常收益率的平均影响。这无疑也是最具创造力的一点。
通过上述方法,Fama et al.(1969)研究了拆股(stock split)事件对股票收益率的影响,并发现股票的异常收益在事件发生后没有显著异常回报,事件所包含的信息已经很好地反映在价格之中,从而证明了市场的有效性。而以上方法论中的三点创新也迅速开辟了一个子领域——事件分析。如今,事件分析在经济和金融领域都有广泛的应用。
根据以上关于有效市场假说和事件分析的研究结果,人们对资产价格和收益率在短期内的不可预测性达成了共识。这是20世纪70年代,人们对资产价格理解迈出的第一步。
3 过度波动导致长期可预测
下面来看看资产价格和收益率在更长的时间周期内能否被预测。这是20世纪80年代的主要研究课题之一。而在这一领域的代表性人物则是Robert Shiller,他做出了大量开创性的贡献。
Shiller的第一个贡献在于提出了方差比检验(variance ratio tests)。Shiller(1979,1981)分别以债券和股票作为资产,研究了它们短期波动和长期波动的方差差异。以股票为例,在1980年以前,学者们倾向于认为股票的长期波动取决于和未来现金流相关的基本面信息的波动,直到Shiller(1981)发表,这个观点也因检验结果而被颠覆。该文的题目Do stock prices move too much to be justified by subsequent changes in dividends?(相对于未来股息的变化来说,股价的波动是否过高了?)——也和它的内容一样具有颠覆性。
我们仍然可以从 $P = E[mx]$ 出发理解Shiller的发现。以股票为例,该无套利定价方程意味着股票今天的价格等于其预期基本面价格的现值,即未来每期现金流(对于股票,可以认为是股息)的折现值之和。令 $P_{it}^{\star}$ 代表股票i的未知基本面价值的折现值,它的变化来自未来股息 $(x)$ 和随机折现因子 $(m)$ 的波动。
由 $P = E[mx]$ 有:
$$ P _ {i t} = E _ {t} \left[ P _ {i t} ^ {\star} \right] \tag {A4} $$
由上式可知,预测误差为 $P_{it} - P_{it}^{\star}$ ,该误差和所有历史信息(包括现在的价格 $P_{it}$ )是不相关的。接下来,可以把 $P_{it}^{\star}$ 写成如下的形式(左右两侧完全是等价的):
$$ P _ {i t} ^ {\star} \equiv P _ {i t} + \left(P _ {i t} ^ {\star} - P _ {i t}\right) \tag {A5} $$
利用误差项 $P_{it} - P_{it}^{\star}$ 和所有历史信息(包括 $P_{it}$ )相互独立这个性质,对上式两边直接求方差可得:
$$ \operatorname {v a r} \left(P _ {i t} ^ {\star}\right) = \operatorname {v a r} \left(P _ {i t}\right) + \operatorname {v a r} \left(P _ {i t} ^ {\star} - P _ {i t}\right) \tag {A6} $$
由于方差一定是非负的,上式意味着基本面价值的波动应该大于价格本身的波动:
$$ \operatorname {v a r} \left(P _ {i t} ^ {\star}\right) > \operatorname {v a r} \left(P _ {i t}\right) \tag {A7} $$
当资产为股票时,式(A7)意味着股票价格的波动应该小于未来股息现值之和的波动。但事实是否如此呢?Shiller(1981)回答了这个问题,并发现了和模型完全相反的结论,即价格的方差比未来股息折现值之和的方差要大得多。Shiller的研究表明,股票和债券的短期波动比其长期波动更加剧烈,说明长期的价格呈现均值回复的特征,因此长期来看这些资产的收益是可以被预测的——高于平均收益之后往往伴随着低于平均水平的收益。这是在20世纪70年代Fama的重要发现后,人们对于资产价格理解迈出的又一步。
在Shiller(1981)之后,学术界关于资产的长期可预测性做了大量的研究。比如,Campbell and Shiller(1988)发现实际盈利的长期均值能很好地预测未来的股息率,且该变量和当前价格的比值可以很好地预测未来的价格。Fama and French(1988)发现随着时间尺度的增加,股息率对收益率的预测能力也逐渐提高(体现为更高的时序回归R-squared),这也和“收益率在短期内难以预测,在长期内可以预测”的观点相一致。短期的高波动是资产价格在长时间尺度下可预测性的前提。
回到 $P = E[mx]$ 这个式子,Shiller等人的研究表明,既然 $P$ 的波动比 $x$ 的波动更高,如果无套利定价公式成立,那么 $P$ 的高波动只能是来自随机折现因子 $m$ 的高波动。因此,接下来学者们必须回答的问题就是:是什么导致了 $m$ 的高波动?来自经济学的理论模型是否支持 $m$ 的高波动?
4 理性CCAPM模型
如果想从经济学理论出发来解释 $m$ 的高波动,那么就需要把资产的价格和人们的储蓄与风险决策(投资风险资产)联系起来。在这方面,当仁不让的选择是基于消费的资产定价模型(consumption-based CAPM, CCAPM),它允许投资者的风险偏好(即随机折现因子)随时间变化,背后的原因可能是消费或者财富的冲击。在CCAPM中,消费者的决策目标是预期效用的最大化:
$$ E \left[ \sum_ {j = 0} ^ {\infty} \beta^ {j} u \left(c _ {t + j}\right) \right] \tag {A8} $$
上式中 $\beta$ 表示一个主观贴现系数、 $u$ 是效用函数、 $c_{t+j}$ 表示 $t+j$ 期的消费。CCAPM假设投资人每一期购买一定量的风险资产(价格为 $P$ ),并通过最大化上述目标函数来确定最优的购买量。根据目标函数的一阶条件可以获得如下关系(Cochrane 2005):
$$ u ^ {\prime} \left(c _ {t}\right) = E \left[ \beta \frac {u ^ {\prime} \left(c _ {t + 1}\right) x _ {i t + 1}}{P _ {i t}} \right] \tag {A9} $$
上式中左侧是在 $t$ 时刻消费一个单位能够获得的边际效用;右侧是将该单位进行投资(风险资产)并在 $t + 1$ 时刻获得 $x_{it + 1} / P_{it}$ 的回报并将其折现之后的边际效用。根据一阶条件,二者应该相等,故得到上式。将其进行简单变化变得到CCAPM的定价方程:
$$ P _ {i t} = E \left[ \beta \frac {u ^ {\prime} \left(c _ {t + 1}\right)}{u ^ {\prime} \left(c _ {t}\right)} x _ {i t + 1} \right] \tag {A10} $$
比较式(A10)和式(A2)可知,在CCAPM下随机折现因子满足:
$$ m = \beta \frac {u ^ {\prime} \left(c _ {t + 1}\right)}{u ^ {\prime} \left(c _ {t}\right)} \tag {A11} $$
CCAPM指出 $m$ 和当期消费与下期消费的边际效用之比有关。从经济理论出发, 这个表达式解释了为什么在经济衰退时, 折现因子比较低: 在经济不景气时, $c_{t}$ 较低、边际效用 $u^{\prime}\left(c_{t}\right)$ 较高, 因此边际效用比 $u^{\prime}\left(c_{t+1}\right) / u^{\prime}\left(c_{t}\right)$ 较低; 反之, 在经济繁荣时, 折现因子 $m$ 较高。
有了模型,接下来就应该用数据对其进行参数估计,从而检验CCAPM是否成立了。但是在当时,人们突然发现不会了!首先,在CCAPM中,模型是变量的非线性方程;其次,需要为消费确定一个完整的随机过程模型;最后,在这个动态系统中,误差项的时序相关性也让使用正式的统计方法难上加难。
面对这些难以逾越的困难,当时的两种妥协方法包括:(1)使用校准和非正式统计;(2)在模型之外强行加入一系列非常具体的假设(哪怕有些假设和被处理的问题毫不相关)从而把非线性的CCAPM线性化处理。在第一种方法的努力中,Grossman and Shiller(1981)是定量检验CCAPM的“始作俑者”。在使用了美国消费数据后,他们发现只有消费的边际效用对消费变化极度敏感,即投资者在表现出极度的风险厌恶时,股票价格的波动才能符合该模型。换句话说,在合理的假设下,CCAPM只能被拒绝。
另外,在使用具体假设后的线性化结果也没好到哪里去,CCAPM依然被拒绝。而因为各种具体的假设也多少让问题变得更加复杂,即人们无法确定CCAPM被拒绝本身是因为理论存在固有的局限,还是因为线性化处理CCAPM而做的各种假设不够合理。在这进退两难之际,人们急需在计量经济学理论上的突破,让正式检验CCAPM成为可能。就在这个时候,Lars Peter Hansen的广义矩估计(Hansen 1982)横空出世。
使用广义矩估计将CCAPM表达成一系列矩条件的形式,即 $E[f(x_{t}, b_{0})] = 0$ 这极大地方便了对模型的参数估计和检验。Hansen(1982)对广义矩估计以及它的各种特性进行了详尽的描述;本书2.7节也对它背后的数学原理进行了解读。而该方法之所以如此强大是它对随机过程 $x_{t}$ 的限制非常少(只需要满足弱平稳和各态历经性),此外它对函数 $f$ 的限制也非常少(可以是非线性的)。这种强大的特征对于处理经济学的面板数据至关重要。在资产定价中,随机过程的残差是相互关联的,且主要关系也是非线性的。正因为如此“好使”,Hansen(1982)成了计量经济学领域最具影响力的论文之一。
有了检验方法,学术界终于可以一展身手了。广义矩估计首次被应用于资产定价正是出自Hansen and Singleton(1982),而他们的结论是CCAPM再次被拒绝了。根据CCAPM理论,从数据估计出的时变折现因子 $m$ 根本无法解释资产价格的高波动。如果在广义矩估计被推出之前,学术界对CCAPM还心存幻想,那么这次CCAPM可以说是彻底被打败了。让上述结果雪上加霜的是,Hansen and Jagannathan(1991)为随机折现因子 $m$ 的波动计算出了一个下界,它和资产的夏普比率有关。以美国股市的数据来计算, $m$ 波动的下界应该在0.5左右。从消费的实际数据来看,消费的波动是很低的。因此如果CCAPM能够解释随机折现因子 $m$ 的波动,那么需要投资者具有不切实际的风险厌恶水平,否则就难以支撑 $m$ 高达0.5的波动。
尽管CCAPM遭到了拒绝,但学术界似乎不想轻易放弃它,而是努力地对理论进行“完善”,包括提出不同形式的效用函数以及考虑不同投资者偏好的差异等。归根到底,是学术界不想放弃理性行为这个假设。而就在这个时期,考虑投资者非理性的行为金融学也悄然萌芽。
5 行为金融学
如果要问谁是行为金融学的代表人物,得到的答案可能是Daniel Kahneman和Amos Tversky。这两位的地位和贡献无须多言,但他们均是著名的心理学家,更多的还是从心理学的角度分析人如何做决策;另外可能的答案是Richard Thaler,但Thaler更大的贡献是行为经济学[1]。
行为金融学的代表人物当属Robert Shiller,而奠定其地位的正是Shiller(1984)这篇提出了噪声交易者模型的论文。这篇论文成为日后日益增加的行为金融学文献的起点。在Shiller的模型中,聪明的投资者依基本面价值进行投资,而噪声交易者的存在造成了价格和内在价值出现了偏离,价格的过度波动来源于人们非理性行为造成的对基本面信息的过度反应。对于聪明的交易者,虽然能对预期回报做出理性反应,但这种反应因受到自身财富的限制而并不充分。
自Shiller(1984)发表之后,大量相关的研究结果被提出,这其中有很多是从行为偏差的角度来修正CCAPM中理性偏好的假设,这无疑有着非凡的意义,它意味着基于理性和行为的模型正在结合。另外,更多的学者开始用心理学的发现来研究个人的行为和偏误,这些心理学发现包括前景理论、过度自信及心理账户理论等。本书6.3节对行为金融学的研究框架进行了系统的介绍。随着这门学科的发展,很多从行为金融学出发的新的定价模型被研究出来,它们对股票市场价格和交易量的高波动以及价格在不同尺度下表现出的异象给出了令人信服的解释。
Shiller(1984)的另一个贡献是回应了长久以来传统经济学派对行为金融学的最大质疑——如果价格偏离了价值,即能被预测,为什么价值没有因为套利而消失?该文提出了套利限制(limits to arbitrage),排除了这个阻碍行为金融学发展的障碍。在行为金融学的进一步发展中,大量的研究表明资产的价格和投资人非理性的情绪有密切的关系(比如泡沫)。其中家喻户晓的例子包括金融市场的同质标的[2]不满足一价定理(Froot and Dabora 1999)和“封闭式基金折价之谜”(Lee et al. 1991)等。
6 预期收益率的截面差异
到目前为止,以上对资产价格的理解仍然停留在时间序列层面上。而一个自然而然的问题是:是什么决定了资产价格的截面差异?例如,为什么在同一时点,某支股票的价值比另一支高呢?根据 $P = E[mx]$ ,价值取决于未来的现金流和折现因子的变化。那么,哪些因素决定了资产不同的现金流以及投资者对不同资产的时间偏好和风险偏好呢?关于资产收益截面差异的研究,首先进入人们脑海中的名字恐怕仍然非Eugene Fama莫属。
早在50年前,关于资产截面收益差异的第一范式无疑是资本资产定价模型(CAPM)。在最初关于CAPM的检验中,最著名的两篇论文当属Black et al.(1972)及Fama and MacBeth(1973)。后者开创性地在每个时间节点逐一进行截面回归,从而规避了残差收益率的截面相关性对回归结果的影响。这篇文章提出的“先回归、再均值”的方法,即Fama-MacBeth回归,在后来得到了非常广泛的应用。
虽然最初的检验结果大体上支持CAPM,但是到了20世纪70年代,很多CAPM无法解释的异象被提出。这些单一异象虽然都挑战着CAPM,但因为它们并没有形成合力,所以人们并未对CAPM产生太大的质疑,直到Fama and French(1992)整合了之前被提出的多种异象,从而给了CAPM“致命一击”。为了摒弃一个旧模型,唯有提出一个更好的新模型,而这个更好的模型就是Fama-French三因子模型(Fama and French 1993)。该模型在市场因子之外加入了价值和规模两个因子。Fama and French(1996)指出三因子模型是Merton(1973)的跨期资本资产定价模型的多因子版本,并认为价值和公司的财务困境风险有关。但是,关于二者代表何种状态变量(state variables)以及为什么它们能够捕捉市场因子无法解释的风险,依旧没有定论。
Fama and French(1993)拉开了使用多因子进行实证资产定价研究的序幕。这个三因子模型也一度成为股票定价中最重要的基准,直到它的继任者Fama-French五因子模型(Fama and French 2015)诞生。在过去的三十年中,Fama and French(1993)引领了多因子模型的发展(很多主流因子模型被提出)以及因子背后成因解释的研究(行为金融学的研究结果也在这方面做出了巨大的贡献),后者的意义则更加非凡。
7 结语
以上从 $P = E[mx]$ 讲起,指出价格由折现因子以及未来的支付额的现值决定。从这个式子出发引出资产价格在短期内难以预测。在更长的时间尺度上,方差比检验发现资产短期的波动大大高于长期的波动,价格的波动大大高于基本面的波动。过度波动意味着资产收益率在长期是可以预测的。
既然 $P$ 的波动远远大于 $x$ 的波动,依据 $P = E[mx]$ ,随机折现因子 $m$ 就必须有很高的波动。在这方面,广义矩估计的提出让人们能够检验CCAPM,然而它却被拒绝了。这也让人们从其他的角度试图理解 $m$ 的高波动,而行为金融学在这方面提供了很好的视角。它从非理性偏差的角度解释价格的高波动,并认为价格可以偏离价
值。噪声交易者模型及有限套利也为行为金融学的发展铺平了道路。如今,系统性风险和投资者行为偏差成为驱动资产价格变化的两大动力,它们也共同推动了人们关于资产预期收益率截面差异的理解。图A.1简要汇总了学术界关于资产价格的研究脉络。
2018年,Free Solo(《徒手攀岩》)这部电影火遍了全球,它讲的是世界上最顶尖的徒手攀岩高手挑战自我、征服自然的故事。这部电影有一句令人印象深刻的台词,它说的是在人类的自我挑战中,总要时不时有一个重大突破(quantum leap)。Eugene Fama、Lars Peter Hansen及Robert Shiller三位的卓越研究无疑是资产定价领域的重大突破。

图A.1 资产价格的研究脉络
[1]Thaler获得诺贝尔奖也主要是因为其在行为经济学方面的贡献而非行为金融学。
[2]例如同一个公司在不同市场上交易。
参考文献
Abarbanell, J.S. and B.J. Bushee (1998). Abnormal returns to a fundamental analysis strategy. The Accounting Review 73 (1), 19-45.
Akbas, F., E. Genc, C. Jiang, and P.D. Koch (2017). Disagreement, aggregate trading volume, and excess market returns. University of Illinois at Chicago, University of South Carolina, Iowa State University. Available at: https://ssrn.com/abstract=3074131.
Akbas, F., C. Jiang, and P.D. Koch (2017). The trend infirm profitability and the crosssection of stock returns. The Accounting Review 92 (5), 1-32.
Ali, A., L. -S. Hwang, and M.A. Trombley (2003). Arbitrage risk and the book-to-market anomaly. Journal of Financial Economics 69 (2), 355-373.
Alwathainani, A.M. (2009). Consistency of firms' past financial performance measures and future returns. The British Accounting Review 41 (3), 184-196.
Amihud, Y. (2002). Illiquidity and stock returns: Crosssection and time-series effects. Journal of Financial Markets 5 (1), 31-56.
An, L., H. Wang, J. Wang, and J. Yu (2020). Lottery-related anomalies: The role of reference-dependent preferences. Management Science 66 (1), 473-501.
Anderson, C.W. and L. Garcia-Feijoo (2006). Empirical evidence on capital investment, growth options, and security returns. Journal of Finance 61 (1), 171-194.
Anderson, R. M., S.W. Bianchi, and L.R. Goldberg (2012). A comment on "The crosssection of volatility and expected returns": the statistical significance of FVIX is driven by a single outlier. Coleman Fung Risk Management Research Center, University of California Berkeley.
Anderson, R. M., S.W. Bianchi, and L.R. Goldberg (2015). In search of statistically valid risk factors. Quantitative Finance 15 (3), 385-393.
Ang, A. (2014). Asset Management: A Systematic Approach to Factor Investing. New York, NY: Oxford University Press.
Ang, A., R.J. Hodrick, Y. Xing, and X. Zhang (2006). The crosssection of volatility and expected returns. Journal of Finance 61 (1), 259-299.
Ang, A., R.J. Hodrick, Y. Xing, and X. Zhang (2009). High idiosyncratic volatility and low returns: International and further U.S. evidence. Journal of Financial Economics 91 (1), 1-23.
Antoniou, A., H.Y. T. Lam, and K. Paudyal (2007). Profitability of momentum strategies in international markets: The role of business cycle variables and behavioural biases. Journal of Banking & Finance 31 (3), 955-972.
Antoniou, C., J.A. Doukas, and A. Subrahmanyam (2013). Cognitive dissonance, sentiment, and momentum. Journal of Financial and Quantitative Analysis 48 (1), 245-275.
Aras, G. and M.K. Yilmaz (2008). Price-earnings ratio, dividend yield, and market-to-book ratio to predict return on stock market: Evidence from the emerging markets. Journal of Global Business and Technology 4 (1), 18-30.
Arnott, R. D., M. Clements, V. Kalesnik, and J.T. Linnainmaa (2019). Factor momentum. Research Affiliates, LLC., Dartmouth College. Available at: https://ssrn.com/abstract=3116974.
Arnott, R. D., C.R. Harvey, V. Kalesnik, and J. Linnainmaa (2019). Alice's adventures in factorland: Three blunders that plague factor investing. The Journal of Portfolio Management 45 (4), 18-36.
Arnott, R.D. and J.M. West (2006). Fundamental indexes™. ETFs and Indexing 2006 (1), 111-121. Asness, C.S. (2015). How can a strategy still work if everyone knows about it? AQR Capital Management, LLC.
Asness, C.S. (2018). Liquid alt ragnarök?AQR Capital Management, LLC.
Asness, C. S., S. Chandra, A. Ilmanen, and R. Israel (2017). Contrarian factor timing is deceptively difficult. The Journal of Portfolio Management 43 (5), 72-87.
Asness, C.S. and A. Frazzini (2013). The devil in HML's details. The Journal of Portfolio Management 39 (4), 49-68.
Asness, C. S., A. Frazzini, N.J. Gormsen, and L.H. Pedersen (2020). Betting against correlation: Testing theories of the low-risk effect. Journal of Financial Economics 135 (3), 629–652.
Asness, C. S., A. Frazzini, R. Israel, T.J. Moskowitz, and L.H. Pedersen (2018). Size matters, if you control your junk. Journal of Financial Economics 129 (3), 479-
Asness, C. S., A. Frazzini, and L.H. Pedersen (2013). Quality minus junk. AQR Capital Management, LLC.
Asness, C. S., A. Frazzini, and L.H. Pedersen (2019). Quality minus junk. Review of Accounting Studies 24 (1), 34-112.
Asness, C. S., J.A. Friedman, R.J. Krail, and J.M. Liew (2000). Style timing: Value versus growth. The Journal of Portfolio Management 26 (3), 50-60.
Asness, C. S., A. Ilmanen, R. Israel, and T.J. Moskowitz (2015). Investing with style. Journal of Investment Management 13 (1), 27-63.
Asness, C. S., A. Ilmanen, and T. Maloney (2017). Market timing: Sin a little, resolving the valuation timing puzzle. Journal of Investment Management 15 (3), 23-40.
Asness, C. S., T.J. Moskowitz, and L.H. Pedersen (2013). Value and momentum everywhere. Journal of Finance 68 (3), 929-985.
Bai, J. (2003). Inferential theory for factor models of large dimensions. Econometrica 71 (1), 135-171. Bailey, D.H. and M. Lopez de Prado (2012). The sharpe ratio efficient frontier. Journal of Risk 15 (2), 3-44.
Baker, M. and J.C. Stein (2004). Market liquidity as a sentiment indicator. Journal of Financial Markets 7 (3), 271-299.
Baker, M., J.C. Stein, and J. Wurgler (2003). When does the market matter? Stock prices and the investment of equity-dependent firms. The Quarterly Journal of Economics 118 (3), 969-1005.
Baker, M. and J. Wurgler (2000). The equity share in new issues and aggregate stock returns. Journal of Finance 55 (5), 2219-2257.
Baker, M. and J. Wurgler (2002). Market timing and capital structure. Journal of Finance 57 (1), 1-32.
Baker, M. and J. Wurgler (2004). A catering theory of dividends. Journal of Finance 59 (3), 1125-1165.
Baker, M. and J. Wurgler (2006). Investor sentiment and the crosssection of stock returns. Journal of Finance 61 (4), 1645-1680.
Baker, M. and J. Wurgler (2007). Investor sentiment in the stock market. Journal of Economic Perspectives 21 (2), 129-152.
Baker, M., J. Wurgler, and Y. Yuan (2012). Global, local, and contagious investor sentiment. Journal of Financial Economics 104 (2), 272-287.
Bali, T.G. and N. Cakici (2008). Idiosyncratic volatility and the cross section of expected returns. Journal of Financial and Quantitative Analysis 43 (1), 29-58.
Bali, T. G., N. Cakici, and R.F. Whitelaw (2014). Hybridtail risk and expected stock returns: When does the tail wag the dog? Review of Asset Pricing Studies 4 (2), 206-246.
Bali, T. G., R.F. Engle, and S. Murray (2016). Empirical Asset Pricing: The Cross Section of Stock Returns. Hoboken, New Jersey: John Wiley & Sons, Inc.
Ball, R. and P. Brown (1968). An empirical evaluation of accounting income numbers. Journal of Accounting Research 6 (2), 159-178.
Ball, R. and P. Brown (2019). Ball and Brown (1968) after fifty years. Pacific-Basin Finance Journal 53, 410-431.
Ball, R., J. Gerakos, J.T. Linnainmaa, and V. Nikolaev (2015). Deflating profitability. Journal of Financial Economics 117 (2), 225-248.
Ball, R., J. Gerakos, J.T. Linnainmaa, and V. Nikolaev (2016). Accruals, cash flows, and operating profitability in the cross section of stock returns. Journal of Financial Economics 121 (1), 28-45.
Banz, R.W. (1981). The relationship between return and market value of common stocks. Journal of Financial Economics 9 (1), 3-18.
Barbee, W. C., J.S. Mukherji, and G.A. Raines (1996). Do sales-price and debt-equity explain stock returns better than book-market and firm size? Financial Analysts Journal 52 (2), 56-60.
Barber, B.M. and J.D. Lyon (1997). Firm size, book-to-market ratio, and security returns: A holdout sample offinancial firms. Journal of Finance 52 (2), 875-883.
Barber, B.M. and T. Odean (2008). All that glitters: The effect of attention and news on the buying behavior of individual and institutional investors. Review of Financial Studies 21 (2), 785-818.
Barberis, N. (2018). Chapter 2 Psychology-based models of asset prices and trading volume. In B.D. Bernheim, S. DellaVigna, and D. Laibson (Eds.), Handbook of Behavioral Economics-Foundations and Applications 1, Volume 1 of Handbook of Behavioral Economics: Applications and Foundations 1, pp. 79-175. North-Holland.
Barberis, N., R. Greenwood, L. Jin, and A. Shleifer (2015). X-CAPM: An extrapolative capital asset pricing model. Journal of Financial Economics 115 (1), 1-24.
Barberis, N. and M. Huang (2008). Stocks as lotteries: The implications of probability weighting for security prices. American Economic Review 98 (5), 2066–
- Barberis, N., L.J. Jin, and B. Wang (2019). Prospect theory and stock market anomalies. 10th Miami Behavioral Finance Conference. Available at: https://ssrn.com/abstract=3477463.
Barberis, N., A. Mukherjee, and B. Wang (2016). Prospect theory and stock returns: An empirical test. Review of Financial Studies 29 (11), 3068-3107.
Barberis, N. and A. Shleifer (2003). Style investing. Journal of Financial Economics 68 (2), 161-199. Barberis, N., A. Shleifer, and R. Vishny (1998). A model of investor sentiment. Journal of Financial Economics 49 (3), 307-343.
Barberis, N., A. Shleifer, and J. Wurgler (2005). Comovement. Journal of Financial Economics 75 (2), 283-317.
Barberis, N. and R. Thaler (2003). Chapter 18 A survey of behavioral finance. In Financial Markets and Asset Pricing, Volume 1 of Handbook of the Economics of Finance, pp. 1053-1128. Elsevier.
Barberis, N. and W. Xiong (2009). What drives the disposition effect? An analysis of a long-standing preference-based explanation. Journal of Finance 64 (2), 751-784.
Barillas, F. and J. Shanken (2017). Which alpha? Review of Financial Studies 30 (4), 1316-1338.
Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance 73 (2), 715-754.
Barinov, A. (2014). Turnover: Liquidity or uncertainty? Management Science 60 (10), 2478-2495.
Barroso, P. and P. Santa-Clara (2015). Momentum has its moments. Journal of Financial Economics 116 (1), 111-120.
Barth, M. E., J.A. Elliott, and M.W. Finn (1999). Market rewards associated with patterns of increasing earnings. Journal of Accounting Research 37 (2), 387-413.
Bartov, E. and M. Kim (2004). Risk, mispricing, and value investing. Review of Quantitative Finance and Accounting 23 (4), 353-376.
Bartram, S.M. and M. Grinblatt (2018). Agnostic fundamental analysis works. Journal of Financial Economics 128 (1), 125-147.
Basu, S. (1977). Investment performance of common stocks in relation to their price-earnings ratios: a test of the efficient market hypothesis. Journal of Finance 32 (3), 663-682.
Basu, S. (1983). The relationship between earnings' yield, market value and return
for NYSE common stocks: Further evidence. Journal of Financial Economics 12 (1), 129-156.
Bayraktar, M. K., S. Doole, A. Kassam, and S. Radchenko (2015). Lost in the crowd? Identifying and measuring crowded strategies and trades. MSCI Inc.
Bender, J., P.B. Hammond, and W. Mok (2014). Can alpha be captured by risk premia? The Journal of Portfolio Management 40 (2), 18-29.
Bender, J., J. -H. Lee, and D. Stefek (2009). Refining portfolio construction when alphas and risk factors are misaligned. MSCI Inc.
Bender, J., X. Sun, R. Thomas, and V. Zdorovtsov (2018). The promises and pitfalls offactor timing. The Journal of Portfolio Management 44 (4), 79-92.
Bender, J. and T. Wang (2016). Can the whole be more than the sum of the parts? Bottom-up versus top-down multifactor portfolio construction. The Journal of Portfolio Management 42 (5), 39-50.
Beneish, M. D., C.M. C. Lee, and D.C. Nichols (2015). In short supply: Short-sellers and stock returns. Journal of Accounting and Economics 60 (2-3), 33-57.
Benjamini, Y. and Y. Hochberg (1995). Controlling the false discovery rate: A practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B 57 (1), 289-300.
Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. The Annals of Statistics 29 (4), 1165-1188.
Berk, J.B. (1995). A critique of size-related anomalies. Review of Financial Studies 8 (2), 275-286. Berk, J. B., R.C. Green, and V. Naik (1999). Optimal investment, growth options, and security returns. Journal of Finance 54 (5), 1553-1607.
Bernard, V.L. and J.K. Thomas (1989). Post-earnings-announcement drift: Delayed price response or risk premium? Journal of Accounting Research 27, 1-36.
Bernard, V.L. and J.K. Thomas (1990). Evidence that stock prices do not fully reflect the implications of current earnings for future earnings. Journal of Accounting and Economics 13 (4), 305-340. Bhandari, L.C. (1988). Debt/equity ratio and expected common stock returns: Empirical evidence. Journal of Finance 43 (2), 507-528.
Bhootra, A. and J. Hur (2012). On the relationship between concentration of prospect theory/mental accounting investors, cointegration, and momentum. Journal of Banking & Finance 36 (5), 1266-1275. Black, F. (1972). Capital market equilibrium with restricted borrowing. Journal of Business 45 (3), 444-455.
Black, F. (1986). Noise. Journal of Finance 41 (3), 528-543.
Black, F., M.C. Jensen, and M. Scholes (1972). The capital asset pricing model: Some empirical tests. In M.C. Jensen (Ed.), Studies in the Theory of Capital Markets. New York, NY: Praeger.
Black, F. and R. Litterman (1992). Global portfolio optimization. Financial Analysts Journal 48 (5), 28-43.
Blitz, D., M.X. Hanauer, and M. Vidojevic (2017). The idiosyncratic momentum anomaly. Robeco Asset Management. Available at: https://ssrn.com/abstract=2947044.
Blitz, D., J. Huij, and M. Martens (2011). Residual momentum. Journal of Empirical Finance 18 (3), 506-521.
Blume, M.E. (1970). Portfolio theory: a step toward its practical application. Journal of Business 43 (2), 152-173.
Blume, M.E. and I. Friend (1973). A new look at the capital asset pricing model. Journal of Finance 28 (1), 19-34.
Bodie, Z., A. Kane, and A.J. Marcus (2017). Investments (11 ed.). New York, NY: McGraw-Hill Education.
Bonferroni, C.E. (1936). Teoria Statistica Delle Classi e Calcolo Delle Probabilità. Florence, Italy: Libreria Internazionale Seeber.
Bonne, G., L. Risenberg, R. Kouzmenko, and P. Zangari (2018). MSCI integrated factor crowding model. MSCI Inc.
Bordalo, P., N. Gennaioli, R. La Porta, and A. Shleifer (2019). Diagnostic expectations and stock returns. Journal of Finance 74 (6), 2839-2874.
Bowles, B., A.V. Reed, M. Ringgenberg, and J.R. Thornock (2019). Anomaly time. Texas A & M University, University of North Carolina, University of Utah, Brigham Young University. Available at: https://ssrn.com/abstract=3069026.
Boyer, B.H. (2011). Style-related comovement: Fundamentals of labels? Journal of Finance 66 (1), 307-332.
Boyer, B. H., T. Mitton, and K. Vorkink (2010). Expectedidiosyncratic skewness. Review of Financial Studies 23 (1), 169-202.
Bradshaw, M. T., S.A. Richardson, and R.G. Sloan (2006). The relation between corporatefinancing activities, analysts' forecasts and stock returns. Journal of Accounting and Economics 42 (1-2), 53-85. Breeden, D.T. (1979). An intertemporal asset pricing model with stochastic consumption and investment opportunities. Journal of Financial Economics 7 (3), 265-296.
Brinson, G. P., B.D. Singer, and G.L. Beebower (1991). Determinants of portfolio
performance II: An update. Financial Analysts Journal 47 (3), 40-48.
Buetow, G. W., R.R. Johnson, and D.E. Runkle (2000). The inconsistency of return-based style analysis. The Journal of Portfolio Management 26 (3), 61-77.
Cakici, N. (2015). Thefive-factor Fama-French model: International evidence. Fordham University. Available at: https://ssrn.com/abstract=2601662.
Cakici, N., K. Chan, and K. Topyan (2017). Crosssectional stock return predictability in China. European Journal of Finance 23 (7-9), 581-605.
Cakici, N., F.J. Fabozzi, and S. Tan (2013). Size, value, and momentum in emerging market stock returns. Emerging Markets Review 16, 46-65.
Campbell, J.Y. and J.H. Cochrane (1999). By force of habit: A consumption-based explanation of aggregate stock market behavior. Journal of Political Economy 107 (2), 205-251.
Campbell, J. Y., S.J. Grossman, and J. Wang (1993). Trading volume and serial correlation in stock returns. The Quarterly Journal of Economics 108 (4), 905-939.
Campbell, J. Y., J. Hilscher, and J. Szilagyi (2008). In searchofdistress risk. Journal of Finance 63 (6), 2899-2939.
Campbell, J.Y. and R.J. Shiller (1988). The dividend-price ratio and expectations offuture dividends and discount factors. Review of Financial Studies 1 (3), 195-228.
Campbell, J.Y. and S.B. Thompson (2008). Predicting excess stock returns out of sample: Can anything beat the historical average? Review of Financial Studies 21 (4), 1509-1531.
Carhart, M.M. (1997). On persistence in mutual fund performance. Journal of Finance 52 (1), 57-82. Carlson, M., A. Fisher, and R. Giammarino (2004). Corporate investment and asset price dynamics:
Implications for the crosssection of returns. Journal of Finance 59 (6), 2577-2603.
Cerniglia, J. and F.J. Fabozzi (2018). Academic, practitioner, and investor perspectives on factor investing. The Journal of Portfolio Management 44 (4), 10-16.
Chan, K.C. and N.-F. Chen (1991). Structural and return characteristics of small and large firms. Journal of Finance 46 (4), 1467-1484.
Chan, L.K. C., Y. Hamao, and J. Lakonishok (1991). Fundamentals and stock returns in Japan. Journal of Finance 46 (5), 1739-1764.
Chan, L.K. C., Y. Hamao, and J. Lakonishok (1993). Can fundamentals predict Japanese stock returns? Financial Analysts Journal 49 (4), 63-69.
Chan, L.K. C., J. Lakonishok, and T. Sougiannis (2001). The stock market valuation of research and development expenditures. Journal of Finance 56 (6), 2431-2456.
Chang, R. P., K. -C. Ko, S. Nakano, and S.G. Rhee (2018). Residual momentum in Japan. Journal of Empirical Finance 45, 283-299.
Chang, Y. Y., R. Faff, and C. -Y. Hwang (2010). Liquidity and stock returns in Japan: New evidence. Pacific-Basin Finance Journal 18 (1), 90-115.
Charitou, A. and E. Constantinidi (2003). Size and book-to-market factors in earnings, cash flows and stock returns: empirical evidence for the uk. University of Cyprus. Available at: https://ssrn.com/abstract=498243.
Chaves, D.B. (2012). Eureka! A momentum strategy that also works in Japan. The Vanguard Group, Inc. Available at: https://ssrn.com/abstract=1982100.
Chen, A.Y. and M. Velikov (2019). Accounting for the anomaly zoo: A trading cost perspective. Finance Down Under, 2019, Building on the Best from the Cellars of Finance. Available at: https://ssrn.com/abstract=3073681.
Chen, J., H. Hong, and J.C. Stein (2001). Forecasting crashes: Trading volume, past returns, and conditional skewness in stock prices. Journal of Financial Economics 61 (3), 345-381.
Chen, J., H. Hong, and J.C. Stein (2002). Breadth of ownership and stock returns. Journal of Financial Economics 66 (2-3), 171-205.
Chen, J., G. Tang, J. Yao, and G. Zhou (2019). Investor attention and stock returns. Xiamen University, Hunan University, Jinan University, Washington University in St. Louis. Available at: https://ssrn.com/abstract=3194387.
Chen, L., R. Novy-Marx, and L. Zhang (2010). An alternative three-factor model. Luohan Academy, University of Rochester, Ohio State University. Available at: https://ssrn.com/abstract=1418117.
Chen, L. H., G.J. Jiang, D.D. Xu, and T. Yao (2012). Dissecting the idiosyncratic volatility anomaly. University of Idaho, Washington State University, Gonzaga University, and University of Iowa. Available at: https://ssrn.com/abstract=2023883.
Chen, P., E. Lezmi, T. Roncalli, and J. Xu (2019). A note on portfolio optimization with quadratic transaction costs. Amundi Asset Management.
Chen, Y. and H. Zhao (2012). Informed trading, information uncertainty, and price momentum. Journal of Banking & Finance 36 (7), 2095-2109.
Chib, S., X. Zeng, and L. Zhao (2020). On comparing asset pricing models. Journal of Finance 75 (1), 551-577.
Chincarini, L.B. and D. Kim (2006). Quantitative Equity Portfolio Management: An Active Approach to Portfolio Construction and Management. New York, NY: McGraw-Hill Education.
Choi, J. J., D. Laibson, and B.C. Madrian (2009). Why does the law of one price fail? An experiment on index mutual funds. Review of Financial Studies 23 (4), 1405-1432.
Choi, J.J. and T.M. Mertens (2019). Extrapolative expectations and the equity premium. Yale School of Management, Federal Reserve Bank of San Francisco. Available at: https://ssrn.com/abstract=3462056.
Choi, N.Y. and R.W. Sias (2012). Why does financial strength forecast stock returns? Evidence from subsequent demand by institutional investors. Review of Financial Studies 25 (5), 1550-1587. Chopra, N., J. Lakoniskok, and J.R. Ritter (1992). Measuring abnormal performance: Do stocks overreact? Journal of Financial Economics 31 (2), 235-268.
Chordia, T., A. Goyal, and A. Saretto (2020). Anomalies and false rejections. Review of Financial Studies 33 (5), 2134-2179.
Chordia, T. and L. Shivakumar (2002). Momentum, business cycle, and time-varying expected returns. Journal of Finance 57 (2), 985-1019.
Chordia, T., A. Subrahmanyam, and V.R. Anshuman (2001). Trading activity and expected stock returns. Journal of Financial Economics 59 (1), 3-32.
Chordia, T. and B. Swaminathan (2000). Trading volume and cross-autocorrelations in stock returns. Journal of Finance 55 (2), 913-935.
Chou, P. -H., T. -Y. Huang, and H. -J. Yang (2013). Arbitrage risk and the turnover anomaly. Journal of Banking & Finance 37 (11), 4172-4182.
Chow, T. -M., F. Li, and Y. Shim (2018). Smart beta multifactor construction methodology: Mixing versus integrating. Journal of Index Investing 8 (4), 47-60.
Chui, A.C. W., S. Titman, and K.C. J. Wei (2010). Individualism and momentum around the world. Journal of Finance 65 (1), 361-392.
Claessens, S. and M.A. Kose (2018). Frontiers of macrofinancial linkages. Bank for International Settlement.
Clarke, R., H. de Silva, and S. Thorley (2013). Risk parity, maximum diversification, and minimum variance: An analytic perspective. The Journal of Portfolio Management 39 (3), 39-53.
Clubb, C. and M. Naffi (2007). The usefulness of book-to-market and ROE expectations for explaining UK stock returns. Journal of Business Finance & Accounting
34(1-2),1-32.
Cochrane, J.H. (1991). Production-based asset pricing and the link between stock returns and economic fluctuations. Journal of Finance 46 (1), 209-237.
Cochrane, J.H. (2005). Asset Pricing (Revised Edition). Princeton, NJ: Princeton University Press. Cochrane, J.H. (2011). Presidential address: Discount rates. Journal of Finance 66 (4), 1047-1108.
Cochrane, J.H. (2017). MacroFinance. Review of Finance 21 (3), 945-985.
Cochrane, J.H. and T.J. Moskowitz (Eds.) (2017). The Fama Portfolio, Selected Papers of Eugene F. Fama. Chicago, IL: The University of Chicago Press.
Cohen, L. and A. Frazzini (2008). Economic links and predictable returns. Journal of Finance 63 (4), 1977-2011.
Cooper, I. and R. Priestley (2011). Real investment and risk dynamics. Journal of Financial Economics 101 (1), 182-205.
Cooper, M. J., H. Gulen, and M.J. Schill (2008). Asset growth and the crosssection of stock returns. Journal of Finance 63 (4), 1609-1651.
Da, Z., Q. Liu, and E. Schaumburg (2014). A closer look at the short-term return reversal. Management Science 60 (3), 658-674.
Damodaran, A. (2007). Return on capital (ROC), return on invested capital (ROIC) and return on equity (ROE): Measurement and implications. New York University. Available at: https://ssrn.com/abstract=1105499.
Daniel, K. D., M. Grinblatt, S. Titman, and R. Wermers (1997). Measuring mutual fund performance with characteristic-based benchmarks. Journal of Finance 52 (3), 1035-1058.
Daniel, K. D., D.A. Hirshleifer, and A. Subrahmanyam (1998). Investor psychology and security market under-and overreactions. Journal of Finance 53 (6), 1839-1885.
Daniel, K. D., D.A. Hirshleifer, and A. Subrahmanyam (2001). Overconfidence, arbitrage, and equilibrium asset pricing. Journal of Finance 56 (3), 921-965.
Daniel, K. D., D.A. Hirshleifer, and L. Sun (2018). Short-and long-horizon behavioral factors. NBER Working Paper No. 24163.
Daniel, K. D., D.A. Hirshleifer, and L. Sun (2020). Short-and long-horizon behavioral factors. Review of Financial Studies 33 (4), 1673-1736.
Daniel, K.D. and T.J. Moskowitz (2016). Momentum crashes. Journal of Financial Economics 122 (2), 221-247.
Daniel, K.D. and S. Titman (1997). Evidence on the characteristics of cross sectional variation in stock returns. Journal of Finance 52 (1), 1-33.
Daniel, K.D. and S. Titman (2006). Market reactions to tangible and intangible information. Journal of Finance 61 (4), 1605-1643.
Daniel, K. D., S. Titman, and K.C. J. Wei (2001). Explaining the crosssection of stock returns in Japan: Factors or characteristics? Journal of Finance 56 (2), 743-766.
Datar, V. T., N.Y. Naik, and R. Radcliffe (1998). Liquidity and stock returns: An alternative test. Journal of Financial Markets 1 (2), 203-219.
Davis, J. L., E.F. Fama, and K.R. French (2000). Characteristics, covariances, and average returns: 1929 to 1997. Journal of Finance 55 (1), 389-406.
De Bondt, W.F. M. and R.H. Thaler (1985). Does the stock market overreact? Journal of Finance 40 (3), 793-805.
De Groot, W., J. Pang, and L. Swinkels (2012). The crosssection of stock returns in frontier emerging markets. Journal of Empirical Finance 19 (5), 796-818.
De Long, J. B., A. Shleifer, L.H. Summers, and R.J. Waldmann (1990). Noise trader riskfinancial markets. Journal of Political Economy 98 (4), 703-738.
Dechow, P. M., R.G. Sloan, and A.P. Sweeney (1995). Detecting earnings management. The Accounting Review 70 (2), 193-225.
DellaVigna, S. and J.M. Pollet (2007). Demographics and industry returns. American Economic Review 70 (2), 193-225.
DellaVigna, S. and J.M. Pollet (2009). Investor inattention and Friday earnings announcements. Journal of Finance 64 (2), 709-749.
DeMiguel, V., L. Garlappi, and R. Uppal (2009). Optimal versus naive diversification: How inefficient is the 1/N portfolio strategy? Review of Financial Studies 22 (5), 1915-1953.
Dey, M.K. (2005). Turnover and return in global stock markets. Emerging Markets Review 6 (1), 45-67.
Dichev, I.D. (1998). Is the riskofbankruptcy a systematic risk?Journal of Finance 53 (3), 1131-1147. Dichev, I.D. and V.W. Tang (2009). Earnings volatility and earnings predictability. Journal of Accounting and Economics 47 (1-2), 160-181.
Dichtl, H., W. Drobetz, and V.-S. Wendt (2020). How to build a factor portfolio: Does the allocation strategy matter? European Financial Management forthcoming.
Diebold, F.X. and R.S. Mariano (2002). Comparing predictive accuracy. Journal of Business & Economic Statistics 20 (1), 134-144.
Dittmar, A.K. and R.F. Dittmar (2008). The timing offinancing decisions: An examination of the correlation infinancing waves. Journal of Financial Economics 90 (1), 59-83.
Dixon, M.F. and I. Halperin (2019). The four horsemen of machine learning infinance. Illinois Institute of Technology, New York University.
Dobrynskaya, V. (2017). Upside and downside risks in momentum returns. National Research University. Available at: https://ssrn.com/abstract=2399359.
Drake, M. S., N.M. Guest, and B.J. Twedt (2014). The media and mispricing: The role of the business press in the pricing of accounting information. The Accounting Review 89 (5), 1673–1701. Drygas, H. (2011). On the relationship between the method of least squares and Gram-Schmidt orthogonalization. Acta et Commentationes Universitatis Tartuensis de Mathematica 15 (1), 3–13.
Duanmu, J., A. Malakhov, and W.R. McCumber (2018). Beta active hedge fund management. Journal of Financial and Quantitative Analysis 53 (6), 2525-2558.
Economic Sciences Prize Committee of the Royal Swedish Academy of Sciences (2013). Understanding asset prices. https://www.nobelprize.org/uploads/2018/06/advanced-economicsciences2013.pdf. Accessed: 2020-04-17.
Ehsani, S. and J.T. Linnainmaa (2019). Factor momentum and the momentum factor. NBER Working Paper No. 25551.
Ellsberg, D. (1961). Risk, ambiguity, and the savage axioms. The Quarterly Journal of Economics 75 (4), 643-669.
Engelberg, J., R.D. McLean, and J. Pontiff (2018). Anomalies and news. Journal of Finance 73 (5), 1971-2001.
Eyster, E., M. Rabin, and D. Vayanos (2019). Financial markets where traders neglect the informational content of prices. Journal of Finance 74 (1), 371-399.
Fama, E.F. (1968). Risk, return and equilibrium: Some clarifying comments. Journal of Finance 23 (1), 29-40.
Fama, E.F. (1970). Efficient capital market: A review of theory and empirical work. Journal of Finance 25 (2), 383-417.
Fama, E. F., L. Fisher, M.C. Jensen, and R. Roll (1969). The adjustment of stock prices to new information. International Economic Review 10 (1), 1-21.
Fama, E.F. and K.R. French (1988). Dividend yields and expected stock returns. Journal of Financial Economics 22 (1), 3-25.
Fama, E.F. and K.R. French (1992). The crosssection of expected stock returns.
Journal of Finance 47 (2), 427-465.
Fama, E.F. and K.R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33 (1), 3-56.
Fama, E.F. and K.R. French (1995). Size and book-to-market factors in earnings and returns. Journal of Finance 50 (1), 131-155.
Fama, E.F. and K.R. French (1996). Multifactor explanations of asset pricing anomalies. Journal of Finance 51 (1), 55-84.
Fama, E.F. and K.R. French (1998). Value versus growth: The international evidence. Journal of Finance 53 (6), 1975-1999.
Fama, E.F. and K.R. French (2004). The capital asset pricing model: Theory and evidence. Journal of Economic Perspectives 18 (3), 25-46.
Fama, E.F. and K.R. French (2006). Profitability, investment and average returns. Journal of Financial Economics 82 (3), 491-518.
Fama, E.F. and K.R. French (2008). Dissecting anomalies. Journal of Finance 63 (4), 1653-1678.
Fama, E.F. and K.R. French (2010). Luck versus skill in the crosssection of mutual fund returns. Journal of Finance 65 (5), 1915-1947.
Fama, E.F. and K.R. French (2012). Size, value, and momentum in international stock returns. Journal of Financial Economics 105 (3), 457-472.
Fama, E.F. and K.R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116 (1), 1-22.
Fama, E.F. and K.R. French (2016). Dissecting anomalies with afive-factor model. Review of Financial Studies 29 (1), 69-103.
Fama, E.F. and K.R. French (2017). International tests of afive-factor asset pricing model. Journal of Financial Economics 123 (3), 441-463.
Fama, E.F. and K.R. French (2018). Choosing factors. Journal of Financial Economics 128 (2), 234-252.
Fama, E.F. and K.R. French (2020). Comparing crosssection and time-series factor models. Review of Financial Studies 33 (5), 1891-1926.
Fama, E.F. and J.D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81 (3), 607-636.
Fang, L. and J. Peress (2009). Media coverage and the crosssection of stock returns. Journal of Finance 64 (5), 2023-2052.
Farcomeni, A. (2008). A review of modern multiple hypothesis testing, with particular attention to the false discovery proportion. Statistical Methods in Medical Research 17 (4), 347-388.
Fergus, K., K. Gallagher, P. Hodges, and K. Hogan (2019). Defensive factor timing. The Journal of Portfolio Management 45 (3), 50-68.
Fisher, R.A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver and Boyd Ltd.
Foster, F. D., T. Smith, and R.E. Whaley (1997). Assessing goodness-of-fit of asset pricing models: The distribution of the maximal R2. Journal of Finance 52 (2), 591-607.
Foster, G. (1977). Quarterly accounting data: Time-series properties and predictive-ability results. The Accounting Review 52 (1), 1-21.
Foster, G., C. Olsen, and T. Shevlin (1984). Earnings releases, anomalies, and the behavior of security returns. The Accounting Review 59 (4), 574-604.
Frankel, R. and C.M. C. Lee (1998). Accounting valuation, market expectation, and crosssectional stock returns. Journal of Accounting and Economics 25 (3), 283-319.
Frankel, R. and L. Litov (2009). Earnings persistence. Journal of Accounting and Economics 47 (1-2), 182-190.
Frazzini, A. (2006). The disposition effect and underreaction to news. Journal of Finance 61 (4), 2017-2046.
Frazzini, A., D.G. Kabiller, and L.H. Pedersen (2018). Buffett's alpha. Financial Analysts Journal 74 (4), 35-55.
Frazzini, A. and L.H. Pedersen (2014). Betting against beta. Journal of Financial Economics 111 (1), 1-25.
Froot, K.A. and E.M. Dabora (1999). How are stock prices affected by the location of trade? Journal of Financial Economics 53 (2), 189-216.
Fu, F. (2009). Idiosyncratic risk and the crosssection of expected stock returns. Journal of Financial Economics 91 (1), 24-37.
Gan, C., B. Hu, Y.G. Liu, and Z. Li (2013). An empirical crosssection analysis of stock returns on the Chinese A-share stock market. Investment Management and Financial Innovations 10 (1), 127-136.
Geczy, C.C. and M. Samonov (2016). Two centuries of price-return momentum. Financial Analysts Journal 72 (5), 32-56.
Gervais, S., R. Kaniel, and D.H. Mingelgrin (2001). The high-volume return premium. Journal of Finance 56 (3), 877-919.
Ghayur, K., R. Heaney, and S. Platt (2018). Constructing long-only multifactor strategies: Portfolio blending vs. signal blending. Financial Analysts Journal 74 (3), 70-85.
Gibbons, M. R., S. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57 (5), 1121-1152.
Giglio, S. and D. Xiu (2019). Asset pricing with omitted factors. Chicago Booth Research Paper, 16-21.
Glaser, M. and M. Weber (2007). Overconfidence and trading volume. The Geneva Risk and Insurance Review 32, 1-36.
Gleason, C.A. and C.M. C. Lee (2003). Analyst forecast revisions and market price discovery. The Accounting Review 78 (1), 193-225.
Gompers, P.A. and A. Metrick (2001). Institutional investors and equity prices. The Quarterly Journal of Economics 116 (1), 229-259.
Gordon, M.J. (1962). The Investment, Financing, and Valuation of the Corporation. Homewood, IL: Irwin Publishing.
Graham, B. and D. Dodd (1934). Security Analysis. New York, NY: McGraw-Hill.
Gray, W.R. and J.R. Vogel (2016). Quantitative Momentum. Hoboken, New Jersey: John Wiley & Sons, Inc.
Green, J., J.R. M. Hand, and F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies 30 (12), 4389-4436.
Green, T. C., R. Huang, Q. Wen, and D. Zhou (2019). Crowdsourced employer reviews and stock returns. Journal of Financial Economics 134 (1), 236-251.
Green, T.C. and B.-H. Hwang (2012). Initial public offerings as lotteries: Skewness preference and first-day returns. Management Science 58 (2), 432-444.
Greenblatt, J. (2006). The Little Book That Beats the Market. Hoboken, New Jersey: John Wiley & Sons, Inc.
Greenblatt, J. (2010). The Little Book That Still Beats the Market. Hoboken, New Jersey: John Wiley & Sons, Inc.
Griffin, J. M., X. Ji, and J.S. Martin (2003). Momentum investing and business cycle risk: Evidence from pole to pole. Journal of Finance 58 (6), 2515-2547.
Griffin, J.M. and M.L. Lemmon (2002). Book-to-market equity, distress risk, and stock returns. Journal of Finance 57 (5), 2317-2336.
Grinblatt, M. and B. Han (2005). Prospect theory, mental accounting, and momentum. Journal of Financial Economics 78 (2), 311-339.
Grinblatt, M. and M. Keloharju (2009). Sensation seeking, overconfidence, and trading activity. Journal of Finance 64 (2), 549-578.
Grinold, R. and R.N. Kahn (1999). Active Portfolio Management: A Quantitative Approach for Producing Superior Returns and Controlling Risk (2 ed.). New York, NY: McGraw-Hill Education. Grinold, R.C. (1994). Alpha is volatility times IC times score. The Journal of Portfolio Management 20 (4), 9-16.
Grossman, S.J. and M.H. Miller (1988). Liquidity and market structure. Journal of Finance 43 (3), 617-633.
Grossman, S.J. and R.J. Shiller (1981). The determinants of the variability of stock market prices. American Economic Review 71 (2), 222-227.
Gu, S., B.T. Kelly, and D. Xiu (2020). Empirical asset pricing via machine learning. Review of Financial Studies 33 (5), 2223-2273.
Guo, B., W. Zhang, Y. Zhang, and H. Zhang (2017). The five-factor asset pricing model tests for the Chinese stock market. Pacific-Basin Finance Journal 43, 84-106.
Guo, H. and R. Savickas (2010). Relation between time-series and crosssectional effects of idiosyncratic variance on stock returns. Journal of Banking & Finance 34 (7), 1637-1649.
Gupta, T. and B.T. Kelly (2019). Factor momentum everywhere. The Journal of Portfolio Management 45 (3), 13-36.
Hahn, J. and H. Lee (2006). Yield spreads as alternative risk factors for size and book-to-market. Journal of Financial and Quantitative Analysis 41 (2), 245-269.
Han, Y., A. He, D.E. Rapach, and G. Zhou (2018). Firm characteristics and expected stock returns. University of North Carolina, Saint Louis University, Washington University in St. Louis. Available at: https://ssrn.com/abstract=3185335.
Han, Y., G. Zhou, and Y. Zhu (2016). A trend factor: Any economic gains from using information over investment horizons? Journal of Financial Economics 122 (2), 352-375.
Hansen, L.P. (1982). Large sample properties of generalized method of moments estimators. Econometrica 50 (4), 1029-1054.
Hansen, L.P. (1985). A method for calculating bounds on the asymptotic
covariance matrices of generalized method of moments estimators. Journal of Econometrics 30 (1-2), 203-238.
Hansen, L. P., J. Heaton, and A. Yaron (1996). Finite-sample properties of some alternative GMM estimators. Journal of Business & Economics Statistics 14 (3), 262-280.
Hansen, L.P. and R. Jagannathan (1991). Implications of security market data for models of dynamic economies. Journal of Political Economy 99 (2), 225-262.
Hansen, L.P. and R. Jagannathan (1997). Assessing specification errors in stochastic discount factor models. Journal of Finance 52 (2), 557-590.
Hansen, L.P. and J.A. Scheinkman (1995). Back to the future: Generating moment implications for continuous-time Markov processes. Econometrica 63 (4), 767-804.
Hansen, L.P. and K.J. Singleton (1982). Generalized instrumental variables estimation of nonlinear rational expectations models. Econometrica 50 (5), 1269-1286.
Harvey, C.R. (2017). Presidential address: The scientific outlook in financial economics. Journal of Finance 72 (4), 1399-1440.
Harvey, C.R. and Y. Liu (2015). Backtesting. The Journal of Portfolio Management 42 (1), 13-28. Harvey, C.R. and Y. Liu (2018). Lucky factors. Duke University, Purdue University. Available at: https://ssrn.com/abstract=2528780.
Harvey, C. R., Y. Liu, and H. Zhu (2016) ... and the crosssection of expected returns. Review of Financial Studies 29 (1), 5-68.
Harvey, C.R. and A. Siddique (2000). Conditional skewness in asset pricing tests. Journal of Finance 55 (3), 1263-1295.
Harvey, C.R. and G. Zhou (1990). Bayesian inference in asset pricing. Journal of Financial Economics 26 (2), 221-254.
Hastie, T., R. Tibshirani, and J. Friedman (2016). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2 ed.). New York, NY: Springer.
Haugen, R.A. and N.L. Baker (1996). Commonality in the determinants of expected stock returns. Journal of Financial Economics 41 (3), 401-439.
He, S. and G.G. Narayanamoorthy (2020). Earnings acceleration and stock returns. Journal of Accounting and Economics forthcoming.
Head, A., G. Smith, and J. Wilson (2009). Would a stock by any other ticker smell as sweet? The Quarterly Review of Economics and Finance 49 (2), 551-561.
Hedayati, S., B.K. Hurst, and E. Stamelos (2018). Transactions costs: Practical
application. AQR Capital Management, LLC.
Herskovic, B., B.T. Kelly, H. Lustig, and S.V. Nieuwerburgh (2016). The common factor in idiosyncratic volatility: Quantitative asset pricing implications. Journal of Financial Economics 119 (2), 249-283.
Hirshleifer, D. (2001). Investor psychology and asset pricing. Journal of Finance 56 (4), 1533-1597. Hirshleifer, D. (2015). Behavioral finance. Annual Review of Financial Economics 7, 133-159.
Hirshleifer, D., K. Hou, and S.H. Teoh (2012). The accrual anomaly: Risk or mispricing? Management Science 58 (2), 320-335.
Hirshleifer, D., K. Hou, S.H. Teoh, and Y. Zhang (2004). Do investors overvalue firms with bloated balance sheets? Journal of Accounting and Economics 38, 297-331.
Hirshleifer, D., P. -H. Hsu, and D. Li (2013). Innovative efficiency and stock returns. Journal of Financial Economics 107 (3), 632-654.
Hirshleifer, D. and D. Jiang (2010). Afinancing-based misvaluation factor and the crosssection of expected returns. Review of Financial Studies 23 (9), 3401-3436.
Hirshleifer, D., S.S. Lim, and S.H. Teoh (2009). Driven to distraction: Extraneous events and underreaction to earnings news. Journal of Finance 64 (5), 2289-2325.
Hirshleifer, D. and S.H. Teoh (2003). Limited attention, information disclosure, and financial reporting. Journal of Accounting and Economics 36 (1-3), 337-386.
Hirshleifer, D., S.H. Teoh, and J.J. Yu (2011). Short arbitrage, return asymmetry, and the accrual anomaly. Review of Financial Studies 24 (7), 2429-2461.
Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian Journal of Statistics 6 (2), 65-70.
Hon, M.T. and I. Tonks (2003). Momentum in the UK stock market. Journal of Multinational Financial Management 13 (1), 43-70.
Hong, H., T. Lim, and J.C. Stein (2000). Bad news travels slowly: Size, analyst coverage, and the profitability of momentum strategies. Journal of Finance 55 (1), 265-295.
Hong, H. and J.C. Stein (1999). A unified theory of underreaction, momentum trading, and overreaction in asset markets. Journal of Finance 54 (6), 2143-2184.
Hong, H. and J.C. Stein (2007). Disagreement and the stock market. Journal of Economic Perspectives 21 (2), 109-128.
Hou, K. (2007). Industry information diffusion and the lead-lag effect in stock returns. Review of Financial Studies 20 (4), 1113-1138.
Hou, K., H. Mo, C. Xue, and L. Zhang (2019a). Security analysis: An investment perspective. Fisher College of Business Working Paper No. 2019-03-016, Charles A. Dice Center Working Paper No. 2019-16. Available at: https://ssrn.com/abstract=3415546.
Hou, K., H. Mo, C. Xue, and L. Zhang (2019b). Which factors? Review of Finance 21 (1), 1-35.
Hou, K., H. Mo, C. Xue, and L. Zhang (2020). An augmented q-factor model with expected growth. Review of Finance forthcoming.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28 (3), 650-705.
Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies. Review of Financial Studies 33 (5), 2019-2133.
Houweling, P. and J. Van Zundert (2017). Factor investing in the corporate bond market. Financial Analysts Journal 73 (2), 100-115.
Hsu, J., V. Viswanathan, M. Wang, and P. Wool (2018). Anomalies in Chinese A-shares. The Journal of Portfolio Management 44 (7), 108-123.
Hu, G. X., C. Chen, Y. Shao, and J. Wang (2019). Fama-French in China: Size and value factors in Chinese stock returns. International Review of Finance 19 (1), 3-44.
Hu, S.-Y. (1997). Trading turnover and expected stock returns: The trading frequency hypothesis and evidence from the Tokyo stock exchange. National Taiwan University.
Huang, A.G. (2009). The cross section of cashflow volatility and expected stock returns. Journal of Empirical Finance 16 (3), 409-429.
Huang, D., F. Jiang, J. Tu, and G. Zhou (2015). Investor sentiment aligned: A powerful predictor of stock returns. Review of Financial Studies 28 (3), 791-837.
Huang, D., H. Lehkonen, K. Pukthuanthong, and G. Zhou (2018). Sentiment across asset markets. Singapore Management University, University of Jyväskylä, University of Missouri, Washington University in St. Louis. Available at: https://ssrn.com/abstract=3185140.
Huberman, G. and S. Kandel (1987). Mean-variance spanning. Journal of Finance 42 (4), 873-888. Huberman, G. and T. Regev (2001). Contagious speculation and a cure for cancer: A nonevent that made stock prices soar. Journal of Finance 56 (1), 387-396.
Huij, J. and S. Lansdorp (2017). Residual momentum and reversal strategies revisited. Erasmus University, Robeco Asset Management. Available at:
https://ssrn.com/abstract=2929306.
Hur, J. and V. Singh (2016). Reexamining momentum profits: Underreaction or overreaction to firm-specific information? Review of Quantitative Finance and Accounting 46 (2), 261-289.
Ibbotson, R. G., J.L. Sindelar, and J.R. Ritter (1994). The market's problems with the pricing of initial public offerings. Journal of Applied Corporate Finance 7 (1), 66-74.
Ilmanen, A., L.N. Nielsen, and S. Chandra (2015). Are defensive stocks expensive? A closer look at value spreads. AQR Capital Management, LLC.
Ingersoll, J.E. and L.J. Jin (2013). Realization utility with reference-dependent preferences. Review of Financial Studies 26 (3), 723-767.
Israel, R., D. Palhares, and S. Richardson (2018). Common factors in corporate bond returns. Journal of Investment Management 16 (2), 17-46.
Jaffe, J., D.B. Keim, and R. Westerfield (1989). Earnings yields, market values, and stock returns. Journal of Finance 44 (1), 135-148.
Jegadeesh, N. (1990). Evidence of predictable behavior of security returns. Journal of Finance 45 (3), 881-898.
Jegadeesh, N., J. Noh, K. Pukthuanthong, R. Roll, and J. Wang (2019). Empirical tests of asset pricing models with individual assets: Resolving the errors-in-variables bias in risk premium estimation. Journal of Financial Economics 133 (2), 273–298.
Jegadeesh, N. and S. Titman (1993). Returns to buying winners and selling losers: Implications for stock market efficiency. Journal of Finance 48 (1), 65-91.
Jegadeesh, N. and S. Titman (1995). Short-horizon return reversals and the bid-ask spread. Journal of Financial Intermediation 4 (2), 116-132.
Jegadeesh, N. and S. Titman (2001). Profitability of momentum strategies: An evaluation of alternative explanations. Journal of Finance 56 (2), 699-720.
Jensen, M.C. (1968). The performance of mutual funds in the period 1945-1964. Journal of Finance 23 (2), 389-416.
Ji, X., J.S. Martin, and Y. Yao (2017). Macroeconomic risk and seasonality in momentum profits. Journal of Financial Markets 36, 76-90.
Jiang, F., J. Lee, X. Martin, and G. Zhou (2019). Manager sentiment and stock returns. Journal of Financial Economics 132 (1), 126-149.
Jiang, G. J., D. Xu, and T. Yao (2009). The information content of idiosyncratic
volatility. Journal of Financial and Quantitative Analysis 44 (1), 1-28.
Jiang, H. (2010). Institutional investors, intangible information, and the book-to-market effect. Journal of Financial Economics 96 (1), 98-126.
Jiang, H., S.Z. Li, and H. Wang (2020). Pervasive underreaction: Evidence from high-frequency data. Michigan State University, The State University of New Jersey, Prime Quantitative Research. Available at: https://ssrn.com/abstract=2679614, SSRN No. 2679614.
Jiang, Y., Y. Qian, and T. Yao (2016). R & D spillover and predictable returns. Review of Finance 20 (5), 1769-1797.
Jostova, G., S. Nikolova, A. Philipov, and C.W. Stahel (2013). Momentum in corporate bond returns. Review of Financial Studies 26 (7), 1649-1693.
Kahneman, D. and A. Tversky (1979). Prospect Theory: An analysis of decision under risk. Econometrica 47 (2), 263-292.
Kan, R. and G. Zhou (2012). Tests of mean-variance spanning. Annals of Economics and Finance 13 (1), 145-193.
Kaniel, R., A. Ozoguz, and L. Starks (2012). The high volume return premium: Cross-country evidence. Journal of Financial Economics 103 (2), 255-279.
Karels, R. and M. Sun (2013). Chapter 24 Active portfolio construction when risk and alpha factors are misaligned. In C.S. Wehn, C. Hoppe, and G.N. Gregoriou (Eds.), Rethinking Valuation and Pricing Models, pp. 399-410. Academic Press.
Keim, D.B. (1983). Size-related anomalies and stock return seasonality: Further empirical evidence. Journal of Financial Economics 12 (1), 13-32.
Kelly, B. T., S. Pruitt, and Y. Su (2017). Instrumented principal component analysis. Yale University, Arizona State University, Johns Hopkins University. Available at: https://ssrn.com/abstract=2983919.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134 (3), 501-524.
Keynes, J.M. (1936). The General Theory of Employment, Interest and Money. London, UK: Macmillan Publishers Ltd.
Khandani, A.E. and A.W. Lo (2011). What happened to the quants in August 2007? Evidence from factors and the transactions data. Journal of Financial Markets 14 (1), 1-46.
Kok, U. -W., J. Ribando, and R.G. Sloan (2017). Facts about formulaic value investing. Financial Analysts Journal 73 (2), 81-99.
Kopman, L. and S. Liu (2011). Treatment offixed transaction costs in Barra optimizer. MSCI Barra Research Paper No. 2011-10. Available at: https://ssrn.com/abstract=1915219.
Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73 (3), 1183-1223.
Kraus, A. and R.H. Litzenberger (1976). Skewness preference and the valuation of risk assets. Journal of Finance 31 (4), 1085-1100.
Kubota, K. and H. Takehara (2018). Does the Fama and Frenchfive-factor model work well in Japan? International Review of Finance 18 (1), 137-146.
Kunz, B. and M. Mazzoleni (2018). When value goes global. Research Affiliates, LLC.
La Porta, R. (1996). Expectations and the crosssection of stock returns. Journal of Finance 51 (5), 1715-1742.
Lakonishok, J., A. Shleifer, and R.W. Vishny (1994). Contrarian investment, extrapolation, and risk. Journal of Finance 49 (5), 1541-1578.
Lam, F.Y. E.C. and K.C. J. Wei (2011). Limits-to-arbitrage, investment frictions, and the asset growth anomaly. Journal of Financial Economics 102 (1), 127-149.
Lamoureux, C.G. and G.C. Sanger (1989). Firm size and turn-of-the-year effects in the OTC/NASDAQ market. Journal of Finance 44 (5), 1219-1245.
Ledoit, O. and M. Wolf (2003). Improved estimation of the covariance matrix of stock returns with an application to portfolio selection. Journal of Empirical Finance 10 (5), 603-621.
Lee, B., J. O'Brien, and K. Sivaramakrishnan (2008). An analysis of financial analysts' optimism in long-term growth forecasts. Journal of Behavioral Finance 9 (3), 171-184.
Lee, C.M. C., A. Shleifer, and R.H. Thaler (1991). Investor sentiment and the closed-end fund puzzle. Journal of Finance 46 (1), 75-109.
Lee, C.M. C. and E. So (2015). Alphanumeric: The Information Underpinnings of Market Efficiency. Now Publishers Inc.
Lee, C.M. C., S.T. Sun, R. Wang, and R. Zhang (2019). Technological links and predictable returns. Journal of Financial Economics 132 (3), 76-96.
Lee, C.M. C. and B. Swaminathan (2000). Price momentum and trading volume. Journal of Finance 55 (5), 2017-2069.
Lee, D. H., M.K. Kim, and T.S. Kim (2016). Abnormal trading volume and the
crosssection of stock returns. KAIST College of Business Working Paper Series No. 2016-008. Available at: https://ssrn.com/abstract=2812010.
Lee, J. -H. and D. Stefek (2008). Do risk factors eat alphas? The Journal of Portfolio Management 34 (4), 12-25.
Lefevre, E. and J.D. Markman (2012). The Reminiscences of a Stock Operator Collection: The Classic Book, The Illustrated Edition. Hoboken, New Jersey: John Wiley & Sons, Inc.
Lehmann, B.N. (1990a). Fads, martingales, and market efficiency. The Quarterly Journal of Economics 105 (1), 1-28.
Lehmann, B.N. (1990b). Residual risk revisited. Journal of Econometrics 45 (1-2), 71-97.
Leote de Carvalho, R., X. Lu, and P. Moulin (2012). Demystifying equity risk-based strategies: A simple alpha plus beta description. The Journal of Portfolio Management 38 (3), 56-70.
Lettau, M. and M. Pelger (2020). Factors that fit the time series and crosssection of stock returns. Review of Financial Studies 33 (5), 2274-2325.
Lewellen, J. (1999). The time-series relations among expected return, risk, and book-to-market. Journal of Financial Economics 54 (1), 5-43.
Lewellen, J. (2002). Momentum and autocorrelation in stock returns. Review of Financial Studies 15 (2), 533-564.
Li, B., J. Qiu, and Y. Wu (2010). Momentum and seasonality in Chinese stock markets. Journal of Money, Investment and Banking 17 (5), 24-36.
Li, C. -A. and C. -C. Yeh (2011). Investor psychological and behavioral bias: Do high sentiment and momentum exist in the China stock market? Review of Pacific Basin Financial Markets and Policies 14 (03), 429-448.
Li, D. and L. Zhang (2010). Does q-theory with investment frictions explain anomalies in the cross section of returns? Journal of Financial Economics 98 (2), 297-314.
Li, J. and J. Yu (2012). Investor attention, psychological anchors, and stock return predictability. Journal of Financial Economics 104 (2), 401-419.
Li, X., Y. Becker, and D. Rosenfeld (2012). Asset growth and future stock returns: International evidence. Financial Analysts Journal 68 (3), 51-62.
Li, X., R.N. Sullivan, and L. Garcia-Feijóo (2014). The limits to arbitrage and the low-volatility anomaly. Financial Analysts Journal 70 (1), 52–63.
Liang, C.Y. C. and Z. Tang (2018). Idiosyncratic return volatility, uncertainty, and asset pricing implications. University of Maine, Clark University. Available at: https://ssrn.com/abstract=3019379. Liew, J. and T. Budavari (2017). The "six" factor-A social media factor derived directly from tweet sentiments. The Journal of Portfolio Management 43 (3), 102-111.
Lin, Q. (2019). Residual momentum and the crosssection of stock returns: Chinese evidence. Finance Research Letters 29, 206-215.
Lin, Q. (2020). Idiosyncratic momentum and the crosssection of stock returns: Further evidence. European Financial Management 26 (3), 579-627.
Linnainmaa, J.T. and M.R. Roberts (2018). The history of the crosssection of stock returns. Review of Financial Studies 31 (7), 2606-2649.
Lintner, J. (1965a). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets. Review of Economics and Statistics 47, 13-37.
Lintner, J. (1965b). Securities prices, risk, and maximal gains from diversification. Journal of Finance 20 (4), 587-615.
Lipson, M. L., S. Mortal, and M.J. Schill (2011). On the scope and drivers of the asset growth effect. Journal of Financial and Quantitative Analysis 46 (6), 1651-1682.
Liu, C. and Y. Lee (2001). Does the momentum strategy work universally? Evidence from the Japanese stock market. Asia-Pacific Financial Markets 8 (4), 321-339.
Liu, J., R.F. Stambaugh, and Y. Yuan (2019). Size and value in China. Journal of Financial Economics 134 (1), 48-69.
Liu, L. X., T.M. Whited, and L. Zhang (2009). Investment-based expected stock returns. Journal of Political Economy 117 (6), 1105-1139.
Liu, L.X. and L. Zhang (2008). Momentum profits, factor pricing, and macroeconomic risk. Review of Financial Studies 21 (6), 2417-2448.
Liu, R. (2019). Asset pricing anomalies and the low-risk puzzle. University of Nebraska at Lincoln. Available at: https://ssrn.com/abstract=3258015.
Liu, W. (2006). A liquidity-augmented capital asset pricing model. Journal of Financial Economics 82 (3), 631-671.
Liu, W., N. Strong, and X. Xu (1999). The profitability of momentum investing. Journal of Business Finance & Accounting 26 (9-10), 1043-1091.
Liu, Y., C. Shi, and X. Lian (2019). Refined book-to-market ratio and the crosssection of stock returns in China. Southwestern University of Finance and Economics, Beijing Liangxin Investment Management Co. Ltd., Shenzhen China-Europe Rabbit Fund Management Co. Ltd. Available at: https://ssrn.com/abstract=3466909.
Lo, A.W. and A.C. MacKinlay (1990). Data-snooping biases in tests offinancial asset pricing models. Review of Financial Studies 3 (3), 431-467.
Lobo, M. S., M. Fazel, and S. Boyd (2007). Portfolio optimization with linear and fixed transaction costs. Annals of Operations Research 152 (1), 341-365.
Lockwood, L. and W. Prombutr (2010). Sustainable growth and stock returns. Journal of Financial Research 33 (4), 519-538.
Loh, R.K. and M. Warachka (2012). Streaks in earnings surprises and the crosssection of stock returns. Management Science 58 (7), 1305-1321.
Lopez de Prado, M. (2018). Advances in Financial Machine Learning. Hoboken, New Jersey: John Wiley & Sons, Inc.
Loughran, T. and J.W. Wellman (2011). New evidence on the relation between the enterprise multiple and average stock returns. Journal of Financial and Quantitative Analysis 46 (6), 1629-1650.
Lucas, R.E. (1978). Asset prices in an exchange economy. Econometrica 46 (6), 1429-1445.
Lyandres, E., L. Sun, and L. Zhang (2008). The new issues puzzle: Testing the investment-based explanation. Review of Financial Studies 21 (6), 2825-2855.
Maillard, S., T. Roncalli, and J. Teiletche (2010). The properties of equally weighted risk contribution portfolios. The Journal of Portfolio Management 36 (4), 60-70.
Mandelbrot, B. (1966). Forecasts offuture prices, unbiased markets, and "martingale" models. Journal of Business 39 (1), 242-255.
Markowitz, H. (1952). Portfolio selection. Journal of Finance 7 (1), 77-91.
McCulloch, R. and P.E. Rossi (1991). A Bayesian approach to testing the arbitrage pricing theory. Journal of Econometrics 49 (1-2), 141-168.
McLean, R.D. and J. Pontiff (2016). Does academic research destroy stock return predictability? Journal of Finance 71 (1), 5-32.
Mei, J., J. Scheinkman, and W. Xiong (2005). Speculative trading and stock prices: Evidence from Chinese A-B share premia. NBER Working Paper No. 11362.
Menchero, J. and B. Davis (2011). Risk contribution is exposure times volatility
times correlation: Decomposing risk using the x-sigma-rho formula. The Journal of Portfolio Management 37 (2), 97-106.
Menchero, J. and J.-H. Lee (2015). Efficiently combining multiple sources of alpha. Journal of Investment Management 13 (4), 71-86.
Menchero, J., D.J. Orr, and J. Wang (2011). The Barra US equity model (USE4) methodology notes. MSCI Inc.
Menchero, J., J. Wang, and D.J. Orr (2011). Eigen-adjusted covariance matrices. MSCI Inc.
Menkhoff, L., L. Sarno, M. Schmeling, and A. Schrimpf (2012). Currency momentum strategies. Journal of Financial Economics 106 (3), 660-684.
Merton, R.C. (1972). An analytic derivation of the efficient portfolio frontier. Journal of Financial and Quantitative Analysis 7 (4), 1851-1872.
Merton, R.C. (1973). An intertemporal capital asset pricing model. Econometrica 41 (5), 867-887. Miller, M.H. and F. Modigliani (1961). Dividend policy, growth, and the valuation of shares. Journal of Business 34 (4), 411-433.
Modigliani, F. and M.H. Miller (1958). The cost of capital, corporation finance and the theory of investment. American Economic Review 48 (3), 261-297.
Mohanram, P.S. (2005). Separating winners from losers among low-book-to-market stocks using financial statement analysis. Review of Accounting Studies 10 (2-3), 133-170.
Moskowitz, T.J. and M. Grinblatt (1999). Do industries explain momentum? nance 54 (4), 1249-1290. Journal of Finance 54 (4), 1249-1290.
Mossin, J. (1966). Equilibrium in a capital asset market. Econometrica 34 (4), 768-783.
MSCI (2014). MSCI quality indexes methodology. MSCI Inc.
Narayan, P. K., H.A. Ahmed, and S. Narayan (2015). Do momentum-based trading strategies work in the commodity futures markets? Journal of Futures Markets 35 (9), 868-891.
Newey, W.K. and K.D. West (1987). A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix. Econometrica 5 (3), 703-708.
Newey, W.K. and K.D. West (1994). Automatic lag selection in covariance matrix estimation. Review of Economic Studies 61 (4), 631-653.
Nissim, D. and S.H. Penman (2001). Ratio analysis and equity valuation: From
research to practice. Review of Accounting Studies 6 (1), 109-154.
Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics 108 (1), 1-28.
Novy-Marx, R. (2014). Understanding defensive equity. NBER Working Paper No. 20591.
Novy-Marx, R. (2015a). Backtesting strategies based on multiple signals. NBER Working Paper No. 21329.
Novy-Marx, R. (2015b). Fundamentally, momentum is fundamental momentum. NBER Working Paper No. 20984.
Novy-Marx, R. and M. Velikov (2016). A taxonomy of anomalies and their trading costs. Review of Financial Studies 29 (1), 104-147.
Obreja, I. (2013). Book-to-market equity, financial leverage, and the crosssection of stock returns. Review of Financial Studies 26 (5), 1146-1189.
Odean, T. (1998). Volume, volatility, price, and profit when all traders are above average. Journal of Finance 53 (6), 1887-1934.
Ohlson, J.A. (1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research 18 (1), 109-131.
Orlov, V. (2016). Currency momentum, carry trade, and market illiquidity. Journal of Banking & Finance 67, 1-11.
Pástor, L. and R.F. Stambaugh (2003). Liquidity risk and expected stock returns. Journal of Political Economy 111 (3), 642-685.
Patton, A.J. and B.M. Weller (2020). What you see is not what you get: The costs of trading market anomalies. Journal of Financial Economics forthcoming.
Peng, L. and W. Xiong (2006). Investor attention, overconfidence and category learning. Journal of Financial Economics 80 (3), 563-602.
Penman, S.H. and F. Reggiani (2018). Fundamentals of value versus growth investing and an explanation for the value trap. Financial Analysts Journal 74 (4), 103-119.
Penman, S.H. and J. Zhu (2019). An accounting-based asset pricing model and a fundamental factor. Columbia Business School, Fudan University. Available at: https://ssrn.com/abstract=3393068.
Penman, S.H. and J.L. Zhu (2014). Accounting anomalies, risk, and return. The Accounting Review 89 (5), 1835-1866.
Peterkort, R.F. and J.F. Nielsen (2005). Is the book-to-market ratio a measure of risk? Journal of Financial Research 28 (4), 487-502.
Petersen, M.A. (2009). Estimating standard errors infinance panel data sets: Comparing approaches. Review of Financial Studies 22 (1), 435-480.
Piotroski, J.D. (2000). Value investing: The use of historical financial statement information to separate winners from losers. Journal of Accounting Research 38, 1-41.
Piotroski, J.D. and E.C. So (2012). Identifying expectation errors in value/glamour strategies: a fundamental analysis approach. Review of Financial Studies 25 (9), 2841-2875.
Polk, C. and P. Sapienza (2008). The stock market and corporate investment: A test of catering theory. Review of Financial Studies 22 (1), 187-217.
Pontiff, J. (2006). Costly arbitrage and the myth of idiosyncratic risk. Journal of Accounting and Economics 42 (1-2), 35-52.
Pontiff, J. and L.D. Schall (1998). Book-to-market ratios as predictors of market returns. Journal of Financial Economics 49 (2), 141-160.
Pontiff, J. and A. Woodgate (2008). Share issuance and crosssectional returns. Journal of Finance 63 (2), 921-945.
Pukthuanthong, K., R. Roll, and A. Subrahmanyam (2019). A protocol for factor identification. Review of Financial Studies 32 (4), 1573-1607.
Qian, E. (2005). Risk parity portfolios: Efficient portfolios through true diversification. Panagora Asset Management, Inc.
Qiao, F. (2019). Replicating anomalies in China. Tsinghua University. Available at: https://ssrn.com/abstract=3263990.
Rabener, N. (2018). Factor allocation models: Improving factor portfolio efficiency. https://www-factorresearch.com/research-factor-allocation-models. Accessed: 2020-5-1.
Rao, A. and A. Gupta (2019). Value investing is down. But is it out? https://www.msci.com/www/blog-posts/value-investing-is-down-but-is/01619618276. Accessed: 2019-12-31.
Rapach, D. E., J.K. Strauss, and G. Zhou (2010). Out-of-sample equity premium prediction: Combination forecasts and links to the real economy. Review of Financial Studies 23 (2), 821-862.
Rapach, D.E. and G. Zhou (2019). Sparse macro factors. Saint Louis University, Washington University in St. Louis. Available at: https://ssrn.com/abstract=3259447.
Reinganum, M.R. (1981). Misspecification of capital asset pricing: Empirical anomalies based on earnings' yields and market values. Journal of Financial Economics 9 (1), 19-46.
Romano, J. P., A.M. Shaikh, and M. Wolf (2008). Formalized data snooping based on generalized error rates. Econometric Theory 24 (2), 404-447.
Romano, J.P. and M. Wolf (2005). Stepwise multiple testing as formalized data snooping. Econometrica 73 (4), 1237-1282.
Romano, J.P. and M. Wolf (2007). Control of generalized error rates in multiple testing. The Annals of Statistics 35 (4), 1378-1408.
Rosenberg, B., K. Reid, and R. Lanstein (1985). Persuasive evidence of market inefficiency. The Journal of Portfolio Management 11 (3), 9-16.
Ross, S.A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13 (3), 341-360.
Rouwenhorst, K.G. (1998). International momentum strategies. Journal of Finance 53 (1), 267-284. Rouwenhorst, K.G. (1999). Local return factors and turnover in emerging stock markets. Journal of Finance 54 (4), 1439-1464.
Ruud, P.A. (2000). An Introduction to Classical Econometric Theory. New York, NY: OxfordUniversity Press.
Samuelson, P.A. (1965). Proof that properly anticipated prices fluctuate randomly. Industrial Management Review 6 (2), 41-49.
Savor, P. and M. Wilson (2013). How much do investors care about macroeconomics risk? Evidence from scheduled economic announcements. Journal of Financial and Quantitative Analysis 48 (2), 343-375.
Savor, P. and M. Wilson (2014). Asset pricing: A tale of two days. Journal of Financial Economics 113 (2), 171-201.
Schneider, P., C. Wagner, and J. Zechner (2020). Low riskanomalies? Journal of Financeforthcoming. Schwert, G.W. (1983). Size and stock returns, and other empirical regularities. Journal of Financial Economics 12 (1), 3-12.
Sewell, M. (2007). Behavioural finance. University of Cambridge.
Shanken, J. (1987). A Bayesian approach to testing portfolio efficiency. Journal of Financial Economics 19 (2), 195-215.
Shanken, J. (1992). On the estimation of beta-pricing models. Review of Financial Studies 5 (1), 1-33.
Sharpe, W.F. (1964). Capital asset prices: A theory of market equilibrium under
conditions of risk. Journal of Finance 19 (3), 425-442.
Sharpe, W.F. (1966a). Mutual fund performance. Journal of Business 39 (1), 119-138.
Sharpe, W.F. (1966b). Security prices, risk, and maximal gains from diversification: Reply. Journal of Finance 21 (4), 743-744.
Sharpe, W.F. (1992). Asset allocation: Management style and performance measurement. The Journal of Portfolio Management 18 (2), 7-19.
Shefrin, H. and M. Statman (1985). The disposition to sell winners too early and ride losers too long: Theory and evidence. Journal of Finance 40 (3), 777-790.
Shen, Q., A.C. Szakmary, and S.C. Sharma (2007). An examination of momentum strategies in commodity futures markets. Journal of Futures Markets 27 (3), 227-256.
Shiller, R.J. (1979). The volatility of long term interest rates and expectations models of the term structure. Journal of Political Economy 87 (6), 1190-1219.
Shiller, R.J. (1981). Do stock prices move too much to be justified by subsequent changes in dividends? American Economic Review 71 (3), 421-436.
Shiller, R.J. (1984). Stock prices and social dynamics. Brookings papers on economic activity 1984 (2), 457-510.
Shiller, R.J. (2009). Irrational Exuberance (2 ed.). Princeton, NJ: Princeton University Press.
Shleifer, A. and R.W. Vishny (1997). The limits of arbitrage. Journal of Finance 52 (1), 35-55.
Sloan, R.G. (1996). Do stock prices fully reflect information in accruals and cash flows about future earnings? The Accounting Review 71 (3), 289-315.
Sloan, R.G. (2019). Fundamental analysis latex. The Accounting Review 94 (2), 363-377.
Soliman, M.T. (2008). The use of DuPont analysis by market participants. The Accounting Review 83 (3), 823-853.
Spiess, D.K. and J. Affleck-Graves (1999). The long-run performance of stock returns following debt offerings. Journal of Financial Economics 54 (1), 45-73.
Stambaugh, R. F., J. Yu, and Y. Yuan (2012). The short of it: Investor sentiment and anomalies. Journal of Financial Economics 104 (2), 288-302.
Stambaugh, R. F., J. Yu, and Y. Yuan (2014). The long ofit: Odds that investor sentiment spuriously predicts anomaly returns. Journal of Financial Economics
114(3),613-619.
Stambaugh, R. F., J. Yu, and Y. Yuan (2015). Arbitrage asymmetry and the idiosyncratic volatility puzzle. Journal of Finance 70 (5), 1903-1948.
Stambaugh, R.F. and Y. Yuan (2017). Mispricing factors. Review of Financial Studies 30 (4), 1270-1315.
Statman, M. (2018). Behavioral efficient markets. The Journal of Portfolio Management 44 (3), 76-87.
Statman, M., S. Thorley, and K. Vorkink (2006). Investor overconfidence and trading volume. Review of Financial Studies 19 (4), 1531-1565.
Stattman, D. (1980). Book values and stock returns. The Chicago MBA: A Journal of Selected Papers 4 (1), 25-45.
Stein, J.C. (2009). Presidential address: Sophisticated investors and market efficiency. Journal of Finance 64 (4), 1517-1548.
Subrahmanyam, A. (2005). On the stability of the crosssection of expected stock returns in the crosssection: Understanding the curious role of share turnover. European Financial Management 11 (5), 661-678.
Sullivan, R., A. Timmermann, and H. White (1999). Data-snooping, technical trading rule performance, and the bootstrap. Journal of Finance 54 (5), 1647-1691.
Thaler, R.H. (1985). Mental accounting and consumer choice. Marketing Science 4 (3), 199-214.
Thaler, R.H. (1999). Mental accounting matters. Journal of Behavioral Decision Making 12 (3), 183-206.
Thomas, J.K. and H. Zhang (2002). Inventory changes and future returns. Review of Accounting Studies 7 (2), 163-187.
Tinic, S.M. and R.R. West (1986). Risk, return, and equilibrium: A revisit. Journal of Political Economy 94 (1), 126-147.
Titman, S., K.C. J. Wei, and F. Xie (2004). Capital investments and stock returns. Journal of Financial and Quantitative Analysis 39 (4), 677-700.
Titman, S., K.C. J. Wei, and F. Xie (2009). Capital investments and stock returns in Japan. International Review of Finance 9 (1-2), 111-131.
Titman, S., K.C. J. Wei, and F. Xie (2010). Access to equity markets, corporate investments and stock returns: International evidence. AFA 2011 Denver Meetings Paper. Available at: https://ssrn.com/abstract=1571648.
Treynor, J.L. (1961). Market value, time, and risk. Unpublished manuscript.
Treynor, J.L. (1962). Toward of theory of market value of risky assets. Unpublished manuscript.
Treynor, J.L. and K.K. Mazuy (1966). Can mutual funds outguess the market? Harvard Business Review 44 (July-August), 131-136.
Tversky, A. and D. Kahneman (1971). Beliefin the law of small numbers. Psychological Bulletin 76 (2), 105-110.
Tversky, A. and D. Kahneman (1973). Availability: A heuristic for judging frequency and probability. Cognitive Psychology 5 (2), 207-232.
Tversky, A. and D. Kahneman (1974). Judgment under uncertainty: Heuristics and biases. Science 185 (4157), 1124-1131.
Tversky, A. and D. Kahneman (1992). Advances in prospect theory: Cumulative representation of uncertainty. Journal of Risk and Uncertainty 5 (4), 297-323.
Ung, D. and P. Luk (2016). What is in your smart beta portfolio? A fundamental and macroeconomic analysis. The Journal of Index Investing 7 (1), 49-77.
Wang, H., J. Yan, and J. Yu (2017). Reference-dependent preferences and the risk-return trade-off. Journal of Financial Economics 123 (2), 395-414.
Wang, Y. and A. Di Iorio (2007). The cross section of expected stock returns in the Chinese A-share market. Global Finance Journal 17 (3), 335-349.
Wasserstein, R.L. and N.A. Lazar (2016). The ASA statement on p-values: Context, process, and purpose. The American Statistician 70 (2), 129-133.
Watanabe, A., Y. Xu, T. Yao, and T. Yu (2013). The asset growth effect: Insights from international equity markets. Journal of Financial Economics 108 (2), 529-563.
Welch, I. and A. Goyal (2008). A comprehensive look at the empirical performance of equity premium prediction. Review of Financial Studies 21 (4), 1455-1508.
White, H. (1980). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica 48 (4), 817-838.
White, H. (2000). A reality check for data snooping. Econometrica 68 (5), 1097-1126.
Xing, Y. (2008). Interpreting the value effect through the q-theory: An empirical investigation. Review of Financial Studies 21 (4), 1767-1795.
Xu, Y. and B.G. Malkiel (2004). Idiosyncratic risk and security returns. AFA 2001
New Orleans Meetings. Available at: https://ssrn.com/abstract=255303.
Yin, L. and Y. Wei (2020). Aggregate profit instability and time variations in momentum returns: Evidence from China. Pacific-Basin Finance Journal 60, 101276.
Yu, J. and Y. Yuan (2011). Investor sentiment and the mean-variance relation. Journal of Financial Economics 100 (2), 367-381.
Zhang, H. (2004). Dynamic beta, time-varying risk premium, and momentum. Yale ICF Working Paper No. 04-26. Available at: https://ssrn.com/abstract=571006.
Zhang, L. (2005). The value premium. Journal of Finance 60 (1), 67-103.
Zhang, L. (2016). Factors war. Tsinghua Financial Review (in Chinese) 37, 101-104.
Zhang, L. (2017). The investment CAPM. European Financial Management 23 (4), 545-603.
Zhou, Z.-G. (2010). The high-volume return premium: Evidence from the Chinese stock market. Review of Quantitative Finance and Accounting 35 (3), 295-313.
Zhu, Z., L. Sun, and M. Chen (2019). Fundamental strength and short-term return reversal. Journal of Empirical Finance 52, 22-39.
修大成
芝加哥大学布斯商学院计量经济学与统计学教授,清华大学五道口金融学院特聘教授,上海交通大学上海高级金融学院特聘教授
余剑峰
清华大学五道口金融学院建树金融学讲席教授、清华大学金融科技研究院副院长、清华大学国家金融研究院资产管理研究中心主任
张然
中国人民大学商学院教授、中国基本面量化投资研究中心主任
周维礼
荷宝投资(Robeco)量化股票研究团队主管
林飞博士
易方达基金管理有限公司指数增强投资部总经理
刘斌博士
嘉实基金管理有限公司量化投资部总监
中国量化投资方兴未艾,这方面却鲜有很好的图书。本书系统地总结了几十年来业界和学术界在因子投资和资产定价方面的研究成果,相信对此有兴趣的读者将深受启发。
这是一本关于股票市场中因子投资的佳作。从半个多世纪前经典的资产定价模型到新鲜出炉的学术论文,作者进行了非常系统的梳理。无论是方法论还是因子背后的经济学逻辑,本书都阐述得极其清晰。由于作者还具备丰富的实战经验,本书也充满了各种实证例子,可谓理论和实践结合的经典,非常有利于读者优化和改进已有因子或提出自己的因子。
随着金融科技、大数据、人工智能的崛起,投资的智能化和科学化成为大势所趋。三位作者长期从事因子投资领域的研究和实践,其新作非常好地诠释了从基本面出发构建多因子量化投资体系的新理论和实践,对中国资本市场的发展和完善意义深远。
本书系统性地介绍了因子投资的前世今生,不仅帮助读者总结和梳理了国际上“诸子百家”的学术发现,而且结合A股市场的实证分析,为读者提供了极其实用的操作建议。本书实在是一本不可多得的因子投资百科全书!
我持续阅读“川总写量化”的文章已有两年多,收获颇丰,同时也能感受到作者们对因子投资的坦诚、热情和执着。本书是量化投资领域兼具理论深度和实务经验的难得佳作。本书让我了解到因子投资的艰难,但也感受到其十足的魅力,相信对这个领域感兴趣的读者也能从书中得到更多启发。
三位作者一直致力于因子投资的研究和实践,他们主编的“川总写量化”“因子动物园”都是量化投资领域高质量、高关注度的公众号。本书系统性地讲述了因子投资的方法论体系,非常有益于投资者完善因子研究和投资框架。
上架建议:投资理财

定价:108.00元

责任编辑:陈林
封面设计:李玲