第3章
主流因子解读
除介绍因子投资的方法论之外,本书的另一个特色是针对A股进行严谨的、可复制的实证分析。这些实证分析分布于本章、第4章及第5章,分别以因子、多因子模型和异象为研究对象,使用第2章介绍的相关方法进行深度实证分析。
然而,巧妇难为无米之炊,要做好实证分析,离不开高质量的原始数据,也离不开严谨的数据处理流程。在因子投资中,数据处理方面存在着很多坑。无论是未来数据的迷雾,还是不切实际的设定[1],都可能让人在兴高采烈后落入无尽的空虚。因此在针对A股进行实证研究之前,首先要把数据和计算因子的流程说清楚。本章的3.1节会系统地介绍这部分内容,包括数据来源、财务数据处理、量价数据处理和历史回溯的基本约定等。全书中所有的实证的数据处理都将遵循3.1节介绍的方法。
在介绍完数据处理方法后,3.2节到3.8节将以A股为研究对象,深度解读学术界认可的主流因子,包括市场因子、规模因子、价值因子、动量因子、盈利因子、投资因子和换手率因子。除换手率因子外,其余因子均被包含在海外学术界最重要的多因子模型中,并得到了业界的广泛认可。把每个因子背后的来龙去脉讲清楚将有助于读者理解本书第4章介绍的这些多因子模型。虽然换手率因子尚未被纳入海外的模型中,但由于其在A股市场的显著性和认可度,本章也将其加入讨论之列。
在以下针对每个因子的论述中会同时关注因子的起源和成因。知前者能了解因子的发展演进,知后者则可以明白每个因子为什么会有显著的超额收益。长久以来,风险补偿都是解释因子溢价的最重要原因。然而,随着行为金融学的发展,越来越多的学者将投资者行为偏差作为解释因子溢价的另一个思路。因此在讨论因子成因时,会涉及部分行为金融学的内容。为了行文的紧凑,本章暂时不会对行为金融学进行展开论述,但6.3节将系统地阐述行为金融学和资产预期收益率之间的关系,供读者参考。在介绍完起源和成因之后,本书将对因子进行基于A股市场的深度实证。
3.1 数据和流程
3.1.1 数据来源
基于数据质量和可得性的考虑,本书中使用的数据主要来自Wind和Tushare[2]。其中基本信息、行情数据、指数成分和宏观数据来自Wind,财务数据来自Tushare。
3.1.2 量价数据处理
本书的全部实证研究均属于日线级别,因此数据频率也以交易日为单位,不涉及对高频数据的处理。量价数据主要指的是与行情相关的数据,包括开盘价、最高价、最低价、收盘价、成交量、换手率、交易状态和涨跌停状态等信息。量价数据比较纯粹、简单,各个数据商提供的服务都差不多,在存储和处理上也比较简单。下面介绍几个常见的问题。
1. 前复权和后复权
由于股票存在配股、分拆、合并和发放股息等事件,会导致股价出现较大的缺口。若使用不复权的价格处理数据、计算各种指标,将会导致它们失去连续性,且使用不复权价格计算收益也会出现错误。为了保证数据连贯性,常通过前复权和后复权对价格序列进行调整,示意图见图3.1。图中股价在t时刻发生跳变,实线a和b两段表示变化前后的实际价格。

图3.1 股票价格复权示意图
前复权保持当前价格不变,将历史价格进行增减,从而使股价连续。前复权用来看盘非常方便,能一眼看出股价的历史走势,叠加各种技术指标也比较顺畅,是各种行情软件默认的复权方式。这种方法虽然很常见,但也有两个缺陷需要注意。首先,为了保证当前价格不变,每次股票除权除息,均需要重新调整历史价格,因此其历史价格是时变的。这会导致在不同时点看到的历史前复权价可能出现差异。其次,对于有持续分红的公司来说,前复权价可能出现负值。
和前复权价相反,后复权价保证历史价格不变,在每次股票权益事件发生后,调整当前的股票价格。后复权价格和真实股票价格可能差别较大,不适合用来看盘。其优点在于,可以被看作投资者的长期财富增长曲线,反映投资者的真实收益率情况。在本书中,无论是计算收益率,还是回溯历史表现,均采用后复权价格。
2. 长期停牌股复牌
由于重大重组和暂停上市后恢复等原因,部分停牌股复牌后没有涨跌停限制,导致该日的收益率异常大或异常小。例如曾经深陷连续亏损、超日债违约等漩涡而濒临破产的★ST超日(002506.SZ),2014年4月29日开始停牌;重组之后更名为协鑫集成,于2015年8月12日复牌上市,由于不受限于10%的涨跌停限制,当日涨幅高达593.72%(见表3.1)。
表3.1 复牌首日大涨示例
| 交易日 | 收益率(%) |
| 2015/08/10 | 停牌 |
| 2015/08/11 | 停牌 |
| 2015/08/12 | 593.72 |
| 2015/08/13 | 10.04 |
| 2015/08/14 | 10.01 |
考虑到我国证券市场现行的涨跌停板制度于1996年12月13日发布并于1996年12月16日开始实施,因此针对1996年12月15日后的数据中出现的异常值做压缩处理。在具体操作中,将日收益率大于 $10\%$ 的数据用 $10\%$ 代替,将日收益率小于 $-10\%$ 的数据用 $-10\%$ 代替[3]。
3. 填充值
A股市场存在停牌制度,而停牌日没有交易数据。这时面临一个问题,到底应该采用上一个非停牌日数据填充还是直接设为缺失值,这需要根据应用场景,具体问题具体分析。
例如,在计算个股动量时,用填充法是没有问题的。将动量定义为当前价格相对于 $T$ 个交易日前(基期)的涨跌幅,如果基期是停牌日,那么用上一个非停牌日价格作为当时的价格水平,从逻辑上是通顺的。又比如,希望计算收益率的历
史波动率。这时填充法将导致停牌日的收益率为零。由于收益率为零相当于没有波动,因此使用它计算波动率并不能真实反映波动率水平。由于没有波动是由于停牌造成的,因此填充法将会造成历史波动率被低估。一个相似的例子是计算个股超额收益率相对于市场超额收益的暴露 $\beta$ 。由于市场超额收益率是每天都有的,而个股收益率停牌日如果用0代替,则会导致 $\beta$ 的计算出现较大偏差。在上述这些情况中应该将停牌日设为缺失值,不参与计算。
4. 最少交易日
A股市场中有些公司出于这样或那样的原因,滥用停牌制度,造成其股票交易断断续续,这会给指标计算带来干扰。举例来说,假如想要利用过去一个月内交易日的收益率数据计算波动率。如果某支股票在绝大多数交易日均停牌,只有少数样本用来计算,则最终结果会受到小样本的影响,造成较大的偏差。为了避免这种情况,对于需要使用一段时间窗口内数据计算的指标,本书要求只有当有效样本数超过时间窗口的三分之二时,才进行相应的计算。仍以一个月波动率为例,由于一个月通常包含21个交易日,因此当样本数量大于或等于14时才会计算波动率,否则把结果做缺失值处理。
少数公司滥用停牌制度,其随意地停牌实际上侵犯了投资者的知情权和交易权,也影响了市场的流动性。为维护资本市场公平交易秩序,优化交易监管,上交所和深交所于2018年12月28日发布了停复牌指引,进一步减少停牌事由,明确停牌条件,缩短停牌期限。图3.2展示了从2005年至2019年每日停牌股票占比。在市场各方的合力之下,上市公司的停牌次数、停牌家数近年来已大幅减少。

图3.2 每日停牌股票数占比
3.1.3 财务数据处理
财务数据就是与公司财务有关的数据,反映企业一定期间的经营成果和财务状况变动。交易所为了保护投资者的权益,要求上市公司定期公布财务报告,以便投资者了解其经营及财务状况。财务数据比量价数据复杂得多,因此下面会花较多笔墨介绍。
1. 报告期
对A股市场,《会计法》规定会计年度从1月1日开始,12月31日结束。一般要求上市企业一年定期披露四次财报,分别是一季报、半年报、三季报、年报[4]。财务报告在披露日期上没有严格要求,只要在规定的截止日之前披露即可。每个报告期都有一个标识,一般用“年份+季度末”的格式表示,如2018年三季报用“20180930”标识,2018年年报用“20181231”标识,具体定义见表3.2。
表3.2 财务报告期
| 报告期 | 起始点 | 结束点 | 常用标签 | 最晚披露日 |
| 一季报 | 1月1日 | 3月31日 | XXXX0331 | 同年4月30日 |
| 半年报 | 1月1日 | 6月30日 | XXXX0630 | 同年8月31日 |
| 三季报 | 1月1日 | 9月30日 | XXXX0930 | 同年10月31日 |
| 年报 | 1月1日 | 12月31日 | XXXX1231 | 次年4月30日 |
2.财务报表
财务报告主要由财务报表构成,财务报表包括“四表一附注”,即资产负债表、利润表、现金流量表、所有者权益变动表和附注,具体定义和特点见表3.3。[5]
表3.3 四表一附注
| 表名 | 含义 | 特点 |
| 资产负债表 | 反映企业在一定日期(通常为各会计期末)的资产、负债和所有者权益情况 | 时点数据 |
| 利润表 | 反映企业在一定时期经营成果(盈利或亏损)和利润分配情况 | 区间数据 |
| 现金流量表 | 反映企业资产负债表中各个项目对现金流的影响,分为经营、投资和融资三个类别 | 区间数据 |
| 所有者权益变动表 | 反映企业期初到期末所有者权益的增减情况 | 区间数据 |
| 附注 | 财务报表附注旨在帮助财务报表使用者深入了解基本财务报表的内容,是财务报表制作者对资产负债表、利润表和现金流量表的有关内容和项目所作的说明和解释。财务报表附注中的内容非常重要,主要包括:企业所采用的主要会计处理方法;会计处理方法的变更情况、变更的原因及对财务状况和经营业绩的影响;发生的非经常性项目;一些重要报表项目的明显情况;或有事项;期后事项;其他对理解和分析财务报表重要的信息 |
3.基准报告期
在披露最新报告期财务报表时,会同时披露对应的某个历史基准报表。不同报表对应的基准报表不同,资产负债表对应上年年报。以白云机场为例,图3.3显示白云机场在披露2018年三季报时,会同时披露年初余额(2017年年报)。另一方面,利润表和现金流量表对应为上年同期值。图3.4展示了白云机场在披露2018年三季报现金流量表时,会同时披露上年同比报告期(2017年三季报)。
合并资产负债表
2018年9月30日
编制单位:广州白云国际机场股份有限公司
单位:元 币种:人民币 审计类型:未经审计
| 项目 | 期末余额 | 年初余额 |
| 流动资产: | ||
| 货币资金 | 3,481,537,664.27 | 2,836,957,414.70 |
| 结算备付金 | ||
| 拆出资金 | ||
图3.3 白云机场2018年三季报资产负债表(部分)
无论一季报、半年报、三季报还是年报,在每期资产负债表披露时,其对应的基准报表都为上年年报;而现金流量表和利润表,其对应的基准报表总为对应的比例报告期,对应关系见表3.4。表3.5给出了一个示例。
合并现金流量表
2018年1—9月
编制单位:广州白云国际机场股份有限公司
单位:元币种:人民币审计类型:未经审计
| 项目 | 年初至报告期期末金额(1-9月) | 上年年初至报告期末金额(1-9月) |
| 一、经营活动产生的现金流量: | ||
| 销售商品、提供劳务收到的现金 | 5,877,994,678.15 | 4,715,182,016.24 |
| 客户存款和同业存放款项净增加额 | ||
| 向中央银行借款净增加额 | ||
| 向其他金融机构拆入资金净增加额 |
图3.4 白云机场2018年三季报现金流量表(部分)
表3.4 基准报告期
| 最新报告期 | 资产负债表 | 利润表 | 现金流量表 |
| 一季报 | 上年年报 | 上年一季报 | 上年一季报 |
| 半年报 | 上年年报 | 上年半年报 | 上年半年报 |
| 三季报 | 上年年报 | 上年三季报 | 上年三季报 |
| 年报 | 上年年报 | 上年年报 | 上年年报 |
表3.5 基准报告期示例
| 最新报告期 | 资产负债表 | 利润表 | 现金流量表 |
| 20180331 | 20171231 | 20170331 | 20170331 |
| 20180630 | 20171231 | 20170630 | 20170630 |
| 20180930 | 20171231 | 20170930 | 20170930 |
| 20181231 | 20171231 | 20171231 | 20171231 |
4. 调整和更正
财务报表披露后,由于某些原因可能会进行一些修正,更改原始的科目数值。修正按照时间频率分为两种,一种是调整,另一种是不定期更正。财务报表
第一次披露时的值称为原始报表;在后续定期报告中再次披露基准报表时,如果基准报表和原始报表科目数值出现了不同,则发生了调整。以中铁工业(600528.SH)为例,它于2017年3月31日首次公布了2016年年报(原始报表),如图3.5所示;于2018年3月28日公布2017年年报时同时披露了2016年年报(基准报表),如图3.6所示。图3.5期末余额对应2016年原始报表,图3.6期初余额对应2016年基准报表。比较2016年的原始和基准报表可知,货币资金、应收票据、应收账款和预付款项均进行了调整。
合并资产负债表
2016年12月31日
编制单位:中铁高新工业股份有限公司
单位:元 币种:人民币
| 项目 | 附注 | 期末余额 | 期初余额 |
| 流动资产: | |||
| 货币资金 | (七)1 | 5,029,065,933.80 | 5,804,069,205.13 |
| 结算备付金 | |||
| 拆出资金 | |||
| 以公允价值计量且其变动计入当期损益的金融资产 | |||
| 衍生金融资产 | |||
| 应收票据 | (七)4 | 1,446,912,807.36 | 457,243,020.17 |
| 应收账款 | (七)5 | 15,372,891,499.20 | 15,703,344,098.78 |
| 预付款项 | (七)6 | 12,583,410,842.95 | 11,330,011,031.13 |
图3.5 2016年中铁工业合并资产负债表(部分)
合并资产负债表
2017年12月31日
编制单位:中铁高新工业股份有限公司
单位:元 币种:人民币
| 项目 | 附注 | 期末余额 | 期初余额(已重述) |
| 流动资产: | |||
| 货币资金 | (七)1 | 6,847,797,345.18 | 8,370,064,573.52 |
| 结算备付金 | |||
| 拆出资金 | |||
| 以公允价值计量且其变动计入当期损益的金融资产 | |||
| 衍生金融资产 | |||
| 应收票据 | (七)4 | 752,356,525.30 | 2,066,512,377.56 |
| 应收账款 | (七)5 | 6,770,694,211.15 | 21,101,007,729.71 |
| 预付款项 | (七)6 | 1,370,385,544.24 | 13,611,701,647.39 |
图3.6 2017年中铁工业合并资产负债表(部分)
不定期更正指的是,由于会计政策变更或者会计统计差错等原因,对之前某期的报告进行更正。更正需要发更正公告,没有明确的时间规律。以柳工(000528.SZ)为例,它先在2018年8月30日披露了2018年半年报,而后又在2018年9月29日对半年报进行了更正。表3.6展示了利润表部分科目更正前和更正后的数值。
5. 基本原则
在进行财务数据的研究时,调整和更正的存在会增加数据处理的复杂度。一个处理方式是,不考虑调整和修正,只使用第一次披露的数值。这种方式简单易
实现,不会引入未来数据;但其缺点是无法反映调整或更正的新信息,信息利用不充分。另外一种方法是始终采用调整后和修正后的最新数据,这种方式也简化了计算过程,缺点是在历史回溯时会利用未来数据,导致结果偏差较大。这两种方式为了追求简单而牺牲了精确性,因而并不推荐。实证资产定价研究和因子投资是非常精细的过程,因而需要遵循以下原则:在当前时点利用可得的最新信息(即point-in-time原则)。按照这个原则,既能保证充分利用最新的数据,例如考虑调整和更正,或者将业绩预告和业绩快报考虑进来,也可以避免使用未来数据。
表3.6 柳工2018年半年报利润表更正(元)
| 会计科目 | 更正前 | 更正后 |
| 营业总成本 | 9,062,061,659.26 | 9,065,019,260.18 |
| 投资收益 | 53,176,657.27 | 54,502,547.68 |
| 营业利润 | 766,448,249.39 | 774,665,801.19 |
| 净利润 | 627,967,425.36 | 636,184,977.16 |
| 基本每股收益 | 0.5207 | 0.5295 |
6. 数据存储
无论是Wind还是Tushare,三大表在处理调整和更正时都采用相同的步骤。以大智慧(601519.SH)2014年年报合并资产负债表为例,表3.7记录了其首次披露、调整和更正过程。这个例子表明底层表中同一个报告期可能会有多条记录,分属于以下四类:类型1—初始报表(最新值)、类型2—基准报表(最新值)、类型3—初始报表(原始值)和类型4—基准报表(原始值)。这四种类型与Wind和Tushare的对应关系如表3.8所示。
表3.7 大智慧2014年合并报表的调整和更正
| 报告期 | 披露日期 | 说明 |
| 20141231 | 20150129 | 2014年年报首次披露 |
| 20141231 | 20160429 | 在披露2015年年报的同时,还披露了2014年年报,部分科目做了调整 |
| 20141231 | 20170217 | 在2017/2/17日对2014年年报进行了更正 |
需要注意的是:(1)如果没有任何一个会计科目发生调整,则初始报表和基准报表记录相同;(2)由于对上市公司财务报表披露规范的指定,1998年之前的数据没有调整和更正,每个报告期只有一条记录;(3)如果更正发生在基准报告之前,则只有三条记录:初始报表(最新值)、初始报表(原始值)和基准报表(最新值);(4)如果更正发生在基准报告之后,则会有表3.8所示的全部四条记录。
表3.8 合并报表在底层表中的四种记录类型
| 类型 | 简称 | Wind | Tushare | 说明 |
| 1 | 初始报表(最新值) | 合并报表 | 合并报表 | 首次披露的财务报表,如有更正,则为更正后值 |
| 2 | 基准报表(最新值) | 合并报表(调整) | 调整合并报表 | 最新报告期披露的基准报告期报表,基准报告期为上年同期或上年年报;如有更正,则为更正后值 |
| 3 | 初始报表(原始值) | 合并报表(更正前) | 调整前合并报表 | 如果有更正公告,则在更正公告发出后,修改初始报表相应的会计科目,修改前的记录标识为初始报表(原始值),修改后的记录标识为初始报表(最新值) |
| 4 | 基准报表(原始值) | 合并调整(更正前) | 调整前合并报表 | 如果有更正公告,则在更正公告发出后,修改基准报表相应的会计科目,修改前的记录标识为基准报表(原始值),修改后的记录标识为基准报表(最新值) |
7. 如何使用
为了说明如何正确使用数据,图3.7展示了几种常见的情况。
第一种情况如图3.7(a)所示, $x$ 年年报在 $t_1$ 日披露后没有发生调整和更正,此时只有1条数据即类型1。 $t_1$ 日后如果要使用该财报数据,则提取类型1即可。
第二种情况如图3.7(b)所示, $x$ 年年报在 $t_1$ 日首次披露,在 $t_2$ 日 $x + 1$ 年年报披露时顺便再一次披露了 $x$ 年年报(基准报表)。因此,若在 $t_1$ 日到 $t_2$ 日之间使用该财报数据,则应提取类型1;若在 $t_2$ 日后使用该数据,则提取类型2。
图3.7(c)展示了第三种情况,即除了常规的初始报表和基准报表,还发生了数据更正,且更正发生在基准报表之前[6]。在 $t_1$ 日披露 $x$ 年年报,此时记录为类型 1;在 $t_2$ 日对年报进行了更正,此时更正后的数据记为类型 1,更正前的数据记为类型 3;在 $t_3$ 日披露调整数据,此时记录为类型 2。因此,如果在 $t_1$ 日到 $t_2$ 日使用 $x$ 年年报,应提取类型 3;若在 $t_2$ 日到 $t_3$ 日之间使用该数据,则提取类型 1;若在 $t_3$ 日之后,提取类型 2 即可。

(c) 有调整且更正发生在调整前

(d) 有调整且更正发生在调整后

图3.7 调整和更正示例

最后一种情况见图3.7(d),即更正发生在基准报表之后。在 $t_1$ 日披露 $x$ 年年报,此时记为类型1;在 $t_2$ 日披露 $x$ 年年报基准报表,记为类型2; $t_3$ 日发出 $x$ 年年报更正公告,此时修改类型1和类型2为更正后的最新值,原来的数据分别记为类型3和类型4。因此,如果在 $t_1$ 日到 $t_2$ 日期间使用该年报,则应提取类型3;如果在 $t_2$ 日到 $t_3$ 日之间使用该数据,则提取类型4;在 $t_3$ 日之后提取类型2即可。
8. 单季度数据
每年12个月可以分为四个季度,每个季度包含三个月份,单季度数据对每个季度作单独衡量。由于资产负债表是一个时点数据,因此单季度数据和对应的报告期数据相同;对于利润表和现金流量表,一季度数据和一季报相同,其余三个季度数据等于对应报告期数据减去环比报告期数据。如果环比报告期缺失,则无法计算单季度数据,单季度数据为空。具体对应关系见表3.9,计算流程图见图3.8。
表3.9 单季度数据计算
| 季度 | 资产负债表 | 利润表 | 现金流量表 |
| 一季度 | 一季报 | 一季报 | 一季报 |
| 二季度 | 半年报 | 半年报减一季报 | 半年报减一季报 |
| 三季度 | 三季报 | 三季报减半年报 | 三季报减半年报 |
| 四季度 | 年报 | 年报减三季报 | 年报减三季报 |

图3.8 单季度数据计算流程图
9. TTM数据
TTM是Trailing Twelve Months首字母的缩写,即滚动12个月数据,以消除季节性差异使得横向可比,具体计算流程见图3.9。在计算过程中,值得一提的是对资产负债表科目的处理方法。由于资产负债表是时点数据,如果要计算其科目的TTM数据,那么有三种常见的算法:(1)当前最新数据;(2)最近四个报告期
平均值;(3)当前最新报告期和其同比报告期的平均值。对于利润表和现金流量表来说,如果最新报告期为年报,则TTM数据即为年报数据;如果是其他报告期,则TTM数据等于当前最新报告期数据,加上上年年报数据,再减去上年同比报告期数据;如果上年年报或同比报告期不存在,则可以使用年化算法,即当前最新报告期数据乘以年化系数(一季报、半年报和三季报的年化系数分别为4、2、4/3)。
3.1.4 因子构造流程
3.1.2节和3.1.3节介绍了股票量价数据和财务数据的常见处理方法。有了数据之后便可使用投资组合排序法构造因子,分析因子收益率等。在实际研究和使用因子时,往往需要处理以下几个问题:(1)如何确定股票池;(2)异常值处理;(3)投资组合排序法中分组的参数设定和调仓频率。本节回答上述问题并介绍本书中数据处理时采用的流程。

图3.9 TTM数据计算流程图
1. 是否剔除金融股
金融行业(银行、证券和保险等)的公司,由于经营模式和会计科目与普通企业存在较大差异,在实证分析时剔除这类公司已经成为学术研究的惯例。然而,本书实证分析部分如没有特别说明,将保留金融行业。这么做的原因有三个:(1)本文涉及的大部分因子具有普适性,不涉及特殊会计科目带来的行业差异;(2)本书的定位偏理论和实践结合,金融行业里面有不少优质公司,从投资的角度来看保留会更优;(3)学术界经典的Fama and French(1993, 2015)在探
过多因子模型时,并没有刻意剔除金融行业。
2. 剔除“黑名单”
在A股市场,有一些特定的股票财务质量太低、风险太高。从学术研究的角度,如果将它们纳入股票池,则可能会影响客观评价因子的收益率;从业界实践的角度,这些股票由于风险太高,往往无法通过风控要求从而被投资者摒弃。本书将这类股票列入“黑名单”。这些股票包括待退市股、风险警示股、净资产为负股及次新股。在本书的实证中,将从股票池中过滤掉黑名单上的股票。以下分别对风险警示股、净资产为负股及次新股进行简要说明。
1998年4月22日,沪深交易所宣布对财务状况(或其他状况)出现异常的股票交易进行特别处理(special treatment),即股票“被ST”。其中异常主要指两种情况:一是上市公司经审计两个会计年度的净利润均为负值;二是上市公司最近一个会计年度经审计的每股净资产低于股票面值。风险警示股往往会面临较多风险,包括暂停上市或退市风险、停牌导致流动性丧失、大涨大跌带来剧烈波动等。上市公司如果没有能力摘掉风险警示的帽子,就将暂停上市,直接面临退市风险。决定退市的股票在恢复交易后,往往会面临一连串的跌停,是一颗大地雷。这类股票需要被重点监控并回避。此外,在传统的学术研究里,净资产为负的股票往往也被剔除。年度报告中净资产为负还有可能被列入风险警示股票。因此,对于在最近报告期净资产为负的股票,本书会将其列入黑名单。最后,次新股即上市时间较短的股票,不同机构对其中“上市时间较短”的定义不一样,但通常不会超过一年。次新股由于具备高弹性、高波动、无套牢盘、无解禁压力以及有高送转等预期,容易受到资金的追捧,风险较高。本书将上市不足一年的股票定义为次新股。
3. 异常值
不同的指标值暗含了不同的信息,数值差异越大,表明信息差异越大。但需要警惕的是,指标只是股票某一个特征的代理变量,应有一个合理的分布区间。由于数据质量和计算方式等问题,可能会在计算指标时出现异常值,给后续研究带来干扰。表3.10显示了2019年5月28日A股市场上市公司的ROE(TTM)分布情况,其中最小值为-1227.85%,这与常识并不相符。进一步检查发现,株治集团(600961.SH)在2018年一季度至2019年一季度期间亏损过大且净资产太小,因而产生了异常值。
表3.10 2019年5月28日ROE(TTM)分布
| 股票数(支) | 均值 | 标准差 | 最小值 | 25%分位数 | 中位数 | 75%分位数 | 最大值 |
| 3365 | 4.16% | 34.53% | -1227.85% | 2.87% | 7.03% | 11.69% | 78.51% |
剔除异常值的方法包括缩尾法(winsorization)、均值标准差法、中位数法和 Boxplot法,其中缩尾法最简单也最常见。本书7.1.4节将简要介绍常见的剔除异常值方法。本书的实证中将采用左右各 $1\%$ 的缩尾处理,将小于 $1\%$ 分位数和大于 $99\%$ 分位数的样本点剔除。
3. 排序和分组
本章的因子实证分析将同时采用单变量排序和独立双重排序法。单变量排序将按某财务或量价指标的十分位数将股票分成10组,统计每个组合的股票特征和预期收益,并检验收益率的显著性。在独立双重排序时,使用市值和目标因子的变量对股票进行独立排序、各分成5组,然后将它们相交得到 $5 \times 5 = 25$ 个投资组合,并按照(2.6)计算因子收益率并检验。由于在双重排序中将市值作为一个默认的排序变量,因此这种方法对市值因子不适用。因此,对于规模因子,仅采用市值进行单变量排序。最后,无论单变量排序得到的10个投资组合,还是双重排序得到的25个投资组合,每个投资组合内股票或按等权重、或按总市值作为权重,计算投资组合的收益率。
4. 因子投资组合调仓频率
一般来说,对于量价类因子(如动量),调仓频率为月度;对于财务类型的因子(如盈利),调仓频率为年度。为了更快地利用因子信息,减少滞后带来的损耗,本书对每一个因子均在每月末进行换仓。为了尽量和实际一致,在调仓日剔除当天停牌股票和一字涨停股票,因为这些股票无法成交。
除此之外,本书将一字跌停股也列入不可交易股的范畴,原因如下。无论是单变量排序还是双重排序,划分出的每个投资组合本身都是多头组合。在构建多头组合时,规避一字跌停股票的原因是出于风控角度的考量。在构建因子投资组合时,需从上述划分出的组合中挑出一部分做多、一部分做空,即使用多、空对冲的组合作为因子和异象组合。因此,在做多时限制买入一字跌停股等价于在做空时限制卖出一字跌停股,这将使空头部分的收益率更符合实际情况。
最后,本书将投资组合再平衡时的交易成本设为0,即不考虑成本。通常来说,交易成本需要精确建模,或者粗略地估算为单边 $3 \text{‰}$ 计算。
5. 研究范围
本书的股票池范围是上海证券交易所主板,深圳证券交易所主板、中小板和创业板的所有股票,即除去科创板后的全部A股。在时间跨度上,起始日为2000年1月1日,结束日为2019年12月31日,整整20年。之所以选择从2000年开始,主要出于两个原因。首先,会计规则从1999年才开始成型和标准化,这样选择能尽量保证财务口径前后一致。其次,选择从2000年开始可以保证足够的样本数量,避免因股票数量太少导致统计误差。图3.10统计了研究区间在市股票数量,可以看到A股上市公司数量逐年增长,2000年年初只有925支,而2019年12月31日已经达到3692支。

图3.10 A股上市公司数量
3.1.5 实证设定
通过本节前面的介绍可知,无论是对于因子还是异象的研究,数据的选择和处理都格外重要。合理、科学的数据处理有助于得到客观的实证分析结果,而准确的表述更是有助于别人对结果进行检验及复现。表3.11给出了本书在实证分析时采用的设定。无论是本章对因子的实证,还是第5章对异象的解读,都将遵循此设定。
表3.11 本书在进行实证分析时采用的设定
| 项目 | 说明 |
| 数据来源 | Wind和Tushare |
| 收益计算 | 后复权收盘价 |
| 长期停牌股复牌首日收益率 | 压缩处理 |
| 缺失值处理 | 向前填充或者不填充 |
| 最少交易日 | 不少于计算窗口2/3的数据 |
| 财务数据处理 | 遵循point-in-time原则 |
| 股票范围 | 全部A股,不易除金融股 |
| 时间区间 | 2000年1月1日至2019年12月31日 |
| 黑名单 | 待退市股、净资产为负股、次新股和风险警示股 |
| 不可交易股 | 停牌股、一字涨停股、一字跌停股 |
| 异常值处理 | 缩尾法 |
| 单变量排序 | 按变量取值从小到大将股票分成10组 |
| 双重排序 | 独立双重排序,即分别使用两个变量各自将股票分为5组,然后交叉得到25个投资组合① |
| 投资组合内股票权重 | 等权重或按总市值加权 |
| 调仓频率 | 每月末 |
| 交易成本 | 设为0 |
①由2.1.3节的介绍可知,双重排序分为独立和条件双重排序两种。独立双重排序由两个变量分别对股票排序,再相交得到投资组合,因此也被形象地称为“交叉法”。Fama and French(1993)采用的就是这种方式。而
条件双重排序则先用第一排序变量划分,再在每个组里使用第二排序变量划分,因此也被形象地称为“分层法”。
[1]万得信息技术股份有限公司(Wind)是中国大陆领先的金融数据提供商、信息和软件服务企业。研究报告、学术论文等经常引用Wind数据。
[2]Tushare是一个免费、开源的Python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的数据。
[3]此处 $10\%$ 与 $-10\%$ 是涨跌幅限制的理论值。在实际操作中,当日交易价格的上下限的计算公式为:上一交易日收盘价 $\times$ ( $1\pm 10\%$ ),然后将计算结果四舍五入至0.01元。举例来说,假设某支股票前一个交易日的收盘价为17.85元,那么涨停板价格理论值为 $17.85\times 1.1 = 19.635$ ,实际值为四舍五入至19.64元;其跌停板价格理论值为 $17.85\times 0.9 = 16.065$ ,实际值为四舍五入至16.07元。由于四舍五入的原因,会最终导致实际的涨跌幅上下限细微的偏离 $10\%$ 和 $-10\%$ 的理论值。在上面的例子中,涨跌幅实际值分别为 $10.03\%$ 和 $-9.97\%$ 。在处理异常值时,需考虑四舍五入的影响。此外, $10\%$ 的涨跌停限制不适用于首日上市的证券;且“被ST”的股票的涨跌幅限制为 $5 \%$ 和 $-5 \%$
[4]A股上市公司从2002年开始披露季度资产负债表和利润表,从2003年开始披露季度现金流量表。
[5]财务报表是财务报告中的标准数据。除了四表一附注外,财务报告还包括董事报告、管理分析和财务情况说明书等非标准内容。
[6]还有一种极其特殊的情形,即更正公告和基准报表在同一日披露。这种情况比较少见,小差错往往在基准报告中就可以做修正调整,除非影响比较大。如股票600087.SH 2010年年报,初次披露日期为2011年3月4日;在2012年4月12日披露了2011年年报及2010年年报基准报表,且同一天也披露了2010年会计差错更正。这种情形在提取数据时,可以忽略掉会计更正记录,因为在新的基准报告中也会体现这种更正。
3.2 市场因子
3.2.1 市场因子起源
由第1章的论述可知,多因子模型源于资本资产定价模型CAPM。CAPM是仅包括市场因子的单因子模型。在多因子模型普及之前,CAPM是人们计算资产预期收益率的第一范式。下面就来看看市场因子。由式(1.1)可知,CAPM模型的数学表达式为:
$$ E \left[ R _ {i} \right] - R _ {f} = \beta_ {i} \left(E \left[ R _ {M} \right] - R _ {f}\right) \tag {3.1} $$
CAPM模型指出资产的预期超额收益与市场组合的预期超额收益成正比,比例 $\beta_{i}$ 系数代表着资产系统性风险。由于市场组合的预期超额收益在长期内为正,CAPM模型意味着人们所熟知的“高风险,高收益”。这一简单而有力的模型在20世纪60年代由Treynor(1961, 1962),Sharpe(1964),Lintner(1965a, 1965b)以及Mossin(1966)分别独立提出,但又以William Sharpe和John Lintner的版本最为知名[1],因此它也常被称作Sharpe-Lintner CAPM模型。这些学者从不同的方法出发,却都得到了同样的结论,CAPM的强大生命力由此可见一斑。
假设投资者使用收益率的均值和方差来刻画股票的回报与风险[2]。对于给定的预期收益水平,投资者总是可以找到一个组合使得组合风险最小。将这些组合连接起来形成一条曲线便构成最小方差前沿。进一步,假设投资者可以按照无风险利率水平自由地借贷。从无风险资产向最小方差前沿做切线,得到切点组合(tangency portfolio),该组合是所有组合中夏普比率最高的(可参考2.5.3节的说明)。理性投资者应根据自己的风险偏好组合无风险资产和该切点组合:对于风险偏好较高的投资者,可以借入资金加杠杆;而对于风险偏好较低的投资者,则可以将一部分资金投资该切点组合,另一部分资金则按照无风险利率借出。由于所有投资者都投资该切点组合,因而这个切点组合就是市场组合。
3.2.2 对CAPM的质疑
由于投资者可按无风险利率自由借贷这一条件往往过于严苛,使得CAPM模型受到了一些批判。Black(1972)和Black et al.(1972)的研究提出,即便放松了这一限制(即不存在无风险资产)也可以推导出另外一个版本的CAPM模型——Black CAPM模型。事实上,Black CAPM模型在市场因子之外又加入了第二个因子,因而是一个两因子模型:
$$ E \left[ R _ {i} \right] = \beta_ {i} E \left[ R _ {M} \right] + (1 - \beta_ {i}) E \left[ R _ {z} \right] \tag {3.2} $$
式中 $E[R_{z}]$ 是第二个因子的预期收益率。由于该因子的系数是 $(1 - \beta_{i})$ ,因而Black et al.(1972)将该因子称为零 $\beta$ 因子,其收益率 $R_{z}$ 和市场组合的收益率 $R_{M}$ 满足协方差为零,即 $\operatorname{cov}(R_{z}, R_{M}) = 0$ 。观察式(3.1)可知,如果考察资产超额收益 $E[R_{i}] - R_{f}$ 和其 $\beta_{i}$ 的关系,则Sharpe-Lintner CAPM模型暗示这二者关系之间的斜率为市场组合的预期超额收益 $E[R_{M}] - R_{f}$ 。反观两因子的Black CAPM模型,随着 $(1 - \beta_{i}) E[R_{z}]$ 这一项的加入且这一项的收益率和资产的 $\beta_{i}$ 成反比,式(3.2)隐含的资产预期收益 $E[R_{i}]$ 和 $\beta_{i}$ 之间的关系相比传统CAPM模型则更加平坦,而这也恰恰更符合实证数据的结果。
由于更加符合实证数据的结果,Black CAPM得到了比Sharpe-Lintner CAPM更广泛的应用,也拉开了关于CAPM的研究序幕。诸多学者从不同角度对CAPM模型进行了大量的实证分析,主要目的是检验CAPM模型隐含的资产预期收益与其 $\beta$ 之间的关系。学者们将这二者之间的关系提炼为三个待检验的假说:(1)仅依据 $\beta$ ,便可解释资产的预期收益的截面差异,且二者之间的关系是线性的。(2)市场组合的超额收益显著为正。(3)如果资产和市场组合不相关(即 $\beta$ 为零),则其预期收益率应为无风险利率,其超额收益为0。为了检验这些假说,截面回归和时间序列回归检验方法被应用于此类检验[3]。但颇为遗憾的是,实证研究大都不支持传统的CAPM模型。其中较为重要的发现有两点。其一,市场组合的平均超额收益很高,但高、低 $\beta$ 组合之间的收益差异要小很多,远远小于CAPM模型隐含的差异,这和Black CAPM模型的结果相符。其二,诸多研究分别发现按照市值、账面市值比(book-to-market ratio,BM)、盈利市值比(earnings-to-price ratio,EP)等变量有助于解释股票预期收益,这也进一步拒绝了CAPM模型。当然,从学科发展的角度来说,CAPM模型被实证证据拒绝也并非坏事,毕竟,正因如此才有了多因子模型和因子投资的兴起。Fama and French(2004)对此进行了很深入的综述和介绍。
总体来看,市场因子对于解释股票收益的时间序列变化很有帮助,是很重要的因子。但诸多证据也显示单凭市场因子不能很好地解释股票收益的横截面差异,这使得引入其他因子、构建多因子模型成为必要的选项。此外,实证研究发现资产预期收益和 $\beta$ 之间的斜率远小于CAPM模型隐含的结果,而更加符合Black CAPM模型。该结果也催生了一大类很重要的异象,即低 $\beta$ 异象——通过做多低 $\beta$ 的股票、同时做空高 $\beta$ 的股票来获取超额收益。Frazzini and Pedersen(2014)以Betting against beta为题详细讨论和实证了这个异象。该文一经发表就获得了学术界和业界的高度关注。
3.2.3 市场因子实证
由于市场因子并非传统风格因子,因而无须构建多、空对冲的因子模拟组合来检验它。本书在构建市场因子时,选用所有股票按照总市值加权的方式,以此得到的投资组合就是市场因子的投资组合。本节的实证重点则在于以下两点:
(1)检验市场组合的超额收益对个股超额收益在时序上的波动的解释程度;
(2) 检验CAPM。
对于第一点,首先使用每支个股的全部超额收益率数据和市场组合同期的超额收益率数据[4],通过时序回归并求出可决系数(coefficient of determination),即 $R_{2}$ ,它的高低代表了市场因子在时序上解释个股超额收益的能力。表3.12和图
3.11分别给出了 $R_{2}$ 的描述性统计和分布。对于A股整体而言,以市场因子为解释变量的 $R_{2}$ 均值和中位数不相上下,其中均值为 $29.09\%$ 、中位数为 $30.52\%$ ; $25\%$ 和 $75\%$ 分位数分别为 $19.83\%$ 和 $28.58\%$ 。上述结果说明市场因子能够在一定程度上解释个股收益率的时序波动。
表3.12 $R2$ 的描述性统计
| 均值 | 标准差 | 最小值 | 25% 分位数 | 中位数 | 75% 分位数 | 最大值 |
| 29.09% | 13.85% | 0.00% | 19.83% | 30.52% | 38.58% | 85.25% |

图3.11 时序回归R2分布
接下来检验CAPM。为此,在t月末,采用过去252个交易日中个股超额收益和市场组合超额收益,通过时序回归计算出个股的市场β,并依照β大小把所有股票分成10档,记为Low(低β组)、2、……、9以及High(高β组)。在剔除黑名单和异常值后,市场β的数据覆盖度如图3.12所示。表3.13给出了这10个投资组合在实证期内的平均市场β值。如果CAPM成立,那么这10档的预期收益应该和每组的β正相关,即低β组预期收益更低,而高β组预期收益更高。然而,实证结果却并非如此。

图3.12 剔除黑名单、异常值后市场 $\beta$ 数据覆盖度
图3.13给出了等权重和市值加权下,这10个投资组合的月均收益率。从图中不难看出,它们并非随着 $\beta$ 的提高而增加。等权重时,这10个组合的收益率和它们的 $\beta$ 的秩相关系数为-0.394( $p$ -值为0.26),并没有表现出显著的单调性。而当采用市值加权时,秩相关系数为-0.745( $p$ -值为0.013),说明了收益率和 $\beta$ 之间的显著的负相关性,这无疑和传统的CAPM相悖,而更加符合Black CAPM模型。
表3.13 10个投资组合的市场 $\beta$ (实证期内时间平均)
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High |
| 0.73 | 0.92 | 1.01 | 1.07 | 1.13 | 1.18 | 1.23 | 1.29 | 1.36 | 1.48 |


图3.13 检验CAPM
CAPM被A股的数据拒绝并不令人意外,也可以由此引申出两个思考。第一,市场因子本身无法有效地解释股票预期收益率的截面差异,因此需要在CAPM模型的基础上加入其他风格因子,找到适合A股市场的多因子模型。第二,高 $\beta$ 并没有带来高收益,反倒是低 $\beta$ 带来了高收益,这表明A股市场中也可能存在著名的低 $\beta$ 异象。
[1]颇有意思的是,在提出CAPM之后,Lintner将他自己的模型和当时已经发表的Sharpe的模型进行了比较,并指出他们的模型并不相同,而且他自己的模型适用性更强。在一段时间内,Sharpe似乎被说服了,并承认Lintner的模型确实优于自己的(Sharpe 1966b)。然而Fama(1968)指出二者的CAPM模型是等价的。
[2]这一假定沿袭自Markowitz(1952),即投资者根据均值—方差优化方法进行投资组合选择。Markowitz的这一经典研究建立了现代投资组合管理理论,也打开了现代金融学的大门。
[3]横截面回归方法的早期代表性研究包括Blume(1970)、Blume and Friend(1973)和Black et al.(1972),他们用组合作为测试资产来提升 $\beta$ 的估计精度,而Fama and MacBeth(1973)的方法则是实证资产定价研究中最为常用的方法之一,2.2.4节对此有详细的讨论。时间序列回归方法的典型代表则是Jensen(1968),通过将资产超额收益序列对市场组合超额收益序列进行回归,得到与市场因子无关的 $\alpha$ ,并通过 $\alpha$ 的显著性来检验模型是否正确反映了资产的预期收益,这也为后来的GRS检验等提供了坚实的基础。
[4]在计算超额收益时,无风险收益率参考锐思数据的计算方式,即2002年8月6日之前使用三个月期定期银行存款利率、2002年8月7日至2006年10月7日使用三个月期中央银行票据的票面利率、2006年10月8日之后使用上海银行间三个月同业拆放利率。
3.3 规模因子
3.3.1 规模因子起源
规模效应(Size)的含义简单清晰,即小市值股票有着比大市值股票更好的表现,而反映这一现象的规模因子则因为著名的Fama and French(1993)三因子模型而家喻户晓。该模型中的SMB(Small-Minus-Big)因子正是规模因子。规模因子的历史要追溯到1981年。Banz(1981)基于纽约证券交易所(NYSE)长达40年的数据发现,按照市值将股票分为5组后,市值最小的一组股票月均收益率比其他股票高 $0.4\%$ ,差异非常显著。不仅如此,规模效应并非线性的,而是对于市值最小的企业最为显著。规模效应背后的原因可以归结于投资者对小盘股的普遍规避:由于难以获取准确的信息,投资者普遍不愿意持有小市值股票,使得这些股票的价格低于规模较大的股票,因而有着较高的预期收益。
自Banz(1981)以来,规模效应吸引了不少美国学者的注意,诸多研究都发现了支持美股市场存在规模效应的证据[1]。Lamoureux and Sanger(1989)更是指出,在纳斯达克交易所上市的公司中,规模效应异常显著。在这些研究中,规模因子溢价的估计都超过了每月 $1.50\%$ ,因此无论在经济上还是统计上都高度显著,但由于样本普遍较少,因而上述结论并不稳健。在诸多研究中,关于规模效应研究最为重要的研究还是要数Fama and French(1993)。这篇经典论文在仔细研究了包括规模、账面市值比(BM)和盈利市值比(EP)一系列可能影响股票和债券收益的因素后,指出规模因子溢价平均为 $0.63\%$ 。该结果虽然小于前述研究,但同样高度显著。Fama and French(1993)在此基础上进一步提出了包括规模因子在内的Fama-French三因子模型,并指出该模型能够比经典的CAPM模型更好地解释股票预期收益的截面差异。在此之后美国市场和国际市场关于规模效应的实证研究便如雨后春笋一般涌现。其中,最重要的国际市场的实证证据来自Fama and French(2012)。
除海外市场外,中国市场也吸引了不少学者的注意。过去数年间,中国市场的规模效应也是众所周知的;在2016年之前,其显著性甚至远超欧美发达国家市场。在相关研究中,很有代表性的一项当属Liu et al.(2019)。这篇文章基于2000年至2016年的数据发现A股市场存在非常显著的规模效应。但值得注意的是,A股市场特殊的IPO制度和投资者群体使得微型股的壳价值长期畸高,从而扭曲了规模溢价。为了正确估计规模溢价,上述研究剔除了市值最小的30%股票,并发现在剔除微小市值股票后,规模效应仍然高度显著。但颇为有趣的是,该文的发现在样本外的表现却和样本内大相径庭。2017至2018年,大市值白马股的表现远远优于小盘股,这使得A股的规模效应被极大地稀释。近年参与A股投资的读者一定会有切身的感受。
3.3.2 规模因子成因
关于规模因子,最自然的解释来自风险补偿说。Chan and Chen(1991)认为,小市值公司普遍在过去遭遇过困境使得市值大幅下滑,即所谓“坠落的天使”(fallen angels)。Fama and French(1995, 1996)进一步指出规模效应可能与小市值股票更大的财务困境风险(financial distress risk)有关。但也并非所有人都对此解释信服。例如,Campbell et al.(2008)基于美股的研究发现,有着更高破产概率的公司确实对规模因子有更大的暴露,但它们并没有更高的预期收益。除此之外,另一种解释认为非流动性是一个定价因子[2],而规模与非流动性相关,并因此呈现出规模效应。但这一解释也并不完美,因为非流动性因子本身仅能解释收益差异的一小部分。除风险补偿外,投资者行为也是一种潜在的解释。机构投资者往往更偏好流动性好的大市值股票,而小盘股由于缺乏知名度,因而缺少投资者基础,这使得小盘股不得不提供更高的预期收益来吸引投资者(见Gompers and Metrick 2001和Daniel et al.2001)。也有研究认为,规模效应可归因于退市偏差、少数股票的极端收益和季节效应。
另一些研究则认为,规模效应可能源自模型设定偏误,是遗漏变量问题的自然结果。Berk(1995)认为,如果定价模型形式设定有误,则公司规模将总是与股票收益中未被解释的部分负相关。举个简单的例子,假设两家公司A和B有相同的期末现金流,但其中公司A的现金流风险更大。自然地,公司A的股价将低于公司B,即其市值更小。但二者的内在价值实际上是相同的,公司A的预期收益也将更高。这便是典型的遗漏变量问题。总体来看,早期实证证据普遍支持股票市场中存在显著的规模效应,而新近的研究则表明,随着投资者熟知规模效应,规模因子表现也趋于平庸,甚至其长期超额收益逐渐变得不再显著。人们在美国、欧洲和中国市场均观察到类似的现象。
3.3.3 规模因子实证
实证中采用总市值(股票收盘价乘以总股本)为排序变量构建规模因子。在剔除了黑名单及异常数据之后,总市值变量的数据覆盖度如图3.14所示。
每月末将股票按照总市值从低到高分成10组。这10组分别记为Small(市值最小的组)、2、……、9以及Big组(市值最大的组)。表3.14汇报了这10个投资组合在整个实证期内的描述性统计。考察并汇报不同组合的描述性统计是学术界的惯例,其目的是在研究目标因子之前定量分析不同组合在常见的特征指标上是否存在差异,以及差异是否会对因子收益率造成影响。对于每个特征指标,首先计算每期每个组合内所有股票在该指标上的均值,然后将全部T期的均值在时序上取平均,并汇报最终的均值。本章实证中考虑的特征指标包括总市值、市场β、持仓股票的平均年化波动率、市净率(P/B)以及总资产收益率(ROA)。在本章余下的实证中,也会汇报使用其他排序变量划分得到的投资组合的描述性统计。

图3.14 剔除黑名单、异常值后市值数据覆盖度
表3.14 总市值分组得到的10个投资组合的描述性统计
| Small | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Big | |
| 总市值(亿元) | 16.18 | 21.18 | 25.91 | 31.19 | 37.48 | 45.62 | 57.64 | 77.47 | 119.44 | 348.74 |
| 市场β | 1.18 | 1.18 | 1.17 | 1.16 | 1.15 | 1.15 | 1.14 | 1.12 | 1.10 | 1.06 |
| 年化波动率 | 47.2% | 47.1% | 46.9% | 46.5% | 46.4% | 46.1% | 45.7% | 45.1% | 44.2% | 41.9% |
| P/B | 5.61 | 5.80 | 6.20 | 5.57 | 5.28 | 4.71 | 4.83 | 4.58 | 4.71 | 4.88 |
| ROA | 1.39% | 2.36% | 2.52% | 3.15% | 3.40% | 3.91% | 4.74% | 5.07% | 5.81% | 6.62% |
观察表3.14中的数据不难发现,这10组的ROA随市值单调递增,即大市值的公司往往盈利能力更强。这个结论和美股一致。比如,Penman and Reggiani(2018)指出美股中ROE和市值呈正相关(第3.6节讨论盈利因子时将会进一步讨论)。除了ROA之外,其他几个指标在这10组中的取值并无显著差异。
表3.15给出了以总市值为变量的排序检验结果(由于是研究规模因子本身,因此本节不涉及双重排序),包括不同投资组合的月均收益率以及其 $t$ -值(Panel A为等权重、Panel B为市值加权)。无论是哪种权重方式,小市值效应在A股上都十分显著,投资组合的收益率随着市值的增加而下降。无论是等权重还是市值加权,以总市值排序得到的10个投资组合的月均收益率和每组总市值的秩相关系数均为-0.976( $p$ -值 $1.46 \times 10^{-6}$ ),呈现出显著的负相关性。
表3.15 市值单变量排序月均收益率(%)
| Panel A: 等权重 | ||||||||||
| Small | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Big | Small-Big |
| 2.35 | 1.81 | 1.52 | 1.36 | 1.21 | 1.16 | 0.96 | 1.02 | 0.90 | 0.94 | 1.41 |
| (3.02) | (2.33) | (2.04) | (1.84) | (1.65) | (1.58) | (1.34) | (1.50) | (1.33) | (1.41) | (3.11) |
| Panel B: 市值加权 | ||||||||||
| Small | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | Small-Big |
| 2.34 | 1.81 | 1.52 | 1.36 | 1.21 | 1.15 | 0.97 | 1.01 | 0.90 | 0.94 | 1.40 |
| (2.99) | (2.33) | (2.04) | (1.84) | (1.65) | (1.58) | (1.36) | (1.48) | (1.34) | (1.41) | (2.90) |
括号内为经Newey-West调整的 $t$ -值。
接下来看因子收益率。当采用等权重时,由做多小市值Small组、做空大市值Big组(即Small-Big组合)构造的规模因子的月均收益率为 $1.41\%$ ( $t$ -值为3.11);当采用市值加权时,规模因子的月均收益率为 $1.40\%$ ( $t$ -值为2.90)。由于这二者的 $t$ -值均高于0.01显著性水平对应的阈值2.6,因此可安全地在该显著性水平下拒绝原假设[3]。(对于书中的实证分析结果,0.05和0.01显著性水平对应的 $t$ -值阈值为别约为2.0和2.6。在后文汇报实证结果时,由于 $t$ -值大小可以清晰地传递出结果是否显著,因此将不再特意强调在某个显著性水平下接受或拒绝原假设。)
图3.15和图3.16给出了等权重和市值加权下,规模因子的多、空两头各自的累计收益率曲线(Panel A),以及因子投资组合(即多空对冲组合,Panel B)的累计收益率曲线。以图3.15为例,由Panel A的曲线可知,做多小市值的股票在A股上能够获得非常丰富的回报。但必须说明的是,上述结果并没有考虑任何交易费用或滑点,仅是从实证资产定价角度研究因子的纸面收益率[4]。除此之外,高收益也常常伴随着高波动。在等权重下,规模因子的多、空投资组合的年化波动率分别为 $37.3\%$ 和 $29.1\%$ 。此外,正如所有因子都有周期性,小市值效应虽然曾经辉煌,但从2017年开始却无情地被大市值股票“打脸”。随着A股市场变得更加有效以及价值投资理念的逐渐回归,大市值的蓝筹优质股自2017年开始走出了一波上涨行情,收益率远高于小市值股票,使得规模因子惨遭大幅回撤。当采用市值加权时(图3.16),规模因子的表现和等权重时十分接近,不再赘述。


图3.15 规模因子累计收益率(等权重)

Panel A:市值最大组和市值最小组(市值加权)

Panel B:市值多空组合(市值加权)
图3.16 规模因子累计收益率(市值加权)
[1]感兴趣的读者可参见Reinganum(1981)、Schwert(1983)和Keim(1983)等。
[2]即流动性差的股票比流动性好的股票有更高的预期收益率。
[3]原假设为因子预期收益率为零。
[4]纸面收益率指的是学术论文中计算的因子收益率,该收益率通常不考虑任何交易成本。
3.4 价值因子
3.4.1 价值因子起源
价值因子的含义简单而明确:相比估值较高的股票,那些估值较低的股票有着更高的预期收益率。与规模因子一样,关于价值因子的研究也起自20世纪80年代,并由Fama and French(1993)这篇雄文发扬光大,而以账面市值比(BM)为变量构建的价值因子也正式确立为系统性的因子。
关于价值因子,Stattman(1980)是最早的相关研究之一,它发现BM较高的公司,股票预期收益也显著更高[1]。除BM之外,其他一些估值指标也被拿来研究和股票预期收益率之间的关系。Basu(1983)指出盈利市值比(EP)有助于解释股票收益,而Jaffe et al.(1989)基于1951至1986年间的长期数据进一步研究确认EP对股票未来收益有显著的正面影响。Bhandari(1988)则发现杠杆率[2]较高的企业有着显著的超额收益。而作为集大成者,Fama and French(1992)的结论稍有不同,他们基于排序法和Fama-MacBeth回归方法的研究指出,单独来看BM和EP都有显著为正的风险溢价,但当同时控制它们和规模后EP不再显著,表明EP的风险溢价可能只是其同规模和BM的相关性带来的虚假效应。Fama and French(1995)提供了支持BM同股票未来收益相关的进一步证据,发现较高的BM预示着持续较差的盈利表现,而较低的BM则预示着持续较好的未来盈利。Fama and French(1992)基于可比性等原则剔除了金融企业,但Barber and Lyon(1997)的研究发现同样的关系对金融企业也成立。除了解释股票预期收益的截面差异,Pontiffand Schall(1998)的研究表明BM也有助于预测市场指数(如标普500指数和道琼斯工业指数[3])的未来收益率。
价值因子在其他市场的实证证据也非常丰富。Chan et al.(1991,1993)和 Daniel et al.(2001)发现日本股市存在显著的价值效应,以BM为代表的价值变量对股票收益有显著的预测能力。Charitou and Constantinidi(2003)和Clubb and Naffi(2007)则提供了BM在英国市场显著的证据,后者更是指出,除了当期 BM,预期BM也对英国市场的股票收益有显著的解释力。此外,Aras and Yilmaz(2008)和Cakici et al.(2013)分别检验了12和18个新兴市场并发现了显著的价值效应。当然,实证资产定价研究中的“扛把子”Eugene Fama和他的搭档 Kenneth French也不会缺席这个重要主题。他们的两项研究Fama and French(2012, 2017)表明在北美、欧洲和亚太地区都存在显著的价值效应,且在日本之外的区域,价值效应随着股票市值增大而变弱。Asness et al.(2013)则更进一步,研究了8个不同的国家和股票、债券、商品及外汇等不同资产,并指出在不同国家、不同资产中广泛而持久地存在显著的价值效应。最后,也有不少研究[4]提供了价值因子存在于A股市场的证据。
3.4.2 价值因子成因
关于价值因子的成因,也可以分为系统性风险补偿和投资者行为偏差两类。前者中最为人熟知的一类解释大概是财务困境风险假说。Griffin and Lemmon(2002)发现在财务困境风险较高的企业中,高、低BM股票组合的收益差异是在其他股票中的两倍,表明价值因子可能与财务困境风险有关,即高BM很可能反映着更高的财务困境风险[5]。Peterkort and Nielsen(2005)也确认了BM应该代表着某种系统性财务风险,发现在没有负债的企业中BM对股票未来收益没有显著影响;而在净资产为负的企业中,BM对股票收益的影响反而是负的。Zhang(2005)则认为企业在不景气时期难以削减在位资产(assets in place),使得在位资产的风险大于增长期权(growth option),因而高BM企业需要更高的回报。而Hahn and Lee(2006)则认为BM反映了与商业周期有关的风险:高BM企业对期限利差(term spread)有着更大的暴露,因此获得更高的预期收益。此外,Lewellen(1999)通过假设Fama-French三因子模型中的因子暴露为BM的线性函数,将BM的预测能力分解为与风险相关和与风险无关的两个部分,并指出风险是其解释力的重要来源之一。Obreja(2013)的新近研究将价值因子溢价归因于企业的经营杠杆。除上述发现外,Cochrane(2017)总结了一些从宏观经济角度研究价值因子的文献。
在使用行为金融学解释价值因子方面,Lakonishok et al.(1994)无疑是最重要的研究之一。这篇经典研究认为投资者倾向于将过去的表现简单外推来评估企业前景,从而会对过去盈利不佳的企业过度悲观,这便导致了价值效应。Ali et al.(2003)发现BM在面临更大套利限制(例如特异性波动率和交易费用更高,投资者群体更不专业)的股票中表现更为显著。Daniel and Titman(2006)发现,由于相对于无形信息(intangible information),投资者只给予了有形信息(tangible information)过少的关注,因而股票未来收益同其无形收益(intangible return)[6]高度负相关,而BM刚好能较好地预测无形收益,从而对股票未来收益有显著的预测能力。Jiang(2010)则进一步指出,机构投资者倾向于买入有正面无形信息的股票,使得无形收益的均值回复在有更多机构投资者的股票中更加显著,因而BM也在这类股票中表现更好。Chan et al.(2001)和Daniel et al.(2001)也利用与Daniel and Titman(2006)类似的研究方法发现研发费用对BM的表现有显著影响。
虽然价值因子历史悠久,且诸多证据支持价值因子溢价在长期内非常显著,但价值因子近年来还是遭遇到不少挑战。例如,在Fama and French(2015)提出五因子模型时,两位作者承认盈利和投资两因子的加入使得价值因子变得冗余。此外,价值因子自2008年以来的后金融危机时代表现并不好,与同期不断创下历史新高的股指相比更是相形见绌,因而饱受质疑。由于价值因子在最近十年的惨淡表现,有很多学者试图从金融学和会计学原理出发,通过改造BM来提升价值因子的表现,并取得了一些不错的成果。Liu et al.(2019)对这些改进后的BM变量进行了综述,并在A股上进行了实证研究。
3.4.3 价值因子实证
尽管越来越多的新近研究质疑以BM构建的价值因子在近年来的效果,并提出了其他的替代物(例如Liu et al.2019主张使用EP代替BM,并通过前者在A股市场
中构造了价值因子),但其悠久的历史和大量的研究成果仍然使BM成为构造价值因子时的首选变量。本书延续学术界的传统,使用BM进行A股市场的价值因子实证分析。在计算BM时,分子为归股东权益合计(不含少数股东权益),分母为总市值。在实证期内,在剔除黑名单及异常数据之后,BM变量的数据覆盖度如图3.17所示。

图3.17 剔除黑名单、异常值后BM变量的数据覆盖度
以BM作为排序变量,每月末将股票按照BM取值从低到高分成10组,记为Low、2、……、9以及High组。表3.16展示了这10个投资组合在整个实证期内的描述性统计。观察表中的数据不难发现,这10组的市值呈现倒U形,即无论是低BM组(Low)还是高BM组(High)的平均市值较其他组都更高。此外,按照BM从小到大划分的10个投资组合的平均ROA呈现出单调递减的趋势,即低BM组的ROA更高、而高BM组的ROA最低。
表3.16 BM分组得到的10个投资组合的描述性统计
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | |
| BM | 0.12 | 0.19 | 0.23 | 0.27 | 0.32 | 0.36 | 0.41 | 0.48 | 0.56 | 0.74 |
| 总市值(亿元) | 107.63 | 83.89 | 83.55 | 83.39 | 85.88 | 88.71 | 97.06 | 109.04 | 138.89 | 232.41 |
| 市场β | 1.06 | 1.13 | 1.14 | 1.15 | 1.16 | 1.16 | 1.16 | 1.16 | 1.15 | 1.12 |
| 年化波动率 | 49.5% | 49.1% | 48.0% | 47.1% | 46.4% | 45.5% | 44.7% | 43.9% | 42.7% | 40.2% |
| P/B | 10.13 | 6.22 | 4.95 | 4.17 | 3.61 | 3.15 | 2.76 | 2.40 | 2.02 | 1.55 |
| ROA | 5.59% | 4.94% | 4.47% | 4.11% | 3.91% | 3.72% | 3.51% | 3.14% | 2.74% | 2.20% |
表3.17 BM单变量排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 0.70 | 1.04 | 1.07 | 1.30 | 1.36 | 1.50 | 1.58 | 1.63 | 1.59 | 1.68 | 0.99 |
| (1.02) | (1.49) | (1.54) | (1.82) | (1.89) | (2.09) | (2.14) | (2.21) | (2.13) | (2.26) | (3.08) |
| Panel B: 市值加权 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 0.57 | 0.53 | 0.57 | 0.72 | 0.94 | 0.90 | 1.08 | 1.32 | 1.21 | 1.44 | 0.88 |
| (0.87) | (0.79) | (0.89) | (1.08) | (1.38) | (1.51) | (1.61) | (1.89) | (1.70) | (2.05) | (2.09) |
括号内为经Newey-West调整的t-值。
表3.17总结了以BM单变量排序的检验结果,表中汇报了不同投资组合的月均收益率以及该收益率的 $t$ -值。无论是采用等权重(Panel A),还是以市值为权重(Panel B)构建这些投资组合,它们的收益率均呈现出了较好的单调性。当使用等权重时,以BM排序得到的10个投资组合的月均收益率和每组平均BM的秩相关系数高达0.988( $p$ -值为 $9.31 \times 10^{-8}$ );当采用市值加权时,秩相关系数为0.939( $p$ -值为 $5.48 \times 10^{-5}$ )。接下来看由做多高BM组、做空低BM组(即High-Low组合)构成的价值因子的收益率。当采用等权重时,价值因子的月均收益率为 $0.99\%$ ( $t$ -值为3.08);当采用市值加权时,价值因子的月均收益率为 $0.88\%$ ( $t$ -值为2.09)。由于等权重相对市值加权来说,在小市值上有额外的暴露,因此等权重时价值因子的月均收益率高于市值加权时的结果也就不足为奇了。
表3.18给出了使用BM和市值进行双重排序的检验结果;双重排序可以降低市值对BM的影响。无论采用等权重(Panel A)还是市值加权(Panel B),都可以从结果中观察到相同的结论。以等权重为例,表3.18的Panel A中的行Small、2、3、4以及Large为使用市值从小到大分成的五档;列Low、2、3、4以及High为通过BM从小到大划分的五档;最后一行平均则是五个市值档的简单平均。从结果中不难看出,在按市值划分得到的每一个档内,BM均有较好的区分度和单调性。此外,每档的High-Low投资组合的月均收益率的显著性随着市值的增加而降低:在Small档内,做多高BM、做空低BM的High-Low组合的月均收益率的t-值高达4.76,而在Large档内,High-Low组合的月均收益率不再显著(t-值仅为1.22)。虽然五组平均来看,最终的价值因子的月均收益率为 $0.69\%$ (t-值为2.89),仍然非常显著,但是High-Low组合月均收益率的显著性随市值增大而降低的结果无疑表明了,BM在大市值的股票中解释股票预期收益率截面差异的能力较差,该结论在等权重和市值加权下均成立。最后,图3.18和图3.19绘制了等权重和市值加权下,使用市值和BM双重排序构建的价值因子的累计收益率曲线(以及多、空头各自的累计收益率曲线)。
表3.18 BM和市值独立双重排序月均收益率(%)
Panel A:等权重
| Low | 2 | 3 | 4 | High | High-Low | |
| Small | 1.42(1.81) | 2.02(2.60) | 2.27(2.94) | 2.24(2.87) | 2.35(3.03) | 0.93(4.76) |
| 2 | 0.92(1.27) | 1.16(1.57) | 1.52(2.02) | 1.74(2.31) | 1.74(2.32) | 0.82(3.38) |
| 3 | 0.90(1.20) | 1.08(1.51) | 1.08(1.51) | 1.36(1.81) | 1.45(1.91) | 0.56(2.12) |
| 4 | 0.69(1.02) | 0.84(1.24) | 0.98(1.37) | 1.24(1.65) | 1.36(1.79) | 0.68(2.07) |
| Large | 0.76(1.15) | 0.61(0.90) | 0.95(1.34) | 1.13(1.59) | 1.21(1.70) | 0.45(1.22) |
| 平均 | 0.94(1.34) | 1.14(1.63) | 1.36(1.90) | 1.54(2.10) | 1.62(2.20) | 0.69(2.89) |
| Small | 1.32(1.69) | 1.98(2.55) | 2.21(2.87) | 2.20(2.82) | 2.32(2.99) | 1.00(4.98) |
| 2 | 0.91(1.24) | 1.15(1.56) | 1.51(2.01) | 1.74(2.30) | 1.73(2.31) | 0.82(3.39) |
| 3 | 0.91(1.21) | 1.08(1.51) | 1.07(1.49) | 1.35(1.78) | 1.44(1.89) | 0.53(2.01) |
| 4 | 0.69(1.03) | 0.85(1.26) | 0.96(1.35) | 1.26(1.67) | 1.36(1.79) | 0.66(2.04) |
| Large | 0.62(0.96) | 0.51(0.76) | 0.87(1.24) | 1.22(1.70) | 1.30(1.81) | 0.68(1.78) |
| 平均 | 0.89(1.28) | 1.11(1.60) | 1.32(1.86) | 1.55(2.11) | 1.63(2.22) | 0.74(3.11) |
括号内为经Newey-West调整的 $t$ -值。



图3.18 双重排序构建的价值因子累计收益率(等权重)

图3.19 双重排序构建的价值因子累计收益率(市值加权)
2019年,Liu et al.(2019)因为其是首个在金融学顶刊上发表的针对中国A股市场的多因子模型而备受关注。该文的两个特点是:(1)出于对A股市场壳价值污染的考虑,剔除了市值最低的 $30\%$ 的股票;(2)使用EP取代BM构建了价值因子。由本节的实证结果可知,BM在小市值中的作用要远远高于在大市值中的作用。因此剔除市值最低的 $30\%$ 的股票无疑会进一步削弱BM的显著性。另一方面,从接下来3.6节关于盈利因子的实证可以看到,在A股中使用ROE为变量构建的盈利因子在小市值中的表现显著弱于其在大市值中的表现,因此剔除市值最低的 $30\%$ 的股票则在“无形中”提升了盈利因子的表现。最后,最为关键的是,由简单的会计学关系可知 $\mathrm{EP} = \mathrm{BM} \times \mathrm{ROE}$ 。所以,市值最低的 $30\%$ 的股票被剔除实则在削弱BM的同时,提升了EP的效果!此消彼长,以EP构建价值因子“优于”以BM构建价值因子也就顺理成章了,然而这完全仅是实证数据展示出的现象。虽然壳污染问题在A股臭名昭著,但以 $30\%$ 为界一刀切是否合理?且在这个基础上,仅凭实证结果的好坏差异就选择EP取代BM也缺乏金融学依据,无法令人信服。Liu et al.(2019)通过详尽的统计检验分析了EP和BM在A股上的差异,并指出无论是否剔除 $30\%$ 最低市值的股票,以EP代替BM都难言合理。本书第4.3节将对此进行探讨。
[1]Rosenberg et al.(1985)也有类似的发现。
[2]该文研究的是负债权益比率(debt-equity ratio),而由于总资产=总负债+权益,因此负债权益比率同资产负债率本质上是一样的(1/资产负债率=1/负债权益比率+1),都反映企业的经营杠杆。
[3]道琼斯工业指数全称为道琼斯工业平均指数(Dow Jones Industrial Average),由道琼斯指数公司(现标普道琼斯指数有限公司)开发并维护。该指数是以价格平均数计算美国30家蓝筹公司的股价平均指数。该指数涵盖了除运输业和公用事业各个行业。
[4]参见Wang and Di Iorio(2007)、Gan et al.(2013)、Hu et al.(2019)、Liu et al.(2019)和Liu et al.
(2019)等研究。
[5]更多研究参见Chan and Chen(1991)和Fama and French(1993)。
[6]此处无形收益并非指无形资产带来的收益,而是指在企业过去一段时间的收益中,与基于会计指标推算得到的结果不相关的那一部分。无形收益的一个典型例子是由增长期权价值上升导致的更好表现。
[7]在本书2.1.2节介绍单变量排序法时,同样使用BM为变量进行了举例,并在表2.2中汇报了市值加权时10组检验结果。与表3.17的Panel B相对比,每组的月均收益率在两个表中是一致的,但其 $t$ -值在两个表中却有差异。这其中的原因是此处汇报的是经Newey-West调整后的 $t$ -值。这个例子也说明在检验中考虑随机扰动的自相关和异方差性的重要性。
3.5 动量因子
3.5.1 动量因子起源
动量因子——严谨地说,截面动量因子——是一个颇受争议的因子。实证资产定价领域的代表人物Eugene Fama一贯旗帜鲜明地反对将动量视作一个系统性因子[1]。但另一方面,该因子又实实在在地存在于不同国家及不同大类资产中。其受关注的程度大概只有前面介绍的规模和价值因子能与之相提并论。动量因子背后反映的是股票间的相对强弱趋势会延续,“强者恒强,弱者恒弱”;通常通过做多过去一段时间表现最好的股票(称为赢家组合)、同时做空这段时间表现最差的股票(称为输家组合)来构建动量因子。
动量因子源自Jegadeesh and Titman(1993)提出的动量效应。他们在每月月末,依据过去X个月的股票总收益率排序,将股票分为10组,按照等权重方式做多收益率最高的一组股票,同时做空收益率最低的一组股票,并持有Y个月[2]。为了规避路径依赖对结果的影响,两位作者构建了Y个不同的子策略,每个子策略的起点相隔一月,最后再取Y个组合的收益均值代表动量效应。实证结果显示,无论是多空组合还是纯多头组合,都可以获取显著且稳健的超额收益,且规模、市场β和季节性等常见因素都没法解释动量效应。
Jegadeesh and Titman(2001)利用样本外数据进一步检验了动量效应,并以此回应了那些认为Jegadeesh and Titman(1993)是数据挖掘结果的批判。Rouwenhorst(1998, 1999)在12个欧洲国家市场和20个新兴市场发现了显著的动量效应,上述发现为支持动量存在于其他市场中提供了有力的证据。类似地,Liu et al.(1999)和Hon and Tonks(2003)表明英国股市存在动量效应。De Groot et al.(2012)指出在新兴市场同样有着显著的动量效应,而Asness et al.(2013)更是提供了动量效应在全球多个市场广泛存在的证据。与上述研究成果鲜明对比的是,在日本和中国A股市场中,动量效应的表现可谓惨不忍睹[3]。
除了个股动量,行业动量也非常显著。Moskowitz and Grinblatt(1999)是这方面的代表性研究。此外,在债券、大宗商品和外汇等资产中也存在动量效应。举例来说,Jostova et al.(2013)、Houweling and Van Zundert(2017)和Israel et al.(2018)研究了公司债市场的动量效应,Shen et al.(2007)和Narayan et al.(2015)讨论了商品期货市场的动量效应,而Menkhoffet al.(2012)和Orlov(2016)表明外汇市场同样存在显著的动量效应。
3.5.2 动量因子成因
关于动量的成因,一部分学者将其归因于系统性风险敞口。具体来说,动态风险敞口假说认为赢家组合和输家组合有着不同的、时变的系统性风险暴露。因此,多空对冲构建的动量因子组合有着时变的系统性风险敞口,需要获得风险溢价补偿[4]。Geczy and Samonov(2016)利用长达近200年的美股数据研究发现,在一个市场状态的初期,动量组合对于当前的市场状态有着负的暴露,从而导致该时期的大幅损失,这意味着动量组合需要获得更高的收益来弥补相关的风险。
Daniel and Moskowitz(2016)将此形象地描述为“动量崩溃”(momentum crashes),并指出这一尾部风险正是动量的风险溢价来源。Liu and Zhang(2008)指出赢家组合对产出增长率因子有着更高的短期暴露,这可以较好地解释动量效应。他们发现额外的因子暴露主要来自赢家组合,而输家组合的因子暴露则在不同时期保持稳定。Chordia and Shivakumar(2002)和Antoniou et al.(2007)则认为经济周期有助于解释动量效应。Yin and Wei(2020)基于中国市场数据发现,总体盈利的不稳定性(aggregate profit unstability)有助于解释动量因子的表现。但也有学者并不认可这类解释,例如,Griffin et al.(2003)和Ji et al.(2017)反对使用宏观经济变量解释动量效应。NovyMarx(2015b)则自成一派,认为价格动量效应来自盈余动量(earnings momentum),当控制盈余动量之后,价格动量便不再显著。
除风险补偿外,更多的学者认为投资者行为偏差能更好地解释动量效应。Daniel et al.(1998)的经典研究认为,投资者对其私有信息的过度自信及有偏的业绩自我归因会造成动量效应。Hur and Singh(2016)进一步指出反应不足是主要原因。其次,Grinblatt and Han(2005)认为投资者心理账户的存在导致了处置效应[5],拉大了股票价格与其基本面价值之间的差异,进而导致了动量效应。他们发现,在控制了未实现盈利值(capital gain overhang)后,动量效应不再显著[6]。第三类解释是推定预期偏差,即投资者通过将当前数据外推来得到对未来表现的预期,而这一朴素估计(naive estimate)是有偏的,Choi and Mertens(2019)是这方面的代表作。而Barberis et al.(2015)则更进一步,构建了部分投资者有推定预期的X-CAPM模型,用以解释资产预期收益的截面差异。知情交易也是一种有趣的解释。Chen and Zhao(2012)发现,在知情交易概率较大的股票中,动量表现优异;反之,在知情交易概率较小的股票中,股价则没有明显的持续性。除上述发现外,另有研究表明收益序列的过度相关性是动量的收益来源。例如,
Lewellen(2002)发现高度分散的规模因子组合和价值因子组合仍表现出非常显著的动量效应,且公司和行业特质不足以解释,而只能归因于收益序列的过度相关性。最后,市场情绪也是另一类重要的解释(Stambaugh et al.2012)。Li and Yeh(2011)基于中国A股市场的数据,指出空头组合蕴含的市场情绪越强烈,动量效应就越显著。Antoniou et al.(2013)等也提供了市场情绪对动量效应有显著影响的证据。
虽然有如此多的理论和实证支持动量效应,但仍有不少学者提出了质疑和批判。相关的问题主要包括三点,其一,有研究认为动量的收益其实来自对其他经典风险因子的暴露。例如,当控制了规模和低波动因子后,动量因子的超额收益在经济和统计意义上都大幅下降(Liu 2019)。此外,NovyMarx(2015b)认为价格动量完全由盈余动量这一基本面特征所驱动。其二,空头端对动量收益的贡献较大,但由于在实践中卖空并不容易,因此动量因子对实际因子投资的作用有限。其三,Patton and Weller(2020)指出由于动量往往有很高的换手率,因此其纸面收益难以很好地转化为实际交易盈利。
针对动量的尾部风险和对动量的批判,学者们也构建了一些拓展方法来优化动量的表现,其中较为知名的包括尾部风险调整的动量和残差动量(residual momentum)。关于前者,最出名的研究当属Daniel and Moskowitz(2016)。该文指出基于对动量策略均值和波动率预测的动态动量策略,可以将静态动量策略的夏普比率提升一倍。类似地,Barroso and Santa-Clara(2015)发现,通过引入目标波动率进行仓位管理也可以显著提升动量组合的表现。残差动量(Blitz et al. 2011)由个股的残差收益率计算,定义为个股收益率中无法被给定多因子模型解释的部分。Blitz et al.(2011)的研究发现残差动量可获得非常显著的收益,且不再有动量崩溃的烦恼。其背后的原因在于求解残差的过程剥离了传统动量因子对系统性风险因子的敞口,从而可以获得更加稳健的收益。Blitz et al.(2017)和Huij and Lansdorp(2017)为此提供了更多有关国际市场的证据。Chang et al.(2018)发现残差动量甚至在日本股市中也可获得显著的超额收益,Chaves(2012)也有类似发现(不过他定义残差动量的方法略有不同)。而Lin(2019, 2020)发现残差动量在A股市场同样有效。但笔者认为,虽然实证结果看似支持残差动量存在于A股市场这一结论,但其背后的原因需要进一步探索。
此外,还有一些研究将动量拓展至更广泛的市场中,以及价格动量之外。例如,Chui et al.(2010)研究了文化对不同市场中动量表现的影响,并指出越是崇尚个人主义的国家,其投资者过度自信和自我归因的偏差越严重、市场成交越活跃、动量因子的表现越好。Jiang et al.(2020)则研究了新闻动量,他们将股票日收益拆分为由信息驱动的和由非信息驱动的两部分,并指出由信息驱动的收益有较强的连续性,因而买入高信息驱动收益的股票,并做空低信息驱动收益的股票,可获得显著的超额收益。
3.5.3 动量因子实证
熟悉A股市场的读者可能有这样的体会,无论使用哪个时间周期计算动量都无法出现显著的动量效应,而更多时候表现出的是反转效应,即前期涨幅高(低)的股票未来的收益率低(高)。根据学术界的发现,在t月末将t-12到t-1之间的11个月内的总收益作为动量因子的排序变量。从定义可知,在计算动量时排除了t月本身的收益。这么做的目的是排除短期反转对动量造成的影响。举例来说,假如现在是2019年1月末,依照上述方法将使用2018年1月末到2018年12月末,即2018年2到12这11个月内的总收益计算动量。实证期内动量变量的数据覆盖度如图3.20所示。

图3.20 剔除黑名单、异常值后动量变量数据覆盖度
表3.19 动量分组得到的10个投资组合的描述性统计
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | |
| 动量 | -26% | -14% | -6% | 0% | 7% | 14% | 22% | 34% | 50% | 92% |
| 总市值(亿元) | 107.23 | 109.17 | 104.30 | 98.69 | 93.06 | 98.97 | 113.18 | 123.01 | 141.31 | 169.11 |
| 市场β | 1.19 | 1.17 | 1.16 | 1.15 | 1.14 | 1.14 | 1.13 | 1.12 | 1.10 | 1.08 |
| 年化波动率 | 45.6% | 44.2% | 43.9% | 44.1% | 44.4% | 44.7% | 45.2% | 46.0% | 47.0% | 49.4% |
| P/B | 4.03 | 4.24 | 3.89 | 4.61 | 4.04 | 4.87 | 4.81 | 5.60 | 5.97 | 9.08 |
| ROA | 2.51% | 2.99% | 3.18% | 3.36% | 3.42% | 3.73% | 3.96% | 4.47% | 4.96% | 5.97% |
每月末将股票按照动量变量的取值从低到高分成10组,记为Low(动量最低)、2、……、9及High(动量最高)组,它们的描述性统计值如表3.19所示。观察表中的数据不难发现,前8组的总市值差异并不大,但第9组和High组的总市值显著增加。由于A股著名的小市值效应,因此在大市值上的暴露无遗将削弱高动量组的表现。除此之外很有意思的是,以动量高低划分的10个投资组合的ROA呈现出单调递增,且High组的P/B也要高于其他组。
表3.20和表3.21分别总结了单变量排序和双重排序的检验结果。首先来看单变量排序,无论采用等权重(Panel A),还是采用市场加权(Panel B)构建这些投资组合,它们的收益率几乎毫无单调性可言。当采用等权重时,这10个投资组合的月均收益率呈现出倒U字形,它们和每组平均动量的秩相关系数为-0.333( $p$ -值为0.347);当采用市值加权时,二者之间则更加无序,秩相关系数仅为0.188( $p$ -值为0.603)。无论等权重还是市值加权,由做多赢家组合(高动量组)和做空输家组合(低动量组)构成的动量因子的月均收益率都不显著。其中,当采用等权重时,动量因子的月均收益率甚至为负(月均收益率为 $0.04\%$ , $t$ -值为-0.14),说明赢家组合跑输了输家组合;当采用市值加权时,动量因子的月均收益率为 $0.08\%$ ( $t$ -值为0.20)。
Panel A: 等权重
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 1.19 | 1.32 | 1.47 | 1.50 | 1.55 | 1.42 | 1.36 | 1.25 | 1.24 | 1.14 | -0.04 |
| (1.60) | (1.78) | (1.97) | (2.00) | (2.16) | (2.00) | (1.92) | (1.79) | (1.79) | (1.73) | (-0.14) |
| Panel B: 市值加权 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 0.87 | 0.82 | 0.88 | 0.61 | 1.02 | 0.91 | 0.78 | 0.91 | 0.71 | 0.95 | 0.08 |
| (1.21) | (1.13) | (1.26) | (0.90) | (1.53) | (1.32) | (1.31) | (1.53) | (1.20) | (1.49) | (0.20) |
括号内为经Newey-West调整的 $t$ -值。
接下来,关注动量和市值进行双重排序的检验结果。无论采用等权重还是市值加权,在按市值分组得到的Small和2这两组中,赢家组的收益率低于输家组的收益率;而在4和Large两组中,赢家组合的收益率高于输家组合的收益率。综合这两点可以看出,动量效应仅微弱地存在于A股的大市值股票中,而对于小市值的股票则更多地表现出反转。将五组平均后得到动量因子。当采用等权重时,动量因子的月均收益率为 $0.05\%$ ( $t$ -值仅为0.22);当采用市值加权时,动量因子的月均收益率为 $0.06\%$ ( $t$ -值仅为0.29)。这两个结果均非常不显著,说明以学术界中的常见方法构建的动量效应并不存在于A股市场中。
表3.21 动量和市值独立双重排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | High | High-Low | |
| Small | 1.94 | 2.31 | 2.22 | 1.93 | 1.70 | -0.23 |
| (2.56) | (2.85) | (2.85) | (2.42) | (2.17) | (-0.91) | |
| 2 | 1.48 | 1.48 | 1.51 | 1.48 | 1.39 | -0.09 |
| (1.92) | (1.93) | (2.08) | (2.04) | (1.91) | (-0.39) | |
| 3 | 1.14 | 1.29 | 1.21 | 1.14 | 1.14 | -0.01 |
| (1.50) | (1.71) | (1.68) | (1.58) | (1.55) | (-0.03) | |
| 4 | 0.87 | 1.04 | 1.05 | 0.90 | 1.09 | 0.23 |
| (1.19) | (1.40) | (1.50) | (1.30) | (1.60) | (0.89) | |
| Large | 0.51 | 0.82 | 1.05 | 0.89 | 0.84 | 0.34 |
| (0.70) | (1.20) | (1.50) | (1.34) | (1.29) | (0.96) | |
| 平均 | 1.19 | 1.39 | 1.41 | 1.27 | 1.23 | 0.05 |
| (1.61) | (1.88) | (1.98) | (1.79) | (1.78) | (0.22) |
Panel B:市值加权
| Low | 2 | 3 | 4 | High | High-Low | |
| Small | 1.88 | 2.26 | 2.17 | 1.88 | 1.68 | -0.20 |
| (2.50) | (2.79) | (2.79) | (2.35) | (2.13) | (-0.78) | |
| 2 | 1.46 | 1.47 | 1.50 | 1.47 | 1.39 | -0.07 |
| (1.89) | (1.91) | (2.06) | (2.02) | (1.91) | (-0.30) | |
| 3 | 1.13 | 1.28 | 1.20 | 1.15 | 1.13 | 0.00 |
| (1.49) | (1.70) | (1.67) | (1.59) | (1.54) | (0.00) | |
| 4 | 0.85 | 1.04 | 1.05 | 0.92 | 1.09 | 0.24 |
| (1.18) | (1.40) | (1.51) | (1.33) | (1.61) | (0.93) | |
| Large | 0.45 | 0.75 | 0.97 | 0.90 | 0.80 | 0.35 |
| (0.62) | (1.10) | (1.39) | (1.38) | (1.21) | (0.94) | |
| 平均 | 1.16 | 1.36 | 1.38 | 1.26 | 1.22 | 0.06 |
| (1.58) | (1.85) | (1.95) | (1.80) | (1.76) | (0.29) |
括号内为经Newey-West调整的 $t$ -值。


图3.21 双重排序构建的动量因子累计收益率(等权重)


图3.22 双重排序构建的动量因子累计收益率(市值加权)
最后,图3.21和图3.22绘制了在等权重和市值加权下,使用动量和BM双重排序构建的动量因子的累计收益率曲线,以及多、空头各自的累计收益率曲线。等权重的结果显示高动量组和低动量组的累积收益率曲线差异非常小,这一结果和双重排序检验的结果相符。此外,由于高动量组的波动更大,因此多空对冲后会导致动量因子本身的累计收益在实证窗口内小于零。比较表3.21、图3.21和图3.22
发现,双重排序时动量因子的月均收益率为正(虽然非常不显著),但其累计收益率却小于零。造成这种差异的原因是,双重排序中的月均收益率是算数平均,累计收益曲线图中反映的是收益率的几何平均,而收益率的波动使得几何平均总是小于算数平均。由于动量因子收益率的算术平均非常接近零,收益率波动造成其几何平均小于零,因此动量因子在实证期内的累计收益小于零。
[1]尽管Fama在Fama and French(2018)一文中考虑了动量因子,但他对该因子的看法依然不变。
[2]在原文中,作者使用 $J$ 和 $K$ 分别代表排序期和持有期的月份长度。由于本书使用符号 $K$ 代表因子个数,因此为了避免混淆,此处使用 $X$ 和 $Y$ 分别表示排序期和持有期的月份长度。
[3]见Liu and Lee(2001)和Liet al(2010)等研究。
[4]参见Zhang(2004)和Dobrynskaya(2017)等。
[5]处置效应(Shefrin and Statman 1985)指投资者倾向于止损小幅亏损的股票,并持有大幅亏损的股票,这一现象在个人投资者中尤为普遍。
[6]更多相关研究见Frazzini(2006)和Bhootra and Hur(2012)。
3.6 盈利因子
3.6.1 盈利因子起源
盈利能力指企业利用已有资源获取利润的能力。通常来说,盈利能力越强,企业前景越好,也越容易受到投资者的关注。经典的股票估值模型,不管股利贴现模型(Dividend Discount Model,DDM)还是剩余收益模型(Residual Income Model,RIM),本质上都是把未来各期的盈利按照一定的折现率贴现到现在。而金融分析师对企业估值的核心工作便是估计其未来的盈利水平。近年来,在学术界盈利能力与预期收益率之间的关系得到了越来越广泛的关注。而盈利因子也被Fama and French(2015)和Hou et al.(2015)两个重要的多因子模型纳入麾下,以更好地解释股票预期收益率的截面差异。
在选择构建盈利因子的变量时,最直接的做法是利用绝对盈利水平来度量盈利能力。然而,为了保证指标在不同公司间可比,在计算时通常需要用诸如总资产、销售收入等对盈利水平进行标准化。由于分子和分母都有很多选择,因此学术界相继提出了很多种高相关,但又不完全相同的变量来评价公司的盈利能力。例如,Haugen and Baker(1996)考察了4个变量并发现盈利能力强的公司有更高的平均收益。
在诸多变量中,最常用的一个还是净资产收益率(Return On Equity, ROE),它是归属于股东的利润与净资产之比。但即便是使用ROE,在不同研究的处理细节上也有细微差异。其中,Fama and French(2006, 2015, 2016)将年度营业利润作为分子计算ROE,而Hou et al.(2015)将季度净利润作为分子。这些研究均表明ROE代表的盈利能力与股票的未来收益呈显著正相关。除了ROE,总资产收益率(Return On Assets, ROA,即归属于股东和债权人的利润与总资产之比)也得到了不少研究者的支持。与ROE类似,关于计算ROA时应选取什么指标作为分子,学术界也有不少争论。Novy-Marx(2013)认为分子应使用毛利润(gross profit),并指出通过毛利润除以总资产算出的ROA(记为GP)具有和BM一样的预测能力,且优于ROE。但Ball et al.(2015)却提出了不同的意见,认为GP的良好表现来自其分母的贡献,当同样将总资产作为分母时,用净利润或营业利润作为分子也能得到优异的表现。
另一个常用来构建盈利因子的变量是有形资本收益率(Return On Tangible Capitals,ROTC,即息税前利润与有形资本之比[2])。ROTC由华尔街明星基金经理Joel Greenblatt提出。他在Greenblatt(2006, 2010)这两本书中讨论了如今已经家喻户晓的选股“神奇公式”[3]。该公式包含一个盈利指标和一个估值指标。盈利指标正是ROTC,而估值指标为企业价值倍数(enterprise multiplier,即息税前利润除以企业价值)。ROTC长期表现优异,但最近几年表现不佳。投入资本回报率
(Return On Invested Capital,ROIC)也是一个常用的盈利因子变量(Damodaran 2007),其计算公式为息前税后利润与投入资本之比[4]。最后,Nissim and Penman(2001)提出使用净经营资产收益率(Return On Net Operating Asset, RNOA)来构建盈利因子,它的定义为经营利润除以净经营资产[5]。RNOA从经营活动的角度考查企业的盈利能力。和ROE相比,它剔除了杠杆带来的干扰;和 ROA相比,它剔除了投资性房地产等与经营活动无关的活动,更加客观和纯粹。理论上,以RNOA为变量构建盈利因子应该有较好的表现,但近年来其表现也不尽如人意。
3.6.2 盈利因子成因
和其他依赖经验研究的因子相比,盈利因子的理论基础要扎实很多。Fama and French(2006,2015)从股利贴现模型出发推导了预期盈利和股票预期收益率之间的关系。Hou et al.(2015)则以实体投资经济学理论(该理论在学术界也被称为 $q$ -理论)为基础建立了预期利润和预期收益率之间的联系。需要注意的是,在实证研究中,考虑到数据的限制,学者们不约而同使用了当期盈利而非预期盈利。由于历史盈利能够较好地代表预期盈利(Zhang 2017),因而可以使用当期盈利代替预期盈利作为构建盈利因子的变量。
除此之外,不少研究也探索了盈利水平之外的维度,包括盈利质量、盈利波动和盈利增长等,它们极大地拓展了盈利因子的内涵。就盈利质量而言,Sloan(1996)可谓是开山之作。该文将盈利分解为现金流和应计利润两部分,并指出盈利的现金流含量越高(即应计利润越少),盈利质量也就越好;反之,盈利的现金流含量越低(即应计利润越多),盈利质量也就越差。在此基础上,该文发现应计项目高的公司相对应计项目低的公司的确有非常显著的负超额收益。这就是著名的应计异象(accruals anomaly)。Ball et al.(2016)进一步指出,净利润并不是最好的度量盈利能力的方法,而采用基于现金流的盈利指标可以得到更好的表现。相比传统的盈利能力,基于现金流的盈利指标不仅表现得更好,而且还可以解释前述的应计异象。
盈利波动之所以吸引了研究者们的注意,是因为它可以部分表征盈利能力的持续性。已有的研究通常用过去 $T$ 个年度或季度的利润的标准差[6]表示盈利波动。Dichev and Tang(2009)对此做了精彩的讨论,他们利用一个简单的时间序列模型指出了盈利持续性、盈利波动和盈利可预测性之间的关系。如果保持盈利持续性不变,则盈利波动和盈利可预测性呈负相关;而如果保持盈利可预测性不变,则盈利波动和盈利持续性呈负相关。Frankel and Litov(2009)进一步确认盈利波动同盈利可持续性的负相关是非常稳健的。此外,也有学者单独研究了现金流波动和应计项目波动对股票收益的影响,并指出二者对股票未来收益都有负面影响(Huang 2009)。
盈利增长则是另一个很重要的维度。投资者大都认可大牛股的重要条件之一是加速增长的盈利[7]。Haugen and Baker(1996)指出成长潜力越大的公司,其未来预期收益越高。Piotroski(2000)在构造F-Score时,使用了ROA的同比变化衡量盈利变动,并取得了不错的效果。此外,盈利增长本身也是一个很丰富的维度,可以进一步细分为很多子变量。例如,自Ball and Brown(1968)的开创性研究以来,标准化的预期外盈利(Standardized Unexpected Earnings,SUE)得到了广
泛的研究。而Akbas et al.(2017)研究了盈利趋势对股票收益的影响,并指出二者呈正相关,且不能被其他常见因子所解释。也有学者研究了盈利增长持续性的影响,但得到的结论却不完全一致(Barth et al.(1999)和Loh and Warachka(2012))。此外,He and Narayanamoorthy(2020)研究发现盈利加速度同股票收益之间呈现稳健的正相关。最后,盈利因子还同质量因子有着密切的关系。Asness et al.(2019)定义的质量因子包括盈利、成长和安全性三个维度,盈利维度自不必说,而成长维度其实就是各种盈利增长变量。Frazzini et al.(2018)的实证结果显示,质量因子有助于解释巴菲特的长期优异表现,这也凸显了盈利因子的重要性。
3.6.3 盈利因子实证
从前文的论述可知,学术界提出了诸多构建盈利因子的变量。在针对A股的实证中,本书选择的变量是ROE(TTM),它源于Fama and French(2015)中的盈利因子。在具体计算中,ROE(TTM)的分子为最近12个月的营业利润(operating profit),分母为股东权益(不含少数股东权益)最近四个报告期的均值。
ROE(TTM)的数据覆盖度如图3.23所示。

图3.23 剔除黑名单、异常值后ROE(TTM)数据覆盖度
每个月末将股票按ROE(TTM)取值从低到高分成10组,记为Low、2、……、9及High组。它们的描述性统计见表3.22。由于ROA和ROE(TTM)一样均体现盈利能力,因此这10个投资组合的平均ROA也呈现单调递增。此外,这10个组合的平均市值也表现出很好的单调性,即ROE(TTM)越高的组市值也越大。
表3.22 ROE(TTM)分组得到的10个投资组合的描述性统计
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | |
| ROE(TTM) | -11.6% | 0.4% | 3.3% | 5.5% | 7.5% | 9.6% | 11.9% | 14.9% | 19.3% | 30.0% |
| 总市值(亿元) | 48.45 | 53.97 | 52.94 | 60.27 | 63.38 | 77.96 | 100.03 | 164.87 | 236.50 | 300.31 |
| 市场β | 1.17 | 1.18 | 1.18 | 1.17 | 1.16 | 1.15 | 1.13 | 1.11 | 1.08 | 1.06 |
| 年化波动率 | 48.6% | 47.3% | 46.6% | 46.2% | 45.8% | 45.4% | 44.6% | 43.9% | 43.3% | 43.5% |
| P/B | 7.01 | 3.86 | 3.58 | 3.59 | 3.70 | 3.85 | 4.00 | 4.21 | 4.73 | 5.87 |
| ROA | -3.53% | 0.75% | 2.09% | 2.79% | 3.69% | 4.51% | 5.30% | 6.24% | 7.56% | 9.69% |
表3.23展示了以ROE(TTM)单变量排序的检验结果。当采用等权重构造投资组合时,这10个投资组合的月均收益率虽然表现出较好的单调性,ROE(TTM)和收益率的秩相关系数为0.855( $p$ -值为0.002),但是它们的差异很小,导致使用High-Low组合构建的盈利因子的月均收益率非常不显著。而当采用市值加权时,这10组的月均收益率的单调性有所下降(秩相关系数为0.552、 $p$ -值为0.098),但它们的差异却非常突出,因而使用High-Low组合构造的盈利因子的月均收益率的显著性也有所上升。等权重和市值加权的结果差异说明,等权重配置提升了低ROE(TTM)组的月均收益率,表明低ROE(TTM)的公司在小市值上有正的暴露,即低ROE的公司更可能是小市值的公司。这一推断和表3.22所显示的依照ROE(TTM)排序得到的10个组合的描述性统计结果非常一致。从表3.22中很容易看出,这10个组合的平均市值几乎单调上升,说明高ROE(TTM)的组的平均市值也更大。
表3.23 ROE(TTM)单变量排序月均收益率 $(\%)$
| Panel A: 等权重 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 1.22 | 1.29 | 1.33 | 1.34 | 1.33 | 1.36 | 1.43 | 1.35 | 1.40 | 1.38 | 0.16 |
| (1.59) | (1.68) | (1.75) | (1.81) | (1.84) | (1.89) | (2.10) | (2.01) | (2.10) | (2.05) | (0.52) |
| Panel B: 市值加权 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | High-Low |
| 0.58 | 0.78 | 0.96 | 0.85 | 0.82 | 0.77 | 1.05 | 0.76 | 1.00 | 1.26 | 0.68 |
| (0.80) | (1.05) | (1.35) | (1.23) | (1.18) | (1.14) | (1.68) | (1.27) | (1.63) | (1.94) | (1.72) |
括号内为经Newey-West调整的 $t$ -值。
针对美股,Penman and Reggiani(2018)统计了不同市值分组下的平均ROE水平,发现ROE的确和市值呈现正相关。盈利水平最高的组的股票市值往往较大,盈利水平最弱的组的股票市值往往较小。一般来说,小公司处于成长期,在长成“参天大树”之前的盈利能力往往较弱;而大公司的行业地位逐渐巩固,经营优势也越来越大,故盈利能力较强并且比较稳定。在一项研究中,Asness et al.(2018)从独特的角度研究了盈利和市值之间的关系。该文的题目是Size matters, if you control your junk,指出控制公司的质量可以使规模因子(小市值效应)在美股上更加显著,这一结论对描述公司质量的不同维度均成立,其中盈利就是一个维度。它的意思是,小市值中有很多盈利能力非常差的股票,这些股票的低收益削弱了小市值效应,即规模因子的表现。一旦将它们的影响剔除,就能极大提高规模因子的表现。该实证结果表明盈利差的公司往往也是市值很低的公司。考虑到这些方面,等权下ROE(TTM)分组的结果也就不难理解,而使用ROE(TTM)和市值的双重排序就可以从一定程度上降低市值对ROE(TTM)的
影响。
表3.24给出了双重排序检验结果。图3.24和图3.25绘制了通过双重排序构建的盈利因子的累计收益率曲线。当控制了市值后,盈利因子(在表3.24中,“平均”一行中的High-Low组合)的平均收益率均非常显著。以等权重为例,在按市值划分得到的每一个档内,ROE(TTM)均有较好的区分度和单调性。在不同的市值档内,通过做多高ROE(TTM)和做空低ROE(TTM)的High-Low组合的月均收益率呈现出“两边低、中间高”的形态,即盈利因子在中间市值档位内更加显著、在大市值和小市值中被稍弱。整体而言,ROE(TTM)对除了Small组内的其余股票都有很好地解释它们预期收益率截面差异的能力。从五组平均值来看,盈利因子的月均收益率为 $0.58\%$ ( $t$ -值为3.27)。上述结论在市值加权时依然成立。
回顾前文3.4.3节中关于价值因子的实证结果,与BM在大市值股票中的效果变差正好相反的是,ROE(TTM)在小市值股票中的效果更差。因此,在实证结果中如果因为某些原因剔除了小市值的股票,则会自然而然地提升ROE(TTM)的表现,同时削弱BM的表现,间接造成EP比BM构造的价值因子更加显著的结果。然而,对于实证研究来说,任何的数据处理都应该格外小心,以免落入过拟合的误区[8]。


图3.24 双重排序构建的盈利因子累计收益率(等权重)
表3.24 ROE(TTM)和市值独立双重排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | High | High-Low | |
| Small | 1.95 | 2.09 | 2.20 | 2.18 | 2.17 | 0.22 |
| (2.43) | (2.65) | (2.90) | (2.94) | (2.77) | (1.03) | |
| 2 | 1.18 | 1.28 | 1.54 | 1.85 | 1.69 | 0.52 |
| (1.51) | (1.72) | (2.07) | (2.59) | (2.29) | (2.36) | |
| 3 | 0.81 | 1.07 | 1.15 | 1.51 | 1.40 | 0.58 |
| (1.06) | (1.38) | (1.58) | (2.12) | (2.00) | (2.73) | |
| 4 | 0.44 | 0.81 | 0.90 | 1.17 | 1.34 | 0.90 |
| (0.60) | (1.09) | (1.25) | (1.76) | (1.97) | (4.14) | |
| Large | 0.57 | 0.52 | 0.66 | 0.74 | 1.27 | 0.70 |
| (0.77) | (0.71) | (0.98) | (1.14) | (1.91) | (2.28) | |
| 平均 | 0.99 | 1.15 | 1.29 | 1.49 | 1.58 | 0.58 |
| (1.32) | (1.55) | (1.81) | (2.18) | (2.27) | (3.27) |
Panel B:市值加权
| Low | 2 | 3 | 4 | High | High-Low | |
| Small | 1.89 | 2.03 | 2.17 | 2.13 | 2.11 | 0.22 |
| (2.34) | (2.58) | (2.85) | (2.88) | (2.73) | (1.01) | |
| 2 | 1.16 | 1.27 | 1.52 | 1.83 | 1.68 | 0.52 |
| (1.49) | (1.71) | (2.06) | (2.58) | (2.27) | (2.37) | |
| 3 | 0.80 | 1.06 | 1.14 | 1.49 | 1.42 | 0.62 |
| (1.05) | (1.35) | (1.57) | (2.10) | (2.01) | (2.84) | |
| 4 | 0.43 | 0.82 | 0.89 | 1.18 | 1.32 | 0.89 |
| (.59) | (1.11) | (1.25) | (1.77) | (1.95) | (4.05) | |
| Large | 0.60 | 0.55 | 0.55 | 0.74 | 1.21 | 0.61 |
| (0.79) | (0.78) | (0.81) | (1.12) | (1.83) | (1.84) | |
| 平均 | 0.98 | 1.15 | 1.26 | 1.48 | 1.55 | 0.57 |
| (1.30) | (1.56) | (1.77) | (2.17) | (2.24) | (3.23) |
括号内为经Newey-West调整的 $t$ -值。


图3.25 双重排序构建的盈利因子累计收益率(市值加权)
[1]他们考察的变量包括账面净收益率(net earnings to book equity)、营业利润比总资产(operating income to total assets)、营业利润率(operating income to total sales)和总资产周转率(total sales to total assets),以及这4个变量的五年移动平均趋势,再加上净利润的五年移动平均趋势。
[2]有形资本不同于有形资产,前者是正常开展业务需要的资本投入,或者日常经营活动所需的资本投入,等于净营运资本(net working capital)加上固定资产(net fixed assets)。
[3]见公众号“川总写量化”文章《Greenblatt的神奇公式及其改进》。
[4]投入资本指所有投资者(股东和债权人)投入的资金总和,这些“资金”都想分享企业的经营成果。投入资本等于净资产加上有息负债,前者属于股东的投入,获取净利润;后者属于债权人的投入,获取利息。
[5]净经营资产等于经营性资产与经营性负债之差。企业的资产和负债都可以分为经营性的和金融性的。根据会计恒等式对资产负债表进行调整,可得净经营性资产等于金融性负债同金融性资产之差加上股东权益。
[6]较为常见的是用过去8个季度的盈利指标的标准差来度量盈利波动,且要求至少6个季度有数据。
[7]常用的变量包括净利润的同比增长率、净利润的同比变化除以总资产和净利润的T年复合增长率,以及ROA的同比变化。
[8]本书第6.1节将会讨论因子挖掘中的过拟合问题。
3.7 投资因子
3.7.1 投资因子起源
投资效应指的是当期投资较多的公司相比于投资较少的公司,在未来的预期收益率更低,即投资和预期收益之间呈现负相关。投资因子是近几年被逐渐认可的一个因子,其原因是Fama and French(2015)和Hou et al.(2015)同时将其纳入了各自的多因子模型。但事实上,投资因子早已植根于公司金融经典的 $q$ -理论,Zhang(2017)更是将其拓展为投资资产定价模型(investment CAPM或ICAPM),与自20世纪60年代以来一直盛行的基于消费的资产定价模型(CCAPM)并驾齐驱。
公司的最优投资行为要求公司投资预期盈利的现值等于投资的边际成本(此时边际利润为0)。在均衡时,盈利率除以投资的边际成本等于折现率,即股票的预期收益率。因此,在盈利率水平给定时,投资越高的公司,股票期望收益越低。这与第3.6节基于相同理论所讨论的盈利与股票预期收益的关系相对应。Fama and French(2015)从DDM推导出了投资因子,他们通过该理论模型推导出预期投资跟股票未来收益的关系,且在实证研究中使用历史投资作为预期投资的朴素估计。Zhang(2017)认为这种处理方式值得商榷,因为历史投资并不能很好地预测未来的实际投资。在本书的6.2.1中将详细解读Hou et al.(2015)和Fama and French(2015)两个模型中投资因子的差异。
抛开争议不谈,几乎没有一项研究是横空出世的,投资因子也不例外。虽然投资因子真正受到重视是2015年之后的事,但对投资效应的研究更久,其中Titman et al.(2004)是最早的实证研究之一。该文使用异常资本投资(abnormal capital investment)来代表投资,并发现有着高额的异常资本投资的公司在接下来一年的收益会显著降低,且该效应不能被其他公司特征或常见的风险因子所解释。Xing(2008)是最早利用 $q$ -理论来构建投资因子的研究之一,其实证研究也支持Titman et al.(2004)的发现。也正是从这篇文章发表的2008年起,投资效应受到了越来越多的重视,诸多学者利用不同的样本对投资效应进行了大量的实证研究。
与Titman et al.(2004)有所不同,大部分后续研究都采用了将总资产增长率作为投资的代理变量,它也是Hou et al.(2015)和Fama and French(2015)采用的定义。Cooper et al.(2008)基于40年的美股数据发现投资对股票未来收益的负面影响非常显著且稳健。此外,大量学术研究成果表明投资因子也存在于其他国家的股票市场中,不过发达国家市场中的投资效应要比新兴市场中的投资效应强很多[1]。此外,A股市场也吸引了一些学者的注意,已有研究大多认为A股市场不存在显著的投资效应。其中,Guo et al.(2017)利用1995至2014年间的数据发现,
3.7.2 投资因子成因
关于投资效应的解释也多种多样。第一种解释就是从 $q$ -理论出发。
Cochrane(1991)最早基于 $q$ -理论提出了投资效应。Zhang(2005)对此进行了拓展,指出有较高盈利能力和较低资本成本的企业会倾向于向扩大投资,并获得较低的预期收益。Xing(2008)指出包含随机折现因子的 $q$ -理论可以很好地解释投资异象。第二种解释则基于实物期权而构建。通过假设资产的风险小于实物期权,研究者们指出更多的投资意味着行权;而用资产代替实物期权,可以降低公司的风险,因而预期收益也随之降低。Berk et al.(1999)、Carlson et al.(2004)和 Anderson and Garcia-Feijoo(2006)等是这类解释的代表。除此之外,Lyandres et al.(2008)还提出了第三种解释,即投资效应是由递减的规模报酬(decreasing return to scale)所致。规模报酬递减意味着,随着投资的增加,资本的边际产出下降,预期收益也随之降低。最后,Cooper and Priestley(2011)认为投资效应与其多空投资组合的系统性风险的差异有关。
除了上述基于系统性风险溢价的解释,也有不少从行为偏差和错误定价的角度进行的分析。但略有不同的是,这类解释更多讨论的是公司的行为,而不仅仅是投资者的行为偏差。Baker and Wurgler(2002)可谓是这方面的先驱,提出企业经理人会利用关于企业真实价值的信息优势进行择时活动,在股票被高估时发行股票扩大投资,但普通投资者通常不会关注这一点。因此,经理人的这一择时行为导致了投资与股票未来收益之间的负相关关系。Baker et al.(2003)再次提出了类似的解释。但后续的实证研究说法不一,Polk and Sapienza(2008)支持这一解释,而Dittmar and Dittmar(2008)却不支持。
那些有着高额投资的公司,就会有过度投资的倾向。这些公司为了构建自己的企业帝国,会投资很多净现值为负的项目,但投资者往往对此反应不足。随着投资者逐渐消化信息并纠正自己的错误行为,这些公司的股票价值将回归,并获得较低的未来回报。Titman et al.(2004)和Cooper et al.(2008)的研究支持这一解释。后者认为,投资者在为公司估值时,倾向于将历史增长率外推来得到预期的未来增长率,但这一外推法常常会落空[2],从而使得投资者高估了股票价值。
另外,公司可利用盈余管理(earnings management)满足市场预期,推动股价上涨和估值上升,进而利用高估值进行有利的并购活动。而并购活动自然会带来资产的增长,从而进一步导致投资与股票被高估的虚假关联。这一关联意味着即便投资效应不存在,人们仍可观察到投资与股票未来收益之间的负相关关系。不过,对于这一点,相关的实证研究并没有达成统一。例如,Li and Zhang(2010)和Lipson et al.(2011)给出了支持这一解释的证据,但Lam and Wei(2011)和Watanabe et al.(2013)却不支持这一解释。
3.7.3 投资因子实证
在对投资因子进行实证中,本书采用上市公司年报中披露的总资产计算总资产(同比)增长率,以此作为排序变量构建投资因子。计算中之所以选择年报,是出于A股上市公司财务报表披露的情况考量。A股上市公司从2002年开始披露季度资产负债表和利润表,从2003年开始披露季度现金流量表。如果选择季报数据计算同比增幅,则会在2003和2004年前后出现大量上一年同期数据的缺失值,导致变量的数据覆盖度在这两年大幅减少。为避免这个问题对实证结果造成影响,故而采用年报数据进行计算。在剔除黑名单及异常数据之后,总资产增长率的数据覆盖度如图3.26所示。
每月末将股票按总资产增长率的取值从低到高分成10组,记为Low、2、……、9及High组。表3.25给出了这10个投资组合在整个实证期内的描述性统计。值得注意的是,这10组的ROA(总资产收益率)随着总资产增长率的增加而单调递增,即总资产增长率越高的公司,其平均ROA也越大。对该现象的解释如下。由会计学原理可知,总资产等于股东权益加负债。假设在不分红的情况下,上市公司总资产的增加由利润和负债的变化决定。数据显示,A股上市公司的平均负债率的时间序列在2006年之后非常稳定(全部A股上市公司的平均负债率在85%左右)。因此,如果进一步假设负债不变,则总资产的变化就由利润决定。这就不难理解为什么总资产增长率低的公司,ROA也低。此外,这10组的总市值呈现出倒U字形,即位于两端的低投资组和高投资组的平均市值低于位于中间的其他组。

图3.26 剔除黑名单、异常值后总资产增长率的数据覆盖度
表3.25 总资产增长率分组得到的10个投资组合的描述性统计
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | |
| 总资产增长率 | -11% | -2% | 2% | 6% | 10% | 14% | 19% | 27% | 42% | 92% |
| 总市值(亿元) | 57.67 | 75.13 | 83.29 | 110.20 | 159.50 | 168.28 | 167.49 | 138.75 | 111.85 | 92.78 |
| 市场β | 1.16 | 1.15 | 1.14 | 1.14 | 1.14 | 1.13 | 1.12 | 1.12 | 1.13 | 1.13 |
| 年化波动率 | 47.3% | 45.9% | 45.5% | 45.2% | 45.0% | 44.6% | 44.7% | 44.9% | 45.5% | 46.6% |
| P/B | 8.23 | 4.75 | 4.17 | 4.29 | 4.53 | 4.09 | 4.17 | 4.41 | 4.49 | 5.96 |
| ROA | 0.08% | 2.06% | 3.05% | 3.68% | 4.16% | 4.60% | 4.76% | 4.98% | 5.38% | 5.89% |
表3.26展示了以总资产增长率单变量排序的检验结果。当采用等权重时,这10个投资组合的月均收益率与它们的排序变量之间并无很好的单调性,秩相关系
数为-0.503( $p$ -值为0.138);通过Low-High构建的投资因子的月均收益率非常不显著且为负( $t$ -值为-0.11)。而当采用市值加权时,上述情况也没有什么变化,这10组的月均收益率和总资产增长率的秩相关系数为-0.527( $p$ -值为0.117),Low-High构建的投资因子的收益率依然不显著(月均收益率为0.17、 $t$ -值为0.70)。
表3.26 总资产增长率单变量排序月均收益率(%)
| Panel A: 等权重 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | Low-High |
| 1.32 | 1.37 | 1.36 | 1.39 | 1.50 | 1.27 | 1.30 | 1.29 | 1.25 | 1.34 | -0.02 |
| (1.76) | (1.90) | (1.89) | (1.94) | (2.16) | (1.84) | (1.88) | (1.84) | (1.74) | (1.87) | (-0.11) |
| Panel B: 市值加权 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | Low-High |
| 1.03 | 0.87 | 1.02 | 1.08 | 1.26 | 0.76 | 0.95 | 0.94 | 0.86 | 0.86 | 0.17 |
| (1.45) | (1.39) | (1.52) | (1.68) | (2.07) | (1.24) | (1.62) | (1.45) | (1.27) | (1.25) | (0.70) |
括号内为经Newey-West调整的 $t$ -值。
表3.27给出了双重排序检验结果。令人意外的是,当控制了市值后,低投资(Low组)的月均收益率往往低于高投资(High组)的月均收益率,这与理论所隐含的投资和预期收益负相关是相反的。以等权重为例,无论在哪个市值组内,Low-High投资组合的月均收益率均为负(虽然都不显著),而最后得到的投资因子月均收益率为 $-0.22\%$ ( $t$ -值为-1.63)。当采用市值加权时,双重排序的结果也和等权重时十分类似,投资因子月均收益率为 $-0.21\%$ ( $t$ -值为-1.52)。图3.27和3.28给出了在等权重和市值加权下,双重排序构建的投资因子的累计收益曲线,以及多、空头各自的累计收益曲线。由于投资因子预期收益率为负,因此,投资因子组合的累计收益曲线几乎成单边下行之势。
投资因子在A股市场的表现和理论的大相径庭值得进一步思考:是学术界相关的金融学理论有瑕疵,还是A股的上市公司“特立独行”?从表3.25展示的总资产增长率与ROA之间的正相关性中,也许可以得出分析上述谜团的思路。由3.6节的论述可知,盈利因子在A股市场是有效的;以ROE(TTM)为变量,以做多高盈利公司和做空低盈利公司构建的盈利因子的收益非常显著。结合盈利因子的表现并考虑到总资产增长率和ROA的相关性,可以推断出低投资的公司在盈利因子上有负的暴露,而高投资的公司在盈利因子上则有正的暴露。然而,无论单变量排序,还是和市值一起进行双变量排序,均无法有效消除上述在盈利因子上的暴露,使得投资因子在一定程度上受到盈利因子的影响。对盈利因子的负暴露会削弱低投资公司的预期收益率,而对盈利因子的正暴露则会提高高投资公司的预期收益率,最终造成了投资因子的失真。
基于上述讨论,为了更准确地讨论投资因子在A股市场上的表现,就必须要规避盈利因子对其的影响。为此,使用ROA和总资产增长率进行条件双重排序来重新构建投资因子。在条件双重排序中,ROA为第一排序变量,总资产增长率为第二排序变量。在Hou et al.(2015)这篇提出四因子模型的论文中,三位作者使用市值、ROE和总资产增长率三重排序的方法构建了包括投资因子在内的三个因子,其出发点也是反映盈利和投资之间的条件关系,它也为使用ROA和总资产增长率条件双重排序提供了理论指引。
表3.27 总资产增长率和市值独立双重排序月均收益率(%)
| Panel A: 等权重 | ||||||
| Low | 2 | 3 | 4 | High | Low-High | |
| Small | 1.95 | 2.09 | 2.11 | 2.09 | 2.27 | -0.31 |
| (2.47) | (2.62) | (2.82) | (2.74) | (2.85) | (-1.79) | |
| 2 | 1.31 | 1.31 | 1.57 | 1.59 | 1.45 | -0.15 |
| (1.75) | (1.80) | (2.06) | (2.15) | (1.95) | (-0.86) | |
| 3 | 0.91 | 1.28 | 1.20 | 1.27 | 1.28 | -0.37 |
| (1.20) | (1.70) | (1.70) | (1.75) | (1.77) | (-2.19) | |
| 4 | 0.91 | 0.83 | 1.01 | 1.05 | 1.11 | -0.20 |
| (1.28) | (1.22) | (1.48) | (1.49) | (1.54) | (-1.09) | |
| Large | 0.83 | 0.85 | 1.08 | 0.82 | 0.90 | -0.07 |
| (1.25) | (1.26) | (1.67) | (1.25) | (1.28) | (-0.32) | |
| 平均 | 1.18 | 1.27 | 1.40 | 1.37 | 1.40 | -0.22 |
| (1.64) | (1.78) | (2.01) | (1.94) | (1.95) | (-1.63) | |
Panel B:市值加权
| Low | 2 | 3 | 4 | High | Low-High | |
| Small | 1.90 | 2.01 | 2.08 | 2.03 | 2.23 | -0.34 |
| (2.40) | (2.53) | (2.77) | (2.67) | (2.81) | (-1.85) | |
| 2 | 1.28 | 1.30 | 1.57 | 1.59 | 1.44 | -0.16 |
| (1.71) | (1.79) | (2.07) | (2.15) | (1.94) | (-0.97) | |
| 3 | 0.91 | 1.26 | 1.20 | 1.27 | 1.28 | -0.37 |
| (1.19) | (1.67) | (1.69) | (1.75) | (1.76) | (-2.20) | |
| 4 | 0.91 | 0.84 | 1.01 | 1.04 | 1.11 | -0.19 |
| (1.29) | (1.24) | (1.49) | (1.48) | (1.54) | (-1.07) | |
| Large | 0.85 | 0.84 | 1.13 | 0.84 | 0.81 | 0.04 |
| (1.28) | (1.25) | (1.71) | (1.30) | (1.17) | (0.16) | |
| 平均 | 1.17 | 1.25 | 1.40 | 1.36 | 1.38 | -0.21 |
| (1.63) | (1.77) | (2.01) | (1.95) | (1.93) | (-1.52) |
括号内为经Newey-West调整的t-值。


图3.27 双重排序构建的投资因子累计收益率(等权重)


图3.28 双重排序构建的投资因子累计收益率(市值加权)
表3.28 ROA和总资产增长率条件双重排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | High | Low-High | |
| ROA Low | 1.27(1.60) | 1.25(1.68) | 1.32(1.80) | 1.35(1.77) | 1.26(1.69) | 0.01(0.07) |
| 2 | 1.47(1.94) | 1.51(1.98) | 1.33(1.83) | 1.20(1.62) | 1.23(1.65) | 0.24(1.15) |
| 3 | 1.37(1.83) | 1.35(1.83) | 1.34(1.90) | 1.23(1.79) | 1.33(1.82) | 0.04(0.20) |
| 4 | 1.27(1.77) | 1.43(2.02) | 1.48(2.17) | 1.29(1.89) | 1.48(2.05) | -0.21(-1.24) |
| ROA High | 1.31(1.95) | 1.35(2.05) | 1.47(2.29) | 1.40(2.16) | 1.25(1.85) | 0.06(0.29) |
| 平均 | 1.31(1.83) | 1.38(1.92) | 1.39(2.01) | 1.30(1.86) | 1.31(1.83) | 0.03(0.19) |
Panel B: 市值加权
| Low | 2 | 3 | 4 | High | Low-High | |
| ROA Low | 0.72 | 0.92 | 1.12 | 1.12 | 0.72 | 0.00 |
| (0.93) | (1.25) | (1.79) | (1.59) | (1.07) | (0.01) | |
| 2 | 1.24 | 1.19 | 0.88 | 0.59 | 0.92 | 0.32 |
| (1.67) | (1.53) | (1.34) | (0.83) | (1.19) | (1.00) | |
| 3 | 1.12 | 1.19 | 1.03 | 0.65 | 0.99 | 0.13 |
| (1.57) | (1.70) | (1.51) | (1.01) | (1.33) | (0.45) | |
| 4 | 0.83 | 1.13 | 0.85 | 1.05 | 1.13 | -0.30 |
| (1.21) | (1.69) | (1.40) | (1.70) | (1.57) | (-1.16) | |
| ROA High | 0.97 | 0.93 | 1.06 | 1.13 | 0.79 | 0.18 |
| (1.69) | (1.50) | (1.59) | (1.89) | (1.23) | (0.70) | |
| 平均 | 0.98 | 1.07 | 0.99 | 0.91 | 0.91 | 0.07 |
| (1.43) | (1.58) | (1.58) | (1.45) | (1.33) | (0.34) |
括号内为经Newey-West调整的t-值。
表3.28汇总了使用ROA和总资产增长率条件双重排序的检验结果。无论等权重还是市值加权,在控制了ROA后,依然无法在A股上观察到显著的投资因子。当采用等权重时,投资因子的月均收益率为 $0.03\%$ ,其 $t$ -值仅为0.19;当采用市值加权时,投资因子的月均收益率为 $0.07\%$ , $t$ -值为0.34。观察表中更细分的结果,在不同的ROA条件分组下,总资产增长率区分股票预期收益率差异的能力均十分有限;无论采用哪种权重,以总资产增长率排序的五组收益率都无显著单调性。尽管如此,表3.28的结果表明,在控制了ROA之后,投资因子的收益率不再显著。这和前文的猜测一致,即投资因子会受到盈利因子的影响,如果不对盈利因子加以控制,则投资因子的负收益可能源于在盈利因子上的负暴露。综合表3.25中的描述性统计,以及表3.27和3.28中的双重检验结果,可以认为投资因子在A股市场中并不显著,而不是和理论相矛盾。
最后,A股市场中投资因子不显著也可能存在另外的解释。一方面,金融学理论表明投资和未来预期收益率呈负相关。另一方面,A股市场中的总资产增长往往来自公司的兼并和收购活动,而这类活动往往伴随着后续股价的上涨、收益率的提高,故造成投资和预期收益率之间的正相关。投资和预期收益率之间的强弱都会影响投资因子,最终造成其在本书的实证期内并不显著。
[1]相关研究请参考Titman et al.(2009, 2010)、Li et al.(2012)、Watanabe et al.(2013)、Cakici(2015)、Fama and French(2017)及Kubota and Takehara(2018)。
[2]这正是在3.5节讨论到的推定预期偏差。
3.8 换手率因子
3.8.1 换手率因子起源
成交量也对股票未来表现有显著影响。对于这一点,业界的应用可能远远早于学界的研究。例如,Lefevre and Markman(2012)详细描述了华尔街的传奇人物 Jesse Livermore于20世纪初提出的趋势交易方法。该方法就包括在股票突破形成上涨趋势时,需要有成交量放大的配合。而换手率作为标准化的成交量指标,同样备受关注。
现如今,学术界和业界的共识是,换手率和预期收益之间呈负相关关系。相关的研究可以追溯到20世纪90年代,但最初的实证结果却并不一致。Campbell et al.(1993)发现市场指数和大盘股日收益率的一阶自相关性都随着成交量的增加而下降。Chordia and Swaminathan(2000)发现高成交股票的日度和周度收益率领先于低成交股票的。Datar et al.(1998)指出换手率有助于解释股票收益。Chordia et al.(2001)进一步指出,成交金额和换手率的变化对股票收益有显著的负面影响。而Subrahmanyam(2005)发现换手率对股票未来表现的影响存在显著的不对称性,对于过去一个月收益最低的股票,换手率同股票未来收益呈负相关,而对于过去一个月表现优异的股票,二者却呈正相关。
再来看看换手率因子在其他市场上的表现。Hu(1997)和Chang et al.(2010)发现在日本股市中,换手率及其变化也都对股票未来收益有显著的负面影响。Rouwenhorst(1999)则在新兴市场中观察到相同的现象。然而,Dey(2005)却有不同的发现,认为在新兴市场中高换手率有正的风险溢价。关于A股市场也有不少研究。Mei et al.(2005)基于中国市场特殊的A/B股交易结构发现投资者的投机活动导致更高的A股换手率和更高的价格,从而推升A/B股价差。此外,Liu et al.(2019)指出A股市场换手率对股票未来收益有显著的负面影响并据此构建了换手率因子(Pessimistic-Minus-Optimistic,PMO),且通过实证结果支持了他们的结论,并在其对A股市场提出的四因子模型中纳入了PMO因子。该因子可以更好地解释其他因子无法解释的异象,如A股市场上的短期反转。
3.8.2 换手率因子成因
早期的相关研究大多将成交量和换手率当作流动性的一种度量方法,但随着Amihud(2002)将非流动性定义为单位成交金额对应的平均收益变化,换手率便不再适合作为流动性的代理变量。Subrahmanyam(2005)认为应将其视作趋势是否能延续的表征,这与Lefevre and Markman(2012)讲述的趋势交易方法不谋而
合。Barinov(2014)也认为换手率与流动性并不相同,而是与市场的总体波动率有关。特别地,他指出换手率异象在那些期权状的股权结构中最为显著,且这一点也可以被总体波动率因子所解释。Chen et al.(2001)则认为换手率可能同股价崩盘风险[1]有关,发现换手率相对于过去6个月的趋势显著增长且在过去36个月又显著正收益的股票面临最高的崩盘风险。
另外,从行为金融学的角度分析,换手率及换手率异象也有一些代表性的研究。Odean(1998)和Statman et al.(2006)指出换手率反映了投资者非理性的情绪,诸如过度自信和盲目乐观,因而是一个情绪指标。Lee and Swaminathan(2000)、Glaser and Weber(2007)及Hong and Stein(2007)则认为换手率和投资者的注意力及投资者的意见分歧有关。Chou et al.(2013)研究发现换手率与股票未来收益的负相关性不能被Fama and French(1993)三因子模型和Liu(2006)的流动性CAPM模型等经典资产定价模型解释,也不能被Daniel et al.(1997)提出的特征收益模型完全解释,而是和行为偏差和套利限制更相关。此外,他们还发现换手率异象高度持续,在组合形成后长达五年的时间内,都可能获得显著的超额收益。
除此之外,一些学者探讨了异常成交量对股票收益的影响,并发现异常高的成交量往往预示着更好的股票表现。例如,Gervais et al.(2001)发现成交量异常高的股票有更高的未来收益,且成交量的预测能力并不受高成交量期间股票收益的影响,这同趋势交易方法的结论有所不同。该文认为高成交量的股票有着更好的可见性(visibility),吸引更多的潜在买家,从而有更好的表现。Kaniel et al.(2012)基于41个国家的数据指出,在发达市场和新兴市场都存在高成交溢价。Zhou(2010)则提供了中国A股市场存在高成交溢价的证据。Akbas et al.(2017)表明市场总体的异常高周度成交量预示着未来一周更高的市场收益以及更高的波动率。Lee et al.(2016)进一步指出高成交溢价是一个短期现象,高成交量的股票虽然在未来一周表现更好,但在更长期的时间表现反而不佳。他们将成交量拆分为预期的成交量和未预期的成交量,并指出前者与不同期限股票的未来收益呈负相关,而后者同股票未来五周之内的收益呈正相关,但对更长期的收益没有显著影响。
3.8.3 换手率因子实证
在构建换手率因子时,本书依照Liu et al.(2019)提出的方法,即使用异常换手率作为排序变量。对于每只股票,在t月末,异常换手率的定义为过去21个交易日的平均换手率和过去252个交易日的平均换手率的比值(换手率基于自由流通股本计算)。剔除黑名单及异常数据后,异常换手率的数据覆盖度如图3.29所示。

图3.29 剔除黑名单、异常值后异常换手率数据覆盖度
每月末将股票按异常换手率从低到高分成10组,记为Low、2、……、9及High组。表3.29给出了这10个投资组合在整个实证期内的描述性统计。无论总市值、市场β、年化波动率,还是P/B及ROA,这10个投资组合在这些变量上的取值都非常接近,并没有在某个变量上表现出明显的单调性,说明换手率和这些变量的相关性是非常低的。这是一个非常优秀的性质。
表3.30展示了以异常换手率为变量的排序检验结果。无论等权重还是市值加权,低换手率效应在A股上都十分显著,投资组合的收益率随着换手率的上升而下降。当采用等权重时,这10个投资组合的月均收益率和每组平均异常换手率的秩相关系数均为-0.903( $p$ -值为 $3.44 \times 10^{-4}$ ),呈现出显著的负相关性;当采用市值加权时,上述单调性有所下降,秩相关系数为-0.612( $p$ -值为0.06)。无论等权重还是市值加权,由做多低异常换手率(Low组)和做空高异常换手率(High组)构造的换手率因子的月均收益率都非常显著。当采用等权时,换手率因子的月均收益率为 $1.50\%$ ( $t$ -值高达5.45);当采用市值加权时,该因子每月的收益率较等权重时下降到 $1.10\%$ ( $t$ -值下降到3.01)。尽管如此,该结果无论在经济上还是统计上都依然非常显著。
表3.29 异常换手率分组得到的10个投资组合的描述性统计
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | |
| 异常换手率 | 0.44 | 0.58 | 0.67 | 0.76 | 0.84 | 0.94 | 1.06 | 1.21 | 1.45 | 2.05 |
| 总市值(亿元) | 111.70 | 102.43 | 106.79 | 106.66 | 112.33 | 130.50 | 125.07 | 124.58 | 119.81 | 112.09 |
| 市场β | 1.16 | 1.16 | 1.16 | 1.15 | 1.14 | 1.14 | 1.13 | 1.12 | 1.11 | 1.11 |
| 年化波动率 | 47.4% | 46.1% | 45.5% | 45.2% | 45.0% | 44.9% | 44.9% | 45.0% | 45.3% | 46.2% |
| P/B | 5.85 | 5.07 | 4.99 | 4.73 | 4.45 | 4.90 | 4.69 | 5.04 | 4.99 | 6.76 |
| ROA | 4.10% | 3.82% | 3.70% | 3.73% | 3.72% | 3.94% | 3.98% | 3.99% | 3.87% | 3.64% |
表3.30 异常换手率单变量排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | Low-High |
| 1.67 | 1.82 | 1.74 | 1.65 | 1.68 | 1.45 | 1.36 | 1.20 | 0.93 | 0.17 | 1.50 |
| (2.40) | (2.57) | (2.43) | (2.30) | (2.33) | (2.04) | (1.88) | (1.66) | (1.28) | (0.23) | (5.45) |
| Panel B: 市值加权 | ||||||||||
| Low | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | High | Low-High |
| 1.09 | 1.34 | 1.33 | 1.15 | 1.04 | 1.39 | 1.18 | 0.83 | 0.80 | -0.01 | 1.10 |
| (1.83) | (2.06) | (2.07) | (1.69) | (1.64) | (2.18) | (1.78) | (1.17) | (1.17) | (-0.01) | (3.01) |
括号内为经Newey-West调整的t-值。
当采用双重排序时,检验结果如表3.31所示。当控制了市值后,换手率因子的月均收益率依然非常显著。这其实非常符合预期,因为以换手率分组得到的不同投资组合在市值上并无太大差异,说明二者之间的相关性很低。同时,结合表3.31中的结果也可以观察到,低换手率异象在小市值中更加显著。以等权重为例,在按市值划分得到的每一个档内,该变量均有较好的区分度和单调性;随着市值的增加,Low-High组合的收益率和显著性都呈现出单调下降的趋势。在平均五组的数据后,等权重下换手率因子每月的收益率为 $1.24\%$ , $t$ -值高达6.67。在市值加权时,Low-High组合的收益率仅在市值最大组内不再显著( $t$ -值为1.50),但综合五组来看,结果依然非常显著,月均收益率为 $1.20\%$ ( $t$ -值为6.51)。无论月均收益率还是其 $t$ -值,较等权重时都没有太大差异。
表3.31 异常换手率和市值独立双重排序月均收益率(%)
Panel A: 等权重
| Low | 2 | 3 | 4 | High | Low-High | |
| Small | 2.69 | 2.39 | 2.16 | 1.97 | 0.99 | 1.70 |
| (3.45) | (3.04) | (2.73) | (2.53) | (1.28) | (8.08) | |
| 2 | 1.97 | 1.77 | 1.64 | 1.38 | 0.47 | 1.50 |
| (2.68) | (2.44) | (2.20) | (1.81) | (0.62) | (6.68) | |
| 3 | 1.74 | 1.56 | 1.42 | 1.01 | 0.43 | 1.32 |
| (2.34) | (2.06) | (1.97) | (1.36) | (0.58) | (5.97) | |
| 4 | 1.32 | 1.45 | 1.21 | 0.96 | 0.28 | 1.04 |
| (1.92) | (2.04) | (1.71) | (1.35) | (0.39) | (5.04) | |
| Large | 1.03 | 1.21 | 1.20 | 0.95 | 0.41 | 0.62 |
| (1.55) | (1.78) | (1.74) | (1.39) | (0.57) | (2.23) | |
| 平均 | 1.75 | 1.68 | 1.53 | 1.25 | 0.52 | 1.24 |
| (2.47) | (2.34) | (2.13) | (1.74) | (0.71) | (6.67) |
Panel B:市值加权
| Low | 2 | 3 | 4 | High | Low-High | |
| Small | 2.65 | 2.36 | 2.12 | 1.94 | 0.90 | 1.74 |
| (3.40) | (3.00) | (2.68) | (2.49) | (1.17) | (8.42) | |
| 2 | 1.95 | 1.76 | 1.63 | 1.38 | 0.46 | 1.49 |
| (2.65) | (2.43) | (2.19) | (1.80) | (0.61) | (6.73) | |
| 3 | 1.73 | 1.54 | 1.43 | 1.00 | 0.45 | 1.28 |
| (2.33) | (2.03) | (1.97) | (1.34) | (0.61) | (5.76) | |
| 4 | 1.31 | 1.47 | 1.22 | 0.96 | 0.28 | 1.03 |
| (1.92) | (2.07) | (1.72) | (1.35) | (0.39) | (5.07) | |
| Large | 0.91 | 1.28 | 1.10 | 0.95 | 0.46 | 0.45 |
| (1.40) | (1.91) | (1.63) | (1.35) | (0.63) | (1.50) | |
| 平均 | 1.71 | 1.68 | 1.50 | 1.24 | 0.51 | 1.20 |
| (2.44) | (2.36) | (2.11) | (1.74) | (0.71) | (6.51) |
括号内为经Newey-West调整的 $t$ -值。
最后,图3.30和图3.31展示了等权重和市值加权下,换手率因子的多、空两头各自的累计收益率曲线(Panel A),以及因子投资组合(即多、空对冲组合,Panel B)的累计收益率曲线。无论等权重还是市值加权,以上两图各自Panel B中换手率因子的累计收益率曲线都非常平顺,看上去非常吸引人(从超过6.0的t-值也可以感受到这一点)。然而,需要“泼一盆冷水”的是,这仍然仅是从实证资产定价出发得到的纸面上的收益率,并没有考虑任何交易费用的影响。考察多空两端的表现,多头组合的月均收益率虽然较本章考查的其他因子的多头收益率更高,但对因子组合的收益率来说,起到更关键作用的还要数空头组合。较其他因子来说,异常换手率因子的空头端(高换手率组)的收益率明显更低,从而更好地平抑了多头端的波动,对于因子收益率的贡献更大。然而在实际交易中,由于做空限制将会使空头端的贡献大打折扣,因此实际中注定无法取得纸面上收益率这种完美的效果。在多头方面,低异常换手率组合则能够显著的跑赢市场组合。在等权重和市值加权时,多头组合的年化夏普比率分别为0.65和0.64,而市场组合年化夏普比率仅为0.40。因此,虽然空头组合难以在实际中发挥作用,但仍然可以利用多头组合跑赢市场的特点,在实际投资中将投资组合有计划地暴露于低异常换手率因子上。

Panel A:异常换手率最高组和异常换手率最低组(等权重)

Panel B:异常换手率多空组合(等权重)
图3.30 双重排序构建的换手率因子累计收益率(等权重)

Panel A:异常换手率最高组和异常换手率最低组(市值加权)

Panel B:异常换手率多空组合(市值加权)
图3.31 双重排序构建的换手率因子累计收益率(市值加权)
[1]股价崩盘风险是金融学术研究中的一个重要话题,通常用过去一段时间的股票收益负偏度来度量,负偏度越大,则股价崩盘风险也越大。