2023年中期投资策略报告 高频选股因子分类体系分析

2023-05-17 09:41:18

来源:中信建投证券

一、事件选股策略跟踪

1.1、分析师预期选股策略月度跟踪


(相关资料图)

1.1.1 分析师预期修正选股策略

1.1.1.1 分析师预期修正选股策略概述

证券分析师由于对某个行业研究较为深入,与所研究行业的上市公司联系较紧密,其掌握的行业和个股信 息通常比其他人要多,分析师预期数据已成为投资者重要的信息来源。分析师预期修正意为在一个时间段内, 分析师或机构对之前预测值的调整。预期调整有一定的趋势性,当新信息出现时,有些分析师会运用该信息领 先自己的同行对自己的预期进行调整,最后往往会伴随着其他分析师对自己的预测进行同向的调整。在这一过 程中,预期均值会伴随修正趋势进行变动。具体表现为前一期预期均值的调整往往会带动后一期预期均值继续 往同向调整。分析师预期修正的调整对下一月的分析师预期值有着同向的影响。其中,预期 EPS、预期净利润的 上调和下调均有较强的趋势性,因此我们选取这两个指标作为后续模型的候选股因子。

实际上,我们可以进一步将预期的上调细分为两个阶段:在上调第一个阶段,称为 P1 阶段,只有少部分分 析师对自己的预期值做出上调,大部分分析师并没做出预期调整,这样可以观察到预期均值出现上升,而分析 师间预期的分歧度也开始上升,我们以离散程度(预期标准差)来衡量分歧度,即预期离散程度开始上升;而 在上调第二个阶段,称为 P2 阶段,其他分析师也会逐渐上调自己的预期,最终所有的分析师预期将会接近一个 值,即我们可以观察到预期均值出现上升,而预期离散程度则出现下降。同样,我们可以根据分析师的均值和 离散度进一步将预期的下调细分为两个阶段 P3(分析师均值下降,离散程度上升)和 P4(分析师均值下降,离 散程度下降)阶段。

经过检测,我们发现上调第一个阶段(P1 阶段)的股票未来一个月表现最好。最后我们采用多指标叠加选 股的方法,将预期 EPS FY1、EPS FY2、预期净利润 FY1 三个分析师预期指标进行叠加选股,即将三个分析师预期 指标均处于 P1 阶段的股票取交集作为我们的推荐组合——分析师预期修正选股组合。

1.1.1.2 分析师预期修正选股策略效果跟踪

经过历史样本内回测和样本外跟踪(自 2019 年 7 月 31 日开始样本外跟踪),2009 年 7 月 31 日至 2023 年 3 月 31 日,组合累计绝对收益 940%,相对中证全指累计超额收益 687%,年化超额收益 16.3%,超额收益夏普 比率 1.87,超额收益最大回撤 7.5%。

另外,从 2019 年 7 月开始样本外跟踪(专题报告数据截至 2019 年 8 月),截至 2023 年 3 月底,累计绝对 收益 100%,累计超额收益 67%,样本外跟踪 44 个月只有 12 个月超额收益为负,月度胜率 73%,回撤为-3%, 样本外表现非常优秀。

1.1.2 分析师预期修正增强选股策略

1.1.2.1 分析师预期修正增强选股策略概述

分析师对于自身过去预测的调整往往意味着新信息的到来,而分析师对于不同股票的预测调整力度又能反 映出不同股票间的边际改善差异和分析师对于新信息的处理能力。进一步地,基于这种分析师调整幅度的差异 能够有利于我们构建选股效果较好的选股因子。因此,我们基于分析师盈利预期调整信息构造了分析师盈利预 期调整因子,分析师盈利预期调整因子反映了市场所有分析师对于股票盈利预期 调整的中间水平。

然后我们在每月末,针对分析师预期修正策略股票池,按照盈利预期调整幅度因子排序,选取指标值最大 的 20 只股票,构建事件叠加盈利预期调整幅度因子的选股组合。其中样本池踢掉了停牌、上市半年之内新股、 ST 和当天涨跌停的股票,这个组合我们称为分析师预期修正增强组合。

1.1.2.2 分析师预期修正增强组合效果跟踪

经过历史样本内回测和样本外跟踪(自 2020 年 12 月 31 日开始样本外跟踪),从 2010 年 1 月至 2023 年(截 至 3 月底)12 年时间,组合年化收益 30.43%,相对中证 500 指数的年化超额收益为 27%。

另外,从 2021 年 1 月开始样本外跟踪,截至 2023 年 3 月底,累计绝对收益 52.25%,累计超额中证 500 收 益 52.43%,样本外跟踪 27 个月只有 7 个月超额收益为负,月度胜率 74%,回撤为-11.30%,样本外表现非常优 秀。

我们基于最新 2023 年 3 月底的分析师预期数据进行选股,从 82 只分析师主动上调预期的股票(P1 阶段股票)中精选出了 20 只股票,其中有 1 只创业板股票,精选的 20 只分析师预期修正增强的股票里按照中信一级 行业分类,其中电子最多为 3 只,然后是有色金属、医药、机械和电新各 2 只,短期我们也值得重点关注这些 行业的表现。

1.2、事件追踪选股策略

1.2.1 跟踪事件库概览

综合考虑事件关注度、数据可得性和政策支持度,目前选择 14 类事件作为跟踪事件库,共分为 6 个大类: 再融资、股权变动、公司业绩、公司治理、负面公告和其它。事件数据源主要来自万德底层数据库和朝阳永续 数据库,报告中所有事件数据提取的截止日期为当月月底。对于每类事件,会根据事件逻辑保留相应的关键属 性,并作逐一清洗。后续我们会根据关注度、数据源、政策等因素,不定期地增减事件类型。

1.2.2 事件量统计

回溯过去一年各类事件的发生数量,按月统计并去除重复个股。截止 2023 年 3 月,1)月均覆盖总量为 2844、 最新覆盖总量为 2920;2)财报相关事件的覆盖量呈明显季节性规律,如业绩快报仅在 1 至 4 月触发、业绩预 告集中在 1、7 月触发;3)月均覆盖量排名靠前的事件为机构调研、低预期信息和股东增减持;4)最新覆盖量 中值得关注的事件为机构调研。将 2023 年 3 月与去年同期相比:1)机构调研、股东增减持、低预期信息的覆 盖量出现小幅上升;2)股份回购、股权激励的覆盖量出现小幅下降。

1.2.3 事件表现跟踪

1.2.3.1 测试方法与设定

对事件表现跟踪分为两个方面,一是对事件个体检验事件效应,考察事件触发日后的累计异常收益;二是 定期构建事件组合,考察相对宽基指数的组合超额收益。

1.2.3.2 事后效应跟踪

测算截止 2023 年 3 月的近一年事件效应,具体考察 T+1~T+20、T+21~T+40、T+41~T+60 和 T+1~T+60 这四种 窗口的 CAR 表现。由于事件类别较多,仅选择重点类别做主要展示。综合考虑显著性、持续性 和稳定性,挑选表现突出的事件绘制 CAR 曲线图;筛选 60 日窗口内 CAR 显著的事件类别,再按收益波动比指标降序排列。 对于正向事件,“业绩快报-超预期”与“超预期信息-增速”的表现尤为突出,CAR 分别达到 4.4%和 4.9%、 胜率均超过 50%,其中前者的稳定性更强、后劲更足,在 3 个子窗口内均为正向 CAR、后 30 日 CAR 数值较高。 对于负向事件,“负面公告-立案调查”表现最突出,其 CAR 最低、负率最高,但效应集中体现在短期窗口、中 长期内出现回升;相对而言“负面公告-诉讼仲裁”综合表现更优,稳定性和持续性均更强。另外,股权激励、 限售股解禁、业绩预告、业绩快报、股东减持等事件也有不俗表现。

1.2.3.3 事件组合追踪

测算截止 2023 年 3 月的近一年事件组合表现,具体设定如下:1)业绩基准为沪深 300、中证 500 和中证 1000;2)按月度调仓,持仓周期为 1 个月;3)事件记录的观测长度分别为 1 个月和 2 个月,即事件影响范围 最长为 3 个月; 4)将观测期内事件个股去重,按等权或流通市值加权得到持仓。考虑到细分事件触发量较少、 不宜构建组合,对事件类别进行适当整合:比如归总业绩快报和业绩预告的正向事件,再比如归总股权激励中 的预案公告日、股东大会公告日和首次实施日。

从整体来看,1)事件组合对中证 500 和中证 1000 的增强效果要明显强于沪深 300;2)流通市值加权组合 的超额幅度要弱于等权组合;3)拉长事件观测期对组合持股量有提升,但对超额收益影响不一。从事件类别来 看,1)超预期信息、低预期信息、限售股解禁、员工持股,在各指数各观测期均为正超额;2)快报预告(负)在 300 内、500 内和 1000 内均为正超额;3)快报预告(正)在 300、500 内负超额,但在 1000 内显著正超额;4)负 面公告的回测效果与自身逻辑出现背离,整体呈正超额,仅 500 内为负超额。 从 300 内表现看,正向超额上,限售股解禁和股东增持表现较优,前者在短期内表现更强劲、后者受观测 长度影响有限;负向超额上,定向增发和股东减持表现较优,后者正好与股东增持表现相对应,表明股东增减 持在 300 内区分度较强。此外,快报预告易受观测期长度影响,负面事件在长观测期中为稳定正超额,而正面 事件短期负超额长期正超额。

从 500 内表现看,正向超额上,激励类事件超额收益较高、胜率一般,员工持股在长观测期下更为突出; 负向超额上,业绩类事件表现突出,正面事件呈明显负超额,负面公告事件在短期内呈显著负超额、但在长期 内超额有所减弱。

从 1000 内表现看,正向超额上,上文中在 300 和 500 表现欠佳的快报预告(正)表现尤为突出,胜率最高; 负向超额上,股东减持表现较为稳健,短期和长期均呈显著负超额。

1.3、分析师预期收益率生命周期模型及分析师因子再增强

1.3.1“预期双击”组合选股策略概述

我们建立了一个同时结合 TPP 和 TPM 因子的生命周期模型,该模型利用 TPP 和 TPM 因子将股票分为四类 (也就是生命周期模型的四个阶段),分别是“触底”、“攀升”、“见顶”、“下滑”,处于同一个阶段的股票构成 了一个投资组合。

1.3.2“预期双击”组合效果跟踪

经过历史样本内回测和样本外跟踪(自 2022 年年初开始样本外跟踪),从 2010 年 1 月至 2023 年(截至 3 月底)12 年时间,组合年化收益 26.52%,相对中证 500 指数的年化超额收益为 23.15%。

另外,从 2022 年年初开始样本外跟踪,截至 2023 年 3 月底,累计绝对收益-4.29%,累计超额收益 10.78%, 样本外跟踪 15 个月只有 3 个月超额收益为负,月度胜率 80%,回撤为-6.94%,样本外表现非常优秀。

1.3.3“预期双击”行业轮动组合效果跟踪

经过历史样本内回测和样本外跟踪(自 2022 年年初日开始样本外跟踪),从 2010 年 1 月至 2023 年(截至 3 月底)12 年时间,组合年化收益 11.98%,相对行业等权指数的年化超额收益为 6.77%。

另外,从 2022 年年初开始样本外跟踪(专题报告数据截至 2022 年 5 月底),截至 2023 年 3 月底,累计绝 对收益 11.53%,累计超额收益 21.02%,样本外跟踪 15 个月仅有 3 个月超额收益为负,月度胜率 80%,回撤为 -3.56%,样本外表现非常优秀。

我们基于最新 2023 年 3 月底的分析师预期数据进行行业选择,“预期双击”组合行业轮动所选的五个行业 分别为非银金融、银行、国防军工、建筑、钢铁,短期这些行业的表现值得我们重点关注。

二、高频选股因子分类体系

2.1、高频选股因子分类体系

2.1.1 高频因子分类体系介绍

本报告对之前的五篇高频报告《高频量价选股因子初探》、《买卖报单流动性因子构建》、《高频订单失衡及 价差因子》、《多层次订单失衡及订单斜率因子》、《流动性因子系统解读与再增强》进行了简单的总结,并且在 这个基础上新增了和资金流相关的高频因子,并根据上述的因子构建了分类体系。

2.1.2 月因子的低频化方法

我们采用下面的具体流程把高频因子转为我们常用的月度低频选股因子。首先因为股票的盘口挂单强弱受 到市场总体走势的影响,因此我们需要对各股票进行截面标准化以剔除市场对个股的影响。

2.1.3 日、周、两周因子的低频化方法

对于日、周、两周低频化的有两种方法,方法一是对过去二十个交易日的因子值进行衰减加权;方法二是 日频换仓的因子直接使用日频因子,周频换仓的因子使用过去五个交易日的因子值进行衰减加权,两周频换仓 的因子使用过去十个交易日的因子值进行衰减加权。

可以发现,方法一虽然多空年化收益比方法二略差,但是由于换手率比方法二更小,所以考虑手续费后的 多空收益会比较接近甚至有些情况多空要好于方法二的构造。为了能让无手续费的多空收益能有效提高,同时 有效降低组合的换手率,所以以下的两周频、周频、日频的因子构建均采用方法一来进行构造。

2.2、高频因子分类 1:订单失衡类

2.2.1 订单失衡类因子介绍

第一类因子为订单失衡类因子,主要是利用日内盘口数据对是量价数据进行了研究。盘口数据包括股票的 委托买卖价格以及委托交易量数据,其反应了当前时刻的投资者情绪和市场的预期。 这一部分主要介绍 VOI、OFI、OIR、SOIR、PIR 五个因子,这五个因子都是使用 level1 当中的买一到买五、 卖一到卖五的委托价格和委托数量构造而成的。对于月频测试结果而言,多空年化收益为 15.02%、19.68%、15.91%、 21.40%、22.41%。 订单失衡类因子的投资逻辑体现在短期买盘压力大的时候长期的股票收益率往往是呈负相关的关系。从散 户来看,在短期内散户容易存在追高杀跌行为。短期追高,价格上涨,但随着时间的累积,价格会逐渐处于高 位,长期来看价格会回落;从主力的角度来看,主力对市场的短时操纵造成了价格的涨跌。强的买卖压力一般 是大单交易造成的,大单交易很可能是主力的“对倒”行为,其目的主要是吸引散户。

2.2.2 订单失衡类因子绩效表现

2.2.2.1 VOI 因子

首先我们展示 VOI 因子的绩效表现:可以看到无论是否考虑手续费,当随着调仓频率的增加时,VOI 因子的 年化多空收益都逐渐升高;同时可以看到手续费对日频因子的年化多空收益影响最大,但是扣费之后多空表现 最好的仍然是日因子。整体来看,VOI 因子在全市场范围内、不同调仓频率下均具有不错的选股能力。

2.2.2.2 MOFI 因子

接着是 MOFI 因子的绩效表现:可以看到在没有手续费的情况下,当随着调仓频率的增加时,MOFI 因子的 年化多空收益逐渐升高;而在扣费的情况下多空年化表现最好的是两周频因子;另外手续费对日频因子的年化 多空收益影响同样是最显著的。整体来看,MOFI 因子在全市场范围内、不同调仓频率下选股能力还是不错的。

2.2.2.3 OIR 因子

然后是 OIR 因子的绩效表现:在不考虑手续费的情况下,OIR 因子的年化多空收益同样随着调仓频率的增加而逐渐升高;在扣费的情况下多空年化表现最好的是周频因子;另外手续费对日频因子的年化多空收益影响依 然是最大的。整体来看,OIR 因子在全市场范围内、不同调仓频率下选股能力也是不错的。

2.2.2.4 SOIR 因子

再然后是 SOIR 因子的绩效表现:SOIR 因子的多空表现随调仓频率和是否计费的变化与 OIR 因子是一样的; 但是整体而言 SOIR 因子的多空年化收益相比 OIR 因子均有所提升。相比 OIR 因子,SOIR 因子在全市场范围内、 不同调仓频率下选股能力更强。

2.2.2.5 PIR 因子

最后是 PIR 因子的绩效表现:同样地,PIR 因子的多空表现随调仓频率和是否计费的变化也与 OIR 因子是一 样的;相比 SOIR 因子而言,PIR 因子的多空表现有了更进一步的提升。总的来说,PIR 因子在全市场范围内、不 同调仓频率下的选股能力是五类订单失衡类因子中最强的。

2.3、高频因子分类 2:量价类

2.3.1 量价类因子介绍

第二类因子为量价类因子。主要利用高频的价格数据,包括了高频的平均成交价格、买一价、卖一价和收 盘价。 其中 MPB 因子通过成交均价进行因子构建,MPC、MPC_max、MPC_skew 则是通过中间价的特征来构建因 子,MAX 因子是通过识别分钟较大涨幅进行构建,RSJ 因子的构建则是从波动率的方面进行。 MPB、MPC、MPC_max、MPC_skew、MAX、RSJ 六个因子,在月频换仓下的多空年化收益分别为 20.3%、 22.64%、16.85%、17.06%、16.99%、17.14%。 在投资逻辑层面上,MPB、MPC、MAX 都是刻画短期价格上涨的因子,股票的短期上涨往往是由于散户投 资者的追涨杀跌以及机构投资者对于市场的操控造成的,长期来看股价往往会出现回落。MPC_max 和 MPC_skew 则是刻画了市场的极端变化,市场发生极端变化一般是大资金进行市场操纵造成的急涨和急跌,往往也会造成 股价在长时间的过程中进行回落。

2.3.2 量价类因子绩效表现

2.3.2.1 MPB 因子

首先是 MPB 因子的绩效表现:可以看到无论是否考虑手续费,当随着调仓频率的增加时,MPB 因子的年化 多空收益都逐渐升高;同时可以看到手续费对日频因子的年化多空收益影响最大,但是扣费之后多空表现最好 的仍然是日因子;MPB 日频因子的多空年化收益非常高,不计费的情况下可以达到 68%,即使扣除手续费后也有接近 41%的多空年化。整体来看,MPB 因子在全市场范围内、不同调仓频率下均具有不错的选股能力,尤其 是对于日频因子而言,MPB 因子选股能力显著。

2.3.2.2 MPC 因子

接下来是 MPC 因子的绩效表现:MPC 因子的多空表现随调仓频率和是否计费的变化与 MPB 因子是一样的; 但是整体而言 MPC 因子的多空年化收益相比 MPB 因子均有所提升;在日频调仓的情况下,MPC 因子的多空年 化收益可以达到 72.41%,扣费之后也有 43.33%。总的来看,MPC 因子在全市场范围内、不同调仓频率下选股能 力比 MPB 因子更强,具有非常不错的选股能力。

2.3.2.3 MPC_max 和 MPC_skew 因子

然后是 MPC_max 因子的绩效表现:与 MPC 因子类似,可以看到无论是否考虑手续费,当随着调仓频率的 增加时,MPC_max 因子的年化多空收益都逐渐升高;同时可以看到手续费对日频因子的年化多空收益影响最大, 但是扣费之后多空表现最好的仍然是日因子。整体来看,MPC_max 因子在全市场范围内、不同调仓频率下均具 有不错的选股能力。

再然后是 MPC_skew 因子的绩效表现:MPC_skew 因子的多空表现随调仓频率和是否计费的变化与 MPC_max 因子是一样的;同样可以看到手续费对日频因子的年化多空收益影响最大,但是扣费之后多空表现最好的仍然 是日因子;相比 MPC_max 因子,MPC_skew 日因子在不扣费情况下的多空年化收益更高,可以达到 62.11%。整 体来看,MPC_skew 因子在全市场范围内、不同调仓频率下同样均具有不错的选股能力。

2.3.2.4 MAX 因子

再接下来是 MAX 因子的绩效表现:与前述四个量价因子类似,MAX 因子的多空年化收益在无论是否扣费的 情况下都是随调仓频率的增加而升高的;同样地,手续费对日频因子的年化多空收益影响也最大,并且扣费之 后多空表现最好的仍然是日因子;整体来看,MAX 因子在全市场范围内、不同调仓频率下同样均具有不错的选 股能力。

2.3.2.5 RSJ 因子

最后是 RSJ 因子的绩效表现: RSJ 因子的多空表现随调仓频率和是否计费的变化与前述 5 个量价类因子是 一样的;同样地,手续费对日频因子的年化多空收益影响也最大,扣费之后多空表现最好的仍然是日因子;整 体来看,RSJ 因子在全市场范围内、不同调仓频率下同样均具有不错的选股能力。

2.4、高频因子分类 3:流动性类

2.4.1 流动性类因子介绍

第三类因子为流动性类因子,主要刻画特定股票的流动性情况,其中 ILLIQ、ILLIQ2、LSIlliq、Gamma 是通过 日频的量价数据构造的。Lambda 是通过高频量价数据构造的,LogquoteSlope、MCI_B 是通过委托数据进行构造 的。 在月频调仓的情况下,ILLIQ、ILLIQ2、LSIlliq、Gamma 、lambda、 LogquoteSlope、MCI_B 这七个因子的多 空年化收益分别为 24.66%、30.38%、23.11%、32.35%、29.13%、22.94%、26.18%。 从投资逻辑上来看,这七个因子均是值越大代表股票的流动性越差,流动性差就会出现低流动性溢价,导 致未来的股票呈上涨趋势。

2.4.2 流动性类因子绩效表现

2.4.2.1 ILLIQ 因子

首先是 ILLIQ 因子的绩效表现:可以看到无论是否考虑手续费,ILLIQ 因子的年化多空收益随调仓频率 的变化不大;另外手续费对 ILLIQ 因子的多空年化收益影响也不大,这说明 ILLIQ 因子的换手率比较低。 整体来看,ILLIQ 因子在全市场范围内、不同调仓频率下均具有不错的选股能力。

2.4.2.2 ILLIQ2 和 LSIlliq 因子

接下来是 ILLIQ2 因子的绩效表现:可以看到相比 ILLIQ 因子,ILLIQ2 因子在不同调仓频率下的多空年 化收益均有大幅提升,日频因子不扣费情况下多空年化收益接近 75%,扣费之后也有 60%的年化多空收 益,这表明 ILLIQ2 因子同样具有换手率较低的特点。整体来看,ILLIQ2 因子在全市场范围内、不同调仓频 率下均具有非常好的选股能力,是我们重点推荐的高频因子之一。

再接下来是 LSIlliq 因子的绩效表现:与 ILLIQ 因子类似,LSIlliq 因子的多空年化收益随调仓频率以及 是否扣费的变化也不大。整体来看,LSIlliq 因子在全市场范围内、不同调仓频率下也具有不错的选股能 力。

2.4.2.3 Gamma 因子

然后是 Gamma 因子的绩效表现:可以看到 Gamma 因子同样具有多空年化收益随调仓频率以及是否 扣费变化不大的特点;相比 ILLIQ 因子,Gamma 因子的多空年化有显著的提升。整体上来看,Gamma 因 子在全市场范围内、不同调仓频率下具有非常不错的选股能力。

2.4.2.4 Lambda 因子

再然后是 Lambda 因子的绩效表现:Lambda 因子的多空年化收益与 Gamma 因子比较接近;另外同样 可以看到 Lambda 因子同样具有多空年华收益随调仓频率以及是否扣费变化不大的特点。整体上来看, Lambda 因子在全市场范围内、不同调仓频率下也具有非常不错的选股能力。

2.4.2.5 LogquoteSlope 因子

再然后是 LogquoteSlope 因子的绩效表现:LogquoteSlope 因子的多空年化收益与 ILLIQ 因子比较接 近;另外同样 LogquoteSlope 因子同样具有多空年化收益随调仓频率以及是否扣费变化不大的特点。整体 上来看,LogquoteSlope 因子在全市场范围内、不同调仓频率下具有不错的选股能力。

2.4.2.6 MCI_B 因子

最后是 MCI_B 因子的绩效表现:与前述 6 个流动性类因子相比,MCI_B 日频因子的多空年化收益在 扣费之后变化相对要大一些,但是在其他调仓频率下扣费的影响也不大。总的来说,MCI_B 因子在全市 场范围内、不同调仓频率下同样具有不错的选股能力。

2.5、高频因子分类 4:资金流类

2.5.1 资金流类因子介绍

第四类因子为资金流类因子。这一部分的因子主要从高频成交量、成交金额、成交笔数的方向来刻画股票 受资金的关注程度。这一部分分别介绍 PTOR、BNI、MB、BAM、SAM、BACov、SACov 这七个因子。 因子 PTOR 通过引入笔数的数据,计算平均每笔的成交金额来构建因子;BNI 和 MB 则是先定义大资金成交 的时间段,再进行因子构建;而 BAM、SAM、BACov、SACov 这四个因子则是通过每笔成交金额的属性来进行因 子的构建。 PTOR、BNI、MB、BAM、SAM、BACov、SACov 这七个因子月频换仓的年化多空收益分别为 21.93%、16.74%、 24.18%、33.37%、32.07%、28.51%、30.74%,均具有比较好的选股能力。

2.5.2 资金流类因子绩效表现

2.5.2.1 PTOR 因子

首先是 PTOR 因子的绩效表现:可以看到无论是否考虑手续费,当随着调仓频率的增加时,PTOR 因 子的年化多空收益都逐渐升高;同时可以看到手续费对日频因子的年化多空收益影响最大,但是扣费之 后多空表现最好的仍然是日因子。整体来看,PTOR 因子在全市场范围内、不同调仓频率下均具有不错的 选股能力。

2.5.2.2 BNI 因子

接下来是 BNI 因子的绩效表现:与 PTOR 因子类似,可以看到无论是否考虑手续费,当随着调仓频率的增加 时,BNI 因子的年化多空收益也都逐渐升高;同时手续费对日频因子的年化多空收益影响也最大。整体来看,BNI 因子在全市场范围内、不同调仓频率下均具有不错的选股能力。

2.5.2.3 MB 因子

再接下来是 MB 因子的绩效表现:与前面两个资金流类因子类似,可以看到在不扣费的情况下,当 随着调仓频率的增加时,MB 因子的年化多空收益也都逐渐升高;同时手续费对日频因子的年化多空收益 影响也最大,并且扣费之后多空表现最好的仍然是日因子。整体来看,MB 因子在全市场范围内、不同调 仓频率下均具有不错的选股能力。

2.5.2.4 BAM 和 SAM 因子

然后是 BAM 因子的绩效表现:可以看到 BAM 因子的多空年化收益在扣费之后变化比较小,说明 BAM 因子 的换手率比较低;并且在不同调仓频率下的多空年化收益均维持在较高的水平。综合来看,BAM 因子在全市场 范围内、不同调仓频率下均具有非常好的选股能力,是我们重点推荐的高频因子之一。

再然后是 SAM 因子的绩效表现:与 BAM 因子的表现类似,可以看到 SAM 因子的多空年化收益在扣费之后变化也比较小,说明 SAM 因子的换手率同样比较低;并且在不同调仓频率下的多空年化收益均维持在较高的水 平。综合来看,SAM 因子在全市场范围内、不同调仓频率下均具有非常好的选股能力,是我们重点推荐的高频 因子之一。

2.5.2.5 BACov 和 SACov 因子

接下来是 BACov 因子的绩效表现:可以看到 BACov 因子的多空年化收益在扣费之后变化同样比较小,说明 BACov 因子的换手率也比较低;并且在不同调仓频率下的多空年化收益均维持在较高的水平。综合来看,BACov 因子在全市场范围内、不同调仓频率下均具有非常好的选股能力。

最后是 SACov 因子的绩效表现:与 BACov 因子的表现类似,可以看到 SACov 因子的多空年化收益在扣费之 后变化也比较小,说明 SACov 因子的换手率比较低;并且在不同调仓频率下的多空年化收益均维持在较高的水 平。综合来看,SACov 因子在全市场范围内、不同调仓频率下也均具有非常好的选股能力。

2.6、高频因子中性化后及在不同指数样本池内的测试结果

2.6.1 高频因子市值行业中性化后效果对比

我们对最大回撤较大的因子作市值行业中性化,在全市场下进行月频调仓测试,结果如下:

可以看到这些因子在作市值行业中性化后稳定性变得更好了,同时部分因子的年化收益也有一定程度的提 升,其余因子的多空年化收益变化也不大。这说明这些因子需要进行市值行业中性化,在作中性化后效果会更 好。我们可以从下述多空收益曲线中看出中性化后这些因子稳定性明显增强,多空收益也有一定程度提升。

2.6.2 高频因子在全市场样本池内的测试效果

首先我们展示这四类高频因子在全市场样本池内的绩效表现:可以看到四类高频因子均获得了不错的多空 收益,在全市场样本池内均具有不错的选股能力。从多空表现来看,这四类高频因子基本都满足随着调仓频率 的增加,因子的多空年化收益也增大的趋势。从多空年化收益来看,订单失衡类因子的多空年化收益在 15%-40%之间;量价类因子的多空年化收益在 20%-70%之间;流动性类因子的多空年化收益在 25%-75%之间;资金流类 因子的多空年化收益在 20%-70%之间。

2.6.3 高频因子在中证 1000 样本池内的测试效果

接下来我们展示这四类因子在中证 1000 样本池内的测试结果:相比在全市场样本池内,四类高频因子在中 证 1000 样本池内获得了更好的多空表现,具有更强的选股能力,这说明这些因子在小市值股票中的表现要更 好。具体来看,订单失衡类因子的多空年化收益在 20%-50%之间;量价类因子的多空年化收益在 20%-80%之间; 流动性类因子的多空年化收益在 25%-70%之间;资金流类因子的多空年化收益在 15%-65%之间。

2.6.4 高频因子在中证 500 样本池内的测试效果

然后我们展示四类高频因子在中证 500 样本池内的测试结果:相比在全市场样本池内的测试结果,四类高 频因子的多空表现在中证 500 样本池内有一定程度弱化,但整体来看依然具有不错的选股能力。具体来说,订 单失衡类因子的多空年化收益在 10%-50%之间;量价类因子的多空年化收益在 10%-40%之间;流动性类因子的 多空年化收益在 15%-50%之间;资金流类因子的多空年化收益在 10%-45%之间,订单失衡类因子和流动性类因 子的表现相比较而言要更好一些。

2.6.5 高频因子在沪深 300 样本池内的测试效果

最后是四类高频因子在沪深 300 样本池内的测试结果:可以看到在沪深 300 样本池内订单失衡类和量价类 因子仍然是有效的,订单失衡类因子的多空收益在 10%-40%之间,量价类因子的多空收益在 5%-35%之间。对于 流动性类因子和资金流类因子,由于市值越大,基金重仓股受资金影响越低,因此这两类因子在沪深 300 样本 池内多空表现偏弱。

三、组合构建方法探究——利用多事件融合信息改进指数增强组合

3.1、多事件融合策略概述

本篇报告从多事件信息出发,将多维度检验得到的有效事件进行聚合,并最终融入到原有指数增强组合。 首先是建立事件库,从各事件的数据源获取原始事件信息,并进行初步清洗;其次是筛选有效事件,参考事件 评价维度,逐一检验单事件有效性、测算单事件组合绩效;而后是聚合有效事件,利用全部有效事件得到个股 预期收益,作为多事件因子;最后是融入增强组合,将多事件因子与现有阿尔法进行融合,尝试提升增强绩效。 经过测试发现:基于事件评估的四维体系,从初始的 17 类事件中筛选出 11 类有效事件。重新整合事件类 别后,对单个事件构建事件组合,发现各类事件的作用域不尽相同:股权激励、股份回购、机构调研和超预期 信息适用于全部三个指数;股东增减持和限售股解禁适用于沪深 300;定向增发、负面公告和预告快报适用于中 证 500 或中证 1000。由多事件信息聚合为多事件因子,设定为中等训练期和极值聚合方法后,因子相对各指数 有明显增强效果。最后将多事件因子融合入原有 300 增强组合,在动态叠加极值因子后,组合绩效得到全面提 升,年化超额从 10.6%提升至 11.7%、信息比率从 2.43 提升至 2.71、最大回撤率从 5.0%缩减至 4.7%、月度胜率 从 74%提升至 76%。

3.2、单事件效应检验

3.2.1 事件评价维度

为了全方位评估事件有效性,建立 4 个维度的评价体系,分别从事件逻辑、事件效应、可验证性和可操作 性进行逐一辨别。首先是事件逻辑,作为判断有效性的先决条件,具体有三个方面:一是政策层面支持力度; 二是市场上的关注度和认可度;三是事件逻辑是否清晰无歧义。其次是可验证性,用于从数据层面判断后续做 检验的必要性,具体有三个方面:一是历史样本量是否充足;二是历史数据的时间跨度是否足够;三是事件触 发日在过往历史上是否可回溯。再者是事件效应,主要参考事件研究法做统计检验,以 CAR(累计异常收益)区 分有效性,重点关注事后窗口 CAR 的显著性、持续性和单调性;另外可以依据事件关键属性筛选样本,有助于提纯事件并凸显效应。最后是可操作性,需要结合事件自身特性与策略构建方式,以便将事件信息转化为策略 信号,比如事件效应的持续性需要覆盖策略持仓期、事件触发域需要覆盖策略域等;另外,本文后续将事件信 息用于改进增强组合,则还需关注事件逐年胜率,以保证对现有组合有稳健的提升效果。

3.2.2 事件效应检验方法

事件效应检验主要采用事件研究法(Event Study),将所有事件样本按触发日对齐,再测算前后窗口内的异 常收益,根据其显著程度判断事件有效性。事件窗口方面,以时点 T0 作为事件触发日,以 20 交易日为间隔单 位,确定事前事后窗口长度,本报告中默认窗口长度为前后 60 个交易日。 异常收益(AR),表示个股真实收益超出预期收益的部分。具体度量是通过截面回归将市场、行业和风格这 些风险因素剥离后,得到的残差收益作为异常收益,再计算特定窗口内的累计值作为累计异常收益(CAR)。其 中,行业划分标准参考中信一级行业,风格因素参考 Barra CNE5 的十大类风格因子的构建方法。值得一提的是, 异常收益的度量不仅限于上述方法,在回归方法、业绩基准、预期收益因素等方面有着诸多选择。考虑到后续 会用于改进增强效果,事件筛选需避免对行业或风格的堆叠,更适宜反映增量信息。

3.2.3 单事件效应回测结果汇总

对前期测试的 11 类事件结果进行汇总,1)明确了事件的触发时点和有区分度的关键属性;2)罗列了事件效应的方向、显著性和持续性;3)综合事件表现得出有效性结论。适当剔除表现欠佳的事 件类别,如事后效应偏弱的事件(负面公告-担保)、事件样本过少的事件(再融资-配股)、存在政策风险的事件 (利润分配-送转)等。

3.3、单事件组合检验

3.3.1 事件组合构建

在有效事件的基础上,进一步检验事件组合的指数增强效果。具体做法是:1)在每月末按自然日前推观察 期;2)若观察期内有指数成份股触发事件,将其纳入到组合中;3)若观察期内同一个股有多次触发,则仅取 最近的触发记录;4)若当期无个股触发事件,则沿用上期的触发结果作为持仓;5)最后将组合内个股按流通 市值加权。 回测方面:1)默认回测区间为 2010 年至 2022 年;2)参考基准可选沪深 300、中证 500 和中证 1000;3) 剔除换仓当日不可交易个股;4)以均价为成交价格;5)费率设定为买入千一、卖出千二。另外,考虑到过低持 股量或长时间空仓会对回测结果造成干扰,不宜采用细分类别作为触发条件,后续会将部分类别整合为大类事 件,以满足每月最低持股量的要求。

3.3.2 事件组合回测

3.3.2.1 股权激励组合

对于股权激励事件,前文的事后效应结果表明:正向效应持续期较长,从预案公告日直至首次实施日之后 的 100 个交易日。因此,纳入多个时间节点作为触发日,包括预案公告日、股东大会公告日和首次实施日。 从回测结果来看:1)股权激励对于沪深 300、中证 500 和中证 1000 均有正向超额表现;2)若拉长观察期,沪深 300 超额略有下降、中证 500 超额基本持平、中证 1000 超额有所上升;3)以近一年表现而言,中证 500 超额表现最为突出,60 日观测期的超额收益达 21.4%。

3.3.2.2 定向增发组合

对于定向增发事件,前文的事后效应结果表明:有必要区别不同时点,初始预案日之后的短期窗口反应充 分,以致于中长期窗口效应有明显衰退,而后续审批时点均有显著持续的正向效应。因此,将预案公告日单独 归为一类,将股东大会公告日、发审委审核日和证监会通过日归为一类。 从回测结果来看:1)定向增发对沪深 300 无增强效果,但对中证 500 和中证 1000 有正向超额;2)对比不 同时点,预案时点的增强效果偏弱、甚至相对中证 1000 呈负超额,而后续时点均为正超额。

3.3.2.3 负面公告组合

对于负面公告事件,前文的事后效应结果表明:诉讼仲裁和担保的事后效应并不显著。因此,仅纳入违规 处罚和立案调查作为负面公告类别。 从回测结果来看:1)负面公告对中证 1000 有明显负超额表现;2)30 日观测期下年化负超额可达-13.2%,但拉长观测期负超额收益会有明显衰退;3)尽管往年均稳定负超额,但近一年表现欠佳。

3.3.2.4 股东增持组合

对于股东增持事件,前文的事后效应结果表明:筛选持有人类型能明显提升事后效应表现,而变动比例也 可作为筛选属性。因此,将高管持有人和非低变动占比作为筛选条件,对比筛选前后的组合表现。 从回测结果来看:1)股东增持对沪深 300 有一定增强效果;2)仅筛选高管类别或非低占比类别,均表现 欠佳,而同时筛选两项条件后能获取正向超额;3)在筛选的基础上拉长观测期,能小幅提升正超额收益。

3.3.2.5 限售股解禁组合

对于限售股解禁事件,前文的事后效应结果表明:若公告日与可流通日的跨度距离较短,更能凸显事后效 应。因此,将两者日期差作为筛选条件,对比筛选前后的组合表现。 从回测结果来看:1)限售股解禁对沪深 300 有一定增强效果;2)筛选日期差属性后,组合超额有负转正; 3)在筛选的基础上拉长观测期,能大幅提升正超额收益。

3.3.2.6 股份回购组合

对于股份回购事件,前文的事后效应结果表明:事后短期内无显著效应,但在中长期窗口有持续显著的正 向效应。因此,选择较长的观测期为主。 从回测结果来看:1)股份回购对沪深 300、中证 500 和中证 1000 均有正向超额;2)对比不同股票池的增 强效果,对大市值增强效果略强些;3)拉长观测期能有效提升正超额收益。

3.3.2.7 机构调研组合

对于机构调研事件,前文的事后效应结果表明:事后的正向效应显著、持续且逐年稳定性强,但收益累积 量要明显弱于事前窗口;在调研主体类型中,基金公司具备显著区分度。因此,事先对样本做主体类型属性的 筛选。 从回测结果来看:1)机构调研对中证 500 和中证 1000 均有正向超额;2)对比不同股票池的增强效果,对 小市值增强效果略强些;3)拉长观测期能有效提升正超额收益,其中沪深 300 超额由负转正;4)近一年表现 欠佳,对三个指数均为负超额收益。

3.3.2.8 预告快报组合

对于业绩预告和业绩快报事件,将正向类别(预告盈利和快报超预期)归为同一类,将负向类别(预告亏 损和快报低预期)归为同一类。前文的事后效应结果表明:预告盈利中的预增和扭亏表现更突出,预告亏损中 的首亏和预减表现更突出。在测试中,尝试将同一大类中不同细分类别进行组合,有助于实现强强结合效果。 从回测结果来看:1)业绩类事件对中证 1000 有明显增强效果;2)单类别中,预增、扭亏、首亏和续亏均 表现突出;2)多类别组合中,预增和扭亏叠加超预期能明显提升超额收益和胜率,首亏和续亏的组合在负率上 有一定提升。

3.3.2.9 超预期信息组合

对于超预期信息事件,前文的事后效应结果表明:业绩增速类别有显著区分度。因此,将信息类别作为筛 选条件,对比筛选前后的组合表现。 从回测结果来看:1)超预期信息对沪深 300、中证 500 和中证 1000 均有可观的正向超额;2)经过业绩增 速筛选后,组合的超额收益大都有明显提升,尤其对沪深 300 有一倍以上的提升幅度;3)对比不同指数增强效 果,相对中证 500 有更强的超额表现。

3.4、多事件信息聚合

3.4.1 多事件因子构建方法

通过前文一系列的测试,大致框定了有效事件的类别、触发时点、关键属性、持续周期和作用域。但考虑 到单一事件的覆盖度有限,并且部分事件效应存在一定周期性,更适宜将多类事件信息聚合。另外,后续事件 信息会用于改进增强组合,可将不定期触发的事件信号转为定期生成的事件因子,便于融入多因子框架。 多事件因子构建流程如下:1)划分观察期与训练期:以月末调仓日为起点往前倒推,先划定观察期再划定 训练期,两者互不重合。其中,观察期用于确定事件的触发情况,训练期用于确定事件的预期收益。2)统计事 件触发情况:在观察期内,同类事件仅取距离调仓日最近的触发记录,也需要计算触发日与调仓日间的日期差。 3)计算事件预期收益:将累计异常收益作为预期收益的度量方法,具体是计算训练期内同类事件样本的均值。 此外,考虑到事件效应的时间敏感度较高,根据观察期内触发事件的日期差去匹配训练期相同日期差的累计异 常收益。4)聚合多事件预期收益:整合观察期内每只个股的所有事件预期收益,可以得到二维的预期收益矩阵,对事件维度进行聚合即可得到当期的多事件因子值。

3.4.2 多事件因子概览

为了展示多事件因子的特点,对其覆盖量、域覆盖度、风格相关性分别进行统计。1)覆盖量逐年走高,从 2014 年的 1000+逐步抬升到 2022 年的 2000+;2)覆盖量呈一定周期性,源于财报披露 相关事件;3)指数内覆盖度较高,近几年三个指数覆盖度均过半;4)银行、TMT 是覆盖度较高的行业。

3.4.3 多事件因子回测

对多事件因子进行分组多空回测,具体设定:1)股票池为指数内成份股,同时剔除新股、ST 股、一字板股、 停牌股;2)分为 5 组,每组等权配置;3)按次月首个交易日的均价成交;4)回测区间从 2014 年至 2022 年。 在测试过程中,会对训练期长度和聚合方法进行参数测试。其中,聚合方法可选均值或极值,均值会兼顾 所有事件效应,极值会凸显最强的事件效应。从测试结果来看:1)对比各指数绩效,中证 1000 强于中证 500 和沪深 300;2)对比聚合方法,沪深 300 内均值和极值的表现大致相当,但中证 500 和中证 1000 内极值方法效果明显占优;3)对比训练期,总体上适宜采用 2 至 4 年的中等长度,而对于中证 500 和中证 1000 可考虑拉长训练期。

对多事件因子进行增强组合回测,优化组合的具体设定:1)最大化多事件因子暴露度,特别地会对因子值 补 0,表明个股的事件效应预期收益为 0;2)股票池为全市场,剔除 ST 股、新股、近期停牌股;3)风险因子 中,行业因子参考中信一级行业,风格因子参考 Barra CNE5 的十大类因子;4)优化约束包含指数内下限、个股 偏离限制、行业偏离限制、风格偏离限制、跟踪误差上限和换手上限。回测的具体设定:1)持仓中剔除一字板 股、停牌股;2)按次月首个交易日的均价成交;3)交易费率为买入千一、卖出千二;4)回测区间从 2014 年 至 2022 年。 从回测表现来看:1)多事件因子对沪深 300、中证 500 和中证 1000 均有正向超额收益;2)对比不同对标 指数,中证 1000 增强效果最为突出、中证 500 略弱些;3)参数测试结果与上述的多空结果基本一致,即极值 方法效果更优、训练期适宜采用中等长度。

3.5、融入指数增强组合

3.5.1 多事件因融合方法

我们选择上篇报告的沪深 300 增强组合作为基准组合,阿尔法源是将成长、流动性、分析师和高频这四类 因子等权配置,再固定叠加分析师事件信号。自 2014 年至 2022 年,该组合的年化超额收益为 10.6%、信息比率为 2.43、超额最大回撤率是 5.04%、月 度胜率为 74%。 在原始阿尔法的基础上融合多事件因子:1)两种候选多事件因子,一种是 1200 日训练期并以均值聚合, 另一种是 800 日训练期并以极值聚合;2)两种叠加方法,一种是在原阿尔法的基础上以固定系数叠加,另一种 是以动态的修正系数叠加,具体是参考过去一段时间多事件因子的分组单调性程度,数值范围 0~1。组合优化方 面,基本沿用基准组合的设定,将年化跟踪误差控制在 4.5%左右、将年化换手率控制在 3 倍左右。

3.5.2 增强组合改进效果

为了明确具体改进效果,分为四个层次作对比。第一层是比较是否叠加多事件因子:从总体比较来看,叠 加后有较明显改进。第二层是比较两种多事件因子:均值因子的改进效果并不明显,而极值因子的年化超额均 有所提升。第三层是比较叠加方法:固定叠加下,改进组合与基准组合的表现大致相当;动态叠加下,改进组 合有显著提升。第四层是比较修正系数的观测长度:适当拉长观测长度有助于提升改进效果、提升稳定性。 总结而言,动态叠加长观测期的极值因子,相对于基准组合有全面提升:年化超额从 10.6%提升至 11.7%、 信息比率从 2.43 提升至 2.71、最大回撤率从 5.0%缩减至 4.7%、月度胜率从 74%提升至 76%。

进一步对比分年表现,可以明确改进提升的根源。固定叠加组合的表现较为激进,在因子表现强势年份有 明显提升,但在因子表现弱势的年份也有明显下滑,因此两者相抵后在整体上既无显著提升又是加大组合波动 性。动态叠加组合的表现较为柔和,虽然强势年份的提升幅度不及固定叠加,但在弱势年份也同步减少叠加权 重,有效控制了下滑程度,因此在总体上既能提升收益又能减少风险,有了全面提升。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

关键词: