一、建模框架可行性探讨
基于“自上而下宏观基本面信息”构建行业轮动框架的建模前提假设是:未来情景可在历史中找寻统 计意义上“显著”的相似性。在这个前提下,我们需要确定 A 股市场在 2005 年至今的近 20 年的发展 历程中,各行业的轮动模式在历史各经济周期中是否有可靠的重复性? 首先,考虑到 A 股各行业并未稳健的进入成熟期,且各个行业所经历的自身成长周期(起步期、 成长期、成熟期、衰退期)没有稳定的重复性,行业历史 beta 属性很难具有可用于统计建模的稳健 性。典型如 2015-2019 白酒饮料公募抱团行情在历史中未发生过;2019-2021 的电新行业大发展在 近 20 年历史中从未发生过;2010 年之前对周期行业的追逐在当前很难重现等等。
其次,我们以 2019-2021 年的核心资产崛起为例,发现如果直接对标行业在特定时期的超额收益, 从统计角度,很难从过往 A 股历史找到相似经验。比如 2019-2021 茅指数和宁指数的崛起背景有: 1. 食品饮料行业在相对低波动经济周期下,其盈利稳定特征受到机构追捧; 2. 全球新能源背景下的产业新周期崛起; 3. 2016 年后北向外资基于 PB-ROE 价值框架的配置力量; 4. 公募对核心资产的―抱团‖。 上述因素除了第一项有可能具有一定历史重复性,其余因素在是历史上没有发生过的,基本不具有 定量建模的可能性。
(资料图)
框架构想:将“行业风格”作为中介的可行性讨论。如果行业自身成长周期与经济周期的综合叠加效应很难统计出稳健的结论,那么基于自上而下视角, 什么特征能够统计出相对稳定的规律呢? 结合中外学术研究与业界实践经验,我们认为在特定的经济、货币和信用周期下,风格特征可能具 有一定重复性,比如成长/价值,动量/反转,高低 beta,高低波动率,高低流动性等。 关于股票风格特征能否被有效预测这一问题在业界至今仍存在比较激烈的争议,本文会在后续建模 结果分析的部分给出我们分析测算的结论。
案例讨论:以大小盘轮动为例,讨论风格的可重复性。为方便理解,我们以 A 股大小盘风格轮动为例:大小盘轮动的相对收益率通常由 PE 相对强度主导, 2013 年后经济波动和中速下行区间,该现象更加明显: 盈利端:在经济上行区间,小盘盈利弹性高于大盘,而在经济下行时表现相反。 估值端:流动性越好(M2 与名义 GDP 同比剪刀差越大),小盘较大盘估值占优。 由于在行业轮动层面,行业属于大盘还是小盘这一风格很难界定,因此在行业轮动框架下较难直接 实践,在此举例仅用于观点证明。
自上而下行业轮动:完整框架。 基于上文讨论,我们将―自上而下宏观基本面到行业优选‖的框架梳理为如下四大部分: 一、基本面指标构建体系:旨在把握中外经济增长、通胀、货币、信贷以及市场情绪等维度信息; 二、行业风格体系构建:用定量标准优选行业风格因子,用于后续风格研判; 三、风格研判量化模型:突破传统自上而下建模方法的局限性,构建有效稳健的风格预测体系; 四、行业组合优选与归因:以月度周期推荐行业组合,基于当期影响风格的核心基本面指标对模型 推荐行业组合进行业绩归因,并完成策略业绩评价。
二、行业风格因子构建体系
风格因子构建:Barra框架vs中银框架
中银行业风格因子的测算方法是基于经典Barra模型改进版本,具体如下: Barra风格因子测算框架:用哑变量来代表行业,将风格因子映射到个股上,并通过将个股截面收 益率对行业哑变量和个股风格暴露进行截面回归,实现同时估算各行业因子和风格因子的多空收益 率。 Barra模型局限性:模型目标是基于宏观基本面对未来的行业风格进行预判,并将风格预判的结果 映射到行业优选组合上。如果按照传统 Barra框架,风格收益则体现为剥离行业特征后的个股风格 因子多空收益组合,因此,该方法较难将风格预测的结果直接映射到行业层。
中银行业风格测算框架:本框架中,我们以中信一级行业为标的,计算行业在 t 时期基本面、估值、 资金、量价等维度的因子暴露(用 表示)。将各行业 t 时刻至 t+1 时刻的收益率与期初 t 时期各 行业标准化后的因子暴露度(用 ̃ 表示)进行截面回归,来估算 t+1 期各风格因子的预期多空收 益率(用 表示)。
风格因子构建:从风格优选映射到行业优选。将对多个风格研判的结论映射到行业优选组合上的步骤如下: 步骤一:基于宏观基本面因子对未来的风格多空方向进行研判; 步骤二:针对各行业对特定风格因子的标准化因子暴露度 (X) 进行打分:如果看多该风格则各行业 打分为标准化的因子暴露度,看空该风格则将各行业标准化暴露度取负号; 步骤三:将多个风格研判所得的行业打分进行等权求和,以筛选出最优行业组合。行业风格因子:构建与筛选标准 在选择行业风格因子时,我们借鉴了传统多因子选股思路以及 Barra USE4、CNE5、CNE6 等经典 风险因子构建行业风格因子方法。从因子显著性、稳定性、低相关性三个维度构建各类风格因子构 建和筛选的标准。
行业风格因子:因子构建与测试。列了参与行业风格筛选与测试的部分备选行业风格因子构建方法与测试结果。基于 2006.06 至 2022.12 区间各风格因子的多空收益时间序列,我们计算因子的相关系数矩阵。行业风格因子:测试与筛选。初步因子筛选:基于 2006.06 至 2022.12 区间各风格因子的多空月度收益时间序列,基于因子多空 月度预期收益率对应|t 值|>2 占比不低于 25%,且 AR(1)系数不低于 0.9,并且如果子类因子与复合 因子同时通过筛选,则以|t 值|显著比例较大者优先入选。通过前 2 步骤筛选,我们得到如下风格因 子列表。 因子相关性测试:测算因子月度多空收益相关系数矩阵可知,部分因子之间仍存在比较明显的相关 性。比如 Value、Beta_1y、EP_Forward、Leverage 的相关性均较高,需要进一步优选处理。
考虑因子的低相关性我们最终选择:估值(Value)、Beta(Beta_1y)、3 个月波动率(Vol_3m)、 12个月价格动量(Mom_12m)四个风格因子作为本版块框架下的预测因子。 行业风格因子开发难度显著高于个股风格因子,在后续模型中我们会持续纳入更多低相关显著因子。
三、宏观基本面指标构建体系
(一)宏观基本面指标体系搭建
指标构建原则:从刻画经济增长、通货膨胀、货币、信贷以及市场情绪等维度优选指标。尽量规避 中观结构性指标,且尽量规避每年 1 月存在缺失的相关指标。指标构建目标是基于最核心的总量指 标,实现自上而下对风格的研判,有效把握行业 Beta 机会。 交易规则设定:设定每个月的第一个交易日以截止上月末能够获取的基本面信息作为模型输入,基 于上文模型,预测未来一个月哪些行业风格会大概率占优,并基于行业因子将行业风格研判结果映 射到具体优选的行业层面。模型在下个月月初换仓。 指标时滞处理:除了 PMI 和利率估值等指标能较为及时的获取,大部分当月宏观指标通常在次月 8 号-20 号之间公布。基于指标公布日期的不同情况,对各指标进行 A 和 B 两类时滞处理。
(二)刻画宏观指标的三个角度
针对一个宏观指标,我们从如下三个维度刻画该指标: 指标所处历史中枢定位:滚动 6 年 Zscore =(当前值–6 年时序中位数)/ 6 年指标标准差 指标超预期:SUE_3Y =(当前值–过去 3 年同期指标均值)/ 3 年同期差值标准差 指标边际变动:3个月变动 = t 月值–(t-3)月值 SEU_3Y 指标旨在基于同期差异来衡量超预期幅度,应用于场景为宏观指标。本模型中,针对市场 衍生指标(利率,ERP 和 VIX)未进行计算。以―PPI 当月同比‖为例将指标进行如下维度拆解: 指标所处历史中枢定位:滚动 6 年 Zscore = (当前值–6 年时序中位数)/ 6 年指标标准差 指标超预期:SUE_3Y =(当前值–过去 3 年同期指标均值)/ 6 年同期差值的标准差 指标边际变动:3个月变动 = t 月值–(t-3)月值。
四、从风格择时到行业轮动量化建模
(一)建模框架:弱投票器理念
宏观建模小样本局限性:基本面数据频率低,样本少,2006 至 2022 年的月度数据不足 200 个样本 点。直接使用机器学习进行分类预测非常容易出现过拟合问题。 解决方案:将一个终极预测目标(行业轮动)拆解为多个低相关的子目标(多类风格研判),并针 对各子目标动态优选最优变量集合来实现样本的多次重复利用。其本质是通过多次使用同一指标来 实现样本扩容,这一理念与随机森林的 bagging 思想存在一定相似性。 流程框架:基于定量标准动态优选各个风格对应的最优基本面指标池,并基于这些指标对特定风格 进行―等权‖弱投票预测,最后将各个风格的预测结果―等权‖求和,得出最优行业。
为了尽可能减少建模过拟合问题,在本报告中,我们做如下几大核心处理: 预测目标:将各个风格多空的研判转为二分类问题:月度风格多空收益大于等于 0 时看多取类别值 1,反之看空取数值-1。 指标处理:将宏观基本面指标 3 个维度的子指标进行了哑变量处理,具体如下: 指标所处历史中枢定位(滚动 6 年 Zscore):大于等于 0 时取 1,否则取-1; 指标超预期(SUE_3Y):大于等于 0 时取 1,否则取-1; 指标边际变动(d3m):大于等于 0 时取 1,否则取-1。
单风格择时:针对优选的多个基本面指标对某个风格进行多空研判时,建议采用等权投票打分方式, 当宏观指标等权打分总分大于 0,则看多这类风格;如果打分总分小于 0,则看空该类风;如果总 分等于 0,则对该风格保持中性观点; 多类风格汇总为行业推荐:对多种风格多空研判观点汇总,采用等权打分方式,看多分数为 1,看 空分数为-1。将分数乘以各中信一级行业标准化后的风格暴露度(X),得到最终的行业推荐组合。
(二)建模框架:基本面变量筛选原则
针对特定风格优选最优变量池,有如下核心要点: 一是关注变量在过去历史区间的预测有效性。本框架我们以某指标在―过去滚动 N 期窗口‖方向研判 胜率为标准,并计算近 N 期单期样本内胜率序列的中位数。当胜率中位数超过一个阈值(如 N = 8 年,胜率阈值 = 53%)时,该指标在有效性维度达标。将―样本内测算窗口长度‖和―单期样本内胜 率时序长度‖均设定为同一个参数 N 是为了减少模型参数,降低过拟合可能性。胜率中位数阈值设 置尽可能低也是体现弱有效投票器思想。
二是关注指标在预测方向的一致性,即该指标在过去 N 期,指标与风格方向存在稳定一致性。即 针对滚动 N 期历史样本内的每一个胜率,指标与风格的正负相关性保持较高概率的稳定性(正负 相关性的判定方法为: 如果样本中胜率大于 50%的样本数量大于胜率低于 50%的样本数量,则为 1, 数量相等为 0,反之为-1)。该限制旨在保证提取宏观指标预测逻辑的稳定性,规避如―有时候 CPI 上行时显著看多成长,有时 CPI 下行时显著看多成长‖的不稳定甚至假逻辑。
(三)建模框架:动态优选参数回测框架
参数设定与回测框架:针对窗口滚动区间(6–10 年),但指标滚动窗口内胜率(51%-55%),方 向一致性概率阈值(70%-90%)均进行稳健性测试,模型框架整体可控。 参数设定:基于数据区间(2006/6/1——至今),我们在后续报告将基于(N = 8 年,样本内胜率中 位数 >= 53%,样本内方向一致性概率 >= 80%为参数设定)来优选各期宏观指标,并对各风格进行 样本外择时预测。该参数组合并非遍历测试的最优解,本质是希望参数设定与建模经验尽可能匹配。 回测框架:为了最大可能规避样本内建模下的过拟合完美曲线,我们采用―样本内建模优选变量, 并预测未来一期‖的滚动回测框架。
A 股数据较短,2022.06 后是稳定滚动窗口区间:滚动 8 年的样本内胜率中位数统计 + 滚动 8 年样 本内方向一致性概率,该框架第一个完整窗口本质需要(2006.06-2022.06)这 16 年数据窗口区间。 当数据开始的日期(2006.06)时长和宏观指标池发生变化时,相对最优的参数组合可能会发生相 对变动,通过情景和压力测试可知,该框架下,参数组合设定和模型业绩具有较强稳健性。
(四)指标胜率:以 2023 年 3 月 1 日模型信号为例
以 2023 年 3 月 1 日模型信号为例:基本面变量均进行哑变量处理,原指标大于 0 则为 1,小于 0 则 为-1,否则为 0;样本内胜率 >= 53%或 <=47% 的认为指标弱正(负)有效,方向一致性概率 >80% 或者 <20% 的认为指标稳定为正(负)相关;指标有效且稳健正相关为 1,有效且稳健负相关的为1,未入选指标为空值。
(五)单一风格择时:样本外弱有效
基于基本面指标的滚动样本外风格择时多空净值曲线如下,整体来讲风格择时是弱有效的。
(六)多风格择时等权复合:样本外强有效
多风格择时等权复合后,模型样本外胜率和夏普率均得到显著提升,复合风格因子的胜率约 61%, 夏普比率约 1.0,体现出多个低相关弱投票器汇总为强有效投票器的效果。
(七)将风格择时映射到行业轮动
行业轮动策略:基于上月末最新数据,在每个月第一个交易日以中信一级行业收盘价买入,持续一 个月,于下个月第一个交易日换仓。当业绩比较基准设定为中信一级行业平均月度收益时。
(八)历史行业推荐列表
复盘 2020 年 1 月至 2023 年 3 月的行业推荐结果,模型较为准确的抓住了区间的核心板块轮动机会, 2023 年初至今,相对准确的把握了 TMT、建材、有色相关板块的机会。
(九)2023年5月4日信号:基本面变量筛选与风格预测
模型 5 月预测:看多高 beta、高估值以及高 3 个月波动率风格,看空 12 个月动量风格!
(十)2023年5月4日信号:行业推荐结果
5 月前 8 行业排序:传媒、综合金融、电子、计算机、有色金属、建材、通信、非银。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
关键词: