如何分配资金？组合优化的是是非非

作者：：刀疤连来源订阅号：Chihiro Quantitative Research

今天给各位介绍一篇关于投资组合优化的好文，作者是我的好朋友，江湖人称刀疤连的连长。他在因子投资和资产配置方面经验丰富。

本文全面系统、深入浅出的阐述了投资组合优化的各个方面，是一篇难的的佳作。相信不管是量化投资领域的老司机还是新警察都能从中得到启发。

闲话不多说，马上走进这篇万字雄文。点击 [阅读原文] 可以跳转到这篇文章的原作，方便关注刀疤连的公众号。

摘要：本文围绕“如何分配资金”这一话题，详细讨论了各类优化模型及其改进方案。首先，根据目标函数需要的参数输入，将其分为四种类型，包括零输入、价格外信息加权、方差协方差类和均值方差优化；然后，从权重约束、协方差估计和多优化器等角度，介绍了一些优化思路。每类优化器都有其优点和缺点，在使用之前，一定要做到知己知彼，才能更有好地理解结果。

1、由分赃说起

一群强盗，刚打劫完一个大户人家，收获颇丰，回到山中老窝，进入分赃环节。分赃是一个技术活，很考验带头大哥的智商和情商，队伍不好带呀，稍有不慎就容易引起内讧。面对堆积如山的财宝，带头大哥也很苦恼，如果按照论资排辈来分，会让消精壮小伙心有不甘；如果按功劳来分，老家伙们肯定也不愿意；如果每个人都一视同仁平均分配，更容易乱成一团。在强盗分赃这个问题上，合理的分配方案，既很必要，也很重要。

同理，无论是散户贸然梭哈入场，还是基金经理精心设计组合，都会面临类似的问题，即每一个证券买多少。唯一不同的是，强盗带头大哥得让每个人都满意，投资者得让组合更合理。如何科学合理地分配资金，让投资组合满足特定的目标，就是投资组合优化问题。

本文一共分为 5 个部分，第 2 部分介绍目标函数有哪些类型，第 3 部分详细梳理各种各样的目标函数，第 4 部分讨论协方差、约束条件和多优化器，第 5 部分总结。

2、整体框架

无论是 FOF 投资经理口中的 BL 模型，还是桥水粉眼中迷离的风险平价，都属于典型的优化问题。浓缩成一句话，即在满足一定的约束条件时，使得组合目标最大化，表示成数学公式如下：

其中被称为目标函数，condition 为各种约束条件。组合优化在金融领域是一个特别浩大的问题，由于直接的应用价值，吸引和积累了大量的成果，形形色色的目标函数，构成了组合优化动物园。

如图 1 所示，按照目标函数输入参数的不同，可以分为四类：零输入、参数为价格外信息、只需要方差协方差，以及均值-方差优化。零输入，即目标函数中不需要任何参数估计，典型的如等权重；参数为价格外信息，顾名思义，目标函数需要输入参数，但参数和价格无关，如 GDP 加权；只需要方差协方差矩阵，即需要估计收益率的方差协方差矩阵，但不必考虑收益率，如最小方差组合；均值-方差优化，除了方差协方差外，还得对收益率进行估计，如经典的切点组合。

图 1 组合优化动物园

图片来源：CQR

接下来详细介绍各类优化方法，既琐碎又有趣。在正式展开之前，需要对常见的数学符号进行约定，具体如表 1。

表 1 数学符号约定

数据来源：CQR

3、组合优化动物园

3.1 零输入

零输入是所有目标函数中最朴素的一类，不需要任何参数估计，因此不会受到估计误差的影响。常见的零输入目标函数有两个：等权重和最大分散权重。

等权重（equal weight）

当没有任何信息或者偏好时，等权重是最简单的办法。等权重认为组合中每个证券具有同等的重要性，每个证券权重为：

等权重不需要进行任何预测，也不需要进行复杂的数学求解，常被用来作为比较基准。Gray（2014）讨论过 Markowitz 的一个老梗，非常有意思。Markowitz 虽然提出了精细的均值方差模型，但考虑到市场情绪和后悔偏差，他做投资时并没有使用这个模型，而是将资金等分到股票和债券上。

“I should have computed the historical covariance of the asset classes and drawn an efficient frontier…I split my contributions 50/50 between bonds and equities.”

等权重虽然看起来简单，但业绩表现十分抢眼，最经典的研究要属 DeMiguel、Garlappi 和 Uppal（2009）。DeMiguel et al. 利用 7 组不同数据，检验了 14 个组合优化模型相对于等权重组合的表现。结果表明，基于历史数据的均值方差组合，由于估计误差的存在，在样本外表现很难超越等权重组合；即使考虑对历史均值方差优化模型的各种调整（贝叶斯压缩、权重限制和卖空限制等），也鲜有能持续好于等权重的方案。

Plyakha、Uppal 和 Vikov（2012）利用标普 500 成分股 40 年的数据比较了等权重、市值加权和价格加权三种方式，结果发现：无论从总收益、阿尔法还是夏普比率，等权重皆优于另外两个组合，虽然组合波动、偏度和峰度会更高；等权重组合相对于市值加权和价格加权的超额收益率，是因为其在市场贝塔、市值和价值因子上有更多的暴露，在动量因子上暴露为负并且在反转因子上暴露为正；月度再平衡也是等权重获得更高收益的原因，通过每月重新调整组合至资金等权重，本质上是一个利用反转因子的反转策略。

DeMiguel et al.（2009）和 Plyakha et al.（2012）的讨论主要集中股票资产，Jacobs，Müller 和 Weber（2014）将研究范围扩展到了多类资产。Jacobs et al.（2014）利用全球股票指数（新兴市场、欧洲、北美和环太平洋）和大类资产（全球股票指数、债券和商品）数据，比较了 11 个常见组合优化模型和简单模型（包括 GDP 加权、等权重、市值加权和固定权重），结果发现：无论是股票指数组合还是多资产组合，复杂的数学优化方法效果有限，甚至不能带来任何价值，个人投资者可以利用等权重等简单加权方式实现较高的风险调整后收益。

最大化分散权重（diversification index）

如果能精确预测某些证券的未来走势，那么持有一个分散组合将变得毫无意义，只要全部押注看好的少量证券即可。然而，在投资领域精确预测只是奢望，骗子才会拍胸脯说预测十拿九稳。此时，持有一个分散化的组合，不将鸡蛋放在一个篮子里，或者多准备几个篮子，将减少集中持仓被一锅端的风险。

那么，什么样的组合才能被称为分散组合呢？按照 Meucci（2010）的定义：

“a portfolio is diversified if it is not heavily exposed to individual shocks.”

即组合不会因为单一冲击受到过多的影响，例如债券违约或者股票财务造假，如果重仓持有则会遭到灭顶之灾，但对充分分散的组合来说拖累就十分有限。

衡量组合分散性的指标有很多，可以从资金权重、风险分配和因子配置等角度度量组合的分散程度。资金权重指标只依赖于组合成分持仓占比，不需要收益率预测和方差协方差估计，简单明了易于计算，如常见的基尼系数；风险分配指标往往依赖于成分的波动率和相关系数估计，如后面要介绍的分散比率（Diversification Ratio）；因子配置是较为前沿的研究，认为组合的收益和风险来源于少量因子，这些因子可以是证券的基本特征（如 AQR 提出的价值、防御、动量和 Carry），也可以是宏观因素（如桥水推崇的经济增长和通货膨胀）。表2展示了常见的几个分散性指标。

表 2 分散性指标

数据来源：CQR

在做投资组合优化时，如果目标函数为基于资金权重的分散指标，此时并不需要额外的参数输入，使得结果对参数估计完全免疫。以香农熵为例，其目标函数可以表示为：

实证方面，任瞳和王武蕾（2017）利用股票、债券和商品数据，比较了组合波动在 3% 时不同分散指标（基尼系数、Herfindahl 指数和香农熵）的效果，结果发现无论从收益、回撤还是换手率，基于香农熵的配置方案最为稳健。

3.2 价格外信息加权

实际上，价格外的信息非常丰富，常见信息包括市值、风格因子、基本面数据和宏观指标等，只要是可获得并且有用都可以用来指导组合资金分配。如果既想利用已有信息，又不想引入过多误差，价格外信息是不错的选择。

市值加权

对于股票组合来说，市值加权方式已经深入人心，其反映了投资者在投资范围内可以获得的平均收益，在 CAPM 条件满足时是 Markowitz 均值方差最优解。20 世纪下半叶市值加权在金融领域长期占据主导，为被动投资提供了坚实的理论支撑。

然而，越来越多的研究发现市值加权并没有理想那么有效。Haugen 和 Baker（1991）从理论到实例，验证了由于投资者对预期收益和风险的不一致、卖空受到限制以及税收等原因，市值加权组合并不是均值-方差最优的；存在一些组合，收益和市值加权差不多，但波动更小。Vogel（2015）利用 1927 年至 2014 年美国股票数据，选择250支最大的股票，研究了等权重、市值加权、动量加权和波动率加权的效果。结果发现，等权重、动量加权和波动率加权，在 CAGR、夏普比率和索提诺比率等多个指标下都好于市值加权，其中波动率加权的夏普和索提诺最高，动量加权收益率最高。

基本面权重

Arnott，Hsu 和 Moore（2004）认为，市值加权会给与高估值股票过多权重，给与低估值股票过少权重，因此结果并不占优。Arnott et al. 提出了一个另类加权方法，通过综合账面价值、现金流、营业收入、股利发放和雇员数量，计算每支股票的基本面得分，并用该的得分进行加权，即基本面质量越高权重越大。使用 1962 年至 2004 年的美国数据回测发现，基本面加权实现年化收益率 12.47%，夏普 0.455，同期标普 500 指数两个指标分别为 10.53% 和 0.315，基本面加权能有效提升市值加权效果。

3.3 方差协方差

最小方差组合（global Minimum variance portfolio，GMVP ）

在所有可能的结果里，风险最小的点即为最小方差组合。如图2所示，最小方差组合在有效前沿上具有唯一性，处于有效前沿最左边，对应的预期收益率也最低；因为处于有效前沿，因此在马科维茨均值方差框架下是最优的。

图 2 最小方差组合

图片来源：CQR

事实上，该组合是马科维茨均值方差优化的特殊情况，其目标函数和约束条件不包含任何预期收益率预测，追求组合总体的方差最小：

在股票市场，最小方差组合是一类流行的 smart beta 策略。Clarke，De Silva 和 Thorley（2006）使用 1968 年 1 月至 2005 年 12 月数据，每月末对美国市值最大的 1000 支股票，计算样本协方差，并用贝叶斯压缩或主成分方法进行修正，然后构造最小方差组合。研究结果表明，不依赖于收益率预测的最小方差组合，相对于市值加权组合，确实能带来信息增量，实现波动率降低了四分之一，组合贝塔降低了三分之一。

另外，几乎所有的指数公司都有编制最小方差指数，如 MSCI 的 MSCI World Minimum Volatility (USD) Index 和标普道琼斯的 S&P 500 Minimum Volatility Index，并且都有相应的 ETF 跟踪。

最大分散度（Maximum Diversification，MD）

最大分散度优化由 Choueifaty 和 Coignard 在 2008 年提出，其目标函数如下：

其中目标函数被称为分散比率（Diversification Ratio，DR），分母为组合波动率，分子为成分的波动率加权平均。从直觉上看，当资产预期收益率与其波动率成正比时，最大分散度就等价于最大夏普比，此时能达到马科维茨均值方差最优；同时，当所有证券波动率都相等的话，最大多元化又等同于最小方差。

Choueifat，Froidure 和 Reynier（2013）进一步讨论了分散比率（DR）和最大分散组合（MDP）的性质。首先，由于证券之间的相关性，波动率的加权平均要大于组合标准差，DR 指标总是大于等于 1；极端情形下，如果所有证券相关系数都为 1，此时所有资产等同，那么 DR 即为 1 分散度最低。其次，可以将 DR 分解为证券相关系数和证券集中度，组合内证券之间相关系数越低，持仓数量越分散，则分散比率越大，即 DR 随着证券平均相关系数（或集中度指标）的减少而增加。然后，DR 的平方近似等于组合的风险因子来源个数，也就是说该值越大，独立的风险来源越丰富，组合的分散作用越好。最后，最大分散度组合中，每一个证券和最大分散度组合的相关系数相等。

实证方面，Choueifaty 和 Coignard（2008）分别在美国股票（S&P 500 成分股）和欧元区股票（DJ 欧元区大盘股）两个市场，采用 1990 年到 2008 年的数据，在每个月月末，利用过去 1 年（250 天）的日度收益率估计协方差矩阵，约束最小最大权重下计算最大分散度组合，并和市值加权、最小方差和等权重进行对比分析。结果发现：最大分散组合在这四个组合中夏普最高，持续跑赢另外几个组合；最大分散组合的收益在市值因子上有明显暴露，但是不能完全被 Fama-French 三因素模型和 LLehman 多因子模型解释，存在较为显著的阿尔法收益；另外，最大分散组合的解比较稳健，实现的分散度比率随着协方差的改变而改变，是市值加权组合的 1.5 倍左右。

Choueifat et al.（2013）将研究范围拓展到了全球股票，利用 MSCI World 成分股中市值最大的前 50%，构造了市值加权、风险平价、等权重、最大分散度和最小方差组合。结果发现，风险平价、最小方差和最大分散度三个组合收益较高波动却很低，夏普优于其他组合，其中最大分散度组合的夏普最高；风险平价、最小方差、等权重和最大分散度在 SMB 上有显著正暴露，在 HML 上也有显著地正暴露，最大分散度组合在这四个模型中阿尔法最大。

风险加权（Naive Risk Parity）

在股票因子领域，低风险异象广泛存在，即低风险股票相对于高风险股票有更好的表现，因此可以用个股风险进行加权，给与低（高）波动股票更多（少）的权重。拓展开来，采用证券的风险倒数确定权重，即为风险加权。其表达式为：

当 k 等于 1 时，即为波动率倒数加权；当 k 等于 2 时，即为方差倒数加权。波动率倒数加权是最常见的形式，例如 Moskowitz，Yao 和 Pedersen（2012）在研究时间序列动量组合时，就采用了该方法确定每一个期货品种的权重。

风险加权只需要考虑每个证券的风险，不需要对证券之间的相关关系进行预测，因此也被称为 Naive Risk Parity。风险加权是风险平价的简化形式，当证券之间的相关系数相等时，波动率倒数加权等同于风险平价。

风险平价（Risk Parity）

风险平价模型近些年比较流行，部分原因是因为网红 Ray Dalio 及全天候基金的风靡，以至于很多人错误地将全天候等同于风险平价。风险平价最早由磐安基金的 Qian（2005）提出，理解起来比较容易，和常见的从资金等权重分配不同，其从风险的角度进行均衡配置，以追求所有证券对组合的风险贡献相同。

Kazemi（2012）以经典的万金油 60/40 组合为例，详细介绍了风险平价策略。如图 3，将 60% 的资金配置股票和 40% 的资产配置债券，看起来是一个完美的分散组合，但从风险的视角来看，90% 的风险都由股票资产贡献，整个组合的波动还是由股票主导；如果从风险的视角进行分配资金，将大约 3/4 的资金分配给债券，将 1/4 的资金分配给股票，就能实现股票和债券的风险平价。

图 3 风险平价介绍

数据来源：Kazemi（2012）

风险平价的构建思想非常简单，首先定义边际风险贡献（Marginal risk contributions，MRC）：

即组合风险对证券的权重的一阶导数，反映了证券每增加一单位权重，对组合风险的影响大小。知道了证券的边际风险贡献后，乘以其权重我们既可以得到风险贡献：

风险贡献可以理解为组合总风险中证券的贡献比例。所有成分的风险贡献之和即为组合风险:

风险平价组合要实现的是，组合内所有证券对组合的风险贡献相同，即：

因此，风险平价组合的目标函数为：

风险平价组合和最大分散度组合在逻辑上非常相似，都是为了达到组合的最大分散作用，但是两者目标函数并不一样。Maillard，Roncalli 和 Teïletche（2008）在他们的研究中详细讨论风险平价的性质。首先，组合中波动较高的证券（或者相关性高的证券）在权重计算时会受到惩罚，获得更小的权重。其次，因为风险平价的解是内生性的，因此只能通过数值方法求解。另外，当所有成分的相关系数相同并且夏普也相等时，风险平价组合是 Markowitz 最优的；当组合所有成分相关系数相等时，那么风险平价即为波动率倒数加权。最后可以证明，风险平价介于等权重和最小方差之间，其波动大于最小方差，小于等权重组合。

总体来说，如果不考虑相关系数的话，风险平价会给与低风险的成分较高的权重，高风险的成分较低的权重，这样整体组合的风险不会太高，因此从收益的角度来看可能并没有吸引力。但如果能够放杠杆的话，那就是另一个说法了。风险平价组合往往处于可行域中风险较低和收益较小的位置，如果融资受限或者成本较高，那么提高收益的唯一途径便是偏离风险平价组合，给与高风险资产更大的资金分配，此时组合夏普跟着降低；如果融资比较容易，那么在不降低夏普的条件下，可以通过杠杆提高收益。因此，CTA 相关的投资组合，天然适合采用风险平价策略（Baltas，2015）。

实证结果表明，不同的证券类型，风险平价的效果可能存在差异。Maillard et al.（2008）利用美国行业数据、农业商品数据和全球资产数据回测了等权重、最小方差和风险平价策略，每月再平衡，协方差采用滚动一年进行估计。结果发现：首先，在波动率和相关系数近似的美国行业中，等权重和风险平价的结果差不多，但风险平价在风险上更加分散，而等权重在权重上更加分散，两者夏普略低于最小方差组合，但分散度指标显著占优。其次，在农业商品中，所有资产的波动差异较大但相关性很接近，此时风险平价组合接近波动率倒数加权。风险平价在收益和风险上表现都比等权重更好，但略输于最小方差组合。但从短期稳定性来看，风险平价组合回撤最小，在风险和权重配置上都比较均衡。最后在全球资产中比较这三个组合，全球资产无论波动性还是相关性，差别都较大，是最常见的应用场景，此时风险平价组合在收益和夏普上碾压等权重与最小方差组合。

3.4 均值方差优化

均值方差优化（Mean Variance Optimize，MVO）

均值方差优化算是组合优化问题的老大哥了，也是组合优化领域的标准框架。1952 年，Markowitz 才 25 岁，正是年少轻狂风华正茂的年纪，完成了论文《资产选择：有效的多样化》，以期望收益率表示组合收益，以收益率方差表示组合风险，开启了现代投资组合管理理论的大门。

在所有优化模型中，MVO 可能是大家最熟悉的一个，只要是有过一点金融相关背景的，都知道如何去表述 MVO：给定风险水平下实现组合收益最大化，或者给定收益水平实现组合风险最小化。不同的投资者风险承受能力也不同，常用风险厌恶系数来衡量风险承受能力，即激进型的投资者拥有较大的，保守型的投资者拥有较小的。学术界和实业界常用指数效用函数来衡量投资者的目标函数，即：

理论上来讲，组合成分间存在无数个混搭方式，每种方式得到一个收益风险对，将所有结果集合在一起，就形成了可行域，即图 4 中的黑点区域。然而，可行域中并不是所有点都是“好结果”，只有处于可行域上侧边缘的点才是正儿八经的最优值，即 MVO 的解，如图中 A 到 D 之间连线，这条线称为有效前沿。任何异于有效前沿的点，均能找到相同风险（收益）下收益（风险）更高（低）的组合。

图 4 MVO

图片来源：CQR

有效前沿上有两个特殊情况：最小方差组合（点 A）和切点组合（点 B）。前者位于有效前沿的最左端，是所有可行域中风险最小的，详细讨论可见最小方差组合部分。

切点组合，顾名思义，即以无风险收益率为起点的射线，同有效前沿相切时的组合。切点组合最大的特点是，其在所有可行域中夏普比率最大，因此也被称为最大夏普组合。如果投资者使用杠杆受到限制或者杠杆成本很高，其提高收益的唯一方式就是沿着有效前沿放大风险，但这么做会牺牲组合的夏普比率，看起来并不是非常划算；相反，如果可以轻松利用杠杆，那么可以通过放大杠杆的方式，保持夏普比率始终最优。因此，另外一个常见的 MVO 即最大化组合夏普比率，其目标函数为：

MVO 在预期收益率和组合风险之间进行权衡，理论结构上看起来非常漂亮和完美，潜在的应用价值也让人垂涎三尺。正如王帅和王建渗（2018）的研究所说，如果对资产未来的收益有较为准确的预测，则应考虑收益类配置模型，如 BL 和 MVO 等，以获取对收益准确预测而带来的高收益。但是天下哪有这样的好事，MVO 在实际应用时面临一堆问题。

总体来说，MVO 背负着六宗罪。第一，参数估计误差大。Chopra 和 Ziemba（1993）的研究表明，在风险厌恶为 50 的情况下，均值估计误差带来的效用损失远远高于方差和协方差；风险厌恶水平越高，对均值的估计误差越敏感，效用损失越大。参数尤其是预期收益的估计误差，会给结果带来巨大的不确定性，带来垃圾进垃圾出的后果。第二，结果对参数输入非常敏感。Michaud（1989）在讨论 MVO 的缺点时发现，其结果可能极其不稳定，输入参数的较小改变，可能会使结果大相径庭。第三，优化结果可能过于集中。Broadie（1993）的测试表明，在约束条件欠缺的的时候，MVO 的结果容易集中在少数证券甚至一个证券。第四，换手率高，交易成本太大。De Carvalho 、 Lu 和 Moulin（2012）比较了 6 个组合优化模型（市值加权、等权重、风险平价、波动率倒数、MVO 和最大分散度），结果表明 MVO 换手率较高，在不加卖空约束时换手率更高。第五，容易得到极端的分配结果。Best 和 Grauer（1991）的研究表明，MVO 容易算出极端大或极端小的权重，且结果对输入均值异常敏感。第六，较差的样本外表现。DeMiguel et al.（2009）的结果表明，基于历史数据的均值方差组合，由于估计误差的存在，在样本外表现很难超越等权重组合。

Black-Litterman 模型（BL）

因为均值方差优化面临一堆问题，对其的改进也慢慢被提了出来，Black-Litterman 模型算是名气最大的一个。BL 模型由 Black 和 Litterman （1990）提出，尝试从预期收益率的角度进行优化，将投资者的主观观点考虑进来，以减少预期收益率的估计误差。具体而言，假设投资者对组合内一个或多个证券收益率具有一定的预测能力，通过贝叶斯方法将这些主观的预期收益率和先验分布下均衡收益率进行加权平均，形成一个新的后验收益率估计值，最后使用后验收益率进行均值方差优化，即可得到蕴含投资者观点的解。

Idzorek（2005）详细介绍了 BL 模型的计算步骤和细节，如图 5 所示。

首先，计算组合所有证券的先验均衡收益率。假设其服从正态分布，预期收益率向量为 π，由风险厌恶系数、历史协方差矩阵和初始权重向量计算而成。这里初始权重向量可以为任何指定权重，如市值加权或最小方差组合权重；成分间预期协方差等于某个常数 r 乘以历史协方差。

然后，估计主观收益率的分布。同样假设其服从正态分布，其预期收益率向量为 Q，如果投资者对 k 个证券具有预测观点，那么 Q 即这 k 个收益率预测的看法向量；预期协方差矩阵为 Ω，即观点的误差矩阵，代表预测观点的信心水平，可以有多种构造方式，如 Satchell 和 Scowcroft （2000）。

最后，将先验均衡收益率和主观收益率按照一定比例进行加权，得到新的后验收益率预测收益向量及其协方差矩阵。接下来的做法和均值方差优化一模一样，把新的参数代入优化器，得到 Markowitz 最优解。

图 5 Black-Litterman 实施过程

图片来源：Idzorek (2005)

实证方面，Bessler、Opfer 和 Wolff（2012）利用 1993 到 2011 的大类资产数据，对比了 8 个优化模型，包括 3 个 BL 模型、等权重、固定权重、均值方差、BS 和最小方差组合。结果发现，由于引入了更为可靠的收益率估计，BL 模型持续优于最小方差、BS 模型和 MVO，具有更高的样本外风险调整后收益、更低的组合风险和更分散的组合持仓。

Bayes-Stein 模型（BS）

对收益率预测的另外一个改进方向便是 Stein 在 1955 年提出的压缩估计法，并由 Jobson、Korkie 和 Ratti（1979）引入组合分析领域，Jorion 在 1984 年做了进一步发展。这个估计方法认为每个组合成分的均值都应该向一个共同的值压缩（world mean），这样能很好地降低参数估计的不确定性，提升组合的样本外表现。具体来看，BS 的计算公式如下：

其中为压缩目标，为压缩强度，为成分历史均值。压缩目标和压缩强度直接用样本数据估计，压缩目标假设所有资产收益率相同，往往让其等于最小方差组合的收益率；压缩强度由样本大小、资产数量、压缩目标、样本均值和协方差等决定。当压缩强度为 0 时，即不进行压缩估计，结果即为传统的均值方差优化；当压缩强度为 1 时，即假设所有证券收益率相同，那么优化结果蜕化为为最小方差组合。

对比 BS 模型和 BL 模型，两者均使用贝叶斯压缩方法，试图减少收益率的估计误差，使均值方差优化结果更加稳健和合理。两者最大的不同是，BS 压缩估计向一个相同的常数压缩，并不会改变收益率均值的原有排序；BL 模型由于吸收了投资者的主观观点，原有的收益率排序可能被打乱，结果更加灵活多样。

Jorion (1985) 使用 7 个国家 1971~1983 年的股票指数数据，比较了等权重、均值方差优化、BS 压缩估计和最小方差组合的表现。结果发现，组合收益率的事前估计值和事后实现值差异较大，而组合波动率的事前和事后差异较小，侧面说明收益率估计误差减少的重要性；相比于传统的均值方差组合，BS 压缩估计结果改善明显，收益率和夏普比都明显提高；最小方差组合夏普比率最高，但是和 BS 的结果没有显著性差异。

Stevenson（2001）利用 11 个国家 1976 到 1998 的 REITs 数据，讨论了 Bayes-Stein 压缩估计对传统均值方差的改善。首先，检验了均值、方差和协方差估计误差可能带来的影响，发现收益均值估计误差带来的影响比方差和协方差大得多，因此收益均值的改进提升空间可能比较大；接着，比较传统均值方差组合、BS 均值方差组合、最小方差组合和等权重组合的表现，发现传统的均值方差优化表现最差，BS 压缩后的均值方差优化效果确实有所提高，表现为收益更大波动更小；最后，比较了四个组合夏普之间是否有显著性差异，发现 BS 组合和最小方差组合相对传统的均值方差组合，夏普比率有显著的提高，而 BS 组合、最小方差组合和等权重三者之间没有明显差异。

4、其他

4.1 权重约束

在讨论 MVO 的六宗罪时我们谈到，如果不对权重做任何约束，任由其裸奔的话，得出来的结果可能千奇百怪，例如出现极端值和过度集中，不符合实际的应用逻辑。其实不只是 MVO，其他目标函数也面临同样的问题。因此，在进行组合优化时，除了选择合适的目标函数，各种各样的权重约束也必不可少，例如限制卖空、上限下限和全资金投入。Michaud（1989）在讨论 MVO 的缺陷时认为，一般来说引入有意义的权重限制，例如机构投资者常面对的卖空约束，确实能改善组合优化的结果，至少会使得结果更稳健。

另一个有趣的研究，可以参考 Behr、Guettler 和 Miebs（2013），从权重约束的角度对最小方差组合进行了改进。由于最小方差模型持仓过于集中，换手率高，Behr et al.（2013）尝试进行改进，一方面试图超越 1/N 组合，另一方面减少换手率。具体来说，通过最小化协方差矩阵的 MSE 得到上限和下限，即将样本协方差向一个特定的协方差压缩，这个特定的协方差由上限和下限决定。在获得权重上限和下限后，再带入最小方差组合求解最小方差解即可。利用 5 个数据集，评估权重约束最小方差组合的表现。结果发现：权重约束最小方差组合夏普比等权重组合高 30%，比市值加权高 60%，比简单的卖空约束组合和单因子协方差组合也实现了更高的夏普；和 Demiguel et al.（2009）提出的 PMV 相比，同样是少数跑赢 1/N 组合的方案，权重约束最小方差组合换手率更低。

4.2 方差协方差估计

一旦涉及参数估计，就会存在估计误差。在讨论 MVO 时，均值的估计误差比方差和协方差大得多，因此出现了 BL 模型和 BS 模型，从收益率的角度进行改进，尽量减少这个磨人小妖精带来的干扰。对于最小方差等只需要方差协方差的优化模型，虽然暗自庆幸逃过了均值估计的魔爪，但并不是就能高枕无忧，因为方差协方差也不是省油的灯，虽然估计误差比均值小，但终究不可忽略。

Hoffstein（2013）在讨论均值、方差和相关系数的估计稳健性时，画了一个非常精致的图，见图 6。其中横轴表示样本长度，纵轴可以理解为估计误差。可以看到，在相同样本长度的情况下，均值估计误差远高于相关系数，相关系数高于方差；在样本长度很短的情况下，三个估计值之间的差距尤其明显；随着样本长度的增加，估计误差也逐渐降低，但依然维持在一定水平不会消逝。

图 6 均值、方差和相关系数的稳健性

图片来源：Hoffstein（2013）

方差协方差的改进方法有很多，常见的有三个：压缩估计、因子模型和高频数据。

压缩估计，即将样本方差协方差矩阵向一个已有的先验矩阵进行压缩，经典的研究可以参考 Ledoit 和 Wolf（2003）。样本方差协方差理论上是无偏估计，但是存在较大的估计误差；F 是一个事先设定的矩阵（例如假设所有成分间相关系数相同），没有估计误差但存在模型设定误差，是一个有偏估计。压缩估计可以表达为：

直观上来看即在估计误差和设定误差之间权衡，为样本估计和先验矩阵的加权结果，权重由压缩强度决定。

建立多因子模型，将证券的风险来源降维到少数因子上，通过估计因子之间的方差协方差矩阵，从而间接推出证券的方差协方差矩阵，是近年来越来越时髦的方式。在股票和债券等投资领域，由于证券数量众多，传统基于历史样本的估计方法越来越差强人意，因此多因子模型大行其道。目前已经有很多公司提供专业的因子模型解决方案，例如国外的 Barra 和国内的 Ricequant。以 Barra 的 CNE5 为例，其将 A 股收益分解为 1 个国家因子、10 个风格因子和 32 个行业因子，从而将参数估计的数量大幅减少，减少了方差协方差的估计误差。

学术研究喜欢用月度收益率估计方差协方差矩阵，数据易得并且没有日历对齐问题。相对低频率数据，高频数据样本量更加丰富，蕴含的信息量也更多，近年来应用在方差协方差估计上越来越常见。如果熟悉 Barra 的话，应该对此不陌生，在其最新版本的风险模型中，已经完全用日度数据代替月度数据。Gosier、Madhavan、Serbin 和 Yang（2005）的研究也详细讨论过这个问题，使用日频数据估计出的波动率，要比月频结果更加稳健和精确。

4.3 多优化器

DeMiguel et al（2009）在比较各个优化器时，提出可以将多个优化器进行结合。例如，最终的目标配置，可以同时考虑等权重和最小方差组合，将两者按照一定方式进行加权：

虽然 DeMiguel et al（2009）的结论并不支持多优化器一定更好，但从直觉上讲，综合考虑多个优化器时，确实能弥补单一优化器的不足，使得结果更加稳定。无论如何，这是一个值得探索的方向。

5、总结

本文围绕“如何分配资金”这一话题，详细讨论了各类优化模型及其改进方案。首先，根据目标函数需要的参数输入，将其分为四种类型，包括零输入、价格外信息加权、方差协方差类和均值方差优化；然后，从权重约束、协方差估计和多优化器等角度，介绍了一些优化思路。组合优化模型理论上可以设计得相当漂亮，实际应用场景也可以包装得光彩夺目，但真正落地的时候，就变成了卸了妆的美女，好看依然好看，终究还是能找到痘痘。量化投资领域，无论是出于无心执念，还是故意卖弄玄虚，总觉得模型越复杂越好，仿佛复杂才能带来价值，这在组合优化领域尤其常见。怎么说呢，模糊的正确要胜过精确的错误，还是不说了。

参考文献

Ang, A., Hodrick, R. J., Xing, Y., & Zhang, X. (2006). The Cross-Section of Volatility and Expected Returns. Journal of Finance, 61(1), 259-299.

Ang, A., Hodrick, R. J., Xing, Y., & Zhang, X. (2009). High Idiosyncratic Volatility and Low Returns: International and Further U.S. Evidence. Journal of Financial Economics, 91(1), 1-23

Broadie, M. (1993). Computing efficient frontiers using estimated parameters.Annals of Operations Research, 45(1), 21-58.

Arnott, R. D. , Hsu, J. C. , & Moore, P. . (2004). Fundamental indexation.SSRN Electronic Journal.

Baltas, N. (2015). Risk-based and factor investing || trend-following, risk-parity and the influence of correlations.Risk-Based and Factor Investing, 65-95.

Behr, P., Guettler, A., & Miebs, F. (2013). On portfolio optimization: Imposing the right constraints.Journal of Banking & Finance, 37(4), 1232-1242.

Bessler, W., Opfer, H., & Wolff, D. (2012). Multi-Asset Portfolio Optimization and Out-of-Sample Performance: An Evaluation of Black-Litterman, Mean Variance and Naïve Diversification Approaches.European Journal of Finance, 23(1), 1-30.

Best, M. J., & Grauer, R. R. (1991). On the Sensitivity of Mean- Variance-Efficient Portfolios to Changes in Asset Means: Some Analytical and Computational Results.Review of Financial Studies, 4(2), 315-342.

Black, F. and Litterman, R. (1990). “Asset Allocation: Combining Investors Views with Market Equilibrium.”Fixed Income Research, Goldman, Sachs & Company, September.

Chopra, V. K., & Ziemba, W. T. (1993). The Effect of Errors in Means, Variances, and Covariances on Optimal Portfolio Choice.Journal of Portfolio Management, 19(2), 6-11.

Choueifaty, Y., & Coignard, Y. (2008). Toward Maximum Diversification.Journal of Portfolio Management, 35(1), 40-51.

Choueifaty, Y., Froidure, T., & Reynier, J. (2013). Properties of the Most Diversified Portfolio.Journal of Interaction Science, 2(2), 49-70.

Clarke, R., De Silva, H., & Thorley, S. (2006). Minimum-variance portfolios in the US equity market.Journal of Portfolio Management, 33(1), 10.

De Carvalho, R. L., Lu, X., & Moulin, P. (2012). Demystifying Equity Risk-Based Strategies: A Simple Alpha Plus Beta Description. Journal of Portfolio Management, 38(3), 56-70.

Demiguel, V., Garlappi, L., & Uppal, R. (2009). Optimal Versus Naive Diversification: How Inefficient is the 1/N Portfolio Strategy?.Review of Financial Studies, 22(5), 1915-1953.

Gosier, K., Madhavan, A. N., Serbin, V., & Yang, J. (2005). Toward better risk forecasts. Journal of Portfolio Management, 31(3), 82-91.

Gray, W. (2014). Harry Markowitz: An Equal-Weight Investor?. Alpha Architect. Available at:https://alphaarchitect.com/2014/10/17/harry-markowitz-an-equal-weight-investor/.

Haugen, R. A., & Baker, N. L. (1991). The efficient market inefficiency of capitalization–weighted stock portfolios. Journal of Portfolio Management, 17(3), 35-40.

Hoffstein, C. . (2013). Allocating under uncertainty: simple heuristics & complex models.SSRN Electronic Journal.

Idzorek, Thomas M . "A step-by-step guide to the Black-Litterman model." Forecasting Expected Returns in the Financial Markets (2007):17-38.

Jobson, J., Korkie, B., & Ratti, V. (1979). Improved estimation for Markowitz portfolios using James-Stein type estimators.

Jacobs, H., Muller, S., & Weber, M. (2014). How should individual investors diversify? An empirical evaluation of alternative asset allocation policies.Journal of Financial Markets, 62-85.

Jorion, P. (1985). International portfolio diversification with estimation risk.Journal of Business, 259-278.

Jorion, & Philippe. (1986). Bayes-stein estimation for portfolio analysis.Journal of Financial & Quantitative Analysis, 21(3), 279-292.

Kazemi, H. (2012). An introduction to risk parity.Alternative Investment Analyst Review, 1(1).

Ledoit, O., & Wolf, M. (2003). Improved estimation of the covariance matrix of stock returns with an application to portfolio selection.Journal of Empirical Finance, 10(5), 603-621.

Maillard, S., Roncalli, T., & Teiletche, J. (2010). On the Properties of Equally-Weighted Risk Contributions Portfolios. Journal of Portfolio Management, 36(4), 60-70.

Meucci, A. (2010). Managing diversification. Social Science Electronic Publishing.

Michaud, R. O. . (1989). The markowitz optimization enigma: is ‘optimized’, optimal?.Financial Analysts Journal, 45(1), 31-42.

Moskowitz, T. J., Ooi, Y. H., & Pedersen, L. H. (2012). Time series momentum. Journal of Financial Economics, 104(2), 228-250.

Plyakha, Y. , Uppal, R. , & Vilkov, G. . (2012). Why does an equal-weighted portfolio outperform value- and price-weighted portfolios?.SSRN Electronic Journal.

Qian, E. (2005). Risk parity portfolios: Efficient portfolios through true diversification. Panagora Asset Management.

Satchell, S. and Scowcroft, A. (2000). “A Demystification of the Black-Litterman Model: Managing Quantitative and Traditional Construction.” Journal of Asset Management, September, 138-150.

Stevenson, S. (2001). Bayes-Stein Estimatorsand International Real Estate Asset Allocation.Journal of Real Estate Research, 21(1-2), 89-104.

Vogel, J. (2015). Which Asset Allocation Weights Work the Best?. Alpha Architect. Available at: https://alphaarchitect.com/2015/10/27/which-asset-allocation-weights-work-the-best/

刀疤连.(2019).风险越大收益越大？想多了！.因子动物园.Available at: https://mp.weixin.qq.com/s/1mfAzrF-gtUiw9D5wzRiwg

任瞳, & 王武蕾. (2017). 风险均衡方法及其在目标风险策略中的应用.兴业证券.

王帅, & 王建渗 (2018). 量化资产配置模型研究报告.Available at: https://mp.weixin.qq.com/s/1aNhMaELqGwInJ3Hq2Lw2w.

---------------------------------------------------------------------------------------

拓展关注：

如何分配资金？组合优化的是是非非

猜你喜欢