本系列前几篇文章中介绍了股票投资的基本知识,以及独具特色的A股市场。本篇将深入介绍量化投资以及其在A股市场中的独特性。
量化投资简介
量化投资是一种依赖数据和数学模型做出交易决策的投资方法,而不是纯粹的基本面分析或人为判断。在量化策略中,投资者使用统计和算法和高速运转的计算机来识别交易机会——例如,一个模型可能会分析财务指标和价格趋势,以挑选预期表现优异的股票。量化投资的目标是基于模式识别和高效计算做出决策,使投资更加系统化和不受情绪影响。量化投资的核心涉及几个关键要素:
- ・数据:从行情数据,订单簿数据等量价数据,到基本面数据和各类另类数据,这些数据的获取,清洗,再加工对于量化投资而言至关重要。机构往往会在自己处理一部分数据的同时大量采购外部数据,但因为现实世界的复杂性,原始数据不可避免地存在很多质量问题,比如有数据缺失,事后填充,幸存者偏差等问题,需要经过大量的处理才能使用。
- ・特征值工程:经过清洗的数据,需要进行特征值工程,即根据需要解决的预测问题,在源数据上提取有效信息形成特征值。随着量化投资的发展,特征值工程变得愈发困难,存在大量结构化信息的特征值的挖掘难度不断变大。
- ・数学模型与算法: 随后,量化研究员调整自己的模型并使用对应的算法来进行量化预测,这消除了大量的人为偏见和情绪,在大量的噪音中寻找到微弱的有效信号。在一些对模型推理速度要求很高的场景里,交易员会倾向于选择简单但快速的模型。金融数据的预测难度极大,普通的机器学习模型很难直接被应用,一般都需要大量的调整。
- ・回测与模拟: 在将量化模型用于真金白银之前,投资者会对其进行回测——即在历史数据上运行该策略,以查看它在过去的表现如何。然而,实践中的回测往往会犯下各种错误,没有经过大量严谨设计的回测过程会很快产生大量的过拟合问题,而即使有着完美的设计,也无法解决市场在一直演变的问题。
- ・算法交易与执行: 许多量化策略通过算法交易实现——计算机程序根据模型的信号自动执行交易。一旦规则设定,算法可以在无需人工干预的情况下扫描市场并发送订单,对于某些策略有时可以在几分之一秒内做出反应。这使得过去无法手动处理大量股票和在毫秒级别快速决策,如今成为可能。例如,一个算法可能每天收盘时重新平衡一个包含 5000 只股票的投资组合,或者在满足某些条件时迅速执行卖出信号。算法执行还可以通过智能拆分订单(避免大的市场冲击)和在最佳时间处理订单来降低交易成本。
量化投资的吸引力在于其严谨、科学的方法。模型可以处理的标准化信息远超人类,并且不受恐惧或贪婪等情绪的影响。投资者借助量化工具可以更好地发现数据中微妙的模式或关系,从而获得优势。此外,由于策略可以彻底回测,量化投资者在开始时就能在一定程度上了解其方法的统计特性(预期回报、波动性、回撤)。然而,量化投资也存在很多陷阱,比如:
- ・模型风险:模型可能是错误的,或者如果市场机制发生变化,模型可能会失效
- ・过拟合:一个过于完美地优化以适应历史噪音的策略,在实盘交易中可能表现不佳
- ・策略失效:随着策略模式被发现,其他市场参与者会迅速采用,使得一个策略失效
- ・技术问题:如交易未能按预期价格执行,或未预见的相关性导致损失
- ・可解释性差:尤其是随着复杂的非线性模型和复杂特征值被使用,现在模型的可解释性普遍变弱,交易员在突发情况前难以做出好的判断
- ・风险管理:许多著名的量化失败案例(例如 1998 年的长期资本管理公司)的发生是因为模型没有考虑极端风险事件事件或依赖过高的杠杆
不可否认,基于数理的量化投资方法已然成为现代市场的主导力量。然而必须认识到,其可信度与稳健性,是依赖于可靠的数据、仔细的测试和审慎的风险控制。
A股市场的量化策略
在上一篇中我们详细介绍了A股市场的独特性:A股市场具有与其他资本市场不相似的投资者结构、严格且独特的交易规则及限制。详细可见:上一篇文章。和类似美国的海外市场不同,A股的高频交易本质上有所不同,在中低频领域的信号不相似,可以用来对冲的工具也少了很多,这种差异性催生了本土化的量化策略。本文将深入剖析,在散户主导和制度约束的土壤中,A股的量化策略有何特色。
被重塑的“高频交易”:戴着“镣铐”舞蹈
在高频交易这个领域,A股和美股有着根本性的不同: - 因为流动性返佣(rebate)等机制的不同,A股并没有美股市场中广泛存在的私营高频做市商。在美国,私营高频做市商之间有着惊人的军备竞赛,从服务器托管,专线,微波网络到 FPGA 等,这些做市商将速度推到极致。但在A股,因为市场约束条件的不同,并没有相似的体系。 - “T+1”制度的制约:A股市场的“T+1”交易规则(即当日买入的股票,下一个交易日才能卖出)废除了海外高频交易的很多高换手率策略。因为无法在日内完成“买入再卖出”的闭环,A股实际上不存在欧美市场那种以次微秒级速度竞争的超高频交易生态。
A股也存在一些本土化的频率较高的策略。为了绕开“T+1”的限制,交易者曾设计出精巧的变相“T+0”策略。一个著名的例子是利用ETF进行的融券套利,其模式是: 1. 融券卖出:在盘中,当某个ETF(如沪深300 ETF)的二级市场交易价格高于其预估的实时净值(IOPV)时,量化机构通过融券业务借入该ETF并立刻在二级市场卖出,锁定高价。 2. 买券:随后,机构利用卖券所得资金,在二级市场同步买入构成该ETF的一篮子成分股。 3. 申购ETF:收盘后,用买来的一篮子股票申购成新的ETF份额。 4. 归还券源:最后,将新申购的ETF份额归还给券商,完成融券闭环。 这个过程实质上完成了对高价ETF的日内做空,实现了无风险套利。然而,这一策略的命脉在于券源的即时可得性。
随着2024年初监管政策的收紧,转融券市场化约定申报由“T+0”调整为“T+1”,意味着借入的证券次日才能使用,这精准地堵上了上述套利漏洞,使得这类依赖日内融券的高频策略空间被极大压缩。
同时,监管机构对“幌骗”(Spoofing)等利用资金优势频繁报单、撤单以诱导市场价格的违规行为进行了精准打击。通过实施差异化收费等措施,大幅提高了频繁报撤单的交易成本。这使得过去那种单纯依赖速度优势、通过制造市场“幻象”来获利的模式难以为继。A股的高频交易被迫从速度为王的军备竞赛,转向更加注重策略逻辑和模型质量的竞赛。
高成本对冲下的策略选择:在“贴水”中寻求平衡
真正的市场中性策略(Market Neutral Strategy)需要通过有效的做空工具来完全对冲市场的系统性风险(Beta),从而剥离出纯粹的超额收益(Alpha)。然而,在A股,这一理想状态面临着严峻的现实。
- ・个股做空工具的“稀缺与昂贵”:A股市场最直接的做空工具——融券的券源供给有限(主要来自公募基金、保险等长期持有者,其出借意愿和数量都有限),且融券成本高昂(年化利率可达6%-8%或更高)。数据显示,融券卖出额占A股总成交额的比例长期低于1%,如此稀缺的资源无法满足大规模量化策略的对冲需求。
- ・股指期货的“贴水之痛”:因此,股指期货成为量化机构进行风险对冲的唯一规模化选择。然而,A股的股指期货(尤其是代表中小盘的IC和IM合约)长期处于“贴水”状态,即期货价格低于现货指数价格。对于需要建立股票多头、同时做空期货以对冲的策略而言,这意味着一笔结构性的、持续侵蚀Alpha收益的高昂成本。
- ・举例说明:假设一个量化中性策略通过股票多头获得了8%的年化Alpha。但如果其对冲所用的股指期货年化贴水率为5%,那么在不考虑其他成本的情况下,这5%的贴水就会吞噬掉大部分Alpha,最终策略的净收益仅为3%。
这种高昂的对冲成本深刻地塑造了A股的量化生态。由于完全对冲的成本过高,能够盈利的大规模纯Alpha策略变得凤毛麟角。绝大部分资金选择放弃市场中性,转而涌向风险敞口更大、目标是跑赢特定指数的“指数增强型”策略。这类策略通常会持有100%的股票多头仓位,同时可能持有少量(或不持有)期货空头仓位,其收益主要由两部分构成:市场的Beta收益和策略的Alpha收益。这种模式虽然可能带来更高的回报,但也意味着在市场整体下跌时,策略净值同样会面临显著回撤,这与投资者对量化“稳健”的传统认知形成了反差。
中低频的差异性信号
量化策略的利润本质上来源于市场的无效性或错误定价。每个资本市场在定价错误上都有其独特性,A股也具有其相对于其他市场比较独特的性质,比如:
- ・市场参与者结构:在美股等成熟市场,交易主体是各类专业机构,个人投资者比例相对较低,而在A股,个人投资者(散户)长期以来贡献了市场交易量的很大一部分。尽管近年来机构化比例有所提升,但散户的活跃度依然是市场的重要特征。这种差异导致了信号端的不同。
- ・数据源:在美股市场,股票有衍生品,同时各类基本面数据的有效性和信息量也更高,这些都构成了非常重要的信号来源。但是在A股,因为没有个股衍生品,基本面数据的历史和密度也更低,机构们往往还是更多地采用量价数据来挖掘信号。
- ・费率和税率等差异:美股因为长期持有和短期持有的税率有显著差异,很多的机构和个人会选择长期持有股票,但A股长期持有和短期持有在费率上的差别则不大,因而也显现出更高的换手率和不同的交易行为。
总结与展望:从“本土化创新”到“全面军备竞赛”
总而言之,A股的量化投资并非海外模式的简单复制,而是一场在特定制度和市场环境下,由本土智慧驱动的创新。其策略核心在于理解并利用由独特的交易规则和高比例的个人投资者等结构性差异所共同塑造的市场微观生态。
展望未来,这一生态正面临深刻变革。随着A股市场注册制的全面推行、养老金等长线资金的入市以及外资的持续流入,市场的机构化程度正在不可逆转地提高。
A股量化行业正站在一个十字路口,过去依赖特定市场红利的野蛮生长时代正接近尾声,一个更加专业化、机构化,与国际前沿全面接轨的“精耕细作”时代即将来临。