区别于传统基本面分析和技术面分析,量化分析是从数量化的角度去挖掘存在某种数学关系的投资策略。结合机器学习算法的量化投资方法已在量化选股、量化择时、股指期货套利、商品期货套利、统计套利、算法交易等多类量化证券投资策略中应用。如今各类量化投资基金聘用机器学习算法科学家,组建人工智能技术研发团队也已成趋势。
该报告介绍了传统量化投资方法在数据智能时代下面临的发展瓶颈及趋势、现代量化投资方法可用的机器学习技术手段,以及常见应用机器学习算法的证券投资业务任务场景。然而机器学习并不能做到完美地代替人力完成所有的工作,人类的思维、经验仍然是量化投资过程中不可或缺的。因而机器学习更多能作为一种辅助工具帮助分析师更好地做投资决策,实践理想的投资策略。
作者 | 张英健、王昕宇、樊晓芳
一、量化投资背景介绍
1. 量化投资简介
量化投资方法主要通过对海量历史及实时的资产交易行情数据进行数理统计分析,选择那些未来回报可能会超越基准的证券进行投资,以期获取超越指数基金的收益。
现代量化投资还利用自然语言处理等文本处理方法,从上市公司调研报告、公司财务报表、金融市场政策文件、社交舆论新闻等文档、资讯中提取影响市场走势、价格波动、交易执行等相关的信息,进一步优化投资策略。具有纪律性、系统性、套利性、概率性四大主要特征。
2. 量化投资策略
量化基金的投资策略按投资证券标的类型、交易方法大致分:量化选股、量化择时、股指期货套利、商品期货套利、统计套利、算法交易、期权套利。也有部分基金根据投资风格及主题,会同时采用事件驱动、行业轮动、多空、市场中性等策略。
3. 传统量化投资策略存在的问题
1)交易策略的时效性:金融市场非线性行为,导致金融数据存在非稳态,量化投资策略时效短;
2)交易策略同质化:量化投资建模因市场而异,但市面上模型同质化现象严重;
3)模型过度拟合:训练数据缺少对意外事件的记录,模型会偏离真实情况,从而导致预测不准;
4)数据挖掘算法的低效与计算机运行能力的有限。
4. 现代量化投资策略中应用机器学习算法的潜力
1)在数据提取和处理过程中,使用强大数据挖掘算法提高数据获取与分析的效率;
2)在模型构建过程中,机器学习能够提供非线性关系化的模糊处理,帮助处理非线性问题;
3)机器学习技术或许可以找到超出传统量化力所能及与人类认知经验的「全局最优解」。
二、量化投资产业及市场现状
1.量化投资策略应用现状
目前量化投资主要应用于期货公司、证券公司、基金公司、资管公司中。西方发达金融市场中, 量化交易占据总交易量的70% , 而我国约为30%,相比之下我国的量化投资仍处于起步阶段。
截至2018年底,我国公募量化基金规模合计1121亿元;相比2017年规模略有缩减约10%,但集中度提升,按各个基金公司管理的量化产品规模排序,前五规模占比达到51.4%。证券类私募基金规模亦从2018年初的2.5万亿缩减至2.25万亿,其中量化产品规模占比基本稳定在8%左右。
2. 应用、提供量化投资策略的投资机构及技术服务机构
三、量化投资交易系统组成及机器学习算法应用流程
1. 量化投资交易系统组成
2. 量化投资中机器学习
算法模型建立与测试过程流程图:
四、证券投资业务中常用机器学习算法的任务场景
五、机器学习在量化投资领域应用的局限性与未来趋势
局限性
1. 金融数据信噪比偏低而易导致过拟合现象。
2. 投资经理难以得知机器学习算法的投资交易逻辑。
3. 机器学习无法准确分析无前例可循的意外事件。
4. 实际量化分析过程可用的数据量远远不足。
未来趋势
1. 分析师的经验和机器学习算法的融合。
2. 量化投资工作中重复性较高的流程将有人工智能接管。
3. 机器学习算法能够提供非线性关系化的模糊处理,弥补人脑思维模型的局限,大幅提高数据挖掘与处理能力。量化投资策略会更丰富。