当前位置:首页 > 新闻 > 正文

当金融投资领域遇到机器学习

发布时间: 2018-10-29 14:24   作者: 袁峻峰   来源: 人工智能杂志

  大数据时代的到来为金融界谋求将自身与人工智能相结合提供了坚实的基础。然而,各种经济金融大数据在为经济和金融领域带来价值的同时也提出了新的挑战。本文探讨了大数据时代下金融投资模型所涉及的复杂经济学理论、行为经济学理论和金融量化模型,以及机器学习在金融投资领域中大数据处理和金融投资模型中的应用。最终,作者提出,当前的机器学习尚未能够为金融投资模型带来革命性的影响。

  一、缘起于大数据

  《经济学人》杂志2017年5月第一期的头条新闻将数据描述为世界上最有价值的资源。早在2014年,阿里巴巴集团董事长马云就说过,阿里巴巴从本质上来讲已经成为了一家数据公司。而《经济学人》的那篇文章中说,现在通用电气和西门子等工业巨头也都开始称自己是数据公司。毋庸置疑,我们已然进入大数据时代。

  在金融投资领域,大数据也已广泛地被使用。据全球知名对冲基金Two Sigma的官网描述,该公司使用了35 PB (1PB=万亿GB)数据用于投资模型,涵盖了1万个数据源。然而,各种经济金融大数据在为经济和金融领域带来价值的同时也提出了新的挑战。

  二、大数据时代下,金融投资模型所涉及的理论

  1974年获得诺贝尔经济学奖的英国知名经济学家和政治哲学家哈耶克曾说过:“从我们的立场出发,必须用一种不同于观察自然界的方法来观察的世界。按照一种有用的形象的说法,即,我们从外部观察自然的世界,但我们从内部观察社会的世界。”大数据给了人们另一种看世界的方式。不确定性原理(Uncertainty Principle)是海森堡于1927年提出的一个量子力学理论。而在经济和金融中,不确定性是复杂经济学[1]的基础假设之一。

  复杂经济学

  近些年,针对主流经济学无法有效处理的经济系统复杂性问题, 布莱恩·阿瑟等经济学家提出了复杂经济学理论。该经济学理论吸取了现代科学领域复杂性研究的新理念,承认并重视了世界的复杂性,避免了绝对化和过分的简单化。“复杂经济学是一门超越了均衡层面的经济学理论,认为经济学不是确定的、可预测的、机械的,而是依赖于过程的、有机的、永远在进化的。”[1]复杂经济学认为,在经济体系中,不同的行为主体,如消费者、厂家、银行、投资者、政府机构等,从事着各样的活动,并且需要不断调整搁置的市场行为与预期以适应市场的情景变化。这种考虑自身行为可能带来结果的行为调整,其不确定性给金融投资又增加了一层复杂性。而这层复杂性是自然科学中所没有的。[1]

  行为经济学

  2017年的诺贝尔经济学奖颁发给了理查德·塞勒教授,表彰其“将心理上的现实假设纳入到经济决策分析中。通过探索有限理性、社会偏好和缺乏自我控制的后果,展示了这些人格特质如何系统地影响个人决策以及市场成果。”行为经济学不仅在金融投资领域得到了有效验证,在互联网公司的搜索、推荐、风控以及其他各类模型中,参考行为经济学理论的个人特征、个人偏好特征都已被大量使用并验证效果。

  金融量化模型

  金融学的核心问题是金融资产定价问题,即什么是未来价值不确定的金融资产的当前价值。1973年,布莱克-斯克尔斯期权定价理论构建了现代金融学理论的重要基石。在现代金融理论的连续时间金融模型中,随机过程、测度、鞅等都为物理、数学和金融工程背景的专家学者提供了广阔的发挥空间。在量化体系中,对于各类基本面量化策略所使用的多因子量化框架是基于尤金·法玛(Eugene Fama)和肯尼思·弗伦奇(Kenneth French)的研究的。在20世纪90年代,他们发表了一系列论文,对基本面策略中经常考虑的因素进行量化分析,极大限度地推进了该领域的发展。通过机器学习从大数据中挖掘投资标的相关因子是目前最容易想到的大数据在投资领域的应用方案之一。

  三、机器学习在金融投资领域中的应用

  大数据处理

  目前所说的大数据通常都达到PB级以上。这是一种大到人们无法直接进行统计和分析的数据量,必须借助于云计算才可能处理。大数据上的建模已离不开机器学习和深度学习。投资领域中常见的大数据研究包括:

  (1)大数据新闻舆情分析。国外的RavenPack公司以及国内的一些公司都提供金融领域新闻以及其他媒体舆情建模与分析服务。学术界也有很多相关研究。例如,丁效等人(于2015年发表)的论文[2]描述了一个基于深度学习的事件驱动策略。

  (2)图像识别。Orbital Insight公司通过机器学习模型对卫星图像进行识别,对零售商盈利、石油库存、矿山产量等进行预测。

  (3)金融知识图谱。金融知识图谱的构建对于投资领域也是一个很重要的应用方向。

  金融投资模型

  因为机器学习在其中只是作为工具被用于大数据处理,所以严格来讲,上述应用并不属于机器学习在经济和金融领域中的应用。通常,深度学习擅长端到端的优化。在金融量化投资领域,从加工原始数据,在线深度学习模型得到投资信号,再通过强化学习等技术进行策略优化和风险管理,业内应该有相关研究与实践。但笔者本人并不十分认同这种方式,主要原因有以下两点:

  (1)无法有效界定投资领域问题的数据边界。

  (2)未来的样本空间和历史样本空间不同。

  将深度学习作为预测模型直接用于资产价格的预测也是通常能想到的方式之一。Batres-Estrada(2015)[3]使用深度学习模型预测股票未来收益正负,根据预测结果选取股票构建投资组合。但由于金融资产厚尾尖峰的分布特性,笔者认为并不适合直接作为预测目标。如何有效地界定投资问题、模型选择、数据边界等都需要深入研究,例如以下的一些探索性研究:

  ·高频数据集上的应用。Dixon(2017)[4]通过递归神经网络(RNN)模型在标普S&P500股指期货分钟级交易报价订单数据上预测价格翻转并构建策略,最终得到了不错的效果。高频数据能达到TB级以上(1TB=1000GB),并且样本分布也更加稳定,应该比日级别数据更合适。

  ·朱等人(2016)[5]使用深度学习模型预测股票箱体的边界。股票箱体理论认为,股票在运行过程中会形成一定的价格区域,即股价是在一定的范围内波动。这样就形成一个股价运行的箱体。如果价格超出范围,就会进入一个新的箱体。交易策略是当股票价格突破顶部边界时买入股票,或者当股票价格突破底部边界时将股票卖出。

 

  以上内容精选于《人工智能》杂志第六期

  本文作者

  袁峻峰

  任职于蚂蚁金服人工智能部,复旦金融学硕士,FRM金融风险管理师。目前从事并关注金融领域机器学习的相关主题与应用。

  欲阅读完整文章,可通过以下方式购买《人工智能》杂志!

  订阅2018年《人工智能》杂志6期共计360元

  银行转账:北京赛迪出版传媒有限公司

  开户行及账号:中国建设银行股份有限公司北京紫竹桥支行11050170560000000152

  银行转账,请备注:人工智能

  接收详细信息请发到:aiview@ccidmedia.com;或是添加客服微信:13601092749

收藏