当前位置:首页 > 新闻 > 正文

智能金融的破局与金融知识图谱

发布时间: 2018-10-29 16:37   作者: 鲍捷   来源: 人工智能杂志

  人们经常会将 “互联网金融”和“智能金融”这两个概念混淆。实际上,二者存在巨大的差别。互联网金融主要是对传统金融业务的效率提升,而智能金融是将很多原有的业务和过程打碎并重构。因此,智能金融的任务难度更大,发展也更缓慢。其发展中的最大瓶颈是“结构化数据之墙”。而金融知识图谱正是为智能金融破局的必然结果。目前,金融知识图谱已经在监管、投资、信贷、审计等多个场景得到了实践落地。随着知识图谱的深化,更多的商业场景会在未来被逐步解锁。

  中国金融知识图谱的工作大概从2015年开始,是为解决整个智能金融发展中的关键瓶颈——结构化数据不足——的必然结果。目前,金融知识图谱已经在监管、投资、信贷、审计等多个场景得到了实践落地。

  一、金融科技的四个发展阶段

  金融知识图谱是智能金融的一部分,而智能金融又是金融科技的一部分。金融科技(Fintech)的发展可以分为上下半场:上半场是触达的革命,也就是俗称的互联网金融;下半场主要是重构的革命,其中更主要的就是智能金融。

  相较于上半场强调金融业务旧模式的升级,下半场强调的是技术的创新。不仅仅是对传统业务的扩张,也是对很多原来不存在的产品和业务可实现性的新发现。智能金融涉及的核心技术包括人工智能、大数据和云计算等,主要产品和服务形式包括智能投研、智能投顾、大数据征信、电子货币等。但是智能金融带来的变化远远不止这些,它本质上是对原有业务的重构。通过解构原有的业务流程,对其中的一些环节进行标准化和自动化,从而创造出新的业务,甚至全新的商业模式。这个过程不仅是技术的革命,更是组织方式的变迁。

  智能金融跟互联网金融是非常不一样的。互联网金融更主要的是对传统金融业务的效率提升,其业务模式本身可能没有太大的改变。互联网金融具备低成本、无边界触达的特点,使得金融服务的客户群体扩大至从前未被传统金融服务覆盖的群体。这也是互联网金融业迅速壮大的基础。在此过程中,流量转化是关键,但用户转移本身并未从根本上创造新的业务。

  而智能金融往往是把原来的业务打碎,然后将其重新组合起来的过程。例如,银行智能化是伴随着银行业中台工作后台化、前台工作开放化的过程;证券业智能化是伴随着传统工作流被打破,大协作取代传统“手工业式”监管、投资流程的过程。因此,从任务的困难程度上来讲,重构是远远大于触达的。这也是为什么智能金融的发展相对于互联网金融要慢很多。

  整个金融的智能化也依托于过去二十年中金融和IT的发展过程。

  第一个阶段(大概是在10年前)是信息化的过程,即“从线下到线上”的过程。

  第二个阶段(从10年前开始)是大数据化的过程,即从“从割裂到融合”的过程。在这之前,金融机构内部以及各个金融机构之间的数据都是不能打通的。过去十年来,各个金融机构开始通过云和数据中心逐渐产生大数据。这个部分的工作是日后发展的基础。

  第三个阶段(大概从5年前开始)是自动化的过程,即“从繁琐到简单”,用机器来替代完成一些比较繁琐的工作。

  第四个阶段(最近这一两年)是开始智能化革命,即“从画龙到点睛”。这也是最难的环节。智能支付、智能投研、金融知识图谱等,都是智能化的一部分。

  二、重构:从标准件化到大工业化

  智能金融的核心是重构的过程。智能金融跟传统的互联网金融是非常不一样的。虽然从技术上来讲,二者都是新技术的应用,但是互联网金融是一种解决规模(Scalability)的问题,而智能金融更多的是把很多原有业务和过程打碎并重新组合。

  金融服务业的发展过程阶段可以类比为“农业”、”矿业”、“手工业”和“大工业”:

  传统投研非常依赖个人经验和个人人脉,所以非常像手工业。现在中国的分析师不到5万人,券商里的分析师不到1万人。分析师的数量并非需要扩展到10万人、20万人才能满足人们不断增长的业务需求。数百万的银行客户经理也在日常进行着“手工业”的劳动。其中相当一部分工作环节可能会被机器替代。

  而大工业要做的并不是比手工业更好、更精致的产品,它很难实现这一点。大工业所要做的是用可复制的技术建立一种协作,建立出有质量保证的产品,这也就是智能金融要达到的目标。

  人们现在可能尚且无法完全预测很多未来将解锁的场景到底是什么,但是可以想象,当企业、中介机构、监管机构、投资者之间的数据交换能够有非常快速的通道时,现在人工完成的很多工作都可以自动化,例如监管、审批和信贷等,这可能会带来业务和商业模式巨大的变化。

  这是非常漫长的工作,很难通过一个复杂的系统一次性实现。当前我们还处于比较早期的阶段,整个市场的投入量和人才都非常少。现在相对比较成熟的是零件和工具层面,系统的成熟化可能要多花几年时间,需要一定的时间将基础的标准件提取出来。从复杂的文档中将数据提取出来,进行数据分析,进而形成标准件。监管、投研、审计、信贷等很多领域都需要这种标准件。大工业的核心就是标准件化,通过标准化实现更高效率的业务智能化。

  三、智能金融的四个发展阶段与结构化数据之墙

  金融智能化本身也可以分为四个阶段。根据亿欧《2017中国智能金融产业研究报告》,截止到2017年,中国智能金融公司有160余家,累计融资250亿元人民币,其中智能营销占37%,智能风控(主要面向个人数据)占26%,智能支付占19%,智能投顾占13%,以上(即前两个阶段)合计占95%,竞争很激烈。而第三阶段、第四阶段还处于起步时期。

  从2012年开始,智能金融兴起的第一个阶段是基于大数据的智能金融,例如智能营销、个人风控。这个阶段发展比较快,主要是因为现有结构化数据比较多。例如,在个人征信领域,借助那段时间P2P的发展,本身利用的数据(如个人征信数据、运营商数据)都已经实现结构化,所以这个赛道在两三年的时间内就已经发展成熟,出现了独角兽级别的企业。

  2014年前后兴起的第二个阶段是基于机器学习发展起来的,其应用主要是在智能支付和智能投顾上开展。智能支付领域围绕生物识别,主要是人脸识别,诸如商汤、旷视等公司都发展得很好。智能投顾领域发展到“智能投顾2.0”,主要围绕着用户画像,这也是第一个阶段大数据的延伸。智能投顾的1.0版本基本上是基于传统理论的资产配置,而智能投顾的2.0版本则加上了机器学习来完成各种用户的画像,产生了“千人千面”,实现了更加个性化的资产配置。

  前两个阶段的发展都很快。从数据上看,这是因为“低枝上的桃子”都被摘下来了,也就是充分利用了现有的结构化数据。到2015年之后,这个领域进入瓶颈,发展速度很明显的就慢下来了,因为“低枝上的桃子”被摘下来以后,剩下的全是“硬骨头”。例如企业征信的发展,与个人征信的发展相比要慢很多,至今仍然没有发展特别大的公司,因为绝大部分企业征信数据,特别是中小企业的数据,都在非结构化的文本里。再例如证券业的智能化中,像一些智能投研、智能投顾的3.0版本发展要比2.0版本慢很多,因为目前这些证券业绝大多数的数据都在文档里,在PDF文件里,包括交易所在内的金融机构都没有结构化的数据表示。如何将PDF文件、扫描文件中的数据提取出来,是当前发展最大的瓶颈,这被称为“结构化数据之墙”。这是2015年前后所遇到的最大问题。

  在2016年前后,诸如智能投研、智能客服,以及企业图谱(主要面向银行),不论是风控还是营销,其发展都需要面对这个问题。2015年前后,逐渐有一些公司开始处理这个问题,于是进入了智能金融的第三个阶段。第三个阶段以文本处理、自然语言处理(NLP)作为核心技术。到目前为止,这个问题还没有被完全解决。例如基础层面上,在财务报表的处理方面,现在已经达到工业可用的状态;其他方面,诸如公告提取、研报提取,有的实现了80%,有的实现了70%,有的甚至只实现了50%,尚未达到全面的工业可用的状态。

  从2017年开始进入第四个阶段,知识和规则变得非常重要,同时又兴起了一些新的应用,例如智能监管、智能资管和智能审计。这个阶段跟前一阶段(NLP)是不一样的。NLP阶段解决的是如何将数据从非结构化的文档里提取出来。当前一步的问题得到初步解决之后,新的业务需求就被解锁了,需要对数据进行自动化的校验、检查和规则运行。因此,很自然地就进入了这个监管、审计的阶段。知识图谱对于这个阶段就变得非常重要。这一阶段比前一个阶段更具有挑战性,到目前为止仍处于刚刚起步的时期。

  

        以上内容精选于《人工智能》杂志第六期

  本文作者

  鲍 捷

  文因互联 CEO、联合创始人。曾是三星美国研发中心研究员,伦斯勒理工学院博士后,麻省理工学院分布式信息组访问研究员。2007 年,于爱荷华州立大学获得博士学位。研究领域涉及人工智能相关方向,如自然语言处理、语义网、机器学习、描述逻辑等。已经发表 70 多篇论文。曾是 W3C OWL(Web本体语言)工作组成员。中国中文信息学会语言与知识计算专委会委员,W3C顾问委员会委员,中国计算机协会会刊编委,中文开放知识图谱联盟(OpenKG)发起人之一。

  欲阅读完整文章,可通过以下方式购买《人工智能》杂志!

  订阅2018年《人工智能》杂志6期共计360元

  银行转账:北京赛迪出版传媒有限公司

  开户行及账号:中国建设银行股份有限公司北京紫竹桥支行11050170560000000152

  银行转账,请备注:人工智能

  接收详细信息请发到:aiview@ccidmedia.com;或是添加客服微信:13601092749

收藏