从互联网一路火到金融行业 各大金融机构都在讨论的数据中台正在风口上

2019-08-20 18:26发布

作者章乐焱为恒生电子数据中台发展部经理、首席技术专家

从互联网行业火到金融行业的概念不少,比如微服务、个性化,也包括最近的各大金融机构都在谈论的“中台”。

2015年12月,阿里巴巴进行了组织升级,即“大中台,小前台”的模式,打破了原来树状结构,小前台距离一线更近,便于快速决策、敏捷行动;而支持类的业务放在中台,扮演平台支撑的角色。在金融行业,稳定与创新之间的矛盾愈渐凸显,如何协调二者矛盾?于是,互联网企业中的中台概念被逐步引入金融领域,并付诸实践。对此,恒生电子数据中台发展部经理、首席技术专家章乐焱分享了关于数据中台的思考与观点。

从数据仓库到数据中台

自3月份的一天起,微信朋友圈里一篇《数据中台已成下一风口》的文章被刷屏了,至今其实关于什么是数据中台,也还没有谁权威定义,在笔者看来,数据中台作为全领域数据的共享能力中心,旨在提供数据采集、数据模型、数据计算、数据治理、数据资产、数据服务等全链路的一站式产品、技术、方法论的服务,构建面向数据应用的数据智能平台。并且我也很认可数据中心业务正经历了从数据仓库到数据平台,再到数据中台的演进,正赋予数据中台更多的职能、更高的价值。

从简单字面理解,数据中台是位于前端数据应用与后端数据源之间的中间层,是为快速敏捷前端应用需求与相对缓慢的核心数据变化及复杂繁琐的数据维护之间提供适配;所以,数据中台即要有从事数据维护“脏活累活”的人,还要有懂全域核心数据的高层级建模分析人员。

上述理解看上去与传统数据仓库区别不大,如何看待数据仓库、数据平台、数据中台的区别,核心是对数据应用价值的不断提升,从“看数”到“用数”,再到创造新业务,可称之为数据应用的三种不同境界。

基于数据仓库的应用,一般提供数据分析报表等功能,解决企业内部“看数”的需求,比如领导者驾驶舱,为企业决策层提供经营数据,响应企业运营的需求;对于金融机构,响应外部监管机构的各种数据报送,也是一种“看数”的强需求。数据的准确性、及时性,是“看数”阶段对数据中心的重要指标。

基于数据平台的应用,在满足“看数”的前提下,越来越多的“用数”需求被提出,越来越多的前端业务场景需要“用数”,要用数据来支持业务发展,需要数据中心及时响应业务需求。

比如:前端的产品运营、用户运营部门,他们是实现企业价值的前台核心部门,互联网时代敏捷、快速的需求,第一时间传递到数据中心。在现代大数据技术支持下,数据中心迅速平台化,前端业务所需的数据集可以快速、灵活地被加入与使用,包括大量的外部参考数据的引入;数据的形式也从传统数仓的结构化数据,延展到半结构化数据、非结构化数据,比如用户行为数据、外部舆情数据;随着数据中心价值的提升,数据治理被提上日程,越来越多的企业愿意为数据质量、数据生命期管理、数据安全与隐私保护投入更多的资源。

基于数据中台的应用,随着数据多样性的发展以及数据价值挖掘技术越来越复杂,对前台应用“用数”的技能要求会越来越高,所以数据中心需要把相应的能力沉淀、共享。

在能力聚焦过程中,特别是在机器学习、自然语言处理、知识图谱等AI技术的催化下,数据中心拥有了创造业务的能力。机器学习揭示人工专家未能察觉的数据结构与数据关系,自然语言处理使得机器能替代人工高效提取非结构化数据中的有用信息,知识图谱让信息的组织更加灵活有效,并能利用图计算技术进行相关的推理;所以数据中心将越来越多的增值服务包装成API,提供给前端应用,从而使得数据中心发展成数据中台,更多的数据被汇聚、被增值,赋能给下游应用。在金融领域,各种智能资讯、智能投研、智能客服、智能风控,正是数据中台支持下创造出来的全新业务场景,正在迅速颠覆这些业务上原先的人工处理模式。

对于数据仓库、数据平台、数据中台也有人做了下面的总结,数据仓库对应分析报表即服务;数据平台对应数据集即服务;数据中台对应数据API即服务。

对于数据的重视莫过于阿里,“DT时代”、“数据是新能源”,这些概念大多出于阿里,包括“数据中台”,“大中台、小前台”。然而,数据资产如何真正激活发挥价值,从数据中台的角度看,还是要找到合适的场景,把它服务化输出,越是刚需的场景也越能体现价值。

盘点三大类数据资产及其应用

作为资本市场的IT服务商,恒生相信从业务需求出发,结合大数据、人工智能的应用,将会是资本市场数字化升级的主要方向。作为资本市场金融机构核心IT系统的主要提供者,在数据中台的建设规划上恒生一定是一个重要的参与者。

有哪些数据资源,会赋能到哪些业务场景,这是我们首要分析的,特别是除传统业务数仓之外的用户大数据、投研大数据。

传统“业务数仓”已普遍被用于客服、合规风控,基于内部业务系统的结构化数据为主,首先满足内外部“看数”的需求。由于业务系统经过多年的建设发展,一般系统建设也可能来自多家开发商或者部分自研,系统版本也几经迭代,技术架构多为异构,所以传统“业务数仓”迫切需要补的短板是通过数据治理提升数据质量。然而,基于业务系统的现状,数据治理很难从根本上解决上游业务系统变更对下游数据应用的影响,需要恒生这样的主流开发商从业务系统设计、交付环节满足机构对数据治理的需求。

“客户第一”的理念一般为金融机构所信奉,IT的发展也首先考虑直接面向客户的场景。所以随着大数据技术的发展,“用户大数据”相应的数据资产首先被关注。

除了业务系统中沉淀结构化用户信息,用户行为数据被进一步采集,然而很多情况下,使用第三方通过互联网提供的用户行为分析服务,导致存在用户隐私信息被无意中泄漏给第三方的安全隐患。在网络安全已立法的今天,金融机构应当建立自己的用户行为分析系统,并告知用户,获得用户的授权。“用户大数据”主要应用场景有金融机构APP的运营、精准营销。基于用户大数据的用户行为分析系统,是金融APP产品运营的重要工具,拉新、促活、留存,都需要有数据的支撑,在这个过程中还需要合法购买第三方的用户分析数据、明细数据补足进入大数据平台,并能有效使用这些外部数据。同时,利用用户大数据及用户标签系统,对用户进行全面、精准的画像,从而实现千人千面的用户服务,比如资讯信息的个性化推荐、金融产品的个性化推荐。这些应用都是数据中台利用“用户大数据”可以提供的数据服务。

在资本市场,投资是核心的业务,不管是客户自主投资、代客理财、自营业务、还是投行业务,后面都需要“投研大数据”的支撑。人工智能的相关技术(机器学习ML、自然语言处理NLP、知识图谱KG)在“投研大数据”的深度加工上也是日渐实用,核心体现在提升数据处理效率、降低数据处理成本、增强特色数据等方面。特别是由于文本类非结构化资讯信息在投研大数据中占很大的比例,自然语言处理技术在资讯关键信息抽取上发挥重大作用。

投研大数据的核心是对作为投资标的企业或金融产品的情报进行收集与分析,对标的企业或金融产品进行多维度标签化,并利用知识图谱的图数据库技术进一步梳理相关实体的相互关系,形成诸如企业股权关系链、上下游产业链,然后用图计算相关技术进行各种量化关系推导,结合金融工程相关理论,可在投资机会分析、投资风险预警上发挥重要作用。

恒生数据中台借助于核心业务系统供应商的占位优势,致力于为资本市场各类金融机构提供一体化的数据中台解决方案,一方面有助于支持前端业务的快速迭代、跨系统的相互协作;另一方面有利于数据分析应用能力的专业化,做大做强。风口上的数据中台,将成为全领域数据的能力共享中心。

本文源自券商中国

更多精彩资讯,请来金融界网站(www.jrj.com.cn)

文章来源: https://www.toutiao.com/group/6727092497429824003/