金融数据标准化征途:数据治理决定成败产业链数据率先试水-全讯新

发布时间:2022-12-24 14:00   文章来源:东方财富

面对日益丰富的海量数据,越来越多的基金证券等投资机构陷入财务数据缺乏标准化的新烦恼。

金融数据标准化征途:数据治理决定成败产业链数据率先试水

我们投研部门每天需要花费大量的精力进行各种数据校对和统一表达口径,极大地影响了投研建模的效率一位券商分析师向记者透露比如维生素在不同的财务数据服务商有不同的表述——维生素,维生素等等,往往造成不同的业务部门对同一件事有歧义,此外,集成电路也被很多金融数据服务商称为微芯片,芯片,集成电路,这也造成了不同业务部门明明讨论的是同一件事,但表述不同,导致误解

他直言,很多财务数据不统一,会大大增加他们对外业务拓展的沟通成本其中,最常见的现象是,作为卖方的券商在向买方推荐基金,保险资管等投资策略时,部分财务数据的计算口径不够一致,导致买方对投资策略的有效性产生担忧,直接影响券商的业务合作进程

财务不规范引发的一系列问题正在引起相关部门的重视。

2月初,中国人民银行,市场监管总局,银监会,证监会联合发布《金融标准化十四五发展规划》,提出进一步推进证券期货标准建设,大力推进资本市场基础数据标准和监管数据标准制定,研究建设资本市场数据标准体系,提升证券期货行业数据治理水平。

受此影响,越来越多的金融数据服务商正在探索金融数据的标准化。

恒生电子首席科学家白说向记者透露,在金融信息数据标准化领域,恒生电子目前正在设计统一的信息模型——基于sdom证券行业模型的数据域划分,证券分类和根定义,综合考虑信息数据在现有业务系统中应用的场景,沉淀公共信息数据服务能力,助力实现金融信息数据标准化。

据一位公募基金公司信息技术部负责人介绍,要真正实现财务数据标准化,除了规范基础数据定义,还需要将财务数据标准化的应用范围拓展到数据治理体系——从数据采集,数据分类,数据存储,到实现公司内部财务数据的标准化建模,标准化定义,需要构建业务,技术,管理维度一致的标准化运营体系。

在他看来,要做好这份工作,基金证券机构和金融数据服务商还是需要勤练内功。

上述公募基金公司信息技术部负责人直言,财务数据标准化建设绝不是设计一个技术平台就能解决的,更不是一个长期,迭代,滚动,分步实施的过程。

数据治理还有很长的路要走。

记者获悉,最近几年来,伴随着越来越多的基金经纪机构设立数据中心,其对财务数据标准化的诉求日益强烈。

目前很多财务数据表达上的差异已经让我们相当难受了某券商机构it部门负责人向记者透露比如集成电路的表述,在很多金融数据服务商中就有很大的不同有些机构称之为集成电路制造或半导体产品,这就不可避免地增加了他们数据校对的工作量

更让他不爽的是,一些金融数据服务商提供的技术术语存在明显的歧义以锂电池为例,可分为三元锂,碳酸锂,磷酸锂,钴酸锂等根据包装,它们可以分为圆柱形,方形和软袋根据不同的使用场景,也有动力电池,储能电池,消费电子电池等不同的称谓但这些金融数据服务商普遍称之为锂电池,导致投研部门不得不停下来

这给我们造成了很多额外的工作量,导致投研建模效率降低,外部业务拓展的沟通成本剧增他坦言这些问题表面上看是由于技术术语等基础数据名称不统一造成的,但更深层次上涉及到各个机构缺乏数据治理的标准化操作体系

前述基金公司信息技术部负责人向记者透露,为了加强数据治理能力,推动财务数据的标准化,他所在的基金公司近两年成立了数据治理委员会,由it治理委员会负责管理。

考虑到基金公司规模还不够大,我们的it治理委员会和数据治理委员会实际上是一套班子,在加强it能力升级的同时推进数据治理架构的建设他指出无形中,基金公司的it能力升级与数据治理紧密相连,帮助基金公司在架构管理,资产管理,标准管理等方面完成数据标准化体系设计和业务流程建设借助it系统的不断升级

该基金公司信息技术部负责人直言,期间他们走过一些弯路,目前还没有完成企业级的数据标准化管理,包括重新优化很多报表,以高度标准化的数据系统提交给监管部门。

此外,我们正在与量化团队就如何创建并行计算环境进行沟通但在实际操作过程中,金融工程团队只有单机版的python,无法充分发挥公司的科技能力,即难以最大限度地利用计算能力开展各类算法建模研究他直言不讳这对财务数据的标准化提出了新的阻力——因为很多财务数据不能被充分利用,没有标准化的操作空间和规模

某金融数据服务商向记者透露,针对上述痛点,他们正在尝试输出自助查询技术服务——基于数据湖,通过智能技术提供自助分析,多维度,数据实验室,api,excel插件,固定报表,帮助各类金融机构根据自身数据标准化需求,完成产品管理系统,客户ecif系统,机构主数据,证券主数据的迭代升级,在实现数据迁移管理的同时,构建更加标准化的数据采集,处理和证券主数据。

产业链数据率先试水

面对日益高涨的数据标准化需求,众多金融数据服务商开始各显神通。

聚源副总经理夏青告诉记者,他们现在正致力于推动产业链数据的标准化。

我们的研究发现,目前产业链数据标准化的应用场景是相当可控的比如各种金融机构的投研领域,对此都有很强的需求比如很多主动投资模型,就需要通过这样的数据来构建热点行业上下游企业和相关资产之间的核心逻辑结构他告诉记者此外,越来越多的金融机构投研人员也将这类数据作为投资决策的新辅助工具,为智能投研打下坚实基础

上述金融数据服务商向记者直言,虽然很多同行将产业链数据标准化作为数据服务业务拓展的新突破口,但在实际操作中,做好这项工作并不难。

其次,金融数据服务商建立一套市场广泛认可,逻辑清晰,可行性高的标准化产业链数据极具挑战性因为很多行业都有自己的产业链发展特点,而金融机构在不同的数据应用场景下存在主观认知偏差,会增加数据场景的应用成本

第三,产业链数据在不同的业务场景下有不同的需求和扩展需求,无形中增加了产业链数据标准化的使用成本,

第四,在投研建模过程中,产业链的复杂性可能导致一些关键节点缺乏完整的标准化数据,导致投研建模的难度急剧增加。

此外,恒生聚源还通过大量的数据分析技术相互验证,避免标准化产业链数据之间错误的逻辑关系,减少产业链数据的冗余信息。

目前,我们还利用nlp等人工智能技术,推动标准化产业链数据在投研建模层面的精准识别能力,有效提升投研模型的数据挖掘效率他指出通过制定产品分类标准,产品包含标准,产品命名定义标准,上下游建设标准等机制,目前已打通上市公司,重点非上市企业等数十万家企业的各种产业链关系,广泛应用于智能投研,智能风控等智能金融场景

多家金融数据服务商指出,虽然越来越多的同行在产业链数据标准化方面做了大量尝试,但实际使用的普及仍受诸多因素影响一是很多金融机构的投研人员基于原有的数据使用习惯,可能无法快速适应新的产业链数据,导致后者更难普及,其标准化效果无形中被削弱,二是如果新的产业链数据计算口径与金融机构现有的数据管理运营模式不一致,后者可能不愿意下大力气重新调整现有的数据计算口径,限制了其应用范围,第三,要实现产业链数据的标准化,很多金融机构还需要审批使用,但这也涉及到很多金融机构的excel表格和日周信息是否会采用他们的数据计算公式如果金融机构不愿意使用它们,标准化过程将更加困难

前述金融数据服务商向记者透露,目前行业正在尝试采用一种相对可行的运作模式,即金融数据服务商与证券交易所,知名买方机构,指数r&d机构合作,参与设计各产业链数据的业务标准,技术标准和应用维度机制,并成功将数据标准引入越来越多知名金融机构的行业知识图谱和智能投研系统通过交易所,知名买方机构,指数r&d机构的影响力,逐步实现这种产业链数据应用的普及,最终

推荐阅读

574
网站地图