- 监管机构
- 银行
- 租赁
- 其他金融
时间:2021-01-20
讲到数据治理,我们经常提到的一个词就是血缘分析,那么什么是血缘分析呢?一句话来说血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。
有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。
在现实世界中,我们每个个体都是祖先通过生育关系一代代孕育而来,这样就形成了我们人类的各种血缘关系。在数据信息时代,我们庞大的数据在每时每刻产生,这些数据又经过各种加工组合、转换,又会产生新的数据,这些数据之间就存在着天然的联系,我们把这些联系称为数据血缘关系。
大数据数据血缘是指数据产生的链路。直白点说,就是我们这个数据是怎么来的,经过了哪些过程和阶段。举个例子,比如在生产系统如淘宝网中,客户在淘宝网页中购买物品后,数据就被存到后台数据库表A中。当我们领导需要查看某个月卖的最火的是哪些物品时,我们需要对存入的这些数据进行加工汇总,形成一张新的表B来存储我们处理的数据,最后我们会根据B表进一步处理成我们前台展现使用的表C。那么A表是C表数据最初的来源,是C表数据的祖先。从A表数据到B表数据在到C表数据,我们认为这条链路就是C表的数据血缘。
在数据的处理过程中,从数据源头到最终的数据生成,每个环节都可能会导致我们出现数据质量的问题。比如我们数据源本身数据质量不高,在后续的处理环节中如果没有进行数据质量的检测和处理,那么这个数据信息最终流转到我们的目标表,它的数据质量也是不高的。也有可能在某个环节的数据处理中,我们对数据进行了一些不恰当的处理,导致后续环节的数据质量变得糟糕。因此,对于数据的血缘关系,我们要确保每个环节都要注意数据质量的检测和处理,那么我们后续数据才会有优良的基因,即有很高的数据质量。

如上图所示,在生成指标B的过程,输入表A进行了变更,如果通过血缘分析,了解到了A所影响的路径范围,那么完全不必要重新做一次所有计算任务,而只是把A到B之间影响到的节点重新加工即可。这样计算量可以大大缩减,而且提高任务的弹性时间,或许1小时内就能完成调整后的计算。
华宇智能数据数据治理解决方案
华宇智能数据拥有专业的数据治理能力框架以及数据治理统一流程、数据治理成熟度评估模型等方法论和项目经验支撑。从数据治理实施落地路径上来讲,应该是自下而上推进,梳理系统数据现状,明确数据存在的问题,制定具体数据标准规范统一数据统计口径,完成数据整合管理等等,推进优化业务应用设计和数据模型,进而推动业务数据架构不断创新,形成闭环。
金融行业的数据资产管理仍存在很多问题。具体来看,金融数据质量不高,主要体现为数据缺失、数据重复、数据错误和数据格式不统一等多个方面。针对这个问题,本文着重解决方法。
未来的金融市场将处处展现大数据的身影,科技革命正在对金融界进行一场巨大的变革,金融科技(FinTech)的运用使得金融市场的规则与技术不断进化,而大数据将在金融科技的运用和变革中扮演重要的角色。
国库现金招标利率以及与同业存单的利差都有所提升,或许反映了银行吸收存款的压力也较之前有了提升。此外,近期DR007利率也有所上行。分析人士指出,4月开始地方债的加快放量发行,或是利率攀升的主要原因。