新闻中心

实践经验分享,百分百可行的数据治理实施方案(开展数据治理)

2023-05-26
浏览次数:
返回列表

首先申明一下本人并不是数据治理领域的专家,也没有体系化的学习过数据治理方法论,本文的方法都是作者本人边踩坑边零星的学习实践中总结出来的。好不好不知道,但可以借鉴一二。

什么是数据治理?

按我个人理解就是把企业分散在各个系统中零散并且标准不统一的数据用统一的标准分类关联整理出来。

企业在信息化发展过程当中因为开始不专业,造成同类型数据分散在各个系统当中,并且这些数据没有统一的格式,没有统一的主数据作关联。

例如:电商部门用和淘宝、京东对接的sass系统管理订单; 线下销售部门用其他的crm 系统管理订单。

两套系统没有通过api 打通,两边的订单id 可能都有重复的,物料编码也不一样,同一个客户在两套系统中客户id不一样,甚至客户名称一个系统用半角英文扣号一个用全角中文扣号。

更糟糕的场景是可能同一个客户在市场部的系统里和销售部不一样,或者两个销售团队抢同一个客户时各自建了一个客户数据,名称一个带公司两个一个不带。

这在快速发展的企业中很常见,由于数据格式不统一要想统一汇总分析就很困难,更别谈进一步的溯源,挖掘分析。

数据部门要想提供一份完整的报表就必须把这些数据统一起来,同一个客户的数据关联起来。这就是数据治理通俗易懂的解释。

理解了什么是数据治理和数据治理的意义,下面老高就来分享一下老高自己是如何做数据治理的。

第一步:梳理业务流程

先不要着急去梳理数据,数据分析的目的是为业务为经营决策服务的,所以先熟悉理解业务,把业务流程图画清楚,越细越好。老板给的时间足够就画到最小单元为止;老板给的时间少就到四级。

一级为公司业务流,二级为一级部门业务流,三级二级部门业务流,四级为场景业务流。如果是集团型的企业可能不止四级,根据自己负责的数据部门负责的数据范围而定。

第二步:梳理出每个业务流的运营管理指标

第一步的梳理业务流是为第二步的梳理指标服务的,如果是不理解什么是指标,老高告诉你指标就是企业中每个人应该关注的点。比如财务关注现金额,毛利润,欠款;销售关注成交金额,客户数,每天打了几个电话。简单粗暴的讲就是每天你应该问你的下属要什么数据,和上级领导什么数据。

指标也是分层级的,大指标是由小指标组成的,每级领导关注的焦点都不一样。具体本文不详细讲了,有时间老高会专门在指标系列文章中讲解。

总之指标要有体系的梳理出来,并且标注好权重。权重根据公司当前的发展目标来定,首要关注的点权重最高。

第三步:梳理系统和系统流程

不要问为什么,先跟着老高做,后面肯定有用的。

这一步就是梳理清楚企业有哪些系统,每个系统有什么模块,模块之间的关系,业务流程是怎么在系统中走的,最终产生了哪些单据,哪些基础数据。

第四步:对比业务流程和系统流程

这一步的目的是看看公司哪些业务流程已经落到系统,有哪些数据是可以供我们分析的。

没有落到系统的业务流程上报给老板和it部门,抓紧建设。

第五步:审计业务系统的数据质量

1.看基础数据,也就是主数据的标准是否统一。主数据就是每套系统都用到的数据,如物料,组织架构,员工资料,客户资料,行业,地区,来源等等。

2.看数据之间的关联关系是否健全,如销售订单和出库订单之间是否有id 关联,出库单是否和对账单、发票有主建关联。

3.数据是否闭环,符合财务准则,数据闭环是业财一体的基础,如果不闭环出具财务报表时就很痛苦。比如出库单发货后还可以撤销,没有月度结算概念,1号出的上月财务报表到2号又变了,税务局就要查你了。

4.数据信息是否健全,比如有的订单有物流信息,有的没有。

5.数据链路的完整性,比如销售订单删除了,出库订单还在。

其他还有很多方面不一一例举,审计的目的是摸清楚数据质量的现状,后面治理时才有抓手。怎么审计,从哪些方面审计,看个人经验。例如我们系统中就经常有订单主表和副表的创建时间不一致,导致从产品纬度和从订单维度出具的每日成交总额不一致。

第六步:制定数据标准

我们在第五步时分析出来了一堆问题,接下来首要的就是制定标准,保证主数据的统一和唯一性,以及其他数据健康度。

这一块可以找专门的教程学习一下,老高后续也会写文讲解。

部分标准需要it部门改造业务系统,用户改变操作习惯;部分由大数据团队技术解决。

第七步:优先治理主数据

只有主数据统一了其他的数据才能通过主数据进行关联,所以治理主数据要放在第一位。

例如客户名称都不统一如何准确分析出客户的销售数据。物料名称不统一如何分析出产品销量排行。

第八步:根据指标体系的权重进行数据治理,出具分析结果

这里就不讲解具体的治理方法了,技术上的事都有成熟的各种解决方案了。

老高建议的是不要大包大懒,先把所有的数据都治理好。因为老板和业务部门的耐心是有限的,他们不会管你什么基础建设,他们就是要快速看到结果。原来只要和it提一个报表需求几个小时就给拉出来了,你数据部门却告诉我要一年才能出报表,还没等你建设好数据仓库就让你滚蛋走人了。

所以我们要根据指标权重优先级先出他们可见的成果,增加他们的信心。

数据中台不是一天建成的,得有取舍,逐步推进。

这就是我们第二步梳理指标的意义所在,只有找准了老板要什么,业务部门要什么我们的数据才能快速产出价值。

希望本文能帮到大家,尤其是刚刚入职的数据负责人,首席数字官,数据分析师。

更多干货分享请关注老高,有好的建议和方法也可以留言评论或私信。

举报/反馈

搜索