您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

向新手解释数据治理的一个最佳方式

发表于:2023-09-16 作者:晓晓 来源:数据驱动智能

数据管理和数据治理可能很难向新手解释。它们涵盖了复杂的数据能力领域,例如元数据管理、数据质量、数据架构、数据编目、数据隐私、数据科学和数据集成。我发现自己在为客户提供建议和向自己团队的新成员提供建议时,很难快速、明确地解释潜在的核心概念。

随着时间的推移,我发现使用类比被证明成功的机会最高。在这种情况下,数据管理可以与房地产管理进行比较,因为两者都需要有效地组织、维护和利用有价值的资产。它不仅有助于理解底层组件,还有助于想象它们如何一起运行。

让我们逐一进行比较:

  • 数据资产:数据资产相当于房地产管理中的建筑物或财产。数据资产也可以被视为数据产品或数据集。数据和房地产管理都围绕管理资产进行,这些资产在适当的治理和培育时会产生价值,但在管理不善时会导致风险和损失。
  • 数据所有权:数据管理中的一个关键概念是所有权 - 职责可以委托给其他人,但最终,一个人或一个团队应该是数据的所有者。对于建筑物来说也是如此,这可能是业主或房东。
  • 数据管理:数据管理涉及将数据资产管理的责任分配给特定的个人或团队,例如,以确保数据具有足够的质量。在房地产管理中,数据管理可以比作负责物业维护和保养的物业经理的角色。
  • 数据消费者/用户:各种个人和业务流程可能会消费组织内部和外部的数据。这可以与将建筑物用于各自目的的租户进行比较。
  • 数据货币化:数据货币化涉及利用数据资产来产生收入,例如通过向其他组织出售数据。在房地产管理中,这相当于从房产中产生收入的方法,例如将空间出租给租户或用于举办活动、出售广告空间或将其全部出售。
  • 数据契约:数据契约是数据生产者和数据消费者之间的正式协议,确认要交换的数据以及相应的格式和质量要求。这可以与租赁协议进行比较,其中描述了房东的期望以及房产将在什么状态下提供。它还概述了该财产可以用来做什么(具体来说,不能用它做什么)——数据契约可以用于类似的目的。
  • 价值量化:估计与资产相关的价值都是值得的。正如财产的价值取决于其位置、大小和状况一样,数据的价值也取决于其相关性、准确性和可访问性。
  • 数据安全和访问控制:数据安全是指保护数据资产免遭未经授权的访问、使用或泄露。在房地产管理中,数据安全可以比作使用锁、警报和安全系统来保护财产免遭盗窃或破坏。
  • 数据架构:这可以比作房产的蓝图,它定义了建筑物的布局、设计和构造。同样,数据架构涉及数据存储和检索系统的设计和结构。架构标准可以为如何构建建筑物提供指南和最佳实践,数据架构标准也可以为数据资产提供相同的指导和最佳实践。
  • 数据域:就像城市被划分为社区一样,数据也可以根据其主题划分为域。任何财产都属于单个域,并且所有域一起包含所有财产 - 这同样适用于数据资产和域。每个社区都有自己的特征,例如人口统计和房产价值,同样,每个数据域也有自己的属性和要求。可以特许像业主委员会会这样的组织(相当于数据域所有者或管理员)来监督这些要求的实施。
  • 数据政策和标准以及监管合规性:这可以与管理财产使用和开发的不同法规进行比较,例如分区法、环境法规以及建筑和消防法规。同样,数据策略和标准定义了组织中管理数据的规则,这些规则源自适用的法规,例如与数据隐私和数据保护相关的法规。
  • 元数据管理:元数据是关于数据的数据——它可以根据数据所包含的数据属性来描述数据资产,谁拥有它,谁有权访问,谁访问过它,何时访问它,它的位置,有多少记录,以及总资产的规模。它可以与有关房产及其功能的详细信息进行比较,例如总平方英尺和立方英尺、所有者、房间数量、位置以及谁拥有建筑物的钥匙。
  • 数据质量:数据质量是指按照准确性、完整性和一致性等维度衡量的数据的适用性。在房地产管理中,数据质量可以与财产的状况和维护进行比较,例如是否存在任何缺陷或安全隐患。
  • 数据修复:数据修复是指识别和纠正数据质量问题的过程。在房地产管理中,数据修复可以与识别和纠正财产缺陷(例如漏水的屋顶或有缺陷的地基)的过程进行比较,以维护财产的价值和安全。
  • 数据使用:这可以与属性使用的测量进行比较,这有助于确定其潜在价值。这包括入住率,但或许还包括更详细的日志,记录谁进入大楼、何时进入、停留多长时间。同样,数据使用测量涉及跟踪和测量组织中数据的使用方式和使用人,以及数据资产的采用程度。
  • 互操作性:这可以与一个属性与其他属性和(上游或下游)系统的兼容性及其共享公共基础设施或资源的能力进行比较。例如,建筑物连接到电网、水网和污水系统,其中每个连接都在电压、水压和管道尺寸以及污水标准方面都有精确定义的标准。类似地,数据互操作性是指资产按照通用标准交换数据并与各种其他系统和应用程序无缝协作的能力。
  • 数据存储:数据存储可以与财产的物理大小和基础结构进行比较。房产可能必须具有一定的最小尺寸,例如才能容纳工业机器或容纳一定规模的家庭。同样,数据存储是指数据库、数据仓库或数据湖中的物理或虚拟存储容量。
  • 数据生命周期:这可以比作房产的生命周期,涉及建设、维护、翻新和拆除等各个阶段。同样,数据生命周期管理涉及在创建、存储、使用、归档和处置等各个阶段管理数据。
  • 数据集成:不同的房产和社区通过道路和交通系统连接起来。特定的建筑物可以方便地到达公共交通和附近的高速公路。数据集成涉及连接来自不同领域和来源的数据,这可能涉及数据清理、数据映射和数据转换等任务,以确保来自不同系统的数据可以一起使用。如果没有集成,您将无法访问或使用数据,就像您无法进入或使用建筑物一样。

房地产类比提供了一种方法来理解数据管理的各个方面以及它们如何协同工作以支持组织的整体数据策略。