艾伦•西蒙

可以将数据建模看作是数据和系统的等效物,就像制造公司在开始构建实际对象之前构建汽车、家用电器或飞机的模型一样。模型帮助我们描绘出一幅不同对象和子系统如何相互关联的概念图。我们可以在投入大量时间和资源到实际对象之前就解决这些细节问题。

在数据模型的情况下,我们可以列出主要数据片段如何相互关联,它们各自的特征和属性是什么,以及将哪些业务规则应用于整个模型以及较小的组件。数据科学家、数据分析师、软件开发人员和其他人可以在构建分析模型、软件数据定义和组织数据的其他用途之前,使用数据模型的描述性内容来明确每个数据块的实际含义。

掌握数据建模基础

2020年3月

畅销书
  • 37个讲座
  • 初学者水平
4.4 (2994)

实体关系技巧和最佳实践阿兰•西蒙

探索课程

在本文中,我们将深入研究数据建模的基础知识,并回答为什么数据建模是数据科学的重要组成部分的常见问题。

数据建模是如何工作的?

数据建模帮助我们以一种高度概念化的方式开始处理数据。它的目的是比许多数据库更接近真实世界。此外,建模沿着概念-逻辑-物理生命周期转换和映射数据,一直到高度调优的数据结构,旨在支持最佳在线性能和响应时间。

换句话说,数据建模是一门反映其他类型技术的学科,这些技术以概念视图开始,以技术实现结束——例如,软件开发和业务流程建模。必威真人投注

数据科学家什么时候使用建模?

数据科学团队负责构建复杂的分析模型,为广泛的预测和探索/发现分析奠定基础。这些分析模型的一个关键组成部分是获取正确的数据。这意味着准确地理解每个数据元素的含义、其内容值的可能范围或列表、数据实例是否必须存在或是否允许丢失数据(例如,如果允许NULL值)、数据如何与其他数据关联,等等。

数据模型帮助数据科学团队充分理解数据,并识别任何可能影响模型有效性和准确性的问题。

掌握数据建模基础
艾伦•西蒙
4.4 (2994)
畅销书
数据仓库入门基础
艾伦•西蒙
4.5 (6747)
畅销书

艾伦·西蒙课程

数据建模的三种类型是什么?

现在我们已经了解了数据建模工作原理的基础知识,接下来让我们了解三种类型的数据模型,每种数据模型在数据库系统中都有自己的角色。

概念数据模型

概念数据模型理想地尽可能地反映真实世界。换句话说,我们试图避免特定数据库管理系统的约束,这通常要求我们的数据以非常特定的方式结构化,有时包括“人工”数据库表或其他克服这些约束所必需的结构。相反,我们希望概念模型用实际的对象、特征、关系和业务规则表示特定的业务问题,或者我们构建它的目的。

逻辑数据模型

逻辑数据模型将概念模型映射到特定于数据库的一组结构中。例如,在关系数据库中,我们有某些结构,如由行和列组成的表。我们采用我们在概念层构建的模型,并应用我们需要进行的任何转换,以便使模型现在符合关系数据库的规则,或我们正在使用的任何类型的数据管理系统。

物理数据模型

在物理层,我们用两种方式对逻辑模型进行调整。第一种方式是由特定于产品的特性和限制所驱动的。第二种方法尝试在数据库实际填满数据并实现后提高性能和响应时间。

所有三个层次都是非常重要的,理想情况下,数据建模生命周期包括在每个层次上的实质性参与。

什么是常见的数据建模工具?

数据建模工具是一种专门的软件,它不仅允许我们绘制主要的数据建模构造——实体、属性和关系——而且还为这些对象附加语义。这些含义可能像属性的数据类型和大小那样简单,也可能像管理数据模型上两个实体之间特定关系的业务规则那样复杂。

然后,语义帮助我们将反映真实世界的高度概念性模型转换为特定于数据库的结构,这些结构成为一个或多个应用程序和系统的数据管理平台。

数据建模工具的范围可以从通用的包,如Microsoft Visio,它已经发展成为一个完整的功能产品,以构建和管理数据模型,到专门的软件,如CA Erwin、ER/Studio Data Architect和许多其他软件。以下是五种最流行的工具。

  1. Microsoft Visio

如果您不需要非常专业的软件,那么Microsoft Visio可能是一个很好的开始。它的图表是专业和直观的。此外,流程图模板是现代的,您可以与您的团队在工具中协作,以获得真实世界的见解。必威中文官网

  1. CA Erwin

如果您使用Windows作为操作系统,并且正在寻找一个数据建模器来处理结构化和非结构化数据,Erwin data modeler是一个屡获殊荣的高质量建模工具。

  1. ER /工作室

Idera的ER/Studio是另一款最适合Windows操作系统的软件。使用企业团队版本,您可以对来自BI、Big data、ETL、NoSQL和关系源的数据进行建模,以及实现命名标准、定义术语表术语,并将模型保存在存储库中供其他团队成员查看。

  1. PowerDesigner

SAP PowerDesigner工具最适合用于数据建模、lync-and-sync和元数据管理。该界面易于导航,并且有一个存储库,因此您可以轻松地与您的团队协作。这个工具在Windows下工作得最好。

  1. Navicat

在任何操作系统上使用Navicat。与其他一些工具相比,它是构建高质量数据模型的更经济有效的方法,而且您仍然可以执行许多相同的任务。Navicat最适合进行正向和/或反向工程,从其他数据源导入模型,或生成复杂的SQL/DDL。

流行的数据建模技术

数据建模的方法不止一种。正确的技术将取决于您的用例和业务需求。一些数据建模方法可以被认为是以数据库为中心的,这意味着它们致力于数据和数据对象之间关系的图形化描述,最终目标是设计和创建数据库。其他技术在本质上更全面,协调处理数据模型,同时处理流程建模和系统开发的其他方面。必威真人投注

大多数方法的根源可以追溯到实体-关系(E-R)建模,该建模始于1976年Peter Chen的学术论文,并经过多年的发展。另一种与经典E-R建模密切相关的技术是所谓的“鱼尾纹符号”,它遵循许多与“经典”E-R建模相同的规则,但使用不同的符号来表示数据和业务规则。

E-R模型,不管符号是什么,都代表真实世界的对象。实体是真实世界中的事物。它有一组或多个属性,这些属性可以有值。因为可以有很多实体,这些实体之间可以有关系。因此,E-R建模就是对这些实体以及它们之间的属性和关系进行建模。

现在,我们已经讨论了很多关于数据建模的内容,所以你可能想知道它如何适合你的职业发展。必威真人投注IT和数据专业人员可以将数据建模作为他们所做的以数据为中心的工作的一部分(数据仓库例如,大数据)或将数据模型作为更大工作的一部分,如定制软件开发、打包软件开发或数据科学和机器学习。必威真人投注一般来说,数据建模对于任何处理数据的人来说都是一项非常重要的技能。有些人可以把数据建模作为他们职业生涯的中心,或者它可以成为一个更大的技能工具包的一部分。

让你的团队。领导行业。

通过Udemy for Business订阅您组织的在线课程和数字学习工具图书馆。

请求一个演示

页面最后更新:2020年6月