然而很多开发团队却非常不重视这个过程,数据库及接口的设计极其随意。甚至还有一些大神认为,数据库和接口的改变是避免不了的事情,做项目就是做完之后试试看,不行再改。可以说,从方法论上就存在问题,就好像修路一样,修好了挖,挖好了修,反反复复,来来回回,开发者和用户都苦不堪言。
说了这么多,下面我们来正式介绍一下数据库设计的整个流程。
数据库设计的基本步骤包括以下几个方面:
一、需求分析阶段
需求分析是整个数据库设计的基础和核心,需求分析的结果是否能准确地反映用户的实际需求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理、实用。这一阶段要收集和分析用户对系统的信息需求和处理需求,以及后续可以存在的扩展功能,从而得到设计系统所必需的信息,建立系统的需求说明文档。
在很多项目中,存在的最大问题就是开发团队对于项目,没有从日常使用者的角度去考虑问题,对项目所涉及的业务流程不熟悉,完全根据用户的描述来被动设计。而往往不懂技术的用户描述是不完备的,最终导致完全的项目在用户试用之后发现很多问题,导致工作量的大幅增加。
因此,在做一个项目之前,完全了解项目用户的业务流程,是对于开发团队素质的一个重要考验。
二、概念设计阶段
概念设计是数据库设计的关键所在,这一阶段通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型,并且用E-R图表示出来。
概念模型也称为信息模型,用于信息世界的建模,实现了由现实世界到信息世界的第一层抽象。
信息世界涉及的主要概念有:
1、实体(Entity):现实世界中存在的可以相互区分的事物或概念,如一个学生
2、实体集(Entity Set):同一类实体的集合,如全体学生
3、属性(Attribute):实体所具有的特征,如学生姓名、性别
4、码/键(Key):唯一标识实体的属性集,例如学生的学号
5、联系(Relationship):实体集之间的对应关系,如一个教师教多个学生、多个学生选多门课
概念模型最常用的表示方法是P.P.S.Chen在1976年提出的实体-联系(Entity-Relationship)模型,简称E-R模型或E-R图
三、逻辑结构设计阶段
这一阶段在概念模型的基础之上,根据转换规则导出一种DBMS支持的逻辑数据库模型,比如说目前最常用的关系型数据库,该模型应满足数据库存取、一致性及运行等方面的用户需求,并且在一定程度上,对些模型进行优化。
例如,一个一对一的E-R模型,可以建立一个单表,比如说班级,对班主任,是一对一的关系,那么只需要一张表。而一个一对多的关系,则需要两张表,比如说班级对学生,就需要把班级设置为一张表,而将班级号作为学生表里的一个外键。多对多的关系,就需要设计三张表,比如说学生和课程,就需要学生、课程、学生选的课程三张表来反映三者之间的关系。
四、物理结构设计阶段
为逻辑数据模型选取一个最适合应用环境的物理结构,利用已经确定的逻辑结构的结果以及DBMS提供的方法、技术,以设计出高效可实现的数据库结构。但一般情况下,在关系型数据库中,数据的存取对用户是透明的,所以对物理设计考虑会相对少一点。尤其是现在有了诸如Spring Data Jpa之类的持久层框架之后,开发者的精力可以主要放在实体之间的关系上面。
五、数据库实施阶段
根据逻辑设计和物理设计的结果建立数据库,编写与调试应用程序,将数据录入到数据库中,同时进行数据库系统的试运行。
以上就是数据库设计的几个重要步骤,在实际操作中,最重要的是正确划分实体和实体间的对应关系,而这也是优秀开发者与普通开发者最大的区别之一。往往优秀的开发者可以看透一个项目之间存在的实体,和实体间的对应关系,从而方便快捷地确定项目的数据库基础。而普通或者低劣的开发人员,则很有可能将实体关系搞得一团糟,最终在实际应用中才发现表设计存在较大的缺陷,最终不得不耗费大量的工作量来解决这个问题。
就好像地心说时代,天文学家用本轮均轮,等大小齿轮咬合模拟的方式来推演太阳、月亮和各行星的轨道。一开始只有地球、太阳、月亮的时候还很好拟合,但是随着多颗行星的发现,到了哥白尼时代,需要模拟的齿轮已经达到了上百个,导致人们苦不堪言。但是,改成以太阳为中心的话,那么一切就清爽直观了。
数据库设计也是如此,如果实体之间的关系没有理顺,那么最终将严重影响项目的开发质量。读者们,你们被实体关系设计得很糟糕的数据库结构坑过吗?如果被坑过,欢迎说出你的故事哦。