- · 《信息系统工程》栏目设[06/28]
- · 《信息系统工程》收稿方[06/28]
- · 《信息系统工程》投稿方[06/28]
- · 《信息系统工程》征稿要[06/28]
- · 《信息系统工程》刊物宗[06/28]
数据库设计的理论和实践
作者:网站采编关键词:
摘要:数据库设计的理论和实践萨师煊王珊中国人民大学摘要。木文讨论数据库研究在应用领域中的理论和实践问题首先从软伴工程的观点来分析应用数据库的信息系统的设计介绍设计中概念
数据库设计的理论和实践萨师煊王珊中国人民大学摘要。木文讨论数据库研究在应用领域中的理论和实践问题首先从软伴工程的观点来分析应用数据库的信息系统的设计介绍设计中概念结构的思想以及体现概,。念结构思想的报告和实现这一思想的实体联系方法然后比,较详细地给出数据库设计的过程。最后谈一谈对数据库设计中存在的问题—。二、曰一绪口近年来由于数据库应用范围日益广泛数据库管理系统简记已不再是用于管,理部门的应用程序或操作系统功能的扩充而成为计算机科学的一个重要分支应用了软件,,。工程的工具和方法同时由于关系数据理论研究的深入开展,为数据库技术提供了坚实的日基础使数据库系统从经验的即席系统成山逐渐成为有严格结构可明晰设计并,,咖。实现的系统、。我们认为数据库研究的课题跨越于应用软件与理论三个领域在这些领域的一端是应用问题即在计算机系统中已经提供了要求在给了目标变量与环境变量的,,软件、一定的应用环境与软硬件的环境下确定设计变量以建立一个良好的有效的且经济的应用,。。信息系统这就是以数据库设计为中心的信息系统的分析与设计在另一端是关系数据理。。这种研究虽以关系模型为背景但并不失普遍性,因为已经证明关系模型可以论的研究。,近年来关系数据理论研究已取得不少成果这些成果可以转换为设计数,映象为其他模型。。据库的工具在这两端之中就是系统软件的研制这一领域也取得了进展并开展,。了新的研究课题关系数据系统开始走上了商业市场,。本文仅讨论数据库研究在应用领域中的一些理论和实践问题应用数据库的信息系统。我们称之为数据库应用系统随着数据库技术的逐渐发展许多计算机系统都已配上,。软件数据库应用系统的研制和应用已日益显示出迫切性和重要性,、二数据库工程和软件工程。软件是公用的程序集合以及与一个系统有关的计算机化的文件资料的总体因此数据。库系统包括数据库管理系统和数据库应用系统都应认为是软件系统,由于软件系统的复杂性大型软件的研制旷日持久成本高错误多且发生过失败的事,,,,“。例出现了所谓软件危机”,因此年在“”会上提出了软件工程的概念用工,,。程方法研究和生产软件按照软件工程的概念软件生产分为五个阶段要求分析和规范说明,软件。设计逻辑设计和物理设计程序设计程序正确性证明和验证又匀维护—软件工程所研究的课题涉及一泛的领域包括,、要求分析定义和规范说明软件系统设计系统程序设计方法学程序测试程序正确性证明软件证明程序设计的工具和环境。,十余年来在这些方面有许多成果大大提高软件性能文本化活力性软件开发的管理。了软件系统的研制水平在数据库应用系统的设计中由于信息结构复杂要求多样化因而有各种各样的设计,,,。方法难于估计效果,而且作为数据库应用系统基石的数据库管理系统往往结构不是很好,。设计工作很大程度上是取决于设计者的经验和直觉的一种艺术没有基于科学的方法学因,。此设计结果出现了效率不高资源浪费等问题,为了改进与提高必须寻求科学的工具和方,。法提出了软件系统和数据库系统设计中相对应的图式图并认为可以研,制一个信息系统设计方法学将软件工程和数据库技木统一起来将软件工程的方法和工具,,。软件系统杏要求分析与规范说明应用于数据库工程建立模刑杏性态描述解空间描述,数据库系统概念结构一设计杏奋杏系统结构结构描述部分解逻辑结构一一一一一一一一一爪葬刃厂一一一杏目标系统解图物理结构。其他的软件工作者也都抱有同样看法认为软件工程中许多方法有助于构造数据库系。。同样数据库管理领域中所用的方法在软件系统中也有广泛的应用,统、三概念结构和报告七十年代以来和软件工程中提出重视需求分析与规范说明的思想相对应在数据库系,,。统设计中也提出了概念结构的思想所谓概念结构的思想就是对我们所关心的那一部分,。客观世界作充分的需求分析明确而严格地理解和描述用户需求,在进行数据库逻辑设计。以前,首先构造不依赖于计算机系统中具体数据模型的信息模型这种信息模型的好处是。提供统一的数据库基础这样可以根据机器系统的具体结构将一种,为逻辑设计作好准备信息模型转换为多种不同的数据模型借以减少逻辑设计的复杂性大大提高程序和数据的,,。独立性、。概念结构理论最深刻影响最大的是报告在报告中提出了数据、。库系统应具有外模式概念模式和内模式三级结构的方案。一个数据库包含现实世界某一部分的数据我们把现实世界的这部分称为组织概念,。模式描述全组织的数据的公共视图表示数据库中所模型化的信息的总体,它应当是组织、、、、。的长期无限制的模型要求具有简明性稳定性完备性理论性和通用性,、概念模式中仅涉及实体实体的性质和实体间的联系。所谓实体是指组织中各用户所、、关心的客观事物它可以是人物事件或者抽象的概念,。概念模式不涉及任何与机器有关。的方面。根据概念模式可定义多个外模式外模式描述外部视图表示与某一应用有关的数据,。的局部视图。。由概念模式映象一个内模式内模式描述内部视图表示数据如何按内视图组织,。概念模式对于外模式与内模式必须是独立的这样的结构可以提高程序与数据的独立其极端情况是对于同一数据可以使用根本不同的模用户的数据视图和存贮策略无关,,性。型所以概念模式是现实世界原型与具体数据模型的中介可以作为计算机数据处理人员,。与非计算机最终用户的接口、一四概念模式和方法报告中提出的概念模式充分体现了概念结构的思想规定了一个标,。准化的数据库系统总的体系结构的特征但是它只是提出了原则问题和研究方向对于概,。。念模式究竟应当包含哪些内容尚缺乏一个共同的协议许多学者在此基础上做了很多工作。体系和某些系统相比较例如工体系结构的一个具体例子,。工认为他的数据独中用户级信息逻辑级与数据,也有的学者把立存取模型是一卫。逻辑级分别对应报告中的外模式概念模式和内模式,于年。一提出了实体联系方法简称卫卜方法他认为用方法定义的组织模式。址司和报告中的概念模式实质上是相同的概念。一方法概念简单清晰容易理解是实现概念结构思想的有力工具,,一方法用巩图定义一个组织模式组织模式是现实世界的纯粹表示与数据模型,,。和存贮结构相独立然后将组织模式转换为各种,所支持的数据库模式。图中用长方形表示实体型在框内写上实体名如学生用,一表示则可写成,。亘亘。用菱形表示实体之间的联系在菱形框内写上联系名并用无向线把菱形分别与有关,。的实体相联系联系的类型可以是几。,。。,或二并把它写在连线旁作基本图解如下下面按各种情况分别。两个不同型实体之间的联系见图,,、、分别表示学生课程。专业系一个学生可以选修多门课程一门课可由,多个学生选修一个系有多个学生一个学生只在一,。个系学习”探求图示加洲杀。两个以上不同型实体集之间的联系。表示零件表示工程项目,表示部件供应者,每一种部件由若干个供应者供应每一供应者供应多种部件部件和工程项目供应者和工程项目之间也是多对多,,、概念模式中仅涉及实体实体的性质和实体间的联系。所谓实体是指组织中各用户所、、关心的客观事物它可以是人物事件或者抽象的概念,。概念模式不涉及任何与机器有关。的方面。根据概念模式可定义多个外模式外模式描述外部视图表示与某一应用有关的数据,。的局部视图。。由概念模式映象一个内模式内模式描述内部视图表示数据如何按内视图组织,。概念模式对于外模式与内模式必须是独立的这样的结构可以提高程序与数据的独立其极端情况是对于同一数据可以使用根本不同的模用户的数据视图和存贮策略无关,,性。型所以概念模式是现实世界原型与具体数据模型的中介可以作为计算机数据处理人员,。与非计算机最终用户的接口、一四概念模式和方法报告中提出的概念模式充分体现了概念结构的思想规定了一个标,。准化的数据库系统总的体系结构的特征但是它只是提出了原则问题和研究方向对于概,。。念模式究竟应当包含哪些内容尚缺乏一个共同的协议许多学者在此基础上做了很多工作。体系和某些系统相比较例如工体系结构的一个具体例子,。工认为他的数据独中用户级信息逻辑级与数据,也有的学者把立存取模型是一卫。逻辑级分别对应报告中的外模式概念模式和内模式,于年。一提出了实体联系方法简称卫卜方法他认为用方法定义的组织模式。址司和报告中的概念模式实质上是相同的概念。一方法概念简单清晰容易理解是实现概念结构思想的有力工具,,一方法用巩图定义一个组织模式组织模式是现实世界的纯粹表示与数据模型,,。和存贮结构相独立然后将组织模式转换为各种,所支持的数据库模式。图中用长方形表示实体型在框内写上实体名如学生用,一表示则可写成,。亘亘。用菱形表示实体之间的联系在菱形框内写上联系名并用无向线把菱形分别与有关,。的实体相联系联系的类型可以是几。,。。,或二并把它写在连线旁作基本图解如下下面按各种情况分别。两个不同型实体之间的联系见图,,、、分别表示学生课程。专业系一个学生可以选修多门课程一门课可由,多个学生选修一个系有多个学生一个学生只在一,。个系学习”探求图示加洲杀。两个以上不同型实体集之间的联系。表示零件表示工程项目,表示部件供应者,每一种部件由若干个供应者供应每一供应者供应多种部件部件和工程项目供应者和工程项目之间也是多对多,,外式撰摸式棍怂外撰式式外式撰蛇浮拱式外谈式撼忍万求掇怂百求梦嘿摇公‘求祥马,术视日困闷匆矛乃概念结构的设计。描述概念模式的有力工具是卫卜图我们首先设计用,卜图表示的组织模式图。这一阶段的设计可按下列步骤进行数据分析概念结构是整个组织中各个用户共同关心的信息结构,只有用整个系。统的观点来考虑和分析问题收集和分析数据才能设计出一个有效的数据库,这就要对整。‘”调查的重点是傲据和‘处理”,个组织进行多方面的调查的处理过程即系统中数据的情况以及它们?。了解组织机构情况为分析信息流程作准备,?了解各部门的业务活动情况输入和使用什么数据如何加工处理这些数据输出什,,,。么信息到什么部门在此基础上进一步弄清系统在处理某一种业务时的详细工作步骤和方。。分析的结果可形成一些图表如用户活动图实体生命周期图气,式?。确定哪些活动由计算机完成哪些活动准备将来由计算机完成哪些,,确定系统边界。。活动由人工完成由计算机完成的活动就是系统应该实现的功能?。分析信息流程绘制系统数据流程图,数据流程图是系统中数据处理过程的总的图?。解可以用自顶向下逐步求精的办法形成,,任何一个系统都可以抽象为根据前面的调查把一个处理功能的具体内容分为若干子功能然后再把每一个子功能,,。。继续细分在处理功能逐步分解时它们所使用的数据也逐级分解,分解的详细程度应能。。把系统的工作过程表达清楚上面的数据流程图是以后设计的基本依据、通过调查获得每个用户对数据库的使用要求包括,,信息要求处理要求和安全性完,。整性的要求括由信息要求导出数据要求对于数据要求还要进行更详尽的收集和分析包,,。每个数据项的名称别名类型长度取值范围数据量大小等基本特征,,,,,特别要注,。意各个用户对数据的定义是否有矛盾或二义性及早调解,?。。数据项之间的联系确定联系的类型是一对一一对多还是多对多,根据语义确定份有关这些图表的使用方法可参阅有关信息系统分析和设计的文献、手、。数据项应满足的完整性约束条件?。。数据的来源弄清是否有冗余的来源不同的来源是否有矛后,?。数据的处置确定对每个数据项允许哪些用户执行哪些操作根据收集到的数据编制数据字典,。。操作的频紧程度。数据分析阶段中一个重要而困难的任务是收集在将来的应用中所涉及的数据若设汁、、人员仅仅按当前的应用来设计数据库的话那末以后再想加入新的实体新的数据项实体,。。间新的联系就十分困难因此应充分考虑到可能的扩充和改变使设计易于更动,。数据库应用系统和广泛的用户有密切的联系数据库设计必须强调用户的参与,因此,设计人员应该和用户取得共同语言,帮助不熟悉计算机的用户建立数据库环境下的共同概。念对设计工作的最后结果共同承担责任,。设计初步图把收集到的数据项进行分类和组织划分实体和属性,由于实体和属性之间在形式上没有可截然划分的界限通常是现实世界对它们已有大体上的自然,。划分我们先按这种自然划分定义。一图然后进行必要的调整,能够作为属性的尽量作,。一为属性以简化,图一图的办法是图即用户视图的设计再进行视图的,,设计艰先设计各部门的分。一一集成,即将各分图综合成总的图这一步要尽可能充分地把组织中各部门对信。息的需求集中到组织模式上不必考虑冗余,由关于学生选修课程的应用得到学生例如涂拄由关于教员教学的应用得到获员娜移书一综合这两个分图可得到裸移名教斑。设计基本毛图在初步一图中可能存在冗余的数据和实体间冗余的联系。所谓冗余的数据是指可由基本数据导出的数据冗余的联系则指可由基本联系导出的别的。。联系冗余信息的存在会破坏数据库的完整性给数据管理增加很多困难应加以消除,,我。一一们把消除了冗余的初步图称为基本图消除冗余的办法一是利用数据分析阶段所得到的数据流程图和数据字典找出基本数据。。和非基本数据二是利用规范化理论中数据依赖的概念消除冗余的联系这方面的探讨工。作在此不拟详述有兴趣的读者请参阅【〕,最后把基本一图反馈回去征求用户意见这样反复几次最终形成基本,,,,召图所。表示的组织模式逻辑模型的设计上面得到的组织模式是独立于任何一种数据模型的概念结构逻辑模型设计的任务是。把组织模式转换为与选用的所支持的数据模型相一致的过程现行的一般、只支持关系网状或层次三种模型中的某一种而其中的某一种数据模型各个机器系统又,,。有许多不同的限制提供不同的环境和工具因而我们把转换过程分二步执行,念结构向一般的数据模型转换然后向特定的,支持下的数据模型转换鲤猛鹦猛鹦。首先把概由于一般数据模型仍是独立于机器的因此转换过程可以遵循普遍的一组规则用工程,图,。。办法完成限于篇幅这些规则就不一一给出读者可参阅〔〕,,第二步转换必须根据具体的的功能和限制它是依赖于机器的,不能给出普遍,。、这一步还应根据用户对各种处理要求的响应时间处理方式和处理频度等要求考,的规则。虑如何提高效率调整数据模型确定记录格式,,规范化理论的作用数据库逻辑设计阶段得到的数据模式是否合适是否会出现更新异常等问题以往传统,,。的办法是凭借经验来逐步调整使之趋于完善缺乏严格的理论依据,,自从关系数据模型出现以后由于这种模型是建立在数学理论的基础之上因此可以就,,关系模型对上述问题进行形式化的研究定义明确的概念寻找判别模式好坏的标准找出,,,。用好的模式取代坏的模式的方法十多年来这方面的研究取得了重大成果发展了关系的,,。规范化理论并把这一理论用于指导数据库设计,规范化理论在数据库逻辑设计中的应用,。主要体现在以下几方面第一,在数据分析阶段用关系数据理论中数据依赖的概念分析和表示数据之间的联,。系数据应满足的语义条件,。第二用规范化理论为工具分析和消除组织模式中冗余的或矛盾的联系,,。第三用规范化理论中范式的概念分析各关系模式,,根据模式中存在的数据依赖确,。定它们都属于第几范式预测模式可能出现的更新异常或存贮冗余,同时考虑数据分析阶宁段所获褥的用户需求判断这些模式是否符合要求确定是否继续分解,,,。第四用模式分解算法自动产生各种模式并对它们进行评价选取较好的模式,,,由于关系数据模型可以映象为其他数据模型,因此可首先把组织模式转换成关系数据。在此过程中可充分运用规范化理论的成果指导设计,然后把关系模型映象为所需,模型。要的数据模型。规范化理论给了我们判断关系模式的优劣标难成为设,提供了模式分解的算法工具。计人员的有力工具和正确指南‘数据库物理设计数据库的物理设计是对逻辑设计阶段所得到的数据模型选取一个最适合应用要求的物。理结构的过程所谓数据库的物理结构主要指数据库在物理设备上的存贮结构和存取方,。由于它完全依赖于给定的机器系统因而设计人员必须深入了解下列情况,法?。、全面了解系统所提供的各种存贮结构存取方法以及它给定的的详细功能。们物理的实现方式和优缺点?。应用环境弄清各种不同的应用按照重要程度使用方式和处理频率对它们进行分,,。类?。外存设备的特性掌握设备的系统对块因子大小的规定和分块原则等,特性。等。由于各种系统差异甚大没有统一的物理设计方法,物理设计的内容主要包括只能给出一般的设计原则和内容,。,根据数据库中数据的使用情况从确定数据的存贮结构提供的各种存贮结。构中选取适合应用环境的加以实现确定存贮结构的主要因素是存取数据的时间存贮空,。、设计者常常要对这些因素加以权衡折衷并,间利用率和对存贮结构的维护代价三个方面。寻找优化方法尽量使这三者的性能均优,?。存取路径的选择和调整数据库必须支持多个用户的多种应用因此应提供对数据,。库的多个存取入口,即对同一数据存贮提供多条存取路径物理设计就要确定建立哪些存。。取路径例如把哪些数据项作为次码建立次索引建立多少次索引,,对于涉及不同数据文。件的查询是否建立链结构这类存取路径等,确定数据的存放位置对数据按不同的存取情况划分为若干组把经常存取和存取速,,度要求高的数据存放在高速存贮器内把存取频度低或存取速度要求低的数据存于低速存,。贮器对同一数据文件按不同的存取要求也可进行垂直划分把一个记录型分为多个或水。平划分把记录值划分为若干组,区别情况分别存放在适当的存贮区域中,?。确定存贮分配的参数例如溢出区的大小和分布块的尺寸块因子大小装填因子,,,。的数值缓冲区的大小和个数等等,这些参数的大小将影响存取时间和存贮分配的策略设,。计人员要全面考虑、、物理设计过程中需要对时间存贮空间维护代价和用户需求进行综合平衡其结果常,,。常会产生多种方案在实施数据库前对各种方案进行细致的评价进行性能预测以决定某,。一较优的方案是十分必要的如果能得到满意的一个物理结构就转向物理实施建立数据,。。否则就要调整物理结构如果仍然无效则应返回逻辑设计阶段修改逻辑模型直到满,库。足设计目标为止、六数据库设计实践中的问题、。以上我们概述了数据库设计的理论方法和过程这些理论与方法的研究对于实践的作用究竟如何呢虽然在这一领域中发展了概念结构的思想研究了关系数据理论作为数,据库设计的理论基础和指南但是这些在大学和实验室中进行的研究对于现有的大型数据,。库却很少发生影响在美国等计算机应用发达的国家这种理论和实践相脱节不能用新成果取代旧方法的,,。。状况十分普遍以程序设计语言的发展过程为例五十年代后期开始有了虹,,等语言这些语言被广泛地使用于科学计算数据处理等方面,,,积累了许多软件系统。和应用程序包经过二十余年间的一系列研究设计以后在,韶年代出现了许多如,。等优秀的语言虽然这些语言在计算机科学工作者中广泛流传但在一般应用程序员,。中其普及的程度却远远不及传统的高级语言,由于使用传统语言所积累的程序系统已形。成了财富因此目前很难由新的先进的语言代替那些旧语言,,面也是如此许多大型数据库已建立并运行多时但难以废弃仍然沿用旧的,,,在数据库方系统和。传统的设计方法。从这一角度来说我国的情况有所不同由于我们在数据处理方面的工作开展较晚数,,据库应用系统的研制只是近两年间的事因此我们应该而且可以在新的条件下考虑我们的,。。研究和设计工作事实上近来所接触到的一些文献已看到这种方向我们应该在数据库,,研究的各个领域包括数据库应用系统的设计中对新的理论方法和工具进行探讨学习国,,,外的经验总结我们自己的工作,,使我们的研究和研制工作能在当前国际较先进水平上迸。行从而设计出更好的数据库系统,参考文献?了习翔桩阳场叭卜,〕倪几,,—???七,工了泣〕比北卫毛,?巨年第,二二人阳,〕恻〕萨师煊数据库的理论与实践,柯田幻五计算机科学,卫期七,,,。。二人山成,址喊,,,。。期转第」吴鸥琦王珊关于,,习小型微型计算机系统召图数据模型转换的一点注记年第,,页一人落之之云犷少无。无么溯夕几加刀,毛七一,班七朗旬七,七七七。了二韶七皿,。铂七七一七七七。。七昭二铂且旬,七七了七七盯七七七七一七七七。七二班沮七七七朗勿‘‘卜石卜石卜,上接第‘日石卜石卜免石卜石卜全,石卜‘卜闷卜石卜石卜闷卜‘卜石卜石卜石卜‘之石卜石卜石卜石卜‘卜石卜石卜‘卜,页日‘咬全到气,石卜石卜,,,人人’,‘卯‘口公沙邵翻云艺夕、压的毗加血能协七士,?喊毛七七哪七七,七时七,七七协一七七诫喊’吕七七协辽的勿阳,劫??
文章来源:《信息系统工程》 网址: http://www.xxxtgc.cn/qikandaodu/2021/0218/1079.html
上一篇:学术论文书写格式简介
下一篇:基于系统工程的某大科学装置动力系统研制项目