关系数据库和信息系统的概念外文翻译资料

 2022-07-31 18:01:03

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


关系数据库和信息系统的概念

E.F.Codd在一个领域内开发了他的关系数据库概念,试图创建一个通用机与数据检索和推理。本文认为,Codd的成就标志着这一努力的结束,并追踪了关系数据库系统的遗产,因为它与信息系统的概念有关。

我们很少把技术论文视为伟大的文学作品,我们倾向于把它们看作是对受限制的知识体系的一种贡献。他们只通过创造和维持知识体系的团体来发挥社会影响力。技术及其应用软件的创新,影响着公众的财富、健康以及组成结构。然而,偶尔会有一篇技术论文超越其团体,影响社会行为。其中一个例子就是Wilhelm Cauer在电子过滤器设计上的开创性工作。他的论文介绍了黑盒设计的概念,这一概念在通用工程和商业实践中迅速普及。

计算机科学的一个重要例子是E.F.(Ted)Codd的数据库基础论文“大型共享数据库数据的关系模型”。Codd的1970年文章中的想法塑造了商业人士设计数据库的方式,并将注意力集中在他们可以从计算机系统存储和检索的信息的性质上。它的故事表明,成功的技术不仅可以扩展人类活动,而且还可以通过将精力集中在简单、有效和完整的思想上,从而限制了他们的注意力。(读者可以在本期“Annals”杂志上从Bradford Wade和Donald Chamberlin的文章中了解Codd的背景和职业生涯)

Codd贡献的三个故事

在历史的叙述中,历史学家认为Codd的论文开创了一个新行业,在一个创造性的过程中,或者结束了关于知识和信息的讨论。作为一个新行业的开始,它在故事的开头就出现了,这个故事的重点是建立了数据库设计的主导技术的想法的兴起。在这个故事的版本中,Codd的论文从根本上改变了我们对数据库的态度。它创造了一个新的知识领域,并创造了一个大而实用的产业。在十年内,这篇论文在学术文献中被引用了至少500次,并为后来作为关系数据库系统的几十种产品提供了模型。

如果我们把这个故事看得很明显,我们可以很容易地得出结论,Codd的想法是组织数据的自然方式。目前大多数教科书都接受这一观点。“我们理所当然的认为这是关系数据库给我们带来的好处”,一个具有代表性的大学教科书这样写道。它支持自己的主张,即关系型技术为组织提供了在低成本计算机上轻松存储、访问和更改数据的能力。没有其他数据库技术可以为这么多应用程序提供这样的好处。

在这个数据库故事的第二个版本中,Codd的论文在叙述中出现了。在Codd的论文之前,主要的计算机供应商正在试验各种各样的数据库概念。其中一些与Codd的想法有关,但大多数都与硬件架构的元素直接相关。在他的1970年的论文发表后不久,大多数这些公司都试图看看他们的产品是如何适应Codd的框架的。一些人试图声称他们的产品优于任何严格遵循关系模型的产品。许多人试图证明他们的软件是Codd的模型。

在最好的情况下,这个发明的故事表明了在构思新产品,并将其推广到市场的难度。它也为我们显示了成功的产品不仅需要强大的技术观念,还需要一大堆其他的因素,比如资本、配套技术、实质的应用、市场愿景,以及能够将这些因素组合到一起的认识。

与许多发明故事不同,Codd在关系数据库上的工作通常是不受争议的。Codd的论文至少有一个先例,他从不否认但很少称赞。Codd发表的论文有一个前提,兰德公司(Rand Corporation)的一份报告中描述发达许多关系数据库的思想。因为在1970年之前,Codd几乎没有数据库研究的背景,他是一个试图破坏他作为关系数据库的创始人的人的诱人目标。然而,没有严肃的学者质疑Codd对该领域的贡献。如果有的话,RAND的报告说明了数据库研究的技术背景。它写于1960年代初,当随机存取存储系统是相对罕见和软件产业尚未形成之时。因此,即使他们提供了对关系数据库的完整描述,他们也缺乏促进这些数据库所需的技术和工业支持。

然而,兰德报告提出了Codd的论文的第三种方法,即将其放在叙述结尾的论文。当“大型数据库的共享模型”出现在故事的结尾时,我们将讨论关系数据开发的环境。从某种程度上讲,这个故事讲述了从磁带和穿孔卡片到磁盘和其他存储设备的随机存取存储器的转变。

除了与特定的硬件形式的联系之外,这最后的故事也让Codd的工作在一个在计算机历史的最初25年里缓慢发展的想法中。这个想法,通常被称为“信息系统”,已经被一些最早的计算机研究人员所阐明。在他们的文章和谈话中,计算机科学家在20世纪50年代初提出,计算机将很快存储大量信息,并能够快速检索这些信息。它将能够通过自然语言识别和符号逻辑的结合,找到特定问题的答案。

Codd的论文的直接先驱,兰德的报告,表明关系数据库完全地进入了信息系统的研究链。该文档开发了一个用于数据存储的模型,用于进行数据推理和回答问题。然而,Codd的论文并没有推进信息系统的讨论,而是缩小了这一领域的范围。它没有被看作是一个复杂系统的重要组成部分,而是将研究人员的注意力集中在设计有效和高效的通用数据库的狭窄问题上。就像计算机科学中的许多基本论文一样,“大型共享数据库的关系模型”限制了我们的设想,同时引入了一种新的、强大的组织计算方式。

信息系统的梦想

信息系统的概念,有时被称为信息检索系统,可以追溯到产生电子计算机的一些相同的力量。这个术语并不是始终如一地使用;它通常描述的是一个提供问题答案的系统。有时,这个术语指的是用英语回答问题的机器。在其他时候,它指的是能够从事实数据库中推理的机器。通常,它描述了一个可以根据关键字搜索检索文档的机器。

美国开始扩大军事生产在1940年代早期,许多商人开始认识到,他们不能过程所需的信息经营他们的业务。“我们认为能更快吗?”商业记者wbull;hbull;柯南特问。“植物的加速和邮件形式的旅行”,他写道“误以为我们在玻璃桌上加速了我们自己的想法和行为,在更短的时间内完成更多。”最强大的处理器的信息时代,IBM的打卡机器,“现在用一种闪烁的方式与过去的单调乏味的方式进行对比”,他写道。“但是我们可以更快地消化和分析它”。

第一个电脑,20世纪40年代末期的机器如ENIAC,EDSAC,IAS电脑,都能处理大量的信息,但他们确定为进行数值计算的工具,而不是信息检索。与“高速通用计算机的发展”,“ENIAC的设计者所解释的那样,数学物理和工程的进展将大大加速。这些想法得到了纽约时报的响应,纽约时报将ENIAC描述为“一种开始在新基础上重建科学事务的工具”。

这些计算速度的报告令人印象深刻,但他们提供的信息几乎与普通个人的活动无关,一般人的计算并不比所得税表格所要求的要高。此外,设计师们强调了新机器的军事重要性,他们将通用商业实践描述为国家安全的一种工具。当一位ENIAC的设计师讨论他的机器的能力时,他可以从数据列表中搜索并整理这些数据集,并立即描述了一个军事工程的例子。“重组从一个系统以另一个经常需要计算工作”,他解释说,在把这个话题转到一个弹道射击表的比较值之前,他解释了这个问题。

一些工程师认为,这些机器能够在搜索和排序数据方面找到重要的应用程序。提出机械检索重要性的少数几个人之一就是战时科学研究与发展办公室主任Vannevar Bush。Bush描述了搜索和存储机器如何在科学知识的组织中找到一个重要的应用。Bush在流行杂志大西洋月刊上对他的观点进行了描述“重复的思维过程并不局限于算术和统计学”,并且描述了一台使用微胶片存储和检索数据的机器的愿景。他承认,并没有这么多的工作,但他说,这样的机器可能满足“企业的需要”。

布什给他的机器命名了“Memex”,用于搜索和排序数据。他只提供了一份关于该设备如何工作的简要概述。他对记忆的机制不太感兴趣,而不是对知识的潜在影响。他首先谈到这样一台机器对科学家的价值,认为足够的“技术图书馆”是研究人员不可或缺的工具。在他看来,这样的机器可以连接思想并且扩展我们对物理和社会世界的理解。“全新形式的百科全书将出现,”他说。然后,他转向了在更普遍的商业、社会和治理领域的潜在应用。律师将会“接触到有关他整个经历和朋友的经验的相关意见和决定”。医生将获得关于诊断的信息,学者们将能够检索任何他们可能需要的文件。“因此科学”,他说,“可能实现人类生产、存储方式,并参照比赛的形式记录”。Memex的提议得到了热情和谨慎的不同对待。那个时期的图书馆员倾向于忽略机器本身,而把注意力集中在布什的论点的前提上,即知识需要更好地组织和传播。在这一点上,只有少数图书馆利用信息加工机械,如打卡穿孔机,因此几乎没有人能够预见麦克斯存储器或任何其他机器如何融入一个图书馆。“美国科学家协调员的战争努力,“一个谨慎的图书管理员解释说,“认为一个信息检索系统是完全可行的。”然而,他不愿意去猜测这样一个系统是如何证明其价值的。

只有几位科学界的成员试图让布什参与到关于他的Memex 讨论中,而其中大部分都是持怀疑态度的。布什在麻省理工学院的同事,数学家Norbert Wiener,声称布什的承诺比他能得到的要多。Memex可以组织现有的知识,但它不能像布什所说的那样,能提供新的想法。“这些机器可能有自己的使命,”他在他的《控制论》中这样解释,“但它们是有限制的,不可能在不熟悉标题的情况下对书进行分类,除非某些特定的人已经认识到了这本书的重要性”。

信息系统的机械方法

布什用微胶片技术描述了这一工具,这是他在战争前研究的一种工具,当时他在一个国家研究委员会的委员会任职,该委员会正在考虑不同的教育技术。使用这种技术,布什“也许建成了第一个沿着这些线路的原型机”工程师卡尔文Mooers(1919 - 1994)这样解释道。但是,他对任何处于商业或政府组织的设备感兴趣,此后不久,战乱开始,所以这个项目就被放弃了。

Mooers在战争期间曾是一名初级工程师,他成为了信息检索系统的领导者。他曾在华盛顿的海军军械实验室工作过,并且在明尼苏达大学学习数学和物理课程。1946年夏天,他以一个学生的身份参加了摩尔学院的一个讲座,这个讲座长达两个月,由ENIAC的设计者们组织的。后来他回到华盛顿,在John Atanasoff的海军实验室当一名设计师研究计算机项目,在此之前,他的研究方向是图书馆和图书馆目录。

不仅仅是为了适应计算机信息检索的问题,Mooers创建了一个专门的打卡系统,他叫Zatocoding。其他公司使用的是简单的机械或类似的电子技术系统,这些机器都没有广泛使用,但他们却被称为“信息检索系统”或“信息系统”。

1955年秋,信息系统的概念出现在William Marchant的百老汇戏剧中,并被公众所知晓。这个剧本讲述的是一个信息检索系统如何在商业组织中使用的。Marchant显然已经对计算机和信息系统有了足够的了解,在戏剧中描述它们可能会为一家公司提供的服务,但是他并没有去描述它们的工作方式或者面临的问题。Marchant在这个戏剧所展现的主题,是他正在探索社会对自动化的恐惧,以及在大萧条时期对美国的失业的思考。他认为,信息系统不会让人们失业,相反,它会“减少你研究的时间,做一些机械式的例行工作”。

信息检索理论的启动

在Marchant的戏剧中,信息检索系统是失败的。事实上,这些系统远远超过了当时的技术能力。在俄亥俄州巴特尔纪念研究所的一个研究小组意识到计算机技术还不成熟,不足以支持“特定相关信息的自动化处理”。他们认为,信息检索的问题需要一个复杂的解决方案,不仅要考虑计算机器,还要考虑数据的结构。这些工程师写道:“需要把信息检索系统的设计当作一个工程问题来对待,就像溶剂回收系统的设计一样。”在他们努力将信息检索系统设计成一个工程问题的过程中,Battelle团队试图建立一种基于布尔代数和阶级微积分的信息检索理论。他们会把每条信息都分配给一个事实,一篇论文,或者一本书,给它们一组有固定定义的类。通过查看这些类的组合,他们觉得可以在检索存储系统中有任何想法,并能够达到对信息的分析。

除了Battelle团队外,哲学家Yehoshua Bar-Hillel开发信息检索的基础,他开始研究信息检索系统的理论。Bar-Hillel的作品, Calvin Mooers写道:“是具有重大意义的,因为它可能是由一位逻辑学家写的处于批判中的信息检索工作。”Bar-Hillel研究了集合的基本逻辑以及信息描述与信息本身之间的联系。他最终得出结论,信息系统设计师比以往任何时候都更有前途。“似乎几乎是普遍的协议,”他写道,“传统的存储和搜索信息的方法在现在还不够有效,在将来会变得越来越少”。

Bar-Hillel认为,信息检索需要基于逻辑和复杂信息集合之间的关系,尽管他承认主要的存储技术,磁带和打印卡片不太适合这些想法。他指出,一些新的计算机工程师正试图开发基于当前硬件的其他信息检索理论,但发现这些方法“非常模糊,没有说服力”。他认为,任何建立信息检索新型理论的付出,都可能会遇到不幸以及部分不可意料的副作用,唯有通过严格审视现有的方法,努力消除一些过时的、不符合现状的方法,才能改善现有的信息检索。

作为业务活动的信息检索

20世纪50年代末,Bar-Hille开始发展他的信息检索理论,企业开始意识到,商业组织实际上就是信息处理的形式。管理学家Herbert Simon写道:“信息和咨询通过组织流行各个方向。”随着组织变得越来越复杂,他们需要越来越复杂的信息形式,然而,这些组织的领导者需要仔细的改进信息的形式。年轻的管理顾问彼得·德鲁克(Peter Drucker)写道:“商业行政人员生活在一个人造的环境中,几乎像在修道院一样孤立。”“问题必须规定了他处理事情的方式,剥夺了与他业务无关的一切。”

Drucher是第一批掌握计算机的力量及其改造组织能力的作家之一。Drucker作为经济学家在奥地利受训,作为记者来到美国,但他的职业生涯是分析师和顾问。他的想法强烈影响了20世纪60年代到70年代管理者的思维。在对美国商业环境的调查中,Drucker认识到,企业越来越依赖于信息的处理。他在1957年写道:“企业需要维持目的与方法、产出与付出之间的平衡。”要做到这点,管理者们需要对大量的信息

全文共10026字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[142685],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。