Рефераты. Наращивание экономической и статистической информации в двухструктурных реляционных базах данных

Указанная классификация ИС в известной мере устарела, так как современные фактографические системы часто работают с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабженными структурированными описателями. При известных факторах фактографическая система может превратиться в документальную (и наоборот).[1,11].

Для систем обработки экономической и статистической информации больше подходят фактографические ИС, которые используются буквально во всех сферах человеческой деятельности.

2. Понятие базы данных.

Существует хорошо известное, но трудно реализуемое на практике понятие базы данных как большого по объему хранили-ща, в которое организация помещает все необходимые ей данные и из которого различные пользователи могут эти данные получать. Устройства памяти, в которых хранятся все данные, могут быть расположены в одном или нескольких местах; в последнем слу-чае они должны быть связаны средствами передачи данных. К дан-ным должны иметь доступ программы.

Действительно, большинство существующих на сегодняшний день баз данных предназначено для ограниченного ряда приложений. Часто на одном компьютере создается несколько баз данных. Со временем базы данных, предназначенные для реализа-ции отдельных родственных функций, можно будет объединить, если такое объединение будет способствовать увеличению эффективности и интенсивности использования всей системы.

Базу данных можно определить как совокупность взаимосвя-занных хранящихся вместе данных при наличии такой минималь-ной избыточности, которая допускает их использование оптималь-ным образом для одного или нескольких приложений; данные за-поминаются так, чтобы они были независимы от программ, использующих эти данные; для добавления новых или модифика-ции существующих данных, а также для поиска данных в базе данных применяется общий управляемый способ. [1,12].

Говорят, что система содержит совокупность баз данных, если эти базы дан-ных структурно полностью самостоятельны. В системах с простой организацией данных для каждого при-ложения создается своя совокупность записей. Назначение базы данных заключается в том, чтобы одну и ту же совокупность дан-ных можно было использовать для максимально возможного числа приложений. Исходя из этого, базу данных часто разрабатывают в качестве хранилища такой информации, необходимость в котором возникает в процессе выполнения определенных функ-ций на заводе, правительственном учреждении или какой-либо другой организации. Такая база данных должна обеспечивать возможность не только получения информации, но также постоян-ной ее модификации, необходимой для процессов управления в данной организации, может оказаться, что для получения информации для целей планирования или ответов на вопросы потребу-ется осуществлять поиск в базе данных. Совокупностью данных могут пользоваться несколько ведомств независимо от того, име-ются ли при этом между ними ведомственные барьеры.[12].

База данных может разрабатываться для пакетной обработки данных, обработки в реальном времени или оперативной обработ-ки (в этом случае обработка каждого запроса завершается к определенному моменту времени, но при этом на время обра-ботки не накладывается жестких ограничений, существующих в системах реального времени). Во многих базах данных преду-смотрена совокупность этих методов обработки, а во многих си-стемах с базами данных обслуживание терминалов в реальном времени происходит одновременно с пакетной обработкой данных.[2].

Большая часть дисковых или ленточных библиотек, которые существовали до использования средств управления базами дан-ных, содержали большое количество повторяющейся информации. При запоминании многих элементов данных допускалась избы-точность, так как на носители информации для различных целей записывались одни и те же данные и, кроме того, хранились различные варианты модификаций одних и тех же данных. База данных предоставляет возможность в значительной степени изба-виться от такой избыточности. Базу данных иногда определяют как неизбыточную совокупность элементов данных. Однако в действительности для уменьшения времени доступа к данным или упрощения способов адресации во многих базах данных избыточ-ность в незначительной степени присутствует. Некоторые записи повторяются для того, чтобы обеспечить возможность восстанов-ления данных при их случайной потере. Чтобы база данных была неизбыточной и удовлетворяла другим требованиям, приходится идти на компромисс. В этом случае говорят об управляемой, или минимальной, избыточности или о том, что хорошо разрабо-танная база данных свободна от излишней избыточности.

Неуправляемая избыточность имеет несколько недостатков. Во-первых, хранение нескольких копий данных приводит к допол-нительным затратам. Во-вторых, при обновлении, по крайней мере, нескольких избыточных копий необходимо выполнять многократные операции обновления. Из-быточность поэтому обходится значительно дороже в тех случаях, когда при обработке файлов обновляется большое количество ин-формации или, что еще хуже, часто вводятся новые элементы или уничтожаются старые. В-третьих, вследствие того, что различные копии данных могут соответствовать различным стадиям обнов-ления, информация, выдаваемая системой, может быть противо-речивой.[12].

Если не использовать базы данных, то при обработке большого количества информации появится так много избыточных данных, что фактически станет невозможным сохранять их все на одном и том же уровне обновления. Очень часто пользователи обнаружи-вают явные противоречия в данных и поэтому испытывают недо-верие к полученной от компьютера информации. Невозможность хране-ния избыточных данных на одинаковом уровне обновления явля-ется основным препятствием в обработке данных с помощью компьютера.

Одной из наиболее важных характеристик большинства баз данных является их постоянное изменение и расширение. По мере добавления новых типов данных или при появлении новых прило-жений должна быть обеспечена возможность быстрого изменения структуры базы данных. Реорганизация базы данных должна осу-ществляться по возможности без перезаписи прикладных про-грамм и в целом вызывать минимальное количество преобразова-ний. Простота изменения базы данных может оказать большое влияние на развитие приложений баз данных в управлении про-изводством.[10].

О независимости данных часто говорят как об одном из основ-ных свойств базы данных. Под этим подразумевается независи-мость данных и использующих их прикладных программ друг от друга в том смысле, что изменение одних не приводит к измене-нию других. В частности, прикладной программист изолирован от влияния изменений данных и их организации, а также от изме-нения характеристик физических устройств, на которых они хра-нятся. В действительности же полностью независимыми данные бывают так же редко, как и полностью неизбыточными. Как мы увидим ниже, независимость данных определяется с различных точек зрения. Сведения, которыми должен располагать програм-мист для доступа к данным, различны для различных баз данных. Тем не менее, независимость данных--это одна из основных причин использования систем управления базами данных.

В том случае, когда один набор элементов данных использу-ется для многих приложений, между элементами этого набора устанавливается множество различных взаимосвязей, необходи-мых для соответствующих прикладных программ. Организация базы данных в значительной степени зависит от реализации взаи-мосвязей между элементами данных и записями, а также от того, как и где эти данные хранятся. В базе данных, используемой мно-гими приложениями, должны быть установлены многочисленные промежуточные взаимосвязи между элементами. В этом случае при хранении и использовании данных контролировать их пра-вильность, обеспечивать их защиту и секретность труднее, чем при хранении данных в простых, несвязанных файлах. Что касается обеспечения секретности данных и восстановления их после сбоев, то этот вопрос является очень важным при конструировании баз данных.[8].

В некоторых системах средства управления базами данных применяются для того, чтобы пользователи могли использовать данные таким путем, который не был предусмотрен разработчи-ками системы. Администраторы или сотрудники могут обращаться к вы-числительной системе с вопросами, которые заранее в ней не пре-дусматривались. Наличие этой возможности означает такую орга-низацию данных в системе, при которой доступ к ним можно осу-ществлять по различным путям, причем одни и те же данные могут использоваться для ответов на различные вопросы. Вся существенная информация об объектах запоминается одновременно и полностью, а не только та ее часть, которая необходима для одного приложения. [10].

В настоящее время существуют СУБД, реализующие эти возможности как на уровне локальных баз данных, расположенных на одном диске (Paradox, Dbase), так и промышленных баз данных (Acsess, Oracle, FoxPro).

3. Эволюция концепций баз данных

Понятие база данных появилось в конце 60-х годов. До этого в сфере обработки данных говорили о файлах данных и о наборах данных.

До появления компьютеров третьего поколения (первые из них были установлены в 1965 г.) программное обеспечение обработки данных осуществляло в основном операции ввода-вывода. 0б организации данных приходилось заботиться при напи-сании прикладных программ, и делалось это элементарным спо-собом, т. е. данные обычно организовывались в виде простых последовательных файлов на магнитной ленте. Независимость данных отсутствовала. Если организация данных или запоминаю-щие устройства изменялись, прикладной программист должен был соответствующим образом модифицировать программы, заново их компилировать и затем отлаживать. Для того чтобы обновить файл, нужно было записать новый. Старый файл сохранялся и назывался исходным. Предыдущий вариант также сохранялся, а нередко сохранялись и более ранние версии файла. Многие файлы использовались для одного приложения. Для других приложений часто использовали те же самые данные, но обычно в другой форме, с другими полями, и поэтому приходилось из одних и тех же данных создавать различные файлы. Вследствие этого уровень избыточности в системе был очень высок и существовали различные файлы, содержащие одни и те же элементы дан-ных.

Иногда использовались файлы с произвольным досту-пом к данным, которые позволяли пользователю получить непосредственный доступ к любой записи в файле вместо того, чтобы последовательно просматривать весь файл. Средства адресации записей обеспечивались прикладным программистом при написа-нии программы. Если изменялись запоминающие устройства, в прикладную программу необходимо было вносить большие изме-нения. На практике изменение запоминающих устройств неизбеж-но. Новая технология привела к значительному уменьшению за-трат на хранение одного бита информации, а размеры файлов сегодня часто превышают по объему использовавшиеся ранее за-поминающие устройства.[7].

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.