Банк Рефератов - Лекции по Основам ВТ - скачать рефераты, бесплатно рефераты

Рефераты. Лекции по Основам ВТ p> Кодда).

4 НФ.

Если в отношении R присутствуют многозначные зависимости, то схема отношения должна находится в 4 НФ. От 3 НФ отличается тем, что существует многозначная зависимость из X->->Y {0}, Y-подмножество X, но

X содержит какой-либо ключ отношения R.

5 НФ (Проекционно-соединительная).

Отношения находятся в этой форме тогда и только тогда, когда каждая зависимость соединения R подразумевается потенциальными ключами отношения R. Декомпозиция схем отношений на ряд подсхем. Нормализация выполняется декомпозицией схем отношений.

Если R={A1..An} P={R1..Rk}

Композиция R1 U R2 U..U Rk={A1..An}

МЕТОДЫ ФИЗИЧЕСКОЙ ОРГАНИЗАЦИИ ДАННЫХ.

Физичиские структуры данных показывают каким образом данные отражаются в среде хранения. При отражении данных с определенной логической структурой, с одной стороны должна сохранятся их симантика, а с другой должна обеспечиваться эффективность обработки данных. На физические структуры оказывает влияние АБД и запоминает устройства, так как размещение данных на разных носителях имеют свою специфику. По способу закрепления места в памяти различают позиционные и непозиционные структуры. В позиционных структурах место и роль элементов заранее однозначно определено, элемент имеет степень закрепления. Иногда структура БД становится гибкой, когда в ключ вводится логика, такие структуры становятся вычисляемыми или рандомизированными. В непозиционных структурах элементы жестко не закреплены, задается логический порядок следования данных, способ отображения связей между ними в памяти, а также порядок, согласно которому определяется следующий элемент. По способу отображения связей между элементами различают последовательно-смежные, списковые структуры.

В последовательных структурах элементы логически следуют друг за другом, располагаясь в смежных участках памяти. В списковых - связи между элементами данных передаются посредством адресных указателей. Для отражения связей между элементами данных используются символические указатели.

Символическая связь – повторение значения поля, по которому производится связывание. Обычно связывающий компонент – идентификатор данных. Связи между элементами данных отражаются с помощью битовых структур. В этом случае кроме файла, содержащего сведения об объектах создаются 1 или несколько битовых структур (битовых векторов или матриц), показывающих взаимоотношения элементов основного файла.

Совокупность индекса и индексного массива является индексной структурой.

В БД обычно используют довольно сложные многоуровневые логические структуры данных. Сокращение объема памяти в БД занимаются специализированные архиваторы, являющиеся утилитами БД. Проектирование физических и логических структур данных тесно связано между собой.

Последовательная организация хранения данных (ПОХД).

ПОХД обладает следующими преимуществами:

1.отсутствие дополнительной адресной информации и плотное размещение данных в запоминающей среде, приводящее к сокращению объема памяти.

2.возможность использования любых носителей информации.

3.сокращение времени обработки при условии, что порядок размещение на носителе совпадает с требованием в порядке обработки.

4.простота организации данных и манипулирование ими, так как идет увеличение объема памяти и уменьшение цены, то значимость 1 и 2 фактора снижается.

Последовательные структуры данных имеют недостатки:

1.неудобство корректировки.

2.необходимость разворачивания нелинейных логических структур в линейные.

3.трудности в обеспечении адекватного, интегрированного отображения предметной области.

4.длительность выборочного поиска.

5.адаптация новых элементов данных последовательную структуру должно выполняться согласно логическому порядку следующего элемента, что вызывает необходимость физического перемещения данных.

В последнее время в связи с широким распространением реляционной БД, использование последовательных данных в файлах увеличивается. Многие реляционные СУБД предусматривают организацию хранения каждого отношения данных в качестве видимого файла.

Списковая организация хранения данных.

Заключается в использование адресных указателей для связей элементов данных. Различают списковую организацию с совместным и раздельным хранением, с объектной, собственной, ассоциативной, адресной информацией, однонаправленные и двунаправленные списки. Такая классификация списковых структур традиционная. Взависимости от характера связывания элементов, списковая структура может связывать однотипные элементы данных в единую структуру – однородный список. На одном и том же множестве элементов может быть задано несколько связей, каждая из которых выделяет подмножество элементов, это списки – многосвязные. Если информация в списках одного типа, то информация называется гомогенной.

Если информация разнородна, то список называется гетерогенным.

СХЕМА.

Многосвязные списки широко распространены, так как отображение в БД предметной области требует много связей. C другими такие структуры просты в реализации, позволяющие сократить дублирование данных, уменьшить время обработки данных за счет выделения подмножеств для различных запросов и сокращении в следствии этого числа просматриваемых элементов. Кроме связывания однотипных используются в БД разнородные

(гетерогенные) структуры, соединяющие разнотипные элементы данных.

При создании БД возможны различные организации однородных и гетерогенных структур. В некоторых БД каждому из типов элементов может ставиться отдельная отдельная совокупность (файл). Такая структура – многофайловая структура.

Списковая организация обладает преимуществами:

1.возможность естественным путем передавать сложные логические взаимодействия между элементами, при корректировках списковых структур добавление и анулирование элементов в списках производится без физического перемещения элементов путем изменения адреса элементов, при этом память может быть повторно использована вновь добавляемым элементом. Новые элементы могут быть привязаны к любому месту памяти.

2.позволяют динамически наращивать состав БД без существенного изменения существующих ее частей.

3.устраняют дублирование данных (избыточность), позволяют на одном и том же множестве элементов обеспечивать их различную упорядоченность.

4.просто могут быть организованы в любой прямоадресной памяти.

НЕДОСТАТКИ:

1. Большой расход памяти на указатели.

2. Физический разброс данных по носителю, увеличивающий время обработки данных.

3. Потеря адреса связи в каком-либо элементе списка, делает недоступным всю оставшуюся часть структуры, а искажение адреса приводит к аварийным ситуациям.

4. Списковая структура нуждается в сложном управлении свободной памяти.

5. Эффект дробления памяти приводит к необходимости реорганизации массива.

СИМВОЛИЧЕСКИЕ УКАЗАТЕЛИ. (СУ)

В любой БД устанавливаются СУ, если они автоматически поддерживают

СУБД.

СУ имеют ряд преимуществ перед адресными:

1. Позволяют производить независимую реорганизацию связанных массивов.

2. Повышают семантическую самостоятельность каждой из связанных совокупностей.

3. Могут быть реализованы в памяти любого типа.

НЕДОСТАТКИ:

1. Расходуется больше времени на поиск и корректировку данных.

2. Требуется больше памяти, чем адресным указателям.

ИНДЕКСНАЯ СТРУКТУРА.

Понятие индекса используется по-разному.

Цель использования индекса – ускорение поиска. В сложных структурах данных индексы могут использоваться в других целях: для повышения устойчивости структуры, сокращения дублирования, для обеспечения быстрого доступа по разным путям к одним и тем же хранимым данным.

Различают структуры с плотной и разряженной индексацией.

При плотной, каждой записи этого файла соответствует элемент индекса.

При

разряженной элементы индекса соответствуют группе записи индексированного файла. При организации БД преимущество плотной индексации.

Характеристика индексных структур – способ организации индексного массива и связаные с ним особенности корректировки структуры.

При разряженной индексации –индексируемый массив должен быть частично упорядочен. Плотная не предъявляет требований к организации индексируемого массива. Распределение памяти для расширенного файла – важно. Выделение специальной области в памяти, их связывает записью, переплетая в цепочку, как следствие – замедляет процесс обработки данных в БД, требует ее периодической реорганизации, кроме индексации по ключивой записи плотная индексация по любому полю записи. Такая индексация – вторичная инвертированная. Она производится как по одному, так и по сов-ти полей. Рандомизированный способ доступа.

Быстрый непосретственный доступ по ключу к нужному экземпляру записи.

При загрузке БД и в процессе ее корректировки. Современные СУБД могут представлять пользователю несколько утилит, модулей рандомизации, либо отдает на выбор самому пользователю. Пользователь будет делать это с помощью входного языка среды ЯОД и ЯМД.

Рандомизированный способ хранения предназначен для хранения файловых структур.

Недостатки прямого доступа к памяти.

1.Записи в памяти различают не в порядке их логического, следовательно последняя обработка данных медленная.

2. Значительно замедляется время работы БД, при появлении большого числа синонимов в БД устранение этого эффекта – открытая адресация и метод цепочек .

При открытой адресации место для синонима ищется в той же области, в которой размещенны основные записи

Алгоритм поиска свободного места в БД.

Последующий просмотр памяти до свободного места.

При использование метода цепочек, синонимной записи могут располагаться в той же области, что и основные записи, а также располагаться в специальной области переполнений. Длинные цепочки синонимов увеличивают времена обработки данных. Для большинства современных алгоритм рандомизированное количество синонимов зависит от объема памяти, выделенной под файл целиком, поэтому при распределение памяти выделяется объем на 10 – 25 % больше чем требуется на хранение данных. Просмотр синонимов БД требует достаточно много времени, для обработки синонимов применяются специальные методы организации данных, обеспечивает быструю обработку в СУБД ORACLE при доступе записи переполнение происходит автоматическим переключением с прямого доступа на метод инвертированных списков. Недостаток прямого доступа к данным является то, что этот доступ обеспечивает быструю обработку по тому полю, по которому происходит рандомизация. Основной путь компенсации этого недостатка – использование комбинированных гибридных гетерогенных структур данных.

Проектирование структуры БД

Должно включать определенные ее состав и структуры

Проект внешнего информационного обеспечения, технический процесс пребанковской подготовки, по необходимости для создания БД, а также организованных методичных и инструктивных материалов.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13