Рефераты. Организация доступа к базам данных в Интернет

Организация доступа к базам данных в Интернет

Министерство культуры Российской Федерации

Восточно-Сибирская государственная академия культуры и искусств

Факультет менеджмента информационных технологий

Кафедра автоматизированных информационных систем

УДК 002.53:681.3.016

ОРГАНИЗАЦИЯ ДОСТУПА К БАЗАМ ДАННЫХ

ВСГАКиИ В ИНТЕРНЕТ

Дипломная работа

Исполнитель: Фомин Евгений Игоревич студент заочного отделения группы 453

Научный руководитель: Баторов А.Р.,к.т.н., доцент.

__________________________________________

И.о.зав.кафедрой: Батуева Э.Б., к.п.н., доцент.

__________________________________________

Дата допуска к защите: _____ 06.2001

Улан-Удэ

2001

Оглавление
Введение. 3

1. Internet – технология работы с базами данных 5

1.1 Реализация доступа к базе данных. 6
1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы 7
1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД 7
1.1.3. Создание информационного хранилища на основе высокопроизводительной
СУБД с языком запросов SQL. Периодическая загрузка данных в хранилище из основных СУБД 8
1.2. Обзор технологий 9
1.2.1. WWW - сервер NCSA HTTPD 9
1.2.2 WWW - сервер Apache c поддержкой Java Servlet 9
1.2.3. SQL - сервер фирмы Oracle 11
1.2.4. Язык программирования Perl 11
1.2.5. Язык программирования Java 12
1.2.6 Java servlets. 12
1.2.7. Пакет Web - Oracle - Web 15
1.2.8. Пакет Cold Fusion фирмы Allaire Corp 15
1.3. Оценка трудоемкости обеспечения WWW доступа 15

2. Практическая часть 17

2.1 ОБЩАЯ ЧАСТЬ 18
2.1.1. Назначение WWW - сервера. Общая схема работы. Определение 18
2.1.2 Непосредственные функции сервера. Базовые определения 20
2.1.3 Протокол MIME 21
2.1.4 Протокол HTTP 22
2.1.5 Интерфейс CGI 23
2.2. Web-сервера Apache 23
2.2.1 Установка WEB-сервера Apache 25
2.2.2 Настройка WEB-сервера Apache 26
2.4. Использование языка Perl 33
2.5 Использование языка Java 34
2.5.1 Основные особенности 34
2.5.2. Взаимодействие с СУБД 38
2.6. Реализация доступа к базе данных 39
2.6.1. Общее описание 39
2.6.2. Описание алгоритма 39

Заключение 49

Литература 50

Приложение 1 Спецификация формата RUSMARC 51

Приложение 2 Спецификация языка Java 90

Приложение 3 Листинг программы – SearchEngein.java 103

Приложение 4 Результаты тестирования программы 111

Введение.

Многие организации используют электронные базы данных (БД) для поддержки своих рабочих процессов. Часто это системы на одного - двух пользователей, выполненные с использованием dbf - ориентированных средств разработки: Clipper, Dbase, FoxPro, Paradox, Access. Обычно используется ряд таких баз, независимых друг от друга. Если информация, хранимая в таких
БД, представляет интерес не только для непосредственных пользователей, то для ее дальнейшего распространения используются бумажные отчеты и справки, созданные базой данных.

С появлением локальных сетей, подключением таких сетей к Интернет, созданием внутрикорпоративных, сетей, появляется возможность с любого рабочего места организации получить доступ к информационному ресурсу сети.
Однако, при попытке использовать существующие БД возникают проблемы связанные с требованием к однородности рабочих мест (для запуска "родных" интерфейсов), сильнейшим трафиком в сети (доступ идет напрямую к файлам
БД), загрузкой файлового сервера и невозможностью удаленной работы
(например, командированных сотрудников). Решением проблемы могло бы стать использование унифицированного интерфейса WWW для доступа к ресурсам организации.

Технология World Wide Web, в переводе "Всемирная паутина", получила столь широкое распространение из-за простоты своих пользовательских интерфейсов. Принцип "жми на то, что интересно", лежащий в основе гипертекста, интуитивно понятен. В технологиях WWW все ключевые понятия просматриваемого документа: слова, картинки - имеют возможность
"раскрыться" новым документом, развивающим это понятие. Такой способ представления информации называется "гипертекстом", а документы, представленные в таком виде - "гипертекстовыми документами". Для описания этих документов используется специальный язык - язык описания гипертекстовых документов или HTML (англ. вариант HyperText Markup
Language).

Из этих предпосылок возникает задача преобразования накопленных данных в гипертекстовые документы WWW, задача поддержки актуальности преобразованной структуры. Другими словами, задача предоставления WWW - доступа к существующим базам данных.

Цель данной дипломной работы, создать интерфейс к файлам БД
Библиотеки 5.0 которые имеют формат RUSMARC (см. прил. 1), так же можно обратиться за информацией по этому формату на сайт РОССИЙСКОЙ БИБЛИОТЕЧНОЙ
АССОЦИАЦИИ (12,11) .

Для реализации поставленной задачи был выбран язык программирования
JavaTM

Дипломная работа состоит из 2-х глав и 4 приложений.

В первой главе Internet – технология работы с базами данных, рассматриваются имеющиеся на данный момент времени технологии по организации доступа к базам данных пользователей Интренет.

Во второй главе Практическая часть поэтапно описывается технология организации доступа к базе данных в формате RUSMARC в частности:

. настройка WEB-сервера Apache;

. настройка Java Server для WEB-сервера Apache;

. выбор инструментария для реализации программы:

. описание алгоритма.

Первое приложение содержит полное описание спецификации формата
RUSMARC с детальным описанием всех полей и подполей и возможных их значении.

Во втором приложении приведены ключевые моменты спецификации языка программирования Java.

Третье приложение содержит листинг программы с включенными в него комментариями.

В четвертом приложении приведены результаты проведенного теста на реальных массивах данных.

1. Internet – технология работы с базами данных

1.1 Реализация доступа к базе данных.

Использование технологий WWW для обеспечения доступа к каким-либо информационным ресурсам подразумевает существование следующих компонент.

1. IP - сети с поддержкой базового набора услуг по передаче данных с единой политикой нумерации и маршрутизации, работающим сервисом имен DNS.

2. Выделенного информационного сервера - WWW-сервера, обеспечивающего предоставление гипертекстовых документов через IP - сеть в ответ на запросы WWW – клиентов (см. рис. 1).

[pic]

Передаваемые гипертекстовые документы оформляются в стандарте HTML - языке описания гипертекстовых документов. Эти документы могут либо храниться в статическом виде (совокупность файлов на диске), либо динамически компоноваться в зависимости от параметров запроса специальным программным обеспечением. Для динамической компоновки HTML-документов, WWW- сервер использует специальным образом оформленные программы- CGI- или Java- программы.

В состав специфики конкретной БД входят как технологические основы, такие как тип СУБД, вид интерфейсов, связи между таблицами, ограничения целостности, так и организационные решения, связанные с поддержкой актуальности баз данных и обеспечением доступа к ней (3).

При обеспечении WWW-доступа к существующим БД, возможен ряд путей - комплексов технологических и организационных решений. Практика использования WWW-технологии для доступа к существующим БД предоставляет широкий спектр технологических решений, по-разному связанных между собой - перекрывающих, взаимодействующих и т.д. Выбор конкретных решений при обеспечении доступа зависит от специфики конкретной СУБД и от ряда других факторов, как то: наличие специалистов, способных с минимальными издержками освоить определенную ветвь технологических решений, существование других
БД, WWW-доступ к которым должен осуществляться с минимальными дополнительными затратами и т.д.

WWW - доступ к существующим базам данных может осуществляться по одному из трех основных сценариев. Ниже дается их краткое описание и основные характеристики.

1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы

В этом варианте содержимое БД просматривает специальная программа, создающая множество файлов - связных HTML-документов (см.рис.2). Полученные файлы могут быть перенесены на один или несколько WWW-серверов. Доступ к ним будет осуществляться как к статическим гипертекстовым документам сервера.

[pic]

Этот вариант характеризуется минимальными начальными расходами. Он эффективен на небольших массивах данных простой структуры и редким обновлением, а также при пониженных требованиях к актуальности данных, предоставляемых через WWW. Кроме этого, очевидно полное отсутствие механизма поиска, хотя возможно развитое индексирование.

В качестве преобразователя может выступать программный комплекс, автоматически или полуавтоматически генерирующий статические документы.
Программа-преобразователь может являться самостоятельно разработанной программой либо быть интегрированным средством класса генераторов отчетов.

1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД

В этом варианте доступ к БД осуществляется специальной CGI- программой, запускаемой WWW-сервером в ответ на запрос WWW - клиента. Эта программа, обрабатывая запрос, просматривает содержимое БД и создает выходной HTML-документ, возвращаемый клиенту. (см. рис. 3)

[pic]

Это решение эффективно для больших баз данных со сложной структурой и при необходимости поддержки операций поиска. Показаниями также являются частое обновление и невозможность синхронизации преобразования БД в статические документы с обновлением содержимого. В этом варианте, возможно, осуществлять изменение БД из WWW-интерфейсов.

К недостаткам этого метода можно отнести большое время обработки запросов, необходимость постоянного доступа к основной базе данных, дополнительную загрузку средств поддержки БД, связанную с обработкой запросов от WWW - сервера.

Для реализации такой технологии необходимо использовать взаимодействие WWW-сервера с запускаемыми программами CGI - Common Gateway
Interface. Выбор программных средств достаточно широк - языки программирования, интегрированные средства типа генераторов отчетов. Для
СУБД с внутренними языками программирования существуют варианты использования этого языка для генерации документов.

1.1.3. Создание информационного хранилища на основе высокопроизводительной СУБД с языком запросов SQL. Периодическая загрузка данных в хранилище из основных СУБД

В этом варианте предлагается использование технологии, получившей название "информационного хранилища" (ИХ). Для обработки разнообразных запросов, в том числе и от WWW-сервера, используется промежуточная БД высокой производительности. Информационное наполнение промежуточной БД осуществляется специализированным программным обеспечением на основе содержимого основных баз данных.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16