Министерство культуры Российской Федерации
Восточно-Сибирская государственная академия культуры и искусств
Факультет менеджмента информационных технологий
Кафедра автоматизированных информационных систем
УДК 002.53:681.3.016
ОРГАНИЗАЦИЯ ДОСТУПА К БАЗАМ ДАННЫХ
ВСГАКиИ В ИНТЕРНЕТ
Дипломная работа
Исполнитель: Фомин Евгений Игоревич студент заочного отделения группы 453
Научный руководитель: Баторов А.Р.,к.т.н., доцент.
__________________________________________
И.о.зав.кафедрой: Батуева Э.Б., к.п.н., доцент.
Дата допуска к защите: _____ 06.2001
Улан-Удэ
2001
Оглавление Введение. 3
1. Internet – технология работы с базами данных 5
1.1 Реализация доступа к базе данных. 6 1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы 7 1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД 7 1.1.3. Создание информационного хранилища на основе высокопроизводительной СУБД с языком запросов SQL. Периодическая загрузка данных в хранилище из основных СУБД 8 1.2. Обзор технологий 9 1.2.1. WWW - сервер NCSA HTTPD 9 1.2.2 WWW - сервер Apache c поддержкой Java Servlet 9 1.2.3. SQL - сервер фирмы Oracle 11 1.2.4. Язык программирования Perl 11 1.2.5. Язык программирования Java 12 1.2.6 Java servlets. 12 1.2.7. Пакет Web - Oracle - Web 15 1.2.8. Пакет Cold Fusion фирмы Allaire Corp 15 1.3. Оценка трудоемкости обеспечения WWW доступа 15
2. Практическая часть 17
2.1 ОБЩАЯ ЧАСТЬ 18 2.1.1. Назначение WWW - сервера. Общая схема работы. Определение 18 2.1.2 Непосредственные функции сервера. Базовые определения 20 2.1.3 Протокол MIME 21 2.1.4 Протокол HTTP 22 2.1.5 Интерфейс CGI 23 2.2. Web-сервера Apache 23 2.2.1 Установка WEB-сервера Apache 25 2.2.2 Настройка WEB-сервера Apache 26 2.4. Использование языка Perl 33 2.5 Использование языка Java 34 2.5.1 Основные особенности 34 2.5.2. Взаимодействие с СУБД 38 2.6. Реализация доступа к базе данных 39 2.6.1. Общее описание 39 2.6.2. Описание алгоритма 39
Заключение 49
Литература 50
Приложение 1 Спецификация формата RUSMARC 51
Приложение 2 Спецификация языка Java 90
Приложение 3 Листинг программы – SearchEngein.java 103
Приложение 4 Результаты тестирования программы 111
Введение.
Многие организации используют электронные базы данных (БД) для поддержки своих рабочих процессов. Часто это системы на одного - двух пользователей, выполненные с использованием dbf - ориентированных средств разработки: Clipper, Dbase, FoxPro, Paradox, Access. Обычно используется ряд таких баз, независимых друг от друга. Если информация, хранимая в таких БД, представляет интерес не только для непосредственных пользователей, то для ее дальнейшего распространения используются бумажные отчеты и справки, созданные базой данных.
С появлением локальных сетей, подключением таких сетей к Интернет, созданием внутрикорпоративных, сетей, появляется возможность с любого рабочего места организации получить доступ к информационному ресурсу сети. Однако, при попытке использовать существующие БД возникают проблемы связанные с требованием к однородности рабочих мест (для запуска "родных" интерфейсов), сильнейшим трафиком в сети (доступ идет напрямую к файлам БД), загрузкой файлового сервера и невозможностью удаленной работы (например, командированных сотрудников). Решением проблемы могло бы стать использование унифицированного интерфейса WWW для доступа к ресурсам организации.
Технология World Wide Web, в переводе "Всемирная паутина", получила столь широкое распространение из-за простоты своих пользовательских интерфейсов. Принцип "жми на то, что интересно", лежащий в основе гипертекста, интуитивно понятен. В технологиях WWW все ключевые понятия просматриваемого документа: слова, картинки - имеют возможность "раскрыться" новым документом, развивающим это понятие. Такой способ представления информации называется "гипертекстом", а документы, представленные в таком виде - "гипертекстовыми документами". Для описания этих документов используется специальный язык - язык описания гипертекстовых документов или HTML (англ. вариант HyperText Markup Language).
Из этих предпосылок возникает задача преобразования накопленных данных в гипертекстовые документы WWW, задача поддержки актуальности преобразованной структуры. Другими словами, задача предоставления WWW - доступа к существующим базам данных.
Цель данной дипломной работы, создать интерфейс к файлам БД Библиотеки 5.0 которые имеют формат RUSMARC (см. прил. 1), так же можно обратиться за информацией по этому формату на сайт РОССИЙСКОЙ БИБЛИОТЕЧНОЙ АССОЦИАЦИИ (12,11) .
Для реализации поставленной задачи был выбран язык программирования JavaTM
Дипломная работа состоит из 2-х глав и 4 приложений.
В первой главе Internet – технология работы с базами данных, рассматриваются имеющиеся на данный момент времени технологии по организации доступа к базам данных пользователей Интренет.
Во второй главе Практическая часть поэтапно описывается технология организации доступа к базе данных в формате RUSMARC в частности:
. настройка WEB-сервера Apache;
. настройка Java Server для WEB-сервера Apache;
. выбор инструментария для реализации программы:
. описание алгоритма.
Первое приложение содержит полное описание спецификации формата RUSMARC с детальным описанием всех полей и подполей и возможных их значении.
Во втором приложении приведены ключевые моменты спецификации языка программирования Java.
Третье приложение содержит листинг программы с включенными в него комментариями.
В четвертом приложении приведены результаты проведенного теста на реальных массивах данных.
1. Internet – технология работы с базами данных
1.1 Реализация доступа к базе данных.
Использование технологий WWW для обеспечения доступа к каким-либо информационным ресурсам подразумевает существование следующих компонент.
1. IP - сети с поддержкой базового набора услуг по передаче данных с единой политикой нумерации и маршрутизации, работающим сервисом имен DNS.
2. Выделенного информационного сервера - WWW-сервера, обеспечивающего предоставление гипертекстовых документов через IP - сеть в ответ на запросы WWW – клиентов (см. рис. 1).
[pic]
Передаваемые гипертекстовые документы оформляются в стандарте HTML - языке описания гипертекстовых документов. Эти документы могут либо храниться в статическом виде (совокупность файлов на диске), либо динамически компоноваться в зависимости от параметров запроса специальным программным обеспечением. Для динамической компоновки HTML-документов, WWW- сервер использует специальным образом оформленные программы- CGI- или Java- программы.
В состав специфики конкретной БД входят как технологические основы, такие как тип СУБД, вид интерфейсов, связи между таблицами, ограничения целостности, так и организационные решения, связанные с поддержкой актуальности баз данных и обеспечением доступа к ней (3).
При обеспечении WWW-доступа к существующим БД, возможен ряд путей - комплексов технологических и организационных решений. Практика использования WWW-технологии для доступа к существующим БД предоставляет широкий спектр технологических решений, по-разному связанных между собой - перекрывающих, взаимодействующих и т.д. Выбор конкретных решений при обеспечении доступа зависит от специфики конкретной СУБД и от ряда других факторов, как то: наличие специалистов, способных с минимальными издержками освоить определенную ветвь технологических решений, существование других БД, WWW-доступ к которым должен осуществляться с минимальными дополнительными затратами и т.д.
WWW - доступ к существующим базам данных может осуществляться по одному из трех основных сценариев. Ниже дается их краткое описание и основные характеристики.
1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы
В этом варианте содержимое БД просматривает специальная программа, создающая множество файлов - связных HTML-документов (см.рис.2). Полученные файлы могут быть перенесены на один или несколько WWW-серверов. Доступ к ним будет осуществляться как к статическим гипертекстовым документам сервера.
Этот вариант характеризуется минимальными начальными расходами. Он эффективен на небольших массивах данных простой структуры и редким обновлением, а также при пониженных требованиях к актуальности данных, предоставляемых через WWW. Кроме этого, очевидно полное отсутствие механизма поиска, хотя возможно развитое индексирование.
В качестве преобразователя может выступать программный комплекс, автоматически или полуавтоматически генерирующий статические документы. Программа-преобразователь может являться самостоятельно разработанной программой либо быть интегрированным средством класса генераторов отчетов.
1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД
В этом варианте доступ к БД осуществляется специальной CGI- программой, запускаемой WWW-сервером в ответ на запрос WWW - клиента. Эта программа, обрабатывая запрос, просматривает содержимое БД и создает выходной HTML-документ, возвращаемый клиенту. (см. рис. 3)
Это решение эффективно для больших баз данных со сложной структурой и при необходимости поддержки операций поиска. Показаниями также являются частое обновление и невозможность синхронизации преобразования БД в статические документы с обновлением содержимого. В этом варианте, возможно, осуществлять изменение БД из WWW-интерфейсов.
К недостаткам этого метода можно отнести большое время обработки запросов, необходимость постоянного доступа к основной базе данных, дополнительную загрузку средств поддержки БД, связанную с обработкой запросов от WWW - сервера.
Для реализации такой технологии необходимо использовать взаимодействие WWW-сервера с запускаемыми программами CGI - Common Gateway Interface. Выбор программных средств достаточно широк - языки программирования, интегрированные средства типа генераторов отчетов. Для СУБД с внутренними языками программирования существуют варианты использования этого языка для генерации документов.
1.1.3. Создание информационного хранилища на основе высокопроизводительной СУБД с языком запросов SQL. Периодическая загрузка данных в хранилище из основных СУБД
В этом варианте предлагается использование технологии, получившей название "информационного хранилища" (ИХ). Для обработки разнообразных запросов, в том числе и от WWW-сервера, используется промежуточная БД высокой производительности. Информационное наполнение промежуточной БД осуществляется специализированным программным обеспечением на основе содержимого основных баз данных.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16