Рефераты. Автоматизированные информационно – поисковые системы

Содержание: 31 миллион WWW-страниц (на май 1997 г.) и полный текст более чем 14,000 newsgroups обновленный в реальном масштабе времени.

Поиск: Предлагает простой(simple (S)) поиск или (much more advanced (MMS)),т.е. более передовой, способ. S - поиск стоит в основном использовать для общих вопросов, MMS - поиск использует специфический поисковый синтаксис. Для облегчения выполнения процедуры имеется подсказка(Simple Search Help). MMS - поиск, используя булинь(boolean), т.е. с помощью ключевых союзов, используя (and, or, not - (и, или, не)) и простую смежность (near - (около)) позволяет употреблять несколько слов, чередование слов, словосочетание в качестве ключевых для проведения поиска.

TS - поиск: Введением ключа типа: " Ваша Фраза " как первое направление поиска, который будет ограничивать число найденных WWW - документов с заголовками типа " Ваша Фраза ".

Результаты: Предлагает три выбора результатов (но два дают тот же самый результат):

1) "Стандартные"("Standard") - результаты, полученные машиной в виде списка параграфов, резюмируемые ей, с наличием URL - адреса, размером файла и последней датой модернизации. Результаты возвращаются как десять пунктов на экране,

2) "Компактный"("Compact") помещают каждый пункт в одной строке с последней датой модернизации картотеки,

3) "Детальный"("Detailed"), который является таким же самым, как и "Стандартный".

Адрес: http://altavista.digital.com

Частота модернизации: Постоянно WWW-роботом.

Excite

Для анализа информации Excite использует поисковую технологию Intelligent Concept Extraction, что позволяет делать запросы по образцу. Это самая популярная поисковая система в Америке. Для каждой найденной страницы она оценивает степень соответствия запросу.

Базы данных: WWW-страницы по всему миру, новости, карты, "yellow pages" ("желтые страницы"), свободно распространяемое программное обеспечение, основные цитаты, программы телевидения, погоду, E - mail адреса, рейсы авиалиний.

Содержание: 50 миллионов WWW-страниц и больше чем двухнедельный запас Usenet новостей.

Поиск: Предлагает только S - поиск, который поддерживает некоторые опции MMS - поиска.

TS - поиск: используйте плюс (+) чтобы определить, что все документы имеют данное слово, или используют минус (-) что бы уточнить, что ни один из документов не имеет данного слова. Возможно так же поддержка вoolean-операторами.

Вы можете использовать "AND", "OR" and "AND NOT"(И, ИЛИ и. И НЕ) операторы и круглые скобки для группировки. Например: (digital or virtual or electronic) AND library.

(цифровой или виртуальный или электронный) И библиотека.

Результаты: Результаты показаны с названием документа, разряд уместности в процентах, URL - адрес, резюме программного обеспечением документа, и опция, чтобы восстановить "More Like This"(" Скорее Этот "), которая позволяет использовать документ как ваш вопрос.

Адрес: http://www.excite.com/

Частота Модернизации: Постоянно - WWW-роботом.

Hot Bot

Для поиска в Интернете использует многопроцессорную параллельную обработку 10. млн. страниц ежедневно. Полезная сторона Hot Bot ограничение на тип страниц по средствам выбора кнопок.

База данных: Расположенные по всему миру WWW-страницы.

Содержание: 54 миллиона WWW-страниц (на сентябрь 1996 г.).

Поиск: Предлагает S - поиск и Эксперт(Expert (Е))- поиск, поддерживает boolean-операторы (И и ИЛИ), поиск фразы, и выбор " человек "или" URL ". Е-поиск также поддерживает задание даты, местоположение (страна и т.д.)

TS - поиск: использует заключение фразы в двойные кавычки (например, " слова фразы ").

Результаты: Результаты показаны с названием документа, разряд уместности в проценте, URL, размер документа.

Адрес: http://www.hotbot.com/

Частота модернизации: Постоянно WWW-роботом ("Slurp").

Infoseek

Infoseek самая популярная поисковая машина в компьютерной индустрии. В мае 1996 она была признана как самая достоверно предоставляющая информацию машина. Привлекательность машины в том, что после отсеивания информации можно проверить найденную информацию ещё раз.

Базы данных: расположенные по всему миру WWW-страницы, новости, запасает цитаты, карты, желтые страницы("yellow pages"), e mail адреса, и т.д.

Содержание: Главный база данных: 50 миллионов URL-адресов. (на сентябрь 1996 г.)

Поиск: предлагает только простой S - поиск, но ключевые слова поиска могут быть ограничены специфическими полями (типа в пределах заголовков документа), поиск с использованием возможностей либо с исключением определённого слова (данному слову предшествует минус"-") или с включением требуемого слова (данному слову предшествует " + "). Для дополнительной информации относительно выбора поиска, используется. Infoseek-Помощь(Infoseek Help).

Результаты: Включает название документа, размер картотеки, URL, краткое резюме, извлеченное из документа, и разряд уместности в процентах.

Адрес: http://www.infoseek.com/

Частота Модернизации: Постоянно WWW-роботом.

Дополнительная информация: в случае большого количества информации см. http://info.infoseek.com/.

Lycos

Lycos - одна из первых поисковых машин. Машина удобна для работы с поиском и для одновременного просмотра сайтов. При выводе информации показывает краткий обзор, и найденные адреса.

Базы данных: расположенные по всему миру WWW-страницы, звуки, картины, "top 5% sites"

Содержание: 70 миллионов URL-адресов (на март 1997г.).

Поиск: предлагает S - поиск и клиентурный(Custom (С)) поиск. С-поиск поддерживает boolean-операторы AND и OR (И и ИЛИ), также как некоторые другие назначения.

Результаты: результаты внесены в упорядоченный список; информация включает адрес документа (URL), название, размер файла, и выдержки из файла.

Адрес: http://www.lycos.com/

Частота модернизации: постоянно WWW-роботом.

ПРОБЛЕМЫ И ВОЗМОЖНОСТИ ПОИСКОВЫХ СИСТЕМ.

Работа многих поисковых машин считается вполне успешной. Однако все современные поисковые системы страдают некоторыми серьёзными недостатками:

1. поиск по ключевым словам даёт слишком много ссылок и многие из них бесполезны.

2. огромное количество поисковых машин с разными пользовательскими интерфейсами порождает проблему когнитивной перегрузки.

3. методы индексирования баз данных, как правило, не связаны с информационным содержанием.

4. часто выдаются ссылки на информацию, которой в Интернете уже давно нет.

5. машины ещё не столь совершены, чтобы понимать естественный язык

в последнее время потребности в интеллектуальной помощи быстро растут. Это привело к появлению интеллектуальных агентов.

Обычно интеллектуальные агенты являются основной частью поисковой машины для поиска используется искусственный интеллект. Пользователь учит агента, а затем он выходит в Интернет для поиска.

Интеллектуальные агенты выполняют инструкции от имени пользователя, имеют некоторую самостоятельность. После поиска они оповещают пользователя о результатах. Агенты учатся в результате своей деятельности.

Интеллектуальность - обучение на основе обратной связи по примерам ошибкам и по средствам взаимодействия с другими агентами.

Простота использования - можно тренировать агента используя естественный язык.

Индивидуальный подход - адаптация к предпочтениям пользователей.

Интегрированность - непрерывное обучение применение уже имеющих знаний к новым ситуациям.

Автономность - ощущение окружающей среды, и анализ выводов.

ЗАКЛЮЧЕНИЕ.

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

1. простота в использовании

2. чётко организованный и обновляемый индекс.

3. быстрый поиск в базе данных и быстрое реагирование.

4. надёжность и точность результатов поиска.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные виды деятельности и наиболее буро развивающиеся отраслью индустрии информационных технологий.

Список литературы.

1. Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989.

2. . А. В. Гаврилов "Локальные сети ЭВМ", Москва, Изд-во "Мир", 1990.

3. Н.А. Гайдамакин «Автоматизированные информационные системы, базы и банки данных», М.: «Гелиос», 2002.

Страницы: 1, 2, 3, 4



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.