Рефераты. Автоматизированные информационно – поисковые системы

         Базы данных: Расположенные по всему миру WWW-страницы и Usenet News (новости).

         Содержание: 31 миллион WWW-страниц (на май 1997 г.) и полный текст более чем 14,000 newsgroups обновленный в реальном масштабе времени.

         Поиск: Предлагает простой(simple (S)) поиск или (much more advanced (MMS)),т.е. более передовой, способ. S - поиск стоит в основном использовать для общих вопросов, MMS - поиск использует специфический поисковый синтаксис. Для облегчения выполнения процедуры имеется подсказка(Simple Search Help). MMS - поиск, используя булинь(boolean), т.е. с помощью ключевых союзов, используя (and, or, not - (и, или, не)) и простую смежность (near - (около)) позволяет употреблять несколько слов, чередование слов, словосочетание в качестве ключевых для проведения поиска.

TS - поиск: Введением ключа типа: " Ваша Фраза " как первое направление поиска, который будет ограничивать число найденных WWW - документов с заголовками типа " Ваша Фраза ".

Результаты: Предлагает три выбора результатов (но два дают тот же самый результат):

          1) "Стандартные"("Standard") - результаты, полученные машиной в виде списка параграфов, резюмируемые ей, с наличием URL - адреса, размером файла и последней датой модернизации. Результаты возвращаются как десять пунктов на экране,

          2) "Компактный"("Compact") помещают каждый пункт в одной строке с последней датой модернизации картотеки,

         3) "Детальный"("Detailed"), который является таким же самым, как и "Стандартный".

         Адрес: #"1.files/image003.gif">

Excite

Для анализа информации Excite использует поисковую технологию Intelligent Concept Extraction, что позволяет делать запросы по образцу. Это самая популярная поисковая система в Америке. Для каждой найденной страницы она оценивает степень соответствия запросу.

         Базы данных: WWW-страницы по всему миру, новости, карты, "yellow pages" ("желтые страницы"), свободно распространяемое программное обеспечение, основные цитаты, программы телевидения, погоду, E - mail адреса, рейсы авиалиний.

         Содержание: 50 миллионов WWW-страниц и больше чем двухнедельный запас Usenet новостей.

         Поиск: Предлагает только S - поиск, который поддерживает некоторые опции MMS - поиска.

         TS - поиск: используйте плюс (+) чтобы определить, что все документы имеют данное слово, или используют минус (-) что бы уточнить, что ни один из документов не имеет данного слова. Возможно так же  поддержка вoolean-операторами.

Вы можете использовать "AND", "OR" and "AND NOT"(И, ИЛИ и. И НЕ) операторы и круглые скобки для группировки. Например: (digital or virtual or electronic) AND library.

(цифровой или виртуальный или электронный) И библиотека.

Результаты: Результаты показаны с названием документа, разряд уместности в процентах, URL - адрес, резюме программного обеспечением документа, и опция, чтобы восстановить "More Like This"(" Скорее Этот "), которая  позволяет  использовать документ как ваш вопрос.

         Адрес: #"1.files/image004.gif">

Hot Bot

Для поиска в Интернете использует многопроцессорную параллельную обработку 10. млн. страниц ежедневно. Полезная сторона Hot Bot ограничение на тип страниц по средствам выбора кнопок.

База данных: Расположенные по всему миру WWW-страницы.

         Содержание: 54 миллиона WWW-страниц (на сентябрь 1996 г.).

         Поиск: Предлагает S - поиск и Эксперт(Expert (Е))- поиск, поддерживает boolean-операторы (И и ИЛИ), поиск фразы, и выбор " человек "или" URL ". Е-поиск также поддерживает  задание даты, местоположение (страна и т.д.)

         TS - поиск: использует заключение фразы в двойные кавычки (например, " слова фразы ").

         Результаты: Результаты показаны с названием документа, разряд уместности в проценте, URL, размер документа.

         Адрес: #"1.files/image005.gif">

Infoseek

Infoseek самая популярная поисковая машина в компьютерной индустрии. В мае 1996 она была признана как самая достоверно предоставляющая информацию машина. Привлекательность машины в том, что после отсеивания информации можно проверить найденную информацию ещё раз.

         Базы данных: расположенные по всему миру WWW-страницы, новости, запасает цитаты, карты, желтые страницы("yellow pages"), e mail адреса, и т.д.

         Содержание: Главный база данных: 50 миллионов URL-адресов. (на сентябрь 1996 г.)

         Поиск: предлагает только простой S - поиск, но ключевые слова поиска могут быть ограничены специфическими полями (типа в пределах заголовков документа), поиск с использованием возможностей либо с исключением определённого слова (данному слову предшествует минус"-") или с включением требуемого слова (данному слову предшествует " + "). Для дополнительной информации относительно выбора поиска, используется. Infoseek-Помощь(Infoseek Help).

         Результаты: Включает название документа, размер картотеки, URL, краткое резюме, извлеченное из документа, и разряд уместности в процентах.

         Адрес: #"1.files/image007.gif">

Lycos

Lycos – одна из первых поисковых машин. Машина удобна для работы с поиском и для одновременного просмотра сайтов. При выводе информации показывает краткий обзор, и найденные адреса.

         Базы данных: расположенные по всему миру WWW-страницы, звуки, картины, "top 5% sites"

         Содержание: 70 миллионов URL-адресов (на март 1997г.).

         Поиск: предлагает S - поиск и клиентурный(Custom (С)) поиск.          С-поиск поддерживает boolean-операторы AND и OR (И и ИЛИ), также как некоторые другие назначения.

         Результаты: результаты внесены в упорядоченный список; информация включает адрес документа (URL), название, размер файла, и выдержки  из файла.

         Адрес: http://www.lycos.com/

         Частота модернизации: постоянно WWW-роботом.




 

 

 

 

ПРОБЛЕМЫ И ВОЗМОЖНОСТИ ПОИСКОВЫХ СИСТЕМ.

Работа многих поисковых машин считается вполне успешной. Однако все современные поисковые системы страдают некоторыми серьёзными недостатками:

1.                 поиск по ключевым словам даёт слишком много ссылок и многие из них бесполезны.

2.                  огромное количество поисковых машин с разными пользовательскими интерфейсами порождает проблему когнитивной перегрузки.

3.                  методы индексирования баз данных, как правило, не связаны с информационным содержанием.

4.                 часто выдаются ссылки на информацию, которой в Интернете уже давно нет.

5.                  машины ещё не столь совершены, чтобы понимать естественный язык

в последнее время потребности в интеллектуальной помощи быстро растут. Это привело к появлению интеллектуальных агентов.

         Обычно интеллектуальные агенты являются основной частью поисковой машины для поиска используется искусственный интеллект. Пользователь учит агента, а затем он выходит в Интернет для поиска.

Интеллектуальные агенты выполняют инструкции от имени пользователя, имеют некоторую самостоятельность. После поиска они оповещают пользователя о результатах. Агенты учатся в результате своей деятельности.

         Интеллектуальность – обучение на основе обратной связи по примерам ошибкам и по средствам взаимодействия с другими агентами.

         Простота использования – можно тренировать агента используя естественный язык.

Индивидуальный подход – адаптация к предпочтениям пользователей.

         Интегрированность – непрерывное обучение применение уже имеющих знаний к новым ситуациям.

         Автономность – ощущение окружающей среды, и анализ выводов.

 

ЗАКЛЮЧЕНИЕ.

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

1.           простота в использовании

2.           чётко организованный и обновляемый индекс.

3.           быстрый поиск в базе данных и быстрое реагирование.

4.           надёжность и точность результатов поиска.

Масштабы информационных ресурсов и  их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты – новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet  продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные виды деятельности и наиболее буро развивающиеся отраслью индустрии информационных технологий.






 

 

 

Список литературы.

1.                      Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989.

2.                      . А. В. Гаврилов "Локальные сети ЭВМ", Москва, Изд-во "Мир", 1990.

3.                      Н.А. Гайдамакин «Автоматизированные информационные системы, базы и банки данных», М.: «Гелиос», 2002.



 


Страницы: 1, 2, 3, 4



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.