Рефераты. Вычислительная техника и информатика (ответы на вопросы по кандидатскому экзамену)

При обсуждении на секции 3 семантических аспектов информационных ресурсов в докладе Л.А. Калиниченко и Н.А. Скворцова внимание уделено возможности использования проекта стандарта онтологической модели DAML+OIL, разрабатываемого W3C, в предметных посредниках на основе инверсируемого преобразования этой модели в каноническую модель посредника. Дискусионно, хотя и недостаточно мотивированно (нужны примеры, демонстрирующие полезность идеи) выглядели предложения об "образном тезаурусе", "образных" метаданных и индексировании "образных данных" в докладе И.М. Зацмана.

Краткий обзор вопросов создания электронных библиотек для организации науки на секции 4 рассматривался в докладах, представленных ОИЯИ, группой физических институтов РАН, Казанским Госуниверситетом. В докладе Е.Н. Филинова и А.В. Бойченко в очередной раз предпринята попытка рассмотрения стандартов представления ресурсов в электронных библиотеках одновременно и для науки, и для культуры и для образования. Представленный материал не поспевает за фактическим развитием представлений ресурсов в современных электронных библиотеках ввиду очевидного отрыва от мирового сообщества в этой области быстро развивающихся технологий.

На секции 5 (На пути к виртуальной обсерватории) Guenther Eichhorn представил доклад о крупной электронной библиотеке публикаций в области астрономии - The Astrophysics Data System (ADS). Это впечатляющая по масштабам коллекция. О.Б. Длужневская и О.Ю. Малков рассказывали о планах приобщения Российского научного астрономического сообщества к международному движению в направлении Виртуальной Астрономической Обсерватории (ВАО). Для этого развивается проект Российской Виртуальной Обсерватории как компонента для интеграции в Международную ВАО. Доклад В.В. Витковского и др. представил информацию о вкладе Специальной астрофизической обсерватории РАН в ВАО. Доклады по астрономическим коллекциям были представлены также на секциях 7 и 9. Доклады от России и Украины на 7 секции посвящены созданию баз данных на основе архивов фотографических пластинок, накопленных в Пулковской и Крымской обсерваториях. На 9 секции обсуждались вопросы применения различных технологий при создании астрономических коллекций объектные модели для пульсарных данных (доклад А.Е. Авраменко) и XML для различных данных наблюдений (доклад В.В. Витковского и др.). Первый доклад характеризовал использование технологии объектной интероперабельности на основе CORBA/DCOM, второй доклад посвящен использованию Web сервисов и их интероперабельности на основе технологий SOAP, WSDL, UDDI.

Важное место в структуре конференции занимает секция 6, посвященная Data Grid и перспективам использования этой архитектуры в электронных библиотеках. Приглашенный доклад И. Заславского из Суперкомпьютерного центра в Сан Диего содержал краткий обзор развиваемых в этом центре технологий - Storage Resource Broker (SRB), являющийся представителем Data Grid, и MIX - посредник, реализующий подход Global as View к интеграции неоднородных источников данных. Пока эти архитектуры рассматриваются отдельно, хотя в перспективе ожидается их интеграция. Доклад В.В. Коренькова объяснил структуру большого проекта Европейского Союза по Data Grid и участие России в этом проекте. Эти два доклада позволяют сравнивать различные архитектуры Data Grid, развиваемые мировым сообществом.

Секции 10 и 13 были посвящены методам представления и поиска документов. Так, Benjamin M.Gross (UIUC,USA), проанализировав приемы работы с электронной почтой (способы выбора адресов, сортировки писем по категориям и т.п.) предложел свой вариант прототипа системы, имеющей на нижнем уровне память для собщений (писем) в виде реляционной базы данных и набор сервисов на верхнем уровне (например, с сервисом индексирования текстов и метаданных) для улучшения организации хранения сообщений, их выборки, адресации и навигации. Многие из предлагаемых решений могут быть применены и для организации электронных коллекций другого типа. Можно отметить и представленные коллективом авторов из Санкт-Петербургского Государственного Университета (СПбГУ) доклады по работам , поддержанным грантами РФФИ и посвященным исследованию возможности автоматического выявления HTML-документов подобной структуры (т.е.получения информации, облегчающей создание программ-медиаторов) и возможности использования информации о содержимом документов в окрестности рассматриваемых Web-страниц для повышения качества поиска. В докладе Б.В. Доброва и Н.В. Лукашевича основное внимание уделено разработке многоязычных информационных систем, в том числе средствам автоматической обработки, индексирования и поиска документов в "многоязычных" коллекциях документов. Большой объем работ по принципам создания на основе расширенной объектной модели документов (DOM) и наполнению научной информацией (по различным областям науки) Интегрированной Распределенной Информационной Системы (ИРИС) Сибирского Отделения РАН был представлен в докладе Ю.И. Шокина, А.М. Федотова и Ю.В. Леонова. В докладе М.В. Губина приведены результаты исследований, проведенных для выбора метода сжатия индексированных файлов (основной индексной структуры для поиска по тексту).

На секции 11 (Интегрированные репозитории научной информации) профессор Bernd Wegner ( Институт Математики Технического Университета в Берлине) отметил, что в деле создания баз знаний библиотечного типа необходимо формирование глобальных репозитариев, что в свою очередь связано с тремя видами деятельности : запоминанием доступных на данный момент электронных материалов, реализацией проектов для решения проблемы архивирования таких материалов с целью их сохранения в читабельном виде для будущих поколений и переводом напечатанной литературы в электронную форму с обеспечением хорошего доступа и поисковых возможностей для потенциальных читателей.Доклад и был посвящен некоторым деталям этой деятельности , в частности, для проектов с распределенной сетевой архитектурой EMANI (Electronic Mathematics Archives Network Initiative ( международный проект) и ERAM (Electronic Research Archive in Mathematics, Германия). Кроме того, был предложен план развития глобальной Электронной Библиотеки по математике (DML и RusDML).

Два доклада в этой секции (с участием авторов из Института Математики СО РАН, Института Проблем Информатики РАН, Института цитологии и генетики СО РАН и Института Вычислительной математики и математической геофизики СО РАН) были посвящены различным сторонам реализации распределенных систем в области молекулярной генетики и биологии, биотехнологии и медицины, и в частности конкретным реализациям системы Gene Discovery/GeneExpress и средствам использования баз данных TRRD, SWISSPROT (структура и функции белков, их классификация и т.д.), EMBL/GenBank (последовательности ДНК, РНК) и Medline. К сожалению, форма представления материала была слишком ориентирована на знание терминологии и понятий рассматриваемой предметной области.

На секции 12 (Интеграция разнородных коллекций) в докладе Ю.С. Затуливетра подчеркивалась предстоящая проблема превращения Интернет в программируемый метакомпьютер путем активизации функциональных возможностей компьютеров сети для глобальных общесистемных (подавление информационного шума, структуризация и интеграция информационных ресурсов, автоматическое управление вычислительными ресурсами) и пользовательских задач; отмечалось, что Grid-технологии - лишь первый серьезный шаг в этом направлении.

Два доклада на этой секции (В.А. Капустина и О.Л. Жижимова с соавторами) были посвящены возможностям и средствам применения протокола Z39/50 для создания профилированных распределенных информационных систем (стандартизации метаданных, схем данных). Наконец, на этой же секции была представлена Библиотечная Подсистема Интегрированной системы информационных ресурсов РАН (ИСИР РАН) как автоматизированная среда доступа к библиотечным каталогам и данным по степени доступности и использования материалов библиотек Институтов РАН (совместный доклад авторов из ВЦ РАН, БЕН РАН и Центра научных телекоммуникаций и информационных технологий РАН).

В рамках программы секции 14 (Архивы) можно отметить доклад Павла Браславского (Уральское отделение РАН) и Tomas Krichel (USA), посвященный технологии организации архивов данных, доступных через Web: форматам и использованию метаданных в стандарте Dublin Core в соответствие с проектом OAI (Open Archive Initiative) для академических организаций, их документов и коллекций. В докладах коллективов авторов из Института проблем передачи информации РАН и Института систем информатики СО РАН характеризовалась технология создания и использования тексто-графической базы данных по истории Российской фундаментальной науки на основе фондов архива РАН и персональных архивов.

Секция 15 (Индексирование документов). В рамках этой секции было представлено два доклада авторов из СПбГУ. В докладе А. Корявко и И. Некрестьянова рассматривалась проблема построения поисковых систем в Web, когда используются альтернативные подходы к оценке "полезности" Web-страниц для конкретного пользователя, опирающиеся, например, не только на информацию о содержимом документа, но и на метаинформацию как о документе, так и о самом пользователе (о его предыдущих запросах, какие документы и сколько времени он их просматривал после выполнения запроса и т.д., что позволяет более эффективно проводить ранжирование документов). Рассматриваются возможности одного из представителей методов, использующих информацию о связях между Web-страницами : алгоритма Клейнберга для ранжирования страниц Web.

Средства для поиска в среде слабоструктурированных данных отмечены в докладе Б.С. Хвостиченко и Б.А. Новикова.

3. Экспертное Совещание ИИТО ЮНЕСКО "Электронные библиотеки в образовании"

Во время конференции, 15 октября 2002 г., Институт Информационных Технологий в Образовании ЮНЕСКО, в кооперации с конференцией RCDL'2002, ОИЯИ и ИПИ РАН провел Международное Экспертное Совещание "Электронные библиотеки в образовании". В соответствии с планом деятельности ИИТО ЮНЕСКО, развивается проект по применению электронных библиотек в образовании. Целью Экспертного совещания явилось обсуждение Аналитического обзора "Электронные библиотеки в образовании", подготовленного международной группой экспертов. Содержание Аналитического обзора было представлено на совещании проф. Л.А. Калиниченко.

В обзоре рассматриваются технологические аспекты создания электронных библиотек на основе нескольких анализируемых проектов США и Европы. Так, в США разрабатывается Национальная электронная библиотека (NSDL) в области науки, технологий, инженерии, математики, ориентированная в первую очередь на использование в образовании и науке. NSDL (первая версия системы планируется в декабре 2002 г.) разрабатывается как интегрированная распределенная информационная среда. NSDL обеспечивает возможность доступа к разнообразным цифровым объектам - не только текстовым, но и мультимедийным, геопространственным объектам, объектам, представляющим результаты измерений, изучаемые образцы и даже дорогостоящие инструменты для дистанционного доступа. Ввиду такого разнообразия информационных объектов, NSDL поддерживает множественный набор различных стандартов метаданных. Интерфейсы таких систем эволюционируют от традиционных, основанных на ключевых словах, в сторону более семантических интерфейсов (например, использование в качестве запросов реперных отметок Атласа грамотности, созданного в США). Планируется весьма быстрое развитие NSDL, включая рассмотрение этой библиотеки как подструктуры федерального правительства.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.