Рефераты. Закономерности движения информации и их влияние на технологию информационного производства

Одной из форм организации данных являются базы данных. Под базой данных в настоящее время понимают организованную специальным образом совокупность данных, отображающую свойства и состояния конкретных объектов (и их отношений), принадлежащих некоторой «предметной области». Предметная область представляет собой часть «информационного пространства», отображающую информационные потребности некоторого ограниченного круга пользователей рассматриваемой базы данных. Под информационным пространством некоторого объекта или их множества понимается совокупность всех информационных компонентов этого объекта (или множества) независимо от способов и средств отображения этих компонентов.

Одна из важнейших характеристик информационного пространства -- его структурированность, под которой понимается такое его свойство, при котором все содержание и особенности этого пространства представляются «информационными компонентами» и взаимосвязями между ними, выраженными в понятном виде.

В зависимости от степени структурированности выделяются следующие виды информационного пространства:

-- неструктурированные (например, разговорная речь);

-- слабо структурированные (например, письменность);

-- структурированные (например, информационные системы);

-- формализованные (для которых известны не только информационные компоненты и связи между ними, но и алгоритмы получения значений любого компонента, например технико-экономические показатели деятельности объекта);

-- машиноструктурированные, для которых известны алгоритмы получения не только информационных компонентов, но и их структурных единиц.

Информационные компоненты объектов могут иметь различную природу -- это документация (организационно-распределительная, экономическая, конструкторская и т. п.), отчеты о НИР, информация на машинных носителях, звуковая и видеоинформация, информация от датчиков и т. д.

Соответственно понятиям «информация» и «данные» в теории баз данных рассматриваются два различных аспекта: инфологический и да-талогический.

Инфологический аспект включает вопросы смыслового содержания информации независимо от способов ее представления и организации в памяти информационной системы и характеризует предметную область базы данных, то есть ту часть реального мира, информационные потребности которого реализуются конкретной базой данных.

Даталогический аспект включает вопросы представления и организации данных в памяти информационной системы и характеризует формы и методы представления информации посредством данных, правила смысловой интерпретации и преобразования данных.

При формировании данных в соответствии с целями информационной системы происходит абстрагирование от несущественных деталей описания тех или иных свойств предметной области. Переход от инфологического к даталогическому представлению предметной области (от ее инфологической к даталогической модели) представляет собой сложный процесс проектирования отображения: «описание предметной области» -- «описание физического размещения данных в памяти информационной системы». На практике он представляет собой последовательность более простых, как правило, итеративных процессов проектирования менее сложных промежуточных отображений, представляющих собой информационные модели предметной области различного уровня абстрагирования.

Основными уровнями абстрагирования и представления данных в настоящее время принято считать внешний, концептуальный и внутренний. Поэтому при создании баз данных проектируются соответствующие внешние, концептуальные и внутренние модели. На внешнем уровне реализуются модели, ориентированные на отдельных пользователей, на концептуальном -- на всех пользователей, на внутреннем -- также на всех пользователей, но с учетом требований производительности и экономного использования ресурсов вычислительной среды.

Объектами моделирования в технологии баз данных служат «предметная область», «база данных» и «данные», поэтому в теории и технологии баз данных широко используются термины «модель предметной области», «модель базы данных», «модель данных». Анализ специальной литературы позволяет сделать вывод, что эти термины являются родовыми для группы терминов, обозначающих разновидность моделей соответствующего типа.

С середины 1960-х годов в рамках исследований проблем искусственного интеллекта начало развиваться новое направление, связанное с концепцией информации на основе отражения, которое впоследствии получило название «представление знаний». Интеллект организованных систем зависит от их способностей к обучению, которые заложены в систему. В одном случае эти способности состоят в простом запоминании информации, в другом -- в умении приобретать навыки использования этой информации для решения задач, в третьем -- формировать новое знание в процессе использования уже имеющегося и т. п. В интересах реализации двух последних видов способностей и развивается новое направление науки и техники -- «представление знаний».

Совокупность средств информатики, обеспечивающих поддержку представления знаний, именуется банком знаний. Этот комплекс включает в себя базу знаний, программные и технические средства, обеспечивающие процессы формирования, использования и коррекции базы знаний, а также дедуктивные машины для логических выводов, систем и т. д.

Основными формами материализации, овеществления и обособления знаний, превращения их в информацию, а также обратной трансформации информации в знания являются книги, журналы, материалы конференций, совещаний, симпозиумов, конгрессов и других временных объединений специалистов; репринты и препринты; научно-техническая документация и проекты; кино-, теле- и видеофильмы; фонограммы; научно-технические отчеты и диссертации; патенты и т. д.

5. Статические законы движения информации

Если представить общественное информационное производство в виде множества взаимосвязанных информационных производств, то в нем можно наблюдать потоки документов и/или записей. Эти потоки формируются благодаря как фиксированным связям между отдельными информационными производствами, так и временным разовым связям, возникающим по мере необходимости. В первом случае информация распространяется по заранее установленному регламенту (контракт, кооперация, подписка и др.) и не требует многократного оформления запроса. В таких случаях принято считать, что действует постоянный запрос. Во втором случае для получения информации заинтересованное информационное производство должно отправить запрос другому производству, которое по своей технологии подготовит и отправит заказчику ответ в виде записи или документа либо массивов записей или документов.

Наблюдая процессы передачи информации, можно заметить, что между отдельными субъектами общественного информационного производства идет интенсивный обмен информацией, в то время как между другими его практически нет. В этом случае мы говорим о наличии или отсутствии у субъектов взаимного интереса. Из этого следует, что предложить общую меру интереса, применимую для каждого конкретного случая, очень трудно. Данный показатель зависит от многих факторов, то есть, по терминологии математики, он является функцией многих аргументов. Перечислить все эти факторы или аргументы не представляется возможным. Для наших целей достаточно рассмотреть зависимость показателя интереса от трех обобщенных факторов: информационного расстояния -- R, информационной сложности -- S и старения -- Т.

Под информационным расстоянием будем понимать некоторую усредненную величину, характеризующую удаленность двух субъектов общественного информационного производства, входящих в общую технологическую структуру. Информационное расстояние между субъектами информационного производства можно описать некоторым многомерным вектором, компоненты которого соответствуют географической, родственной, служебной, этнической и другой близости этих субъектов. Некоторую скалярную норму этого вектора обозначим R. Такое определение информационного расстояния, конечно, не является жестким. Уточнить его можно только при рассмотрении отдельных небольших групп информационных производств, поддерживающих взвешенные связи друг с другом. Однако для установления характера зависимости меры информационного интереса от информационного расстояния последнее можно определить также качественно.

Информационное расстояние до последнего времени существенно зависело от географического: чем дальше субъекты по месту их нахождения, тем больше информационное расстояние между ними. Если субъекты информационного производства -- люди, информационное расстояние между ними увеличивается по мере удаленности родственных отношений, мест жительства, учебы или работы, профессиональных интересов и т. п.

Представим себе, что мы измерили интенсивность информационных потоков между всеми парами субъектов общественного производства и рассортировали их по величине информационного расстояния между субъектами пары. Для каждого достаточно малого интервала информационного расстояния (R + R ± AR) найдем среднюю величину интереса по всем парам с информационным расстоянием, лежащим в этом интервале, -- J ( R ). Многочисленные наблюдения показывают, что эта зависимость представляет собой круто падающую функцию аргумента на относительно малом интервале R, близком к нулю. Если считать, что интерес субъекта информационного производства к самому себе (R=0) бесконечен, то зависимость среднего интереса от информационного расстояния может быть приблизительно описана выражением J (R) = K/R2, что позволяет сформулировать эмпирический закон информационного тяготения: «Интерес субъектов информационного производства друг к другу обратно пропорционален квадрату информационного расстояния между ними».

Несколько проще определяется зависимость показателя интереса от сложности информации. С достаточной определенностью сложность документа или записи можно измерить количеством содержащихся в них полей или символов. Если сложность документа очень большая, то им интересуется не очень много людей и/или информационных производств. Полный комплект технической документации на производство самолета, пожалуй, не интересует никого в отдельности. Но наличием свободных мест на конкретные рейсы самолета интересуются многие тысячи людей ежедневно. Полный комплект документации на самолет содержит сотни тысяч иди миллионы записей, а информация о наличии свободных мест укладывается в одной короткой записи. Подсчитав число запросов на документы различной сложности в течение достаточно длительного промежутка времени, мы можем построить зависимость средней величины показателя интереса к документам от их сложности -- J (S).

Страницы: 1, 2, 3, 4, 5



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.