Рефераты. Методические указания по микропроцессорным системам p> Архитектура с управлением по запросам. Она разбивает решаемые задачи на менее сложные подзадачи и результаты их решения снова объединяются для формирования окончательного результата. Команда, которую следует выполнять, определяется, когда ее результат оказывается нужным для другой активной команды.

Архитектура с управлением наборами условий. Работает аналогично предыдущей архитектуре. Типичное применение такой структуры – распознавание изображений с использованием клеточных матриц процессорных элементов.

Архитектура ЭВМ с общей памятью. В ней используется та или иная система межсоединений для объединения процессоров с памятью. Системы межсоединений могут быть конструктивно оформлены в виде шин, колец, кубов, кэшей.

Архитектура с параллельными процессорами. Здесь используется высокая степень параллелизма, которая допускает независимое выполнение нескольких процессов на нескольких процессорах. Для этого класса ММПС широко используемой формой структур параллельной обработки являются гиперкубы, или двоичные n-кубы, в которых между процессорами имеют место двухпунктовые связи для передачи информации между ними (в 16-вершинном кубе каждый процессорный элемент ММПС соединен с четырьмя соседними).

Необходимо отметить, что повышение производительности ММПС, которое может быть достигнуто за счет параллельной обработки, зависит от доли вычислений, которые могут выполняться параллельно. На рис. 5.3 иллюстрируется повышение производительности, которое может быть достигнуто при использовании различного количества процессоров, работающих параллельно, по сравнению с долей Р вычислений, которые могут выполняться параллельно.

[pic]

Рис. 5.3. Зависимость производительности параллельных процессов от доли вычислений Р, выполняемых параллельно

На рис. 5.4 приведено соотношение между возможностями ММПС по выполнению векторной, параллельной и скалярной обработки информации.
Увеличение производительности ММПС, которое достигается за счет использования векторной и параллельной обработки, является весьма существенным, поэтому скорость реализации алгоритмов, в которых заложены обе указанные формы параллелизма, возрастает.

Мультимикропроцессорные системы, которые являются параллельными ЭВМ, строятся из большого числа процессоров, располагающих собственной памятью, и используют широкий спектр связей между процессорами для обмена. Топологии этих МПС могут быть организованы в соответствии со следующими схемами:

- древовидные сети;

- шины;

- конвейеры;

- процессоры БПФ;

- сети перекрестного обмена;

- гиперкубы;

- сетки (решетки) с одним, двумя, тремя или большим числом измерений;

- кольца;

- цилиндры;

- тороиды;

- пирамидальные сети.

[pic]

Рис. 5.4. Взаимосвязь между векторной, параллельной и скалярной производительностью ММПС

Перечисленные выше структуры сопоставляются по следующим характеристикам: легкость реализации системы на основе существующих устройств, сложность соединительной сети, наличие предпосылок для расширения структуры, сопоставление используемого алгоритма и структуры системы. На рис. 5.5 приведен набор топологических решений для реализации тех или иных алгоритмов.

Древовидные сети подвержены влиянию переменных задержек, которые имеют место при добавлении узлов к поддереву, когда данные у всех узлов одного поддерева должны быть переданы на другое.

Производительность конвейера ограничивается производительностью самого медленного его участка. Кроме этого в конвейере имеют место затраты времени на посылку сообщений из одного каскада в другой.
Для того, чтобы преодолеть ограничения, присущие традиционным сетям связи, разработаны высокопоточные сети. Для параллельной обработки информации предложены три варианта построения высокопоточных сетей: сеть «бабочка»; сеть с перекрестным обменом и гиперкуб.

[pic]

Рис. 5.5. Виды топологии параллельных ММПС

Сеть «бабочка», разработанная в конце 60-х годов Рабинером и Гоулдом, повышает скорость вычислений при реализации БПФ, которое требует выполнения
4N2 умножений и 4N2 сложений комплексных чисел (на этой сети необходимо повторить алгоритм N/2log2 N раз).

Сеть перекрестного обмена предложена в конце 60-х годов Пизом и
Стоуном и представляет собой альтернативный вариант топологии связной сети по отношению к варианту «бабочка» для выполнения БПФ, которое реализуется за log2 N шагов.

Гиперкуб или бинарный N-куб представляет собой теоретическую концепцию, обосновывающую возможность наращивания структуры за пределами трех измерений (см. рис. 5.6).

[pic]

Рис. 5.6. Топология ММПС “гиперкуб”

N-размерный куб содержит 2N узлов (узловых процессоров). Концепция гиперкуба удобна для описания универсальных матричных ЭВМ, так как многие другие сетевые топологии могут быть отображены на гиперкуб путем отбрасывания некоторых связей.

Сетки (решетки) представляют собой одномерные, двумерные матрицы или матрицы большей размерности. На их основе реализуются систолические или волновые матрицы, в которых каждая ячейка соединена со своими ближайшими
«соседями» во всех измерениях.

Цилиндры и тороиды являются разновидностью решеток, в которых число используемых измерений и топология поверхности выбираются таким образом, чтобы они соответствовали реализуемому прикладному алгоритму.

5.2. Основные перспективные проекты высокопроизводительных ММПС

Высокопроизводительные ММПС (или суперЭВМ) были ориентированы, главным образом, на выполнение больших объемов вычислений с плавающей запятой. Для достижения высокой производительности, существенной для данной области приложений, в суперЭВМ использовалась комбинация быстрых схем и усовершенствования в методах организации архитектуры. Эти усовершенствования вывели производительность машины за те пределы, которые можно было обеспечить только за счет быстродействия схем.

ЭВМ IBM 7030, известная под названием STRETCH, была в 100 раз быстрее, чем более старая IBM 704. Для достижения столь смелой цели был введен ряд архитектурных усовершенствований. Отдельное устройство обработки команд позволяло одновременно обрабатывать до шести команд. Чтобы сгладить различие между длительностью такта ЦП и относительно большим временем доступа к основной памяти, было использовано несколько методов, включая опережающую выборку данных и метод «закорачивания» для предотвращения множественного доступа к одной и той же ячейке памяти.

В ЭВМ CDC 6660 используется много функциональных устройств и схема резервирования, названная «счетной платой». Эта плата поддерживает динамическую информацию о регистрах, функциональных устройствах и шинах.
Способность выполнения команд в порядке, отличном от порядка, предписанного программой, ведет к параллельной обработке независимых команд и увеличивает степень параллелизма при работе машины.

В ЭВМ IBM 360/91 реализована двухуровневая иерархия конвейеров.
Центральный процессор подразделяется на три устройства, которые могут работать параллельно. Они образуют конвейеризацию первого уровня. Два устройства – устройство выдачи команд и устройство вычислений с плавающей точкой – сами являются конвейерными. Третье устройство предназначено для вычислений с фиксированной запятой и имеет только одну ступень. Система тегов и аппаратные средства для их сравнения (или общая шина данных) позволяют выдать некоторую команду, даже если ее регистр результата является регистром результата частично выполненной команды.

Одна из первых высокопроизводительных ММПС, созданная фирмой CRAY
RESEARCH, – скалярно-векторная супер-ЭВМ CRAY-1 имеет регистровую архитектуру (Р-архитектуру). В такой архитектуре функциональные устройства получают операнды только из регистров.

Другими примерами регистровой архитектуры являются архитектуры супер-
ЭВМ СDС-6000 а также CRAY X-MP, CRAY-2 и скалярное устройство ЭВМ CDC
CYBER205.

Максимальная производительность, например, супер-ЭВМ CRAY X-MP составляет 100 Мфлопс, а суммарная - 28-41 Мфлопс, так как от 70% до 85% общего времени вычислений затрачивается на вычисление скалярных величин.

В качестве иллюстрации применения приведенных в подразделе 5.1 архитектур современных ММПС рассмотрим наиболее перспективные разработки основных классов высокопроизводительных ММПС: скалярную векторную, матричную и ММПС типа гиперкуб.

Архитектура скалярной суперЭВМ относится к типу SISD – архитектур, подобна скалярной архитектуре суперЭВМ CRAY-1 и приведена на рис. 5.7.

В данной архитектуре предусмотрено три функциональных устройства
(устройства сложения и умножения с плавающей запятой и устройство целочисленного сложения), а также два набора регистров (S и А). Такая архитектура позволяет достичь высокой производительности за счет того, что здесь максимальная скорость выдачи команд – одна команда в такт.

[pic]

Рис. 5.7. Структура скалярной суперЭВМ

Набор регистров А используется, главным образом, для хранения адресов и для адресных вычислений (например, для вычисления индексов), а набор регистров S – для хранения данных и результатов при выполнении соответствующих команд.

Однородная векторная суперЭВМ серии Т фирмы FPS (Floating Point
Systems) была выпущена в 1986 году и превышала производительность всех известных в тот период суперЭВМ. Самая мощная модель серии Т-140000 имеет
16384 узла, каждый из которых содержит транспьютер Т414 и 64-разрядный векторный процессор с плавающей запятой с производительностью 64*106 Флопс, а производительность машины в целом составляет 262*109 Флопс; емкость памяти достигает 16 Гбайт. Программное обеспечение ЭВМ серии Т представляет собой язык параллельной обработки ОККАМ. Каждый узел, конструктивно оформленный в виде одной печатной платы, содержит (рис. 5.8) транспьютер
Т414 (он же управляющий процессор), 64-разрядный векторный процессор с плавающей запятой, двупортовое ЗУПВ емкостью 1 Мбайт и 16 последовательных каналов связи.

Восемь узловых плат (узловых процессоров), соединенных друг с другом и с системной платой, образуют модуль. Возможности каждого модуля характеризуются производительностью 128*106 Флопс и максимальным объемом
ЗУПВ 8 Мбайт, пропускная способность внутри модуля составляет 12 Мбайт/с, а внешние связи системной платы имеют пропускную способность 0,5 Мбайт/с.

Векторный процессор обращается к памяти как к двум банкам векторов, в одном из которых хранится 256 векторов, а в другом – 768, при этом два обращения к памяти производятся за время одного цикла длительностью 125 нс.
Сумматор векторного процессора снабжен 6-каскадным конвейером, а конвейер умножителя имеет 5 ступеней при работе с 32-разрядными данными и 7 - при обработке 64-разрядных данных. Модули (т.е. 8 узловых процессоров и системная плата) объединяются друг с другом в виде пространственной решетки и реализуют архитектуру ММПС типа ОКМД.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.