Рефераты. Прогноз развития супер ЭВМ p> Одним из способов дальнейшего повышения производительности вычислительной системы является объединение суперкомпьютеров в кластеры при помощи оптоволоконных соединений. С этой целью компьютеры CRAY T3/E снабжены каналами ввода/вывода с пропускной способностью 128 Гбайт/с.
Потенциальные заказчики проявляют повышенный интерес к новой разработке фирмы. Желание приобрести компьютер изъявили такие организации как
Pittsburgh Supercomputer Center, Mobile Oil, Департамент по океанографии и атмосферным исследованиям США. При этом подписано несколько контрактов на изготовление нескольких компьютеров 512-процессорной конфигурации.

Среди японских компаний следует выделить фирму Hitachi, которая выпустила суперкомпьютер SR2201 с массовым параллелизмом, содержащий до
2048 процесоров. В основе системы переработанная компанией процессорная архитектура RA-RISC от фирмы Hewlett-Paccard. Псевдовекторный процессор функционирует под управлением ОС HP-UX/MPP Mash 3.0. В компьютере, кроме того, использована система поддержки параллельного режима работы Express, созданная корпорацией Parasoft и получившая название ParallelWare.
Производительность нового компьютера составляет 600 Гфлопс. К марту 1999 г. фирма планирует продать 30 суперкомпьютеров.

Одним из наиболее масштабных проектов в области создания вычислительных средств с массовым параллелизмом является проект фирмы Intel по разработке самого быстродействующего компьютера на основе микропроцессоров шестого поколения P6. Новая система , которую планируется установить в Sandia National Laboratories будет состоять из 9000 процессоров Pentium P6 и иметь пиковую производительность 1000 ГФлопс.
Заказчиком системы является министерство энергетики США. При этом основной областью применения будет являться моделирование подземных ядерных взрывов
, что позволит тратить 25 млн. долларов в год вместо 300 млн.

За последнее десятилетие имеет место следующая днинамика роста производительности параллельных вычислительных систем в США:
1987 г. - 50 Мфлопс

1989 г. - 1 Гфлопс(суперкомпьютеры СМ)

1991 г. - 10 Гфлопс(векторные процессоры и процессоры серии 528)

1994г. - 100 Гфлопс (CRAY,PARAGON)

1996-1997гг. – 200-500 Гфлопс (комбинация векторного процессора и куба поточной обработки).

1998-1999 гг. –1000-3000 Гфлопс (ASCI, T3E)
Особо выдающимися характеристиками отличаются суперкомпьютеры в середине 90- х годов:

- Фирма IBM ALPS (1024 процессора RS6000, производительность 50 Гфлопс);
-Intel Paragon XPS (1872 процессора, производительность 72,9 Гфлопс);
- Thinking Mashines CM5 (512 процессоров Super Spark, производительность 83
Гфлопс);
- NCube 2SM80 (8192 процессора, производительность 84Гфлопс);
- Numerical Wind Tunnel (140 процессоров, производительность 124 Гфлопс на тестах LINPACK);
- Intel Paragon XPS Supercomputer (4000 процессоров 1860XP, производительность 300 Гфлопс)
- Сray Research MPP System (2048 процессоров Alpha, производительность -
300 Гфлопс)
- Thinking Mashines CM5 (16384 процессора Super Spark, производительность
1000 Гфлопс)

Краткие харатеристики наиболее распространенных современных суперкомпьютеров приведены ниже

IBM RS/6000 SP2

Производитель -International Business Machines (IBM), отделение
RS/6000.

Класс архитектуры: Масштабируемая массивно-параллельная вычислительная система (MPP).

Узлы имеют архитектуру рабочих станций RS/6000. Существуют несколько типов "SP-узлов", которые комплектуются различными процессорами: PowerPC
604e/332MHz, P2SC/160MHz, POWER3/MHz (более ранние системы комплектовались процессорами POWER2/66 и 77MHz). Возможна установка узлов с SMP- архитекутурой - до 4 процесоров PowerPC. Объем памяти для POWER3-узлов - до
4GB, для PowerPC-узлов - до 3GB.

Доступны конфигурации SP от 2 до 128 узлов (и до 512 по специальному заказу). Узлы устанавливаются в "стойки" (до 16 узлов в каждой). Одна SP- система может содержать узлы различных типов.

Узлы связаны между собой высокопроизводительных коммутатором (IBM high- performance switch), который имеет многостадийную структуру и работает с коммутацией пакетов.
Cистемное ПО: OC AIX (устанавливается на каждом узле). LoadLeveler – система поддержки пакетной обработки. Параллельные приложения исполняются под управлением Parallel Operating Environment (POE).
Средства программирования: поставляется оптимизированная реализация интерфейса MPI (ранее - MPL).

HP 9000 (Exemplar)

Производитель: Hewlett-Packard, High-performance systems division.

Класс:многопроцессорные сервера с общей памятью (SMP).

В настоящее время доступны несколько "классов" систем семейства HP
9000: сервера начального уровня (D,K-class), среднего уровня ( N-class) и наиболее мощные системы (V-class).
Процессоры: 64-битные процессоры c архитектурой PA-RISC 2.0 (PA-8200, PA-
8500).

Число процессоров: N-class - до 8 процессоров. V-class - до 32 процессоров. В дальнейшем ожидается увеличение числа процессоров до 64, а затем до 128.

Возможно объединение до 16 SMP-гиперузлов V-class или K-class в кластер "HP Enterprise Parallel Server". Для связи узлов используется коммутатор HP HyperFabric.
Системное ПО: устанавливается операционная система HP-UX (совместима на уровне двоичного кода с ОС SPP-UX компьютеров Convex SPP).
Средства программирования: HP MPI - реализация MPI 1.2, оптимизированная к архитектуре Exemplar. Распараллеливающие компиляторы Fortran/C, математическая библиотека HP MLIB. CXperf - средство анализа производительности программ.

Cray T3E

Производитель: Silicon Graphics

Класс архитектуры: масштабируемая массивно-параллельная система, состоит из процессорных элементов (PE).

В настоящее время существуют две модификации: T3E-900 и T3E-1200.

Процессорный элемент PE состоит из процессора, блока памяти и устройства сопряжения с сетью. Используются процессоры Alpha 21164 (EV5) с тактовой частотой 450 MHz (T3E-900) и 600 MHz (T3E-1000), пиковая производительность которых составляет 900 и 1200 MFLOP/sec соответственно.
Процессорный элемент располагает своей локальной памятью (DRAM) объемом от
256MB до 2GB.

Системы T3E масштабируются до 2048 PE.

Процессорные элементы связаны высокопроизводительной сетью с топологией трехмерного тора и двунаправленными каналами. Скорость обменов по сети достигает 480MB/sec в каждом направлении.

Используется операционная система UNICOS/mk.

Поддерживается явное параллельное программирование c помощью пакета
Message Passing Toolkit (MPT) - реализации интерфейсов передачи сообщений
MPI, MPI-2 и PVM, библиотека Shmem. Для Фортран-программ возможно также неявное распараллеливание в моделях CRAFT и HPF. Среда разработки включает также набор визуальных средств для анализа и отладки параллельных программ.

Cray T90

Производители: Silicon Graphics, Cray Research.

Класс архитектуры: многопроцессорная векторная система (несколько векторных процессоров работают на общей памяти).

Модели Серия T90 включает модели T94, T916 и T932.

Процессор Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производительностью 2GFlop/s.
Число процессоров Система T932 может включать до 32 векторных процессоров
(до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s.

Возможно объединение нескольких T90 в MPP-системы.

Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памяти и обеспечивает скорость обменов с памятью до 800MB/sec.

Используется операционная система UNICOS.

Cray SV1

Производитель: Silicon Graphics

Класс архитектуры: масштабируемый векторный суперкомпьютер.

Используются 8-конвейерные векторные процессоры MSP (Multi-Streaming
Processor) с пиковой производительностью 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 стандартных 2-конвейерных процессора с пиковой производительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz.

Процессоры объединяются в SMP-узлы, каждый из которых может содержать
6 MSP и 8 стандартных процессоров. Система (кластер) может содержать до 32 таких узлов.

SMP-узел может содержать от 2 до 16GB памяти. Система может содержать до 1TB памяти. Вся память глобально адресуема (архитектура DSM).

Используется операционная система UNICOS.

Поставляется векторизующий и распараллеливающий компилятор CF90.
Поддерживается также явное параллельное программирование с использованием интерфейсов MPI, OpenMP или Shmem.

Cray Origin2000

Производитель Silicon Graphics

Класс архитектуры: модульная система с общей памятью (cc-NUMA).

Использованы 64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz

Основной компонент системы - модуль Origin, включающий от 2 до 8 процессоров MIPS R10000 и до 16GB оперативной памяти. Поставляются системы
Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей. Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter.

Используется операционная система SGI IRIX. Поставляется распараллеливающий компилятор Cray Fortran 90. Поддерживается стандарт
OpenMP.

Onyx2 InfiniteReality2

Производитель Silicon Graphics

Класс архитектуры: многопроцессорная система визуализации; по аппаратной архитектуре очень похожа на Origin2000.

Система может включать до 128 процессоров MIPS R10000.

Графические возможности системы обеспечивают специальные устройства трех типов: геометрические (векторные) процессоры, растровые процессоры, генераторы аналоговых сигналов. Система может быть оборудована 16 независимыми каналами графического вывода (visualization pipelines). На аппаратном уровне поддерживается графический интерфейс OpenGL.

Используется операционная система SGI IRIX.

Sun HPC 10000 (StarFire)

Производитель Sun Microsystems, серия Sun HPC.

Класс архитектур: многопроцессорный SMP-сервер.

Процессор UltraSPARC II/336MHz

Система StarFire объединяет от 16 до 64 процессоров.

Система включает от 2GB до 64GB памяти.

Системное ПО: ОС Solaris, ПО распределения ресурсов Load Sharing
Facility (LSF). Поставляется пакет поддержки параллельных приложений Sun
HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая система), Prism (визуальная среда разработки), S3L (библиотека математических подпрограмм), и др.

NEC SX-5

Производитель NEC, серия SX.

Класс архитектуры: параллельный векторный суперкомпьютер (PVP).

Каждый узел системы является векторно-конвейерным SMP- суперкомпьютером, объединяющим до 16 индивидуальных векторных процессоров
(каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s).

Объем памяти каждого узла - до 128GB, производительность обменов с памятью достигает 1TB/sec. Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s.

Для связи узлов используется высокоскоростной коммутатор (IXS
Internode Crossbar Switch).

Используется операционная система SUPER-UX.

Поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Fortran77/SX и Fortran90/SX с автоматическим распараллеливанием и векторизацией, а также интегрированная среда разработки и оптимизации
PSUITE.

Fujitsu VPP

Производитель Fujitsu

Класс архитектуры параллельный векторный суперкомпьютер (PVP).

Модификации VPP300, VPP700, VPP5000

Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения. Для VPP700: VU состоит из 7 конвейеров и обеспечивает пиковую производительность до 2.4 GFLOP/sec. Объем памяти - до 2GB. Для VPP5000:
VU состоит из 4 конвейеров, пиковая производительность - 9.6 GFLOP/sec.
Объем памяти - до 16GB.

Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec Для VPP5000: до 512 PE, суммарная пиковая производительность до 4.9 TFLOP/sec.

Процессорные элементы связаны коммутатором (crossbar network), который производить двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 - 615MB/sec, для VPP5000 -
1.6GB/sec. Используется операционная система UXP/V, основанная на UNIX
System VR4.

Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и
PVM 3.3.

AlphaServer

Производитель Compaq, Digital.

Высокопроизводительный SMP-сервер, AlphaServer Array - кластерная система.

Процессоры GS140 и GS60 - Alpha 21264, 8400 и 8200 - Alpha 21164

Число процессоров GS140 и 8400 - до 14, GS60 и 8200 - до 6

Объем памяти GS140 - до 28GB.

Кластеры AlphaServer Array могут объединять до 8 узлов AlphaServer, т.е. в общей сложности до 112 процессоров. Могут комбинироваться узлы различных типов. Узлы связываются между собой коммутатором MEMORY CHANNEL, который обеспечивает скорость обменов до 66MB/sec и латентность порядка 3 мкс.

На платформе AlphaServer поддерживаются операционные системы Tru64
UNIX (это новое имя Digital UNIX), OpenVMS и Windows NT. Поставляется ПО кластеризации TruCluster Software.

Используются коммуникационные библиотеки TruCluster MEMORY CHANNEL
Software и MPI. Поддерживается распараллеливание в стандарте OpenMP.

Особо выдающимися характеристиками отличаются суперкомпьютеры в конце
90-х годов предстиавлены в таблице 3.

Таблица 3 – наиболее быстродействующие суперекомпьютеры

|№ |Изготовите|Суперкомпьютер |Страна|Год |Число |Пиковая |Реальная|
| |ль | | |создани|процессор|производ|производ|
| | | | |я |ов |и-тельно|и-тельно|
| | | | | | |сть, |сть на |
| | | | | | |Гфлопс |пакете |
| | | | | | | |LINPAK, |
| | | | | | | |Гфлопс |
|1 |Intel |ASCI Red | USA |1999 |9472 |3154 |2121.3 |
|2 |SGI |ASCI Blue |USA |1998 |6144 |3072 |1608 |
| | |Mountain | | | | | |
|3 |SGI |T3E1200 |USA |1998 |1084 |1300.8 |891.5 |
|4 |Hitachi |SR8000/128 |Japan |1999 |128 |1024 |873.6 |
|5 |SGI |T3E900 |USA |1997 |1324 |1191.6 |815.1 |
|6 |SGI |ORIGIN2000 |USA |1999 |2048 |1024 |690.9 |
|7 |SGI |T3E900 |UK |1997 |876 |788.4 |552.92 |
|8 |IBM |SP Silver |USA |1998 |1952 |1296 |547 |
|9 |SGI |T3E900 |USA |1999 |812 | 730.8 |515.1 |
|10|SGI |T3E1200 |UK |1998 |612 |734 |509.9 |
|11|IBM |ASCI Blue |USA |1998 |1344 |892 |468.2 |
| | |Pacific CTR SP | | | | | |
| | |Silver | | | | | |
|12|Hitachi |SR8000/64 |Japan |1999 |64 |512 |449.7 |



Страницы: 1, 2, 3



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.