Процессоры МРР

К процессорам с массовым параллелизмом (МРР) относятся суперкомпьютеры (машины), предназначенные для выполнения сложных вычислений, хранения больших баз данных, управления ими, а также для других целей. Характерные особенности процессоров МРР:

=> в них используются стандартные высокопроизводительные процессоры (типа Intel Pentium, Sun UltraSPARC, IBM RS/6000 и DEC Alpha) и сеть для передачи сообщений с малым временем ожидания и высокой пропускной способностью;

=> обладают высокой производительностью ввода-вывода, поскольку обрабатывают огромные (терабайты) массивы данных, которые должны быть распределены по дискам и требуют перемещения с большой скоростью;

=> имеют низкую отказоустойчивость, для чего большие МРР всегда содержат специальное аппаратное и программное обеспечение для контроля системы, обнаружения неполадок и их исправления. Остановимся подробнее на двух конкретных системах МРР: Cray ТЗЕ и Intel/Sandia Option Red.

Cray ТЗЕ. С точки зрения архитектуры семейство ТЗЕ состоит из нескольких идентичных моделей суперкомпьютеров, отличающихся ценой и производительностью [9, 16]. Например, производительность машины ТЗЕ-1200 составляет 1200 мегафлопов на процессор, или операций с плавающей точкой (FLoating-point OPeration —FLOP).

Состав Cray Т3 Е. Основным узлом ТЗЕ является процессорный блок (ПБ), который содержит (рис. 19.2,а):

=> процессорный элемент ПЭ;

=> модуль памяти МП;

=> контроллер памяти. В его состав входит 512 специальных Е-регист- ров, которые могут загружаться адресами с целью чтения или записи слов из удаленной памяти (или блоков из 8 слов);

=> сетевой интерфейс с процессором передачи данных и коммутатор.

В качестве процессорного блока (рис. 19.2,а) используется процессор DEC Alpha 21164.

Основные характеристики процессора:

=> представляет собой суперскалярный процессор с RISC-архитектурой, способный выполнять 4 команды за цикл. В зависимости от модели процессор работает с частотами 300, 450 и 600 МГц; имеет 64-битные регистры. Размер виртуальных адресов ограничен

Структура процессорного блока (а) и мультикомпьютера Cray ТЗЕ (б); основная топологическая связь узлов (в)

Рис. 19.2. Структура процессорного блока (а) и мультикомпьютера Cray ТЗЕ (б); основная топологическая связь узлов (в)

43 битами, а физических — 40 битами, т.е. возможен доступ к 1 Тбайт физической памяти;

=> имеет двухуровневую встроенную кэш-память. Кэш первого уровня содержит 8 Кбайт для команд и 8 Кбайт для данных. Кэш второго уровня является трехвходовой ассоциативной кэш-памятью на 96 Кбайт, содержащей вместе и команды и данные. Поскольку кэш-память обоих уровней может быть до 2 Гбайт на процессор и максимальное число процессоров равно 2048, общий объем памяти может составлять 4 Тбайт.

Узлы (ПБ) в ТЗЕ связаны двумя разными способами (рис. 19.2,6): => дуплексным трехмерным тором, в котором каждый узел имеет 6 каналов связи с соседними узлами по направлениям X — вправо, влево, Y — вперед, назад и Z — вверх и вниз (см. рис. 19.2,а,в). Скорость передачи данных в этих каналах связи равна 480 Мбайт/с в любом направлении. Это — основная топология;

=> одной или несколькими подсистемами ввода-вывода GigaRings с коммутацией пакетов, обладающими высокой пропускной способностью. Узлы используют эту подсистему для взаимодействия друг с другом, а также с сетями, дисками и другими периферийными устройствами. Они по ней посылают пакеты размером до 256 байт. Каждый GigaRing состоит из пары колец шириной в 32 бита, которые соединяют процессорные блоки со специальными узлами ввода- вывода. Узлы ввода-вывода содержат гнезда для сетевых карт, дисков и других устройств.

Особенности функционирования. Система Cray ТЗЕ работает с глобальным общим адресным пространством. Любой узел

(процессорный элемент) может иметь доступ к любой памяти любого другого узла. Контроллер памяти узла захватывает доступ к удаленной памяти и управляет транзакцией сообщения в контроллере памяти удаленного узла. Транзакция сообщения автоматически передается через промежуточные узлы (коммутаторы) до места назначения, с малыми задержками на каждом переходе. Данные удаленной памяти не кэшируются, поскольку отсутствует аппаратный механизм их сохранения.

Хотя вся память доступна любому узлу, распределение данных между ними отдано программному обеспечению. Кэш-память используется только для хранения инструкций из локальной памяти. Программа составляется так, чтобы избежать частых обращений к удаленной памяти.

Система ТЗЕ может содержать до 2048 узлов, поэтому в ней для повышения надежности на каждые 128 пользовательских узлов содержится один запасной узел. Неисправные узлы могут быть замещены запасными во время работы системы без перезагрузки.

Intel/Sandia. В середине 1990-х гг. в США приступили к разработке

  • 5 уникальных систем МРР со скоростью 1,3, 10, 30 и 100 терафло- пов/с соответственно (1тера = 1012). Отметим, что 100 терафлопов в 500 000 раз больше, чем мощность процессора Pentium Pro, работающего с частотой 200 МГц. Рассмотрим первый 100-терафлоповый суперкомпьютер, который появился в 1996 г. Он состоит из 4608 узлов (4536 вычислительных узлов, 32 сервисных узла, 32 дисковых узла,
  • 6 сетевых узлов и 2 узла загрузки) с организацией в виде трехмерной сетки. Процессоры расположены на платах двух типов:

=> плата kestrel {рис. 19.3,о) используется в качестве вычислительного узла. Она имеет два логических модуля. Каждый из модулей включает 2 процессора Pentium Pro на 200 МГц и разделенное ОЗУ на 64 Мбайт. Каждый узел kestrel содержит собственную 64-битную локальную шину и собственный сетевой адаптер (Network Interface Chip - NIC);

=> платы eagle используются в качестве сервисных, дисковых, сетевых узлов и узлов загрузки. Каждая плата имеет два процессора Pentium Pro, отличающихся высокой скоростью ввода-вывода. Платы образуют решетку 32x38x2 в виде двух взаимосвязанных плоскостей 32x38 (рис. 19.3,6). Отметим, что платы находятся не во всех узлах решетки, поскольку размер решетки продиктован целями компоновки. Применяется пространственная маршрутизация, позволяющая обходить поврежденный канал связи. Для этого в каждом узле располагается маршрутизатор с шестью каналами связи (вперед- назад, вправо—влево, вверх—вниз) с другой плоскостью и с платой

Структура платы kestrel (а) и топология сети (б) системы Intel/Sandia

Рис. 19.3. Структура платы kestrel (а) и топология сети (б) системы Intel/Sandia

kestrel или eagle. Каждый канал связи может передавать информацию одновременно в обоих направлениях со скоростью 400 Мбайт/с.

В системе можно выделить 4 логические части:

=> сервисные узлы, представляющие собой машины UNIX общего назначения с разделением времени, которые позволяют программистам писать и отлаживать свои программы;

=> вычислительные узлы, предназначенные для запуска больших приложений (они запускают микроядро системы UNIX);

=> узлы ввода-вывода, которые управляют 640 дисками, содержащими более 1 Тбайт данных. Имеется два независимых набора узлов ввода-вывода: узлы для секретной и несекретной работы;

=> системные узлы, используемые для загрузки системы.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >