Процессоры МРР

К процессорам с массовым параллелизмом (МРР) относятся суперкомпьютеры (машины), предназначенные для выполнения сложных вычислений, хранения больших баз данных, управления ими, а также для других целей. Характерные особенности процессоров МРР:

  • • в них используются стандартные высокопроизводительные процессоры (типа Intel Pentium, Sun UltraSPARC, IBM RS/6000 и DEC Alpha) и сеть для передачи сообщений с малым временем ожидания и высокой пропускной способностью;
  • • обладают высокой производительностью ввода-вывода, поскольку обрабатывают огромные (терабайты) массивы данных, которые должны быть распределены по дискам и требуют перемещения с большой скоростью;
  • • имеют низкую отказоустойчивость, для чего большие МРР всегда содержат специальное аппаратное и программное обеспечение для контроля системы, обнаружения неполадок и их исправления.

Остановимся подробнее на двух конкретных системах МРР: Cray ТЗЕ и lntel/Sandia Option Red.

Т3Е

С точки зрения архитектуры семейство ТЗЕ состоит из нескольких идентичных моделей суперкомпьютеров, отличающихся ценой и производительностью [9, 16]. Например, производительность машины Т3Е-1200 составляет 1200 мегафлопов на процессор, или операций с плавающей точкой (FLoating-point Operation – FLOP).

Состав Cray ТЗЕ. Основным узлом ТЗЕ является процессорный блок (ПБ), который содержит (рис. 19.2,а):

  • • процессорный элемент ПЭ;
  • • модуль памяти МП;
  • контроллер памяти. В его состав входит 512 специальных Е-регистров, которые могут загружаться адресами с целью чтения или записи слов из удаленной памяти (или блоков из 8 слов);
  • • сетевой интерфейс с процессором передачи данных и коммутатор. В качестве процессорного блока (рис. 19.2,а) используется процессор DEC Alpha 21164.

Основные характеристики процессора:

• представляет собой суперскалярный процессор с RlSC-архитектурой, способный выполнять 4 команды за цикл. В зависимости от модели процессор работает с частотами 300, 450 и 600 МГц; имеет 64-битные регистры. Размер виртуальных адресов ограничен

Структура процессорного блока (а) и мульти компьютера Cray ТЗЕ (6); основная топологическая связь узлов (в)

Рис. 19.2. Структура процессорного блока (а) и мульти компьютера Cray ТЗЕ (6); основная топологическая связь узлов (в)

  • 43 битами, а физических – 40 битами, т.е. возможен доступ к 1 Тбайт физической памяти;
  • • имеет двухуровневую встроенную кэш-память. Кэш первого уровня содержит 8 Кбайт для команд и 8 Кбайт для данных. Кэш второго уровня является трехвходовой ассоциативной кэш-памятью на 96 Кбайт, содержащей вместе и команды и данные. Поскольку кэш-память обоих уровней может быть до 2 Гбайт на процессор и максимальное число процессоров равно 2048, общий объем памяти может составлять 4 Тбайт.

Узлы (ПБ) в ТЗЕ связаны двумя разными способами (рис. 19.2,б):

  • дуплексным трехмерным тором, в котором каждый узел имеет 6 каналов связи с соседними узлами по направлениям X – вправо, влево, Y – вперед, назад и Z – вверх и вниз (см. рис. 19.2,а,в). Скорость передачи данных в этих каналах связи равна 480 Мбайт/с в любом напраалении. Это – основная топология;
  • • одной или несколькими подсистемами ввода-вывода GigaRings с коммутацией пакетов, обладающими высокой пропускной способностью. Узлы используют эту подсистему для взаимодействия друг с другом, а также с сетями, дисками и другими периферийными устройствами. Они по ней посылают пакеты размером до 256 байт. Каждый GigaRing состоит из пары колец шириной в 32 бита, которые соединяют процессорные блоки со специальными узлами ввода- вывода. Узлы ввода-вывода содержат гнезда для сетевых карт, дисков и других устройств.

Особенности функционирования. Система Cray ТЗЕ работает с глобальным общим адресным пространством. Любой узел

(процессорный элемент) может иметь доступ к любой памяти любого другого узла. Контроллер памяти узла захватывает доступ к удаленной памяти и управляет транзакцией сообщения в контроллере памяти удаленного узла. Транзакция сообщения автоматически передается через промежуточные узлы (коммутаторы) до места назначения, с малыми задержками на каждом переходе. Данные удаленной памяти не кэшируются, поскольку отсутствует аппаратный механизм их сохранения.

Хотя вся память доступна любому узлу, распределение данных между ними отдано программному обеспечению. Кэш-память используется только для хранения инструкций из локальной памяти. Программа составляется так, чтобы избежать частых обращений к удаленной памяти.

Система ТЗЕ может содержать до 2048 узлов, поэтому в ней для повышения надежности на каждые 128 пользовательских узлов содержится один запасной узел. Неисправные узлы могут быть замещены запасными во время работы системы без перезагрузки.

 
< Пред   СОДЕРЖАНИЕ     След >