Метакомпьютинг и технологии Grid

GRID-технологии являются одной из перспективных реализаций в области кластерных исследований. Концепция Grid ("решетка" – построение вычислительной системы наподобие модели кристалла – с компьютерами в узлах решетки) зародилась в контексте проблемы построения сверхмощных вычислительных установок. В 80-х гг. XX в. для этого уже применялись суперкомпьютерные технологии, полученный опыт оказался не только позитивным. Пришло понимание, что при высокой цене жесткие архитектуры суперкомпьютеров обладают ограниченной масштабируемостью. В то же время для решения ряда задач (в частности, для прогнозирования природных явлений, обработки данных о высокоэнергетических ядерных реакциях, для исследования эволюции Вселенной и т.п.) требовались гибкие и наращиваемые вычислительные мощности принципиально нового уровня.

Идея объединения вычислительных и коммуникационных технологий в гибкие системы дала в 90-х гг. XX в. толчок метакомпьютингу как способу соединения отдельных вычислительных центров. В настоящее время метакомпьютинг определяется как "использование мощных вычислительных ресурсов, прозрачно доступных посредством коммуникационной среды". В дополнение к прозрачности существенны такие характеристики, как "бесшовность", "масштабируемость", "синхронизируемость" и "глобальность". Таким образом, предлагалось, "скрыв" коммуникации, использовать подключенные к сети компьютеры и целые вычислительные центры как единый вычислительный ресурс. Основной акцент делался на то, что потенциальный пользователь может получить практически неограниченные мощности для выполнения суперсложных вычислений и хранения данных [2].

В качестве процессорных ресурсов в современных Grid- системах применяются не только мощные специализированные вычислительные устройства, но также рабочие станции и обычные персональные компьютеры. Теперь под термином "вычислительные ресурсы" понимают все, что участвует в совместной компьютерной обработке данных. К ресурсам следует отнести программные комплексы, коммуникации, системы хранения, хранилища данных и информационные системы.

Например, Grid – это не просто технологии для высокопроизводительных вычислений. Современное реальное содержание Grid – это инфраструктура, обеспечивающая поддержку любой глобально распределенной обработки для многих типов приложений: электронного бизнеса, распределенного производства, исследования данных, системы обработки высокой пропускной способности (High Throughput Computing – НТС) и, конечно, распределенного суперкомпьютинга. В отличие от метакомпьютинга, для многих приложений, в том числе и с большим объемом вычислений, не требуются высокопроизводительные коммуникации; в этом случае в качестве коммуникационной среды может выступать привычный Интернет [agora.guru.ru/abrau2008/pdf/050.pdf].

Ниже кратко рассмотрена архитектура программного обеспечения Grid. Базовым программным обеспечением Grid и де-факто международным стандартом является сегодня Globus [osp.ru/os/2003/01/182393/|. Его взяли за основу в ведущих проектах Grid (IPG, NCSA, Gryphyn, DataGrid). Бо́льшая часть новых исследований и разработок в области Grid ориентируется именно на Globus [2].

Основная задача, решаемая в Grid, – обеспечение доступа к ресурсам, а поскольку ресурсы распределенные, то функционирование обеспечивается специальной формой организации программного обеспечения – службами. В отличие от модели "клиент-сервер" тот или иной набор служб устанавливается здесь на каждом ресурсе. Множество служб должно удовлетворять двум структурным условиям:

  • • Каждый тип служб должен иметь стандартный протокол доступа, в соответствии с которым реализуется прикладной интерфейс клиентов. В рамках стандартных протоколов допустимы различные способы реализации служб.
  • • Множества служб на разных ресурсах должны быть согласованными. Это предполагает известную унификацию наборов служб на основе тождественности их семантики, а также наличие общих правил, регламентов и организационных соглашений, на которые опирается конфигурирование служб.

На рис. 5.3 показан алгоритм отправки задания и загрузки свободного вычислительного устройства с учетом политики доступа и поиска свободного ресурса, реализуемый соответствующей службой.

Алгоритм прохождения задания в Grid-системе

Рис. 5.3. Алгоритм прохождения задания в Grid-системе

Успех проекта Globus обеспечили следующие ключевые службы и протоколы:

  • • протокол доступа к управлению ресурсами (Grid Resource Allocation and Management – GRAM) и служба Gatekeeper, которые обеспечивают безопасное создание удаленных процессов и управление ими;
  • • служба метакаталогов (Grid Information Service – GIS), отвечающая за распределенный сбор данных и информационное обслуживание;
  • • службы инфраструктуры безопасности (Grid Security Infrastructure – GSI), поддерживающие однократную регистрацию, делегирование полномочий и отображение прав доступа на разные локальные системы.

Работы в области Grid направлены сегодня на существенное расширение состава служб. Предложенное на данный момент решение состоит в том, чтобы "за основу" взять стандарты Web-служб, разработанные консорциумом W3C (SOAP, WSDL, WS-Inspection и т.д.). В результате архитектура Grid наследует замечательные свойства Web-служб, одновременно наследуя широкий спектр инструментов разработки и исполнительных сред на выбор (например, J2EE, Microsoft.Net, IBM WebSphere, Sun ONE). Базовой архитектурой Grid становится Open Grid Services Architecture, реализованная в Globus 3.0.

 
< Пред   СОДЕРЖАНИЕ     След >