20.01.2013 Views

ClustrX в действии. Суперкомпьютер «Ломоносов

ClustrX в действии. Суперкомпьютер «Ломоносов

ClustrX в действии. Суперкомпьютер «Ломоносов

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Cистема упра<strong>в</strong>ления <strong>ClustrX</strong><br />

уни<strong>в</strong>ерсальная платформа для <strong>в</strong>ычислительных систем любого<br />

масштаба<br />

Игорь Глухо<strong>в</strong><br />

Руко<strong>в</strong>одитель отдела разработки программного обеспечения компании «Т-Платформы»


Система упра<strong>в</strong>ления <strong>ClustrX</strong><br />

Система упра<strong>в</strong>ления <strong>ClustrX</strong> произ<strong>в</strong>одст<strong>в</strong>а компании<br />

«Т-Платформы» я<strong>в</strong>ляется пакетом программного<br />

обеспечения, обеспечи<strong>в</strong>ающего <strong>в</strong>ысокоэффекти<strong>в</strong>ное<br />

упра<strong>в</strong>ление <strong>в</strong>семи сер<strong>в</strong>исами кластера любого масштаба, а<br />

также <strong>в</strong>сей инженерной инфраструктурой ЦОД.<br />

Отличительные особенности системы <strong>ClustrX</strong>:<br />

� Единый, интуити<strong>в</strong>но понятный графический интерфейс для администратора системы и<br />

её пользо<strong>в</strong>ателей;<br />

� Поддержка кластеро<strong>в</strong> от нескольких узло<strong>в</strong> до сотни тысяч;<br />

� А<strong>в</strong>томатизация функций администриро<strong>в</strong>ания и мониторинга;<br />

� Полный ох<strong>в</strong>ат <strong>в</strong>сей инфраструктуры системы, <strong>в</strong>ключая обслужи<strong>в</strong>ающее оборудо<strong>в</strong>ание;<br />

� Комплексное решение, <strong>в</strong>ключающее <strong>в</strong>се необходимое для работы кластера<br />

� Относительно низкая стоимость со<strong>в</strong>окупного <strong>в</strong>ладения системой.


Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />

Архитектура<br />

<strong>ClustrX</strong> построена на принципах децентрализации ресурсо<strong>в</strong> и унифициро<strong>в</strong>анного<br />

<strong>в</strong>заимодейст<strong>в</strong>ия между различными подсистемами, обеспечи<strong>в</strong>ающих <strong>в</strong>ысокий уро<strong>в</strong>ень<br />

системной произ<strong>в</strong>одительности.<br />

Система<br />

статистики<br />

Система<br />

мониторинга<br />

Менеджер<br />

ресурсо<strong>в</strong><br />

Система<br />

аудита<br />

Система а<strong>в</strong>арийного<br />

остано<strong>в</strong>а<br />

Графический интерфейс системы упра<strong>в</strong>ления<br />

Пользо<strong>в</strong>атели<br />

Администраторы


Графический интерфейс упра<strong>в</strong>ления<br />

В <strong>ClustrX</strong> упра<strong>в</strong>ление <strong>в</strong>семи её компонентами<br />

осущест<strong>в</strong>ляется посредст<strong>в</strong>ом удобного графического<br />

интерфейса (GUI), обеспечи<strong>в</strong>ающего упра<strong>в</strong>ление кластером из<br />

единой точки и наглядность и удобст<strong>в</strong>о контроля параметро<strong>в</strong> и<br />

программных компоненто<strong>в</strong>.<br />

Графический интерфейс построен на базе web-технологий и поз<strong>в</strong>оляет администраторам и<br />

пользо<strong>в</strong>ателям системы получать и обрабаты<strong>в</strong>ать данные, упра<strong>в</strong>лять как отдельными<br />

компонентами, так и системой <strong>в</strong> целом практически из любой точки мира.<br />

Командный интерфейс администратора (Command-Line Interface, CLI) — это механизм<br />

<strong>в</strong>ыполнения команд ОС, предназначенный для пользо<strong>в</strong>ателей кластерного комплекса с<br />

полномочиями администраторо<strong>в</strong>. Он реализо<strong>в</strong>ан <strong>в</strong> <strong>в</strong>иде отдельного сер<strong>в</strong>иса.


Компоненты <strong>ClustrX</strong>.<br />

<strong>ClustrX</strong>.Management<br />

Упра<strong>в</strong>ляющий модуль <strong>ClustrX</strong>.Management служит для унификации упра<strong>в</strong>ления <strong>в</strong>семи<br />

компонентами кластерной системы, поз<strong>в</strong>оляя пользо<strong>в</strong>ателю системы любого уро<strong>в</strong>ня<br />

доступа операти<strong>в</strong>но получать требуемую информацию и принимать соот<strong>в</strong>етст<strong>в</strong>ующие<br />

решения.<br />

Осно<strong>в</strong>ные функции:<br />

� Упра<strong>в</strong>ление конфигурацией аппаратных и программных компоненто<strong>в</strong> кластера;<br />

� Единое упра<strong>в</strong>ление пользо<strong>в</strong>ателями, рабочими группами и политиками;<br />

� Упра<strong>в</strong>ление <strong>в</strong>семи категориями доступа к ресурсам системы;<br />

� Упра<strong>в</strong>ление энергопотреблением;<br />

� А<strong>в</strong>томатизиро<strong>в</strong>анное раз<strong>в</strong>ерты<strong>в</strong>ание кластера и поддержание его <strong>в</strong> up-to-date состоянии;<br />

� Упра<strong>в</strong>ление служебными сер<strong>в</strong>исами DNS, DHCP, LDAP, NTP, NFS, Lustre и др.


<strong>ClustrX</strong>.Management. Графический<br />

интерфейс упра<strong>в</strong>ления<br />

Аппаратные части<br />

кластерной системы<br />

Окно текущих<br />

процессо<strong>в</strong><br />

Лог-процессинг<br />

Окно упра<strong>в</strong>ления<br />

компонентами<br />

кластера<br />

Окно упра<strong>в</strong>ления<br />

сигнализацией


Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.Watch<br />

Компонент <strong>ClustrX</strong>.Watch служит для осущест<strong>в</strong>ления мониторинга программных и<br />

аппаратных компоненто<strong>в</strong> кластерной системы и эффекти<strong>в</strong>но решает следующие задачи:<br />

� Визуализация статусо<strong>в</strong> компоненто<strong>в</strong> кластерной системы;<br />

� Поддержка мониторинга и упра<strong>в</strong>ления до 10 000 узло<strong>в</strong> (при необходимости <strong>в</strong>озможно<br />

у<strong>в</strong>еличение количест<strong>в</strong>а обслужи<strong>в</strong>аемых узло<strong>в</strong>);<br />

� Комфортная работа с мониторинг-клиентами поддержи<strong>в</strong>аемых операционных систем<br />

при низкой загрузке аппаратной части;<br />

� Мониторинг удалённых компоненто<strong>в</strong> по протоколам SNMP, MODBUS и др.;<br />

� Мониторинг и упра<strong>в</strong>ление оборудо<strong>в</strong>анием по протоколу IPMI;<br />

� Мониторинг сторонних процессо<strong>в</strong> с помощью программных интерфейсо<strong>в</strong>;<br />

� Полная поддержка гетерогенных архитектур;<br />

� Интеграция с подсистемой логгиро<strong>в</strong>ания на уро<strong>в</strong>не операционной системы


<strong>ClustrX</strong>.Watch. Графический интерфейс упра<strong>в</strong>ления<br />

Перечень<br />

оборудо<strong>в</strong>ания<br />

Выбранный<br />

элемент<br />

Перечень датчико<strong>в</strong><br />

системы


Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.Safe<br />

Модуль <strong>ClustrX</strong>.Safe – это система а<strong>в</strong>томатического у<strong>в</strong>едомления/отключения кластера<br />

при <strong>в</strong>озникно<strong>в</strong>ении нештатных ситуаций. <strong>ClustrX</strong>.Safe обеспечи<strong>в</strong>ает безопасность и<br />

работоспособность кластерной системы на <strong>в</strong>сех уро<strong>в</strong>нях системы.<br />

Осно<strong>в</strong>ная функциональность:<br />

� Обеспечение мониторинга событий, температуры окружающей среды, <strong>в</strong>лажности<br />

<strong>в</strong>оздуха, температуры охлаждающих жидкостей,<br />

� А<strong>в</strong>томатический опрос датчико<strong>в</strong> и магнитоупра<strong>в</strong>ляемых контакто<strong>в</strong><br />

� Контроль доступа на уро<strong>в</strong>не <strong>в</strong>сего комплекса и отдельных стоек<br />

� Контроль состояния систем бесперебойного питания, системы <strong>в</strong>одяного охлаждения,<br />

кондициониро<strong>в</strong>ания <strong>в</strong>оздуха<br />

� А<strong>в</strong>томатическое отключение на осно<strong>в</strong>е сценарие<strong>в</strong><br />

� Высокая надежность и <strong>в</strong>озможность а<strong>в</strong>тономной работы<br />

� Интеграция данных <strong>в</strong> систему мониторинга


Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.CNL<br />

Операционная система <strong>ClustrX</strong>.CNL я<strong>в</strong>ляется комплексной платформой, <strong>в</strong> соста<strong>в</strong> которой<br />

<strong>в</strong>ходят:<br />

� Узел упра<strong>в</strong>ления - модифициро<strong>в</strong>анная ОС Linux с <strong>в</strong>строенным графическим интерфейсом<br />

администриро<strong>в</strong>ания;<br />

� Пакет драй<strong>в</strong>еро<strong>в</strong> и Linux-ядра, сконфигуриро<strong>в</strong>анные для поддержки оборудо<strong>в</strong>ания<br />

кластера;<br />

� Генератор образо<strong>в</strong> операционной системы для <strong>в</strong>ычислительных узло<strong>в</strong> и модуль<br />

� раз<strong>в</strong>ерты<strong>в</strong>ания;<br />

� Система упра<strong>в</strong>ления кластером, <strong>в</strong>ключая базу данных конфигураций;


Техническая поддержка<br />

Компания «Т-Платформы», я<strong>в</strong>ляясь разработчиком<br />

системы <strong>ClustrX</strong>, предлагает следующие услуги по<br />

технической поддержке пользо<strong>в</strong>ателей кластерных систем:<br />

� Сопро<strong>в</strong>ождение на <strong>в</strong>сех этапах строительст<strong>в</strong>а: от предпроектных работ до <strong>в</strong><strong>в</strong>ода <strong>в</strong><br />

эксплуатацию;<br />

� А<strong>в</strong>арийный сер<strong>в</strong>ис 24 часа <strong>в</strong> сутки, 7 дней <strong>в</strong> неделю<br />

� Резер<strong>в</strong>иро<strong>в</strong>ание мощностей на случай <strong>в</strong>ыхода узло<strong>в</strong> заказчика из строя<br />

� Удалённое обно<strong>в</strong>ление как отдельных программных компоненто<strong>в</strong>, так и системы <strong>в</strong><br />

целом


<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />

<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />

<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>», я<strong>в</strong>ляющийся на<br />

сегодняшний день крупнейшей кластерной<br />

системой <strong>в</strong> России, успешно упра<strong>в</strong>ляется пакетом<br />

<strong>ClustrX</strong>.<br />

Пико<strong>в</strong>ая произ<strong>в</strong>одительность суперкомпьютера «Ломоносо<strong>в</strong>» ра<strong>в</strong>няется 1,7 ПФлопс.<br />

Число <strong>в</strong>ычислительных узло<strong>в</strong>:<br />

� На базе х86 - 5 100<br />

� На базе GPU – 1 065<br />

С помощью пакета <strong>ClustrX</strong> осущест<strong>в</strong>ляется упра<strong>в</strong>ление <strong>в</strong>сей аппаратной частью и <strong>в</strong>семи<br />

приложениями кластерной системы.


<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />

<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />

Среднее <strong>в</strong>ремя <strong>в</strong>ыполнения задач – 4 373 часа <strong>в</strong> день


<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />

<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />

Среднее количест<strong>в</strong>о уникальных пользо<strong>в</strong>ателей <strong>в</strong> день – 186


Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />

Функционал<br />

Показатели произ<strong>в</strong>одительности пакета <strong>ClustrX</strong> VS другие системы упра<strong>в</strong>ления.<br />

Разработчик Hewlett-Packard T-Platforms<br />

Наимено<strong>в</strong>ание продукта<br />

Упра<strong>в</strong>ление инфрастурктурой<br />

HP Cluster<br />

Management Utility<br />

<strong>ClustrX</strong><br />

Bright<br />

Computing<br />

Bright Cluster<br />

Manager<br />

Adaptive<br />

Computing<br />

Moab Adaptive<br />

HPC Suite<br />

Мониторинг аппаратных компоненто<strong>в</strong> есть есть есть есть<br />

Возможность настройки собст<strong>в</strong>енных параметро<strong>в</strong><br />

мониторинга<br />

есть есть есть есть<br />

Модуль опо<strong>в</strong>ещения о критических событиях есть есть есть есть<br />

А<strong>в</strong>томатизиро<strong>в</strong>анное принятие решений по устранению<br />

нештатных ситуаций<br />

есть есть есть есть<br />

Поддержка работы с менеджерами нагрузки нет есть есть есть<br />

Возможность использо<strong>в</strong>ания распределителей нагрузки<br />

других произ<strong>в</strong>одителей<br />

нет нет есть нет<br />

Упра<strong>в</strong>ление ПО ScaleMP нет нет есть нет


Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />

Функционал<br />

Показатели произ<strong>в</strong>одительности пакета <strong>ClustrX</strong> VS другие системы упра<strong>в</strong>ления.<br />

Разработчик Hewlett-Packard T-Platforms<br />

Наимено<strong>в</strong>ание продукта<br />

Упра<strong>в</strong>ление <strong>в</strong>ычислительным комплексом<br />

HP Cluster<br />

Management Utility<br />

<strong>ClustrX</strong><br />

Bright<br />

Computing<br />

Bright Cluster<br />

Manager<br />

Adaptive<br />

Computing<br />

Moab Adaptive<br />

HPC Suite<br />

Максимальное количест<strong>в</strong>о обслужи<strong>в</strong>аемых узло<strong>в</strong> 4096 более 10 000 более 10 000 н/д<br />

Графический интерфейс упра<strong>в</strong>ления есть есть есть есть<br />

Поддержка графического интерфейса для различных<br />

операционных систем<br />

Linux Linux<br />

Linux,<br />

Windows,<br />

MacOS<br />

н/д<br />

Web-интерфейс нет есть есть есть<br />

Поддержка нескольких кластеро<strong>в</strong> одно<strong>в</strong>ременно нет есть есть нет<br />

Экспертная система упра<strong>в</strong>ления энергопотреблением нет нет нет есть<br />

Упра<strong>в</strong>ление пользо<strong>в</strong>ателями и политиками нет есть есть нет<br />

Упра<strong>в</strong>ление группами есть есть есть нет<br />

Мониторинг <strong>в</strong>ыполнения <strong>в</strong>ычислительных задач нет есть есть есть<br />

Статистика по <strong>в</strong>ыполняемым задачам нет есть есть есть<br />

Планиро<strong>в</strong>ание задач нет есть есть есть


Будущее СlustrX. <strong>ClustrX</strong> 2.0<br />

Планируемая дата <strong>в</strong>ыхода: октябрь 2012 года<br />

Но<strong>в</strong>ые <strong>в</strong>озможности:<br />

� Коробочная <strong>в</strong>ерсия программного пакета – устано<strong>в</strong>очный диск, документация,<br />

техническая поддержка;<br />

� Поддержка third-party менеджеро<strong>в</strong> ресурсо<strong>в</strong>;<br />

� Полная статистика использо<strong>в</strong>ания кластера, интеграция <strong>в</strong> продукт механизмо<strong>в</strong> HOPSA;<br />

� Многоуро<strong>в</strong>не<strong>в</strong>ый аудит;<br />

� А<strong>в</strong>томатическое/полу-а<strong>в</strong>томатическое раз<strong>в</strong>ерты<strong>в</strong>ание на мини-кластера.


О компании<br />

� Осно<strong>в</strong>ана <strong>в</strong> 2002 году<br />

� Предоста<strong>в</strong>ляет полный спектр программно-аппаратных решений и услуг <strong>в</strong> области HPC<br />

� Я<strong>в</strong>ляется одним из лидеро<strong>в</strong> миро<strong>в</strong>ого суперкомпьютерного рынка<br />

� Доля компании на суперкомпьютерном рынке России и СНГ соста<strong>в</strong>ляет около 40%<br />

� Реализо<strong>в</strong>ала более 200 суперкомпьютерных проекто<strong>в</strong><br />

� Объем продаж компании <strong>в</strong> 2011 году соста<strong>в</strong>ил $83,5 млн.<br />

� Разработчик самых мощных суперкомпьютеро<strong>в</strong> СНГ 2004, 2007, 2009, 2009 и 2011 гг.<br />

� Шесть решений компании <strong>в</strong>ошли <strong>в</strong> рейтинг TOP500 самых мощных суперкомпьютеро<strong>в</strong> мира


Спасибо за <strong>в</strong>нимание!

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!