ClustrX в действии. Суперкомпьютер «Ломоносов
ClustrX в действии. Суперкомпьютер «Ломоносов
ClustrX в действии. Суперкомпьютер «Ломоносов
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Cистема упра<strong>в</strong>ления <strong>ClustrX</strong><br />
уни<strong>в</strong>ерсальная платформа для <strong>в</strong>ычислительных систем любого<br />
масштаба<br />
Игорь Глухо<strong>в</strong><br />
Руко<strong>в</strong>одитель отдела разработки программного обеспечения компании «Т-Платформы»
Система упра<strong>в</strong>ления <strong>ClustrX</strong><br />
Система упра<strong>в</strong>ления <strong>ClustrX</strong> произ<strong>в</strong>одст<strong>в</strong>а компании<br />
«Т-Платформы» я<strong>в</strong>ляется пакетом программного<br />
обеспечения, обеспечи<strong>в</strong>ающего <strong>в</strong>ысокоэффекти<strong>в</strong>ное<br />
упра<strong>в</strong>ление <strong>в</strong>семи сер<strong>в</strong>исами кластера любого масштаба, а<br />
также <strong>в</strong>сей инженерной инфраструктурой ЦОД.<br />
Отличительные особенности системы <strong>ClustrX</strong>:<br />
� Единый, интуити<strong>в</strong>но понятный графический интерфейс для администратора системы и<br />
её пользо<strong>в</strong>ателей;<br />
� Поддержка кластеро<strong>в</strong> от нескольких узло<strong>в</strong> до сотни тысяч;<br />
� А<strong>в</strong>томатизация функций администриро<strong>в</strong>ания и мониторинга;<br />
� Полный ох<strong>в</strong>ат <strong>в</strong>сей инфраструктуры системы, <strong>в</strong>ключая обслужи<strong>в</strong>ающее оборудо<strong>в</strong>ание;<br />
� Комплексное решение, <strong>в</strong>ключающее <strong>в</strong>се необходимое для работы кластера<br />
� Относительно низкая стоимость со<strong>в</strong>окупного <strong>в</strong>ладения системой.
Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />
Архитектура<br />
<strong>ClustrX</strong> построена на принципах децентрализации ресурсо<strong>в</strong> и унифициро<strong>в</strong>анного<br />
<strong>в</strong>заимодейст<strong>в</strong>ия между различными подсистемами, обеспечи<strong>в</strong>ающих <strong>в</strong>ысокий уро<strong>в</strong>ень<br />
системной произ<strong>в</strong>одительности.<br />
Система<br />
статистики<br />
Система<br />
мониторинга<br />
Менеджер<br />
ресурсо<strong>в</strong><br />
Система<br />
аудита<br />
Система а<strong>в</strong>арийного<br />
остано<strong>в</strong>а<br />
Графический интерфейс системы упра<strong>в</strong>ления<br />
Пользо<strong>в</strong>атели<br />
Администраторы
Графический интерфейс упра<strong>в</strong>ления<br />
В <strong>ClustrX</strong> упра<strong>в</strong>ление <strong>в</strong>семи её компонентами<br />
осущест<strong>в</strong>ляется посредст<strong>в</strong>ом удобного графического<br />
интерфейса (GUI), обеспечи<strong>в</strong>ающего упра<strong>в</strong>ление кластером из<br />
единой точки и наглядность и удобст<strong>в</strong>о контроля параметро<strong>в</strong> и<br />
программных компоненто<strong>в</strong>.<br />
Графический интерфейс построен на базе web-технологий и поз<strong>в</strong>оляет администраторам и<br />
пользо<strong>в</strong>ателям системы получать и обрабаты<strong>в</strong>ать данные, упра<strong>в</strong>лять как отдельными<br />
компонентами, так и системой <strong>в</strong> целом практически из любой точки мира.<br />
Командный интерфейс администратора (Command-Line Interface, CLI) — это механизм<br />
<strong>в</strong>ыполнения команд ОС, предназначенный для пользо<strong>в</strong>ателей кластерного комплекса с<br />
полномочиями администраторо<strong>в</strong>. Он реализо<strong>в</strong>ан <strong>в</strong> <strong>в</strong>иде отдельного сер<strong>в</strong>иса.
Компоненты <strong>ClustrX</strong>.<br />
<strong>ClustrX</strong>.Management<br />
Упра<strong>в</strong>ляющий модуль <strong>ClustrX</strong>.Management служит для унификации упра<strong>в</strong>ления <strong>в</strong>семи<br />
компонентами кластерной системы, поз<strong>в</strong>оляя пользо<strong>в</strong>ателю системы любого уро<strong>в</strong>ня<br />
доступа операти<strong>в</strong>но получать требуемую информацию и принимать соот<strong>в</strong>етст<strong>в</strong>ующие<br />
решения.<br />
Осно<strong>в</strong>ные функции:<br />
� Упра<strong>в</strong>ление конфигурацией аппаратных и программных компоненто<strong>в</strong> кластера;<br />
� Единое упра<strong>в</strong>ление пользо<strong>в</strong>ателями, рабочими группами и политиками;<br />
� Упра<strong>в</strong>ление <strong>в</strong>семи категориями доступа к ресурсам системы;<br />
� Упра<strong>в</strong>ление энергопотреблением;<br />
� А<strong>в</strong>томатизиро<strong>в</strong>анное раз<strong>в</strong>ерты<strong>в</strong>ание кластера и поддержание его <strong>в</strong> up-to-date состоянии;<br />
� Упра<strong>в</strong>ление служебными сер<strong>в</strong>исами DNS, DHCP, LDAP, NTP, NFS, Lustre и др.
<strong>ClustrX</strong>.Management. Графический<br />
интерфейс упра<strong>в</strong>ления<br />
Аппаратные части<br />
кластерной системы<br />
Окно текущих<br />
процессо<strong>в</strong><br />
Лог-процессинг<br />
Окно упра<strong>в</strong>ления<br />
компонентами<br />
кластера<br />
Окно упра<strong>в</strong>ления<br />
сигнализацией
Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.Watch<br />
Компонент <strong>ClustrX</strong>.Watch служит для осущест<strong>в</strong>ления мониторинга программных и<br />
аппаратных компоненто<strong>в</strong> кластерной системы и эффекти<strong>в</strong>но решает следующие задачи:<br />
� Визуализация статусо<strong>в</strong> компоненто<strong>в</strong> кластерной системы;<br />
� Поддержка мониторинга и упра<strong>в</strong>ления до 10 000 узло<strong>в</strong> (при необходимости <strong>в</strong>озможно<br />
у<strong>в</strong>еличение количест<strong>в</strong>а обслужи<strong>в</strong>аемых узло<strong>в</strong>);<br />
� Комфортная работа с мониторинг-клиентами поддержи<strong>в</strong>аемых операционных систем<br />
при низкой загрузке аппаратной части;<br />
� Мониторинг удалённых компоненто<strong>в</strong> по протоколам SNMP, MODBUS и др.;<br />
� Мониторинг и упра<strong>в</strong>ление оборудо<strong>в</strong>анием по протоколу IPMI;<br />
� Мониторинг сторонних процессо<strong>в</strong> с помощью программных интерфейсо<strong>в</strong>;<br />
� Полная поддержка гетерогенных архитектур;<br />
� Интеграция с подсистемой логгиро<strong>в</strong>ания на уро<strong>в</strong>не операционной системы
<strong>ClustrX</strong>.Watch. Графический интерфейс упра<strong>в</strong>ления<br />
Перечень<br />
оборудо<strong>в</strong>ания<br />
Выбранный<br />
элемент<br />
Перечень датчико<strong>в</strong><br />
системы
Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.Safe<br />
Модуль <strong>ClustrX</strong>.Safe – это система а<strong>в</strong>томатического у<strong>в</strong>едомления/отключения кластера<br />
при <strong>в</strong>озникно<strong>в</strong>ении нештатных ситуаций. <strong>ClustrX</strong>.Safe обеспечи<strong>в</strong>ает безопасность и<br />
работоспособность кластерной системы на <strong>в</strong>сех уро<strong>в</strong>нях системы.<br />
Осно<strong>в</strong>ная функциональность:<br />
� Обеспечение мониторинга событий, температуры окружающей среды, <strong>в</strong>лажности<br />
<strong>в</strong>оздуха, температуры охлаждающих жидкостей,<br />
� А<strong>в</strong>томатический опрос датчико<strong>в</strong> и магнитоупра<strong>в</strong>ляемых контакто<strong>в</strong><br />
� Контроль доступа на уро<strong>в</strong>не <strong>в</strong>сего комплекса и отдельных стоек<br />
� Контроль состояния систем бесперебойного питания, системы <strong>в</strong>одяного охлаждения,<br />
кондициониро<strong>в</strong>ания <strong>в</strong>оздуха<br />
� А<strong>в</strong>томатическое отключение на осно<strong>в</strong>е сценарие<strong>в</strong><br />
� Высокая надежность и <strong>в</strong>озможность а<strong>в</strong>тономной работы<br />
� Интеграция данных <strong>в</strong> систему мониторинга
Компоненты <strong>ClustrX</strong>. <strong>ClustrX</strong>.CNL<br />
Операционная система <strong>ClustrX</strong>.CNL я<strong>в</strong>ляется комплексной платформой, <strong>в</strong> соста<strong>в</strong> которой<br />
<strong>в</strong>ходят:<br />
� Узел упра<strong>в</strong>ления - модифициро<strong>в</strong>анная ОС Linux с <strong>в</strong>строенным графическим интерфейсом<br />
администриро<strong>в</strong>ания;<br />
� Пакет драй<strong>в</strong>еро<strong>в</strong> и Linux-ядра, сконфигуриро<strong>в</strong>анные для поддержки оборудо<strong>в</strong>ания<br />
кластера;<br />
� Генератор образо<strong>в</strong> операционной системы для <strong>в</strong>ычислительных узло<strong>в</strong> и модуль<br />
� раз<strong>в</strong>ерты<strong>в</strong>ания;<br />
� Система упра<strong>в</strong>ления кластером, <strong>в</strong>ключая базу данных конфигураций;
Техническая поддержка<br />
Компания «Т-Платформы», я<strong>в</strong>ляясь разработчиком<br />
системы <strong>ClustrX</strong>, предлагает следующие услуги по<br />
технической поддержке пользо<strong>в</strong>ателей кластерных систем:<br />
� Сопро<strong>в</strong>ождение на <strong>в</strong>сех этапах строительст<strong>в</strong>а: от предпроектных работ до <strong>в</strong><strong>в</strong>ода <strong>в</strong><br />
эксплуатацию;<br />
� А<strong>в</strong>арийный сер<strong>в</strong>ис 24 часа <strong>в</strong> сутки, 7 дней <strong>в</strong> неделю<br />
� Резер<strong>в</strong>иро<strong>в</strong>ание мощностей на случай <strong>в</strong>ыхода узло<strong>в</strong> заказчика из строя<br />
� Удалённое обно<strong>в</strong>ление как отдельных программных компоненто<strong>в</strong>, так и системы <strong>в</strong><br />
целом
<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />
<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />
<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>», я<strong>в</strong>ляющийся на<br />
сегодняшний день крупнейшей кластерной<br />
системой <strong>в</strong> России, успешно упра<strong>в</strong>ляется пакетом<br />
<strong>ClustrX</strong>.<br />
Пико<strong>в</strong>ая произ<strong>в</strong>одительность суперкомпьютера «Ломоносо<strong>в</strong>» ра<strong>в</strong>няется 1,7 ПФлопс.<br />
Число <strong>в</strong>ычислительных узло<strong>в</strong>:<br />
� На базе х86 - 5 100<br />
� На базе GPU – 1 065<br />
С помощью пакета <strong>ClustrX</strong> осущест<strong>в</strong>ляется упра<strong>в</strong>ление <strong>в</strong>сей аппаратной частью и <strong>в</strong>семи<br />
приложениями кластерной системы.
<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />
<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />
Среднее <strong>в</strong>ремя <strong>в</strong>ыполнения задач – 4 373 часа <strong>в</strong> день
<strong>ClustrX</strong> <strong>в</strong> дейст<strong>в</strong>ии.<br />
<strong>Суперкомпьютер</strong> «Ломоносо<strong>в</strong>»<br />
Среднее количест<strong>в</strong>о уникальных пользо<strong>в</strong>ателей <strong>в</strong> день – 186
Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />
Функционал<br />
Показатели произ<strong>в</strong>одительности пакета <strong>ClustrX</strong> VS другие системы упра<strong>в</strong>ления.<br />
Разработчик Hewlett-Packard T-Platforms<br />
Наимено<strong>в</strong>ание продукта<br />
Упра<strong>в</strong>ление инфрастурктурой<br />
HP Cluster<br />
Management Utility<br />
<strong>ClustrX</strong><br />
Bright<br />
Computing<br />
Bright Cluster<br />
Manager<br />
Adaptive<br />
Computing<br />
Moab Adaptive<br />
HPC Suite<br />
Мониторинг аппаратных компоненто<strong>в</strong> есть есть есть есть<br />
Возможность настройки собст<strong>в</strong>енных параметро<strong>в</strong><br />
мониторинга<br />
есть есть есть есть<br />
Модуль опо<strong>в</strong>ещения о критических событиях есть есть есть есть<br />
А<strong>в</strong>томатизиро<strong>в</strong>анное принятие решений по устранению<br />
нештатных ситуаций<br />
есть есть есть есть<br />
Поддержка работы с менеджерами нагрузки нет есть есть есть<br />
Возможность использо<strong>в</strong>ания распределителей нагрузки<br />
других произ<strong>в</strong>одителей<br />
нет нет есть нет<br />
Упра<strong>в</strong>ление ПО ScaleMP нет нет есть нет
Система упра<strong>в</strong>ления <strong>ClustrX</strong>.<br />
Функционал<br />
Показатели произ<strong>в</strong>одительности пакета <strong>ClustrX</strong> VS другие системы упра<strong>в</strong>ления.<br />
Разработчик Hewlett-Packard T-Platforms<br />
Наимено<strong>в</strong>ание продукта<br />
Упра<strong>в</strong>ление <strong>в</strong>ычислительным комплексом<br />
HP Cluster<br />
Management Utility<br />
<strong>ClustrX</strong><br />
Bright<br />
Computing<br />
Bright Cluster<br />
Manager<br />
Adaptive<br />
Computing<br />
Moab Adaptive<br />
HPC Suite<br />
Максимальное количест<strong>в</strong>о обслужи<strong>в</strong>аемых узло<strong>в</strong> 4096 более 10 000 более 10 000 н/д<br />
Графический интерфейс упра<strong>в</strong>ления есть есть есть есть<br />
Поддержка графического интерфейса для различных<br />
операционных систем<br />
Linux Linux<br />
Linux,<br />
Windows,<br />
MacOS<br />
н/д<br />
Web-интерфейс нет есть есть есть<br />
Поддержка нескольких кластеро<strong>в</strong> одно<strong>в</strong>ременно нет есть есть нет<br />
Экспертная система упра<strong>в</strong>ления энергопотреблением нет нет нет есть<br />
Упра<strong>в</strong>ление пользо<strong>в</strong>ателями и политиками нет есть есть нет<br />
Упра<strong>в</strong>ление группами есть есть есть нет<br />
Мониторинг <strong>в</strong>ыполнения <strong>в</strong>ычислительных задач нет есть есть есть<br />
Статистика по <strong>в</strong>ыполняемым задачам нет есть есть есть<br />
Планиро<strong>в</strong>ание задач нет есть есть есть
Будущее СlustrX. <strong>ClustrX</strong> 2.0<br />
Планируемая дата <strong>в</strong>ыхода: октябрь 2012 года<br />
Но<strong>в</strong>ые <strong>в</strong>озможности:<br />
� Коробочная <strong>в</strong>ерсия программного пакета – устано<strong>в</strong>очный диск, документация,<br />
техническая поддержка;<br />
� Поддержка third-party менеджеро<strong>в</strong> ресурсо<strong>в</strong>;<br />
� Полная статистика использо<strong>в</strong>ания кластера, интеграция <strong>в</strong> продукт механизмо<strong>в</strong> HOPSA;<br />
� Многоуро<strong>в</strong>не<strong>в</strong>ый аудит;<br />
� А<strong>в</strong>томатическое/полу-а<strong>в</strong>томатическое раз<strong>в</strong>ерты<strong>в</strong>ание на мини-кластера.
О компании<br />
� Осно<strong>в</strong>ана <strong>в</strong> 2002 году<br />
� Предоста<strong>в</strong>ляет полный спектр программно-аппаратных решений и услуг <strong>в</strong> области HPC<br />
� Я<strong>в</strong>ляется одним из лидеро<strong>в</strong> миро<strong>в</strong>ого суперкомпьютерного рынка<br />
� Доля компании на суперкомпьютерном рынке России и СНГ соста<strong>в</strong>ляет около 40%<br />
� Реализо<strong>в</strong>ала более 200 суперкомпьютерных проекто<strong>в</strong><br />
� Объем продаж компании <strong>в</strong> 2011 году соста<strong>в</strong>ил $83,5 млн.<br />
� Разработчик самых мощных суперкомпьютеро<strong>в</strong> СНГ 2004, 2007, 2009, 2009 и 2011 гг.<br />
� Шесть решений компании <strong>в</strong>ошли <strong>в</strong> рейтинг TOP500 самых мощных суперкомпьютеро<strong>в</strong> мира
Спасибо за <strong>в</strong>нимание!