20.01.2013 Views

Моделирование астрофизических струйных выбросов на ...

Моделирование астрофизических струйных выбросов на ...

Моделирование астрофизических струйных выбросов на ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

рассматриваемый пространственный узел. Именно в таких задачах <strong>на</strong>иболее эффективными<br />

оказываются вычисления <strong>на</strong> графических ускорителях благодаря относительно низкой<br />

доле времени обменов между памятью ускорителя и основной памятью узла в общем времени<br />

вычислений. В этом случае узел кластера используется как модуль с одним вычислительным<br />

ядром, включающим одно из процессорных ядер, один графический ускоритель с<br />

интегрированной памятью и 96 Гб памяти общего <strong>на</strong>з<strong>на</strong>чения. Вычисление всей совокупности<br />

интегралов вида (7) в данном пространственном узле производится в рамках блока<br />

тредов одного графического мультипроцессора, а каждый отдельный интеграл вычисляется<br />

в рамках одного треда в указанном блоке. При этом загрузка распределения интенсивности<br />

и телесных углов для данного пространственного узла и данной сферы <strong>на</strong>правлений<br />

производится однократно, обеспечивая данные для всего блока тредов.<br />

Использование указанных подходов позволило существенно ускорить работу программного<br />

комплекса. В частности, процедура трассировки и интегрирования УПИ вдоль луча с<br />

использованием технологии OpenMP <strong>на</strong> 12-ядерном узле кластера К-100 выполняется в 10.8<br />

раз быстрее, чем <strong>на</strong> одном процессорном ядре, а процедура вычисления источников рассеяного<br />

излучения во всех пространственных узлах выполняется <strong>на</strong> графическом процессоре<br />

nVidia Tesla в 82.3 быстрее, чем <strong>на</strong> одном процессорном ядре (все измерения производились<br />

<strong>на</strong> одном узле кластера К-100, процессор Intel Xeon X5670 2.93ГГц).<br />

5. Результаты расчетов<br />

Вычисления производились с использованием кластера К-100 ИПМ им. М.В. Келдыша<br />

РАН. Использованы треугольные сетки, состоящие из 8000 ячеек, со сгущением у диска.<br />

Проведе<strong>на</strong> серия вычислительных экспериментов для разных вариантов граничных условий<br />

<strong>на</strong> тонком диске. Подробно рассмотрим случай, когда плотность ветра с тонкого диска<br />

ограниче<strong>на</strong> снизу величиной ρw. Шаг по времени в расчетах выбирался автоматически<br />

в зависимости от скорости течения плазмы в расчетной области. Во избежание развития<br />

неустойчивостей число Куранта принималось равным CF L = 0.05.<br />

5.1. Ускорение выброса в ка<strong>на</strong>ле<br />

Начальными условиями для расчетов служат распределения величин в момент времени<br />

t = 18.05, полученные в [5]. В рассматриваемой области существует замагниченный ка<strong>на</strong>л,<br />

внутри которого движется разреженное вещество струйного выброса, причем плотность<br />

вещества падает с удалением от центральной области (рис. 3).<br />

Рис. 5. Начальное распределение интенсивности I и модуля силы давления излучения<br />

„Включение“ поля излучения приводит к возникновению дополнительной ускоряющей<br />

силы, действующей <strong>на</strong> разреженное вещество, причем величи<strong>на</strong> этой силы тем больше, чем<br />

106

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!