Моделирование астрофизических струйных выбросов на ...
Моделирование астрофизических струйных выбросов на ...
Моделирование астрофизических струйных выбросов на ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
рассматриваемый пространственный узел. Именно в таких задачах <strong>на</strong>иболее эффективными<br />
оказываются вычисления <strong>на</strong> графических ускорителях благодаря относительно низкой<br />
доле времени обменов между памятью ускорителя и основной памятью узла в общем времени<br />
вычислений. В этом случае узел кластера используется как модуль с одним вычислительным<br />
ядром, включающим одно из процессорных ядер, один графический ускоритель с<br />
интегрированной памятью и 96 Гб памяти общего <strong>на</strong>з<strong>на</strong>чения. Вычисление всей совокупности<br />
интегралов вида (7) в данном пространственном узле производится в рамках блока<br />
тредов одного графического мультипроцессора, а каждый отдельный интеграл вычисляется<br />
в рамках одного треда в указанном блоке. При этом загрузка распределения интенсивности<br />
и телесных углов для данного пространственного узла и данной сферы <strong>на</strong>правлений<br />
производится однократно, обеспечивая данные для всего блока тредов.<br />
Использование указанных подходов позволило существенно ускорить работу программного<br />
комплекса. В частности, процедура трассировки и интегрирования УПИ вдоль луча с<br />
использованием технологии OpenMP <strong>на</strong> 12-ядерном узле кластера К-100 выполняется в 10.8<br />
раз быстрее, чем <strong>на</strong> одном процессорном ядре, а процедура вычисления источников рассеяного<br />
излучения во всех пространственных узлах выполняется <strong>на</strong> графическом процессоре<br />
nVidia Tesla в 82.3 быстрее, чем <strong>на</strong> одном процессорном ядре (все измерения производились<br />
<strong>на</strong> одном узле кластера К-100, процессор Intel Xeon X5670 2.93ГГц).<br />
5. Результаты расчетов<br />
Вычисления производились с использованием кластера К-100 ИПМ им. М.В. Келдыша<br />
РАН. Использованы треугольные сетки, состоящие из 8000 ячеек, со сгущением у диска.<br />
Проведе<strong>на</strong> серия вычислительных экспериментов для разных вариантов граничных условий<br />
<strong>на</strong> тонком диске. Подробно рассмотрим случай, когда плотность ветра с тонкого диска<br />
ограниче<strong>на</strong> снизу величиной ρw. Шаг по времени в расчетах выбирался автоматически<br />
в зависимости от скорости течения плазмы в расчетной области. Во избежание развития<br />
неустойчивостей число Куранта принималось равным CF L = 0.05.<br />
5.1. Ускорение выброса в ка<strong>на</strong>ле<br />
Начальными условиями для расчетов служат распределения величин в момент времени<br />
t = 18.05, полученные в [5]. В рассматриваемой области существует замагниченный ка<strong>на</strong>л,<br />
внутри которого движется разреженное вещество струйного выброса, причем плотность<br />
вещества падает с удалением от центральной области (рис. 3).<br />
Рис. 5. Начальное распределение интенсивности I и модуля силы давления излучения<br />
„Включение“ поля излучения приводит к возникновению дополнительной ускоряющей<br />
силы, действующей <strong>на</strong> разреженное вещество, причем величи<strong>на</strong> этой силы тем больше, чем<br />
106