20.01.2013 Views

k - 50

k - 50

k - 50

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

АЛГОРИТМЫ РЕШЕНИЯ ОБРАТНЫХ<br />

ГЕОФИЗИЧЕСКИХ ЗАДАЧ НА<br />

МНОГОПРОЦЕССОРНЫХ<br />

ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ<br />

Е.Н. Акимова 1 , Д.В. Белоусов 1 , В.Е. Мисилов 2<br />

1 Институт математики и механики УрО РАН<br />

2 Уральский федеральный университет<br />

г. Екатеринбург


Аннотация<br />

Для решения обратной задачи гравиметрии о нахождении плотности в слое<br />

итерационными методами градиентного типа и обратной задачи гравиметрии о<br />

восстановлении поверхности раздела между средами с помощью итеративно<br />

регуляризованного метода Ньютона, а также для решения СЛАУ с блочно-<br />

трехдиагональными матрицами применительно к задачам электроразведки<br />

построены параллельные прямые и итерационные алгоритмы.<br />

Алгоритмы реализованы на многопроцессорных системах различного типа:<br />

многопроцессорном комплексе МВС-ИММ, графических процессорах NVIDIA и<br />

многоядерном процессоре Intel с использованием новых вычислительных технологий.<br />

Параллельные алгоритмы встроены в разработанную систему удаленных<br />

вычислений «Специализированный Веб-портал решения задач<br />

на многопроцессорных вычислителях».<br />

Решены задачи с квази-модельными и реальными данными.<br />

Работа выполнена при поддержке УрО РАН в рамках программы фундаментальных<br />

исследований Президиума РАН № 18 «Алгоритмы и математическое обеспечение для<br />

вычислительных систем сверхвысокой производительности».<br />

2


1. Методы решения обратных задач гравиметрии<br />

Важнейшими задачами исследования структуры земной коры являются обратные<br />

задачи гравиметрии: нахождение плотности в слое и поверхности раздела.<br />

1.1. Задача о нахождении плотности в слое (линейная)<br />

Одной из важнейших моделей строения земной коры является модель горизонтальной<br />

слоистой среды. Плоскость xOy совпадает с дневной поверхностью, ось z направлена вниз.<br />

Рассм. линейная обратная задача гравиметрии о нахождении переменной плотности � xy<br />

в гориз. или кривол. слое<br />

3<br />

П �{( x, y, z) �R : ( x, y) �D, H ( x, y) � z � H ( x, y)}<br />

( , )<br />

1 2<br />

2<br />

D �{( x, y) �R : a � x � b, c � y � d}.<br />

по грав. данным, измеренным на площади земной поверхности<br />

Используется априорная информация об отсутствии аномалий плотности вне слоя с<br />

криволинейными границами H1 H1 ( x, y)<br />

и такими, что<br />

и выпол. условие Распределение плотности внутри слоя не зависит от z.<br />

� H2 H2 ( x, y)<br />

� H1�H2 �(<br />

x, y)<br />

H ( x, y) �h�const. i i<br />

Рис. 1. Модель среды<br />

3


Два этапа решения задачи гравиметрии<br />

1 этап – выделение аномального поля<br />

(методика П.С. Мартышко, И.Л. Пруткина, см. [1])<br />

2 этап – нахождение плотности в слое<br />

Задача сводится к решению линейного двумерного интегрального уравнения<br />

Фредгольма первого рода для нахождения искомой плотности [2]<br />

� �<br />

bd<br />

� 1 1<br />

�<br />

A� � f ���<br />

� 1 1 ��(<br />

x�, y�) dx�dy� � �g(<br />

x, y),<br />

2 2 2 2 2 2 2<br />

2<br />

a c���x�x����y�y���H1<br />

( x�, y�) � �� x � x�� � � y � y�� � H 2 ( x�, y�)<br />

� �<br />

��<br />

� � � �<br />

(1)<br />

f � ( , )<br />

где гравитационная постоянная, �gxy� гравитационный эффект,<br />

порождаемый источниками в горизонтальном или криволинейном слое.<br />

Задача гравиметрии (1) относится к классу некорректно поставленных задач, решение<br />

которой обладает сильной чувствительностью к погрешности правой части, полученной в<br />

результате измерений и предварительной обработки геофизических данных.<br />

____________________________________________________________________<br />

[1]. Мартышко П.С., Пруткин И.Л. Технология разделения источников гравитационного поля<br />

по глубине // Геофизический журнал. 2003. Т. 25. № 3. С. 159�168.<br />

[2]. Мартышко П.С., Кокшаров Д.Е. Об определении плотности в слоистой среде по гравитационным<br />

данным // Геофизический журнал. 2005. Т. 27. № 4. С. 678-684.<br />

4


Методы решения с регуляризацией<br />

После дискретизации уравнения (1) на сетке n �M�N, где задана правая<br />

часть �g(<br />

x, y),<br />

и аппроксимации интегрального оператора по квадратурным<br />

формулам задача (1) сводится к решению СЛАУ с плохо обусловленной<br />

либо симметричной матрицей (горизонтальный слой), либо несимметричной<br />

матрицей (криволинейный слой)<br />

( A��E) z �b,<br />

схема Лаврентьева (2)<br />

В случае криволинейного слоя СЛАУ предварительно преобразуется к виду<br />

�, ��� T T<br />

( A A���E) z �<br />

A b. схема Тихонова (3)<br />

где параметры регуляризации.<br />

Для решения СЛАУ (2) и (3) используются итерационные методы градиентного типа [3].<br />

____________________________________________________________<br />

[3]. Васин В.В., Еремин И.И. Операторы и итерационные процессы Фейеровского типа.<br />

Теория и приложения. Екатеринбург, 2005.<br />

5


Методы решения СЛАУ (заполненная матрица)<br />

1. Итеративно регуляризованный метод простой итерации (МПИ)<br />

� 1<br />

� � [( � ) � ], �max � A��E k 1 k k<br />

z z A �E<br />

z b<br />

где макс. соб. знач.<br />

�max<br />

(симм. случай)<br />

2. Метод минимальных невязок (ММН)<br />

k k<br />

k�1 k ( A( Az �b), Az �b)<br />

k<br />

z � z � ( Az �b);<br />

k<br />

2<br />

A( Az �b)<br />

3. Метод наискорейшего спуска (МНС)<br />

k�1 k<br />

z � z �<br />

T k<br />

A Az<br />

T<br />

2<br />

� A b T<br />

A<br />

k<br />

Az �b<br />

T k T<br />

A( A Az � A b)<br />

2 ( );<br />

4. Метод минимальной ошибки (ММО)<br />

k�1 k<br />

z � z �<br />

k<br />

2<br />

Az � b T<br />

A<br />

k<br />

Az � b<br />

T k<br />

A ( Az � b)<br />

2 ( );<br />

5. Метод сопряженных градиентов (МСГ)<br />

6. Прямой метод квадратного корня (МКК)<br />

(СЛАУ с симметр. положит. опред. матрицей)<br />

A � A��E k<br />

Az � b<br />

b<br />

��� останов по невязке<br />

6


Параллельная реализация на суперкомпьютере<br />

Для решения линейной обратной задачи гравиметрии устойчивые итерационные<br />

методы градиентного типа численно реализованы на МВС - российском суперкомпьютере<br />

кластерного типа с распределенной памятью.<br />

ИММ УрО РАН : суперкомпьютеры «Уран», МВС-1000/17EK, МВС-ИММ.<br />

МВС-ИММ: 14 2-х процессорных 2-х ядерных модулей AMD Opteron 64 bit (2.6 ГГц);<br />

интерфейс GbitEthernet; 112 Гб оперативной памяти.<br />

Параллельные численные алгоритмы реализованы с помощью библиотеки MPI [4]<br />

на языке Фортран. Распараллеливание итерационных методов основано на разбиении<br />

матрицы A горизонтальными полосами на m блоков, а вектора решения z и<br />

вектора правой части b СЛАУ на m частей так, что n �m�L, где n � размерность<br />

системы уравнений, m � число процессоров, L � число строк матрицы в блоке.<br />

На текущей итерации каждый процессор вычисляет свою часть вектора решения.<br />

Host – processor<br />

1– processor<br />

2 – processor<br />

…<br />

m – processor<br />

Рис. 2. Схема распределения данных по процессорам<br />

______________________________________________________________________<br />

[4]. Воеводин Вл.В. Технологии параллельного программирования. URL: http://parallel.ru/<br />

7


Реализация на ГВС с графическими процессорами<br />

ИММ УрО РАН : кластер NVIDIA Tesla включает 20 вычислительных узлов.<br />

Каждый узел содержит 8 GPU Тesla S20<strong>50</strong>, <strong>50</strong> Гб ОЗУ и 2 шестиядерных CPU.<br />

ГВС-1 (отдел некорректных задач анализа ИММ УрО РАН)<br />

ГВС-2 (кафедра ВМ и УМФ УрФУ)<br />

Характеристики СPU-1:<br />

Частота процессора (ГГц)<br />

Оперативная память (Гб)<br />

Характеристики GPU-1:<br />

Количество процессорных ядер<br />

Частота ядра (МГц)<br />

Частота процессора (МГц)<br />

Количество видеопамяти (Мб)<br />

Характеристики СPU-2:<br />

Частота процессора (ГГц)<br />

Оперативная память (Гб)<br />

Характеристики GPU-2:<br />

Количество процессорных ядер<br />

Частота ядра (МГц)<br />

Частота процессора (МГц)<br />

Количество видеопамяти (Мб)<br />

4-ядер. Intel Core I5-7<strong>50</strong><br />

2.66<br />

Таблица 1. Технические характеристики ГВС1 и ГВС2<br />

8<br />

NVIDIA GeForce GTX 285<br />

240<br />

648<br />

1476<br />

1024<br />

4-ядер. Intel Core I7-9<strong>50</strong><br />

3.06<br />

8<br />

NVIDIA GeForce GTX 480<br />

480<br />

700<br />

1401<br />

1536<br />

8


Оптимизация работы с памятью<br />

Для решения линейной обратной задачи гравиметрии о восстановлении плотности<br />

в слое итерационные методы градиентного типа реализованы на графических<br />

процессорах NVIDIA с помощью технологии CUDA [5].<br />

Для оптимизации работы с памятью при вычислениях используются два приема.<br />

1. Для сеток не очень большой размерности (размер СЛАУ ), когда данные входят<br />

в память видеокарты, матрица A порядка n и вектор z размерности n расширяются до<br />

размерности M и дополняются нулями таким образом, чтобы M было кратно числу<br />

блоков. Размер блока BLOCK_SIZE (threads) выбирается кратным 16, поскольку в одном<br />

блоке группируются до 512 потоков. Тогда количество блоков вычисляется по<br />

формуле: blocks=M/BLOCK_SIZE. Вычисления производятся без выгрузки данных в<br />

память Host-процессора. Данные находятся только в памяти видеокарты.<br />

2. Для сеток довольно большой размерности (размер СЛАУ), когда данные не<br />

входят в память видеокарты, наилучшим по быстродействию оказывается метод<br />

вычисления элементов матрицы A «на лету», т.е. вычисление значения элемента<br />

матрицы происходит в момент обращения к этому элементу без сохранения его в<br />

память видеокарты. Это позволяет существенно снизить количество обращений к<br />

памяти видеокарты и заметно ускорить процесс вычислений по сравнению с хранением<br />

матрицы A в памяти Host-процессора и порционной загрузкой в видеоускоритель для<br />

вычислений.<br />

______________________________________________________________________________________________________<br />

[5]. Берилло А. NVIDIA CUDA – неграфические вычисления на графических процессорах.<br />

URL: http://www.ixbt.com/video3/cuda-1.shtml<br />

9


1.2. Задача о нахождении поверхности раздела<br />

между средами (нелинейная)<br />

Рассматривается трехмерная структурная обратная задача гравиметрии<br />

о восстановлении поверхности раздела между средами по известному скачку плотности<br />

и гравитационному полю, измеренному на некоторой площади земной поверхности.<br />

Предполагается, что нижнее полупространство состоит из нескольких слоев<br />

постоянной плотности, разделенных искомыми поверхностями Si.<br />

Плоскость xOy совпадает с дневной поверхностью, ось направлена вниз.<br />

z<br />

Рис. 3. Модель среды<br />

10


В предположении, что гравитационная аномалия создана отклонением искомой<br />

поверхности S от горизонтальной плоскости z H,<br />

в декартовой системе координат<br />

функция z � z( x, y),<br />

описывающая искомую поверхность раздела, удовлетворяет<br />

нелинейному двумерному интегральному уравнению Фредгольма первого рода [6]<br />

�<br />

� �<br />

bd<br />

� 1 1<br />

�<br />

A[ z] � f �� ���<br />

� 1 1 �dx�dy��G(<br />

x, y),<br />

2 2 2 2 2 2 2 2<br />

a c���x�x����y�y���z(<br />

x�, y�) � �� x � x�� � � y � y�� � H � �<br />

��<br />

� � � �<br />

f � �<br />

где гравитационная постоянная, скачок плотности на границе раздела сред,<br />

G( x, y) � аномальное гравитационное поле,<br />

асимптотическая плоскость для данной поверхности раздела.<br />

z�H� � �<br />

Предварительная обработка гравитационных данных, связанная с выделением<br />

аномального поля, выполняется по методике [1].<br />

________________________________________________________________________________<br />

[6]. Нумеров Б.В. Интерпретация гравитационных наблюдений в случае одной контактной поверхности //<br />

ДАН СССР. 1930. № 21. С. 569-574.<br />

(4)<br />

11


Метод Ньютона<br />

Уравнение гравиметрии является существенно некорректной задачей, решение<br />

обладает сильной чувствительностью к погрешности правой части, полученной<br />

в результате измерений и предварительной обработки геофизических данных.<br />

n �M� N,<br />

G( x, y),<br />

После дискретизации уравнения (4) на сетке где задана правая часть<br />

и аппроксимации интегрального оператора по квадратурным формулам<br />

имеем систему нелинейных уравнений<br />

A [ z] � F . (5)<br />

n n<br />

Для решения системы (5) используется итеративно регуляризованный метод Ньютона [7]<br />

�1<br />

� � � �<br />

k�1 k k k k<br />

z � z � �A� n z �kI��Anz�k( z H) F �<br />

�<br />

�<br />

� �<br />

� � � n �<br />

. (6)<br />

k<br />

Здесь An�z�, Fn � конечномерные аппроксимации интегрального оператора и правой части (6),<br />

k<br />

k<br />

A' ( z ) � дискретизация производной оператора A в точке ; � �параметры<br />

регуляризации.<br />

n<br />

z<br />

z k<br />

k�1<br />

k<br />

Нахождение очередного приближения по найденному сводится к решению СЛАУ<br />

� �<br />

k k<br />

n n k<br />

A z F<br />

k k�1 k<br />

n � n<br />

, (7)<br />

A � A� z �� I � n�n где плохо обусловленная несимметричная заполненная матрица,<br />

� �<br />

� � � � � ��<br />

k k k k k<br />

F A z A z � z F<br />

n n вектор размерности<br />

� n k n �<br />

_______________________________________________________________________<br />

12<br />

[7]. Bakushinsky A., Goncharsky A. Ill-Posed Problems:Theory and Applications. London: Кluwer Publishers.1994.<br />

z<br />

n.


Методы решения СЛАУ<br />

Предварительно система (7) приводится к виду<br />

k k�1kTk'k�1kTk B z � �<br />

�( An ) An �� kI �<br />

�z�(<br />

An ) Fn � b.<br />

(8)<br />

k T<br />

( A ) �<br />

'<br />

� �<br />

где транспонированная матрица, параметры регуляризации.<br />

n<br />

На каждом шаге метода Ньютона используются итерационные методы градиентного типа.<br />

1. Итеративно регуляризованный метод простой итерации (МПИ)<br />

k�1 k 1 k<br />

z � z � [( A� �E)<br />

z �b],<br />

(9)<br />

�max<br />

� � A��E где максимальное собственное значение матрицы (симметр. случай),<br />

max<br />

2. Метод сопряженных градиентов в регуляризованном варианте (МСГ)<br />

� k<br />

k�1 k<br />

z � z<br />

�<br />

k k k k�1<br />

��k( B z �b) � �k(<br />

z � z ), (10)<br />

где k и вычисляются по известным формулам [8].<br />

k k<br />

B z � b<br />

Условие останова по невязке :<br />

�<br />

� .<br />

b<br />

Численная реализация и распараллеливание метода Ньютона с использованием<br />

итерационных градиентных методов выполнена на МВС-ИММ.<br />

___________________________________________________________________________<br />

[8]. Фаддеев В.К., Фаддеева В.Н. Выч. методы лин. алгебры. М.: Гос. изд. физ.�мат. лит., 1963.<br />

k<br />

13


2. Параллельные алгоритмы решения СЛАУ с<br />

блочно-трехдиагональными матрицами<br />

Важнейшими задачами исследования неоднородности земной коры являются задачи электроразведки.<br />

Одним из известных методов электроразведки является метод вертикального электрического зондирования<br />

(ВЭЗ). После использования конечно-разностной аппроксимации задача ВЭЗ сводится к решению СЛАУ с<br />

блочно-трехдиагональной матрицей [9]. Другой важной задачей электроразведки является задача бокового<br />

каротажного зондирования (БКЗ). В работе [10] показано, что после использования конечно-разностной<br />

аппроксимации задача БКЗ сводится к решению СЛАУ с блочно-трехдиаг. матрицей большой размерности.<br />

Рис. 4. Вид матрицы СЛАУ<br />

Для решения СЛАУ с блочно-трехдиаг. матрицами применительно к задачам электроразведки используются<br />

параллельные алгоритмы матричной прогонки (ПАМП), квадратного корня (ПАКК) и ПМСГ с предобуславливателем<br />

(СЛАУ с симметр. положит.-определ. матрицей).<br />

Реализация на многоядерном процессоре Intel с помощью OpenMP.<br />

______________________________________________________________________________________________<br />

[9]. Тихонов А.Н., Самарский А.А. Уравнения математической физики. М.: Наука, 1966.<br />

[10]. Дашевский Ю.А., Суродина И.В., Эпов М.И. Квазитрехмерное математическое моделирование<br />

диаграмм неосесим. зондов пост. тока в анизотропных разрезах // Cиб. ЖИМ. 2002. Т. 5. № 3(11). С. 76-91.


2.1. Параллельный алгоритм матричной прогонки<br />

где Yi и искомые и заданные векторы размерности n, квадратные матрицы порядка n.<br />

i<br />

Будем предполагать, что исходная область P – прямоугольник. Разобьем P на L подобластей вертикальными<br />

линиями так, что В качестве параметров выберем векторы связывающие неизвестные<br />

на сетке по вертикали. В подобластях, определяемых интервалами (K,K+M), рассмотрим задачи<br />

F � Ai , Bi , Ci �<br />

N �L� M .<br />

YK , K � 0, M,..., N ,<br />

Рис. 5. Разбиение области<br />

�С0Y0 � B0Y1 � F0 , i � 0<br />

�<br />

��AY<br />

i i�1�CiYi�BY i i�1 � Fi , i �1,..., N �1<br />

�<br />

��AN<br />

YN �1<br />

� CNYN � FN , i � N,<br />

�<br />

�1��0� 1 1 1 1 �<br />

0<br />

� 1 �<br />

..<br />

�<br />

��AU i i�1�CU i i � BU i i�1 � 0, U K � � �, U ,<br />

.. K �M<br />

� � �<br />

0<br />

�<br />

� � � �<br />

0 0<br />

�<br />

� � � �<br />

� . . . . . . . . . . . . .<br />

�<br />

�0��0� n n n n �<br />

..<br />

� n �<br />

AU ..<br />

�<br />

�� i i�1�CU i i � BU i i�1 � 0, U K � � �, U .<br />

0 K �M<br />

� � �<br />

� � �<br />

0<br />

��<br />

�<br />

�1��0� �0��1� � 1 1 1 1 �<br />

0<br />

� 1 �<br />

0<br />

�<br />

��AV<br />

i i�1�CV i i � BV i i�1 � 0, VK � � �, V ,<br />

.. K �M<br />

� � �<br />

� � �<br />

..<br />

�<br />

0 0<br />

�<br />

� � � �<br />

� . . . . . . . . . . . . .<br />

�0��0� � n n n n �<br />

..<br />

� n �<br />

AV ..<br />

�<br />

i i�1 CV i i BV i i�1 0, VK � �, V .<br />

0 K �M<br />

� �<br />

��<br />

� � � � �<br />

� � �<br />

0<br />

�<br />

�<br />

�0��1� �0��0� �<br />

0<br />

� �<br />

0<br />

�<br />

i i�1 i i i i�1 i, K<br />

� �, ,<br />

.. K M<br />

� �<br />

� �<br />

�<br />

�<br />

..<br />

�<br />

�0��0� �AW � CW � BW � F W � W � i � K �1, ..., K � M �1.<br />

_____________________________________________________________________<br />

[11]. Акимова Е.Н. Распараллеливание алгоритма матричной прогонки // Математическое<br />

моделирование. М.: Наука, 1994. Т. 6. № 9. C. 61- 67.<br />

(11)<br />

(12)<br />

(13)<br />

(14)


1 n<br />

1 n<br />

Утверждение 1. Если Ui,..., Ui �решения<br />

задач (12), Vi ,..., Vi � решения задач (13),<br />

W � решения задачи (14), Yi � решения исходной задачи (11) на ( K, K M),<br />

тогда<br />

�<br />

i<br />

После подстановки (15) в (11) получим систему относительно параметров<br />

U K<br />

1 2 n 1 2 n<br />

� � � �<br />

Y � U U ... U Y � V V ... V Y �W<br />

. (15)<br />

i i i i K i i i K �M<br />

i<br />

� 0 0 1� 0 � 0 1� M 0 0 1<br />

� � � � � �<br />

� C � B U Y � B V Y � F � B W , K � 0;<br />

�<br />

��<br />

AKU K �1 YK �M � CK � AKVK �1 � BKU K �1 YK � BKVK �1 YK<br />

�M<br />

�<br />

�<br />

��<br />

FK � AKWK �1�BKWK�1, K � M , 2 M , ..., N � M;<br />

�<br />

���<br />

ANU N �1�YN �M ��C N � ANVN �1�YN � FN � ANWN �1,<br />

K � N,<br />

где K и V � квадратные матрицы порядка n.<br />

Y , K � 0, M,..., N .<br />

Схема параллельного алгоритма матричной прогонки: (12)-(13)-(14) → (16) → (15).<br />

Задача (16) решается классическим алгоритмом матричной прогонки.<br />

Задачи (12)-(13)-(14) и (15) решаются независимо на L процессорах.<br />

Утверждение 2. Если для исходной системы (11) выполняются достаточные условия устойчивости<br />

метода матричной прогонки по А.А. Самарскому [12]<br />

C B C A C A C B i N<br />

�1 �1 �1 �1<br />

0 0 �1, N N �1, i i � i i �1, �1,..., �1,<br />

причем хотя бы одно из неравенств – строгое, то эти же условия достаточны и для устойчивости метода<br />

матричной прогонки при решении системы уравнений (15) относительно параметров Y<br />

(см. [11]).<br />

____________________________________________________________________________________________<br />

[11]. Акимова Е.Н. Распараллеливание алгоритма матричной прогонки // Математическое моделирование.<br />

М.: Наука, 1994. Т. 6. № 9. C. 61- 67.<br />

[12]. Самарский А.А., Николаев Е.С. Методы решения сеточных уравнений. М.: Наука, 1978.<br />

K<br />

K<br />

(16)


2.2. Параллельный метод сопряженных<br />

градиентов с предобуславливателем<br />

МСГ – эффект. итерационный метод решения СЛАУ с симметричной положительно-определенной матрицей [8].<br />

Введение предобуславливания применяется с целью сущест. ускорения сходимости итерационного процесса.<br />

Ax � b<br />

Исходная СЛАУ заменяется на<br />

Условием выбора предобуславливателя C является следующее:<br />

� �<br />

cond A cond A cond A cond A A C A<br />

� �<br />

Для СЛАУ (17) МСГ с предобуславливателем имеет вид<br />

�1 �1<br />

C Ax � C b.<br />

(17)<br />

max max<br />

�1<br />

( ) �� ( ), ( ) � , ( ) � , � . (18)<br />

0 0 0 �1<br />

0 0 0<br />

r � b � Ax , p � C r , z � p ,<br />

( r , z )<br />

, ,<br />

( Ap , p )<br />

k k<br />

k �1<br />

�<br />

k<br />

��k k<br />

�k<br />

� k k<br />

x x p<br />

k<br />

Az � b<br />

b<br />

��� условие останова по невязке.<br />

min min<br />

r � r �� Ap , z � C r ,<br />

k �1 k k k �1 �1 k �1<br />

k<br />

k�1 k�1<br />

k �1 k �1<br />

k ( r , z )<br />

� � �k �k<br />

� k k<br />

p z p<br />

Распараллеливание МСГ с предобуславливателем см. выше (рис. 2).<br />

, . (19)<br />

( r , z )<br />

__________________________________________________________________________________________________________<br />

[8]. Фаддеев В.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.: Гос. издат. физ.-мат. литературы, 1963.


2.3. Метод квадратного корня<br />

Метод квадратного корня – быстрый метод решения СЛАУ с симметричной положительноопределенной<br />

матрицей [8]. МКК основан на разложении матрицы А в произведение<br />

T<br />

A � S S , где S � верхняя треугольная матрица с положит. элементами на главной диагонали,<br />

T<br />

S � транспонированная матрица. Метод состоит в последовательном решении двух систем<br />

T<br />

S y �b, Sz � y.<br />

Решения (20) находятся по рекуррентным формулам<br />

�y<br />

� b s ,<br />

�<br />

�<br />

�<br />

�y �<br />

��<br />

i � n<br />

�z<br />

� y s<br />

n n nn<br />

1 1 11<br />

�<br />

i�1<br />

n �<br />

bi ��<br />

ski y<br />

� y<br />

k<br />

i � � sik zk<br />

k �1<br />

k�� i 1<br />

i<br />

, 2,3,...., ;<br />

i<br />

s<br />

s<br />

ii<br />

ii<br />

_________________________________________________________________________________________________________<br />

[8]. Фаддеев В.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.: Гос. издат. физ.-мат. литературы, 1963.<br />

,<br />

�z � , i � n �1, n � 2,...,1.<br />

��<br />

Распараллеливание МКК для вычислителя с общей памятью основано на параллельном вычислении<br />

s , j � i,..., n,<br />

каждой i � ой строки матрицы S.<br />

Строка с номером i разбивается на m<br />

частей.<br />

ij<br />

1 –<br />

процессор<br />

2 –<br />

процессор<br />

…<br />

m –<br />

процессор<br />

Рис. 6. Разбиение i � ой строки по процессорам<br />

(20)<br />

(21)


3. Специализированный Веб-портал<br />

Параллельные алгоритмы решения обратных задач гравиметрии и параллельные алгоритмы решения СЛАУ<br />

для задач электроразведки встроены в разработанную систему удаленных вычислений (ОНЗАП ИММ УрО РАН).<br />

Предназначен для запуска программ решения задач на МВС, кластере NVIDIA Tesla и GPU NVIDIA GeForce.<br />

Рис. 7.<br />

19


Специализированный Веб-портал<br />

Изначально Веб-портал предназ. для запуска программ решения задач гравиметрии на МВС-1000/17EK.<br />

Веб-портал предоставляет возможность пользователю через Веб-интерфейс выбирать тип вычислителя с<br />

указанием числа процессорных узлов, вид задачи и метод ее решения, загружать входные данные, получать<br />

выходные данные и графическое изображение результатов решения с помощью графических пакетов<br />

Surfer и gnuplot. Для каждой задачи выводится время счета.<br />

Веб-портал состоит из трех основных частей : HTTP-сервер IIS (информационные службы Интернета),<br />

на котором установлено Веб-приложение; база данных SQL Server 2000, в которой хранятся все задачи<br />

пользователей с входными и выходными данными; служба, выполняющая загрузку данных, запуск задач на<br />

многопроцессорных вычислителях различных типов, просмотр состояния задачи и загрузку результатов<br />

завершившихся задач на Веб-портал.<br />

Рис. 8. Архитектура Веб-портала<br />

20


4. Результаты моделирования (Восточный Урал)<br />

На протяжении многолетних исследований в ИГФ УрО РАН выделены протяженные<br />

линейные аномалии векового хода геомагнитного поля – Башкирская аномалия<br />

(юго-западый Урал) и Буткинская аномалия (восточный Урал).<br />

Аномалии связаны с изменением плотности в земной коре.<br />

Рис. 9. Пространственное распределение магнитовариационного поля<br />

(._._ профили наблюдений, V - наблюденное поле, /// - аномальные зоны )<br />

21


4.1. Результаты моделирования (восточный Урал)<br />

Для восточной части Урала обработан массив гравитационных данных,<br />

2<br />

измеренный на площади S : 59.4�144 км .<br />

Площадь пространственно совпадает с зоной Буткинской аномалии векового хода.<br />

Аномальное поле предоставлено сотрудниками ИГФ УрО РАН (г. Екатеринбург).<br />

По реальным наблюденным данным для изучения природы аномалии решены<br />

Задача 1 о нахождении плотности в слое между глубинами<br />

H �10 км, H �20<br />

км.<br />

1 2<br />

Задача 2 о восстановлении поверхности раздела.<br />

Расстояние до асимпт. плоскости<br />

H �15<br />

км.<br />

3<br />

Скачок плотности ���0.2 г / см . Шаги сетки:<br />

После дискретизации обе задачи сводятся к СЛАУ с матрицами<br />

�x�0.594, �y�1.44 км.<br />

10000�10000. Задача 1 решена параллельными МПИ и ММН на МВС-ИММ, NVIDIA Tesla и NVIDIA GeForce.<br />

Задача 2 решена методом Ньютона (на каждом шаге метода � ПМСГ) на МВС-ИММ.<br />

22


Линейная задача (восточный Урал)<br />

Рис. 10. Аномальное разностное гравитационное поле для области<br />

(разность полей, пересчитанных на 10 и 20 км)<br />

S<br />

23


Решение линейной задачи (восточный Урал)<br />

Рис. 11. Распределение восстановленной плотности в слое для области<br />

Интерпретация результатов проведена сотрудниками ИГФ УрО РАН.<br />

Выделен субмеридиональный блок земной коры пониженной плотности (0.2 – 0.3 г/см3).<br />

S<br />

24


Решение нелинейной задачи (восточный Урал)<br />

H �15<br />

км.<br />

Расстояние до асимп. плоскости Скачок плотности<br />

Рис. 12. Восстановленная поверхность раздела для области S<br />

3<br />

���0.2 г / см .<br />

Получены прогибы поверхности, связанные с зонами пониженной плотности.<br />

25


Времена решения линейной задачи гравиметрии<br />

Введем коэф. ускорения и эффективности m 1 m m m<br />

1 2<br />

где Tm � время выполнения параллельного алгоритма на MBC-ИММ либо на многоядерном<br />

процессоре с числом процессоров или ядер m ( m�1), T1 � время выполнения последовательного<br />

алгоритма на одном процессоре либо на одном ядре, T � время решения задачи на видеоускорителе.<br />

Вычислитель<br />

Intel Core I7 (1 ядро)<br />

Intel Core I7 (2 ядра)<br />

Intel Core I7 (4 ядра)<br />

NVIDIA GeForce (480 яд.)<br />

МВС─ИММ (1 проц.)<br />

МВС─ИММ (2 проц.)<br />

МВС─ИММ (4 проц.)<br />

МВС─ИММ (10 проц.)<br />

МВС─ИММ (20 проц.)<br />

МВС─ИММ (<strong>50</strong> проц.)<br />

Время T , мин.<br />

m<br />

Технол. OpenMP<br />

7.73<br />

4.05<br />

2.1<br />

0.2<br />

Технол. MPI<br />

24.33<br />

12.18<br />

6.10<br />

2.46<br />

1.24<br />

0.5<br />

S � T / T , E � S / m, S � T / T ,<br />

Ускорение<br />

либо m S<br />

—<br />

1.91<br />

3.68<br />

38.7<br />

—<br />

1.99<br />

3.99<br />

9.89<br />

19.6<br />

48.7<br />

k<br />

Az �b / b � 0.011, 749 итер, СЛАУ 10000�10000 Эффективность<br />

Em<br />

—<br />

0.96<br />

0.92<br />

—<br />

—<br />

0.99<br />

0.99<br />

0.99<br />

0.98<br />

0.97<br />

Таблица 1. Времена решения линейной задачи гравиметрии (восточный Урал)<br />

2<br />

S<br />

26


Решение нелинейной задачи на МВС-ИММ<br />

(восточный Урал)<br />

В табл. 2 приведены времена счета на МВС-ИММ и коэффициенты ускорения<br />

и эффективности решения нелинейной задачи гравиметрии для области S<br />

итеративно регуляризованным методом Ньютона с использованием ПМСГ<br />

(сетка 100 х 100, матрица СЛАУ 10000 х 10000).<br />

m m T m S m E<br />

(число проц.)<br />

1<br />

3<br />

9<br />

27<br />

(время, мин.)<br />

94.88<br />

40.46<br />

16.52<br />

11.49<br />

(ускорение)<br />

—<br />

2.34<br />

5.74<br />

8.25<br />

(эффективность)<br />

—<br />

0.78<br />

0.64<br />

0.30<br />

81 7.72 12.3 0.15<br />

Таблица 2. Времена решения нелинейной задачи о восстановлении<br />

поверхности раздела (восточный Урал)<br />

27


4.2. Решение задачи о нахождении распределения потенциала<br />

На ГВС решена задача о нахождении распределения потенциала в проводящей среде с известным<br />

квази-модельным решением с помощью параллельных алгоритмов матричной прогонки (ПАМП),<br />

предобусловленного метода сопряженных градиентов (ПМСГ) и метода квадратного корня (ПАКК).<br />

Исходные данные и решение задачи предоставлены лабораторией скважинной геофизики<br />

ИНГГ СО РАН (г. Новосибирск).<br />

После дискретизации задача сводится к решению СЛАУ с плохо обусловленной симметричной<br />

положительно-определенной блочно-трехдиагональной матрицей размерности 76136� 76136<br />

c квадратными блоками порядка 248.<br />

Приближенное решение задачи сравнивалось с модельным решением с помощью вычисления<br />

относительной погрешности<br />

M П M<br />

� � Y �Y / Y � � �<br />

критерий останова ПМСГ.<br />

M<br />

П<br />

Здесь Y � модельное решение, Y � приближенное решение задачи.<br />

cond A<br />

�<br />

max<br />

11 6 �5<br />

( ) � �1.3 �10 , �max�1.4�10 , �min�1.1�10�0,<br />

�min<br />

�<br />

cond A cond A<br />

�<br />

max<br />

9<br />

( ) � � 4.1�10 �<br />

( ).<br />

min


� � �<br />

�7 �7 �7<br />

ПМСГ �10 , ПАМП � 2�10 , ПМКК � 6�10 .<br />

Рис. 13. Численное решение задачи


Времена решения задачи<br />

Метод Вычислитель , сек. (Windows API) T , сек. (OpenMP)<br />

ПМСГ<br />

ПАМП<br />

ПАКК<br />

� � �<br />

�7 �7 �7<br />

ПМСГ �10 , ПАМП � 2�10 , ПМКК � 6�10 .<br />

Tm<br />

МСГ без предобусл: t=10 час.<br />

Intel Core I5 (1 ядро ) 57 21<br />

Intel Core I5 (2 ядра ) 46 16<br />

Intel Core I5 (4 ядра ) 36 14<br />

NVIDIA GeForce (240 яд.) ─ ─<br />

Intel Core I5 (1 ядро ) 52 21<br />

Intel Core I5 (2 ядра ) 28 18<br />

Intel Core I5 (4 ядра ) 16 14<br />

NVIDIA GeForce (240 яд.) ─ 10<br />

Intel Core I5 (1 ядро ) 12 7.4<br />

Intel Core I5 (2 ядра ) 9 4.6<br />

Intel Core I5 (3 ядра ) 10 3.8<br />

Intel Core I5 (4 ядра ) 12 4.2<br />

m


Основные результаты<br />

Для решения линейной обратной задачи гравиметрии о нахождении плотности<br />

в слое итерационными методами градиентного типа и нелинейной обратной задачи<br />

гравиметрии о восстановлении поверхности раздела между средами с помощью<br />

итеративно регуляризованного метода Ньютона, а также для решения СЛАУ<br />

с блочно-трехдиагональными матрицами применительно к задачам электроразведки<br />

построены параллельные прямые и итерационные алгоритмы.<br />

Алгоритмы реализованы на многопроцессорных вычислительных системах<br />

различного типа: многопроцессорном комплексе МВС-ИММ, графических процессорах<br />

NVIDIA и многоядерном процессоре Intel. Параллельные алгоритмы встроены в<br />

разработанную систему удаленных вычислений «Специализированный Веб-портал<br />

решения задач на многопроцессорных вычислителях».<br />

Решены задачи с квази-модельными и реальными данными.<br />

Результаты вычислений показывают, что использование метода Ньютона и<br />

параллельных методов градиентного типа при решении обратных задач гравиметрии<br />

позволяют получать корректные решения и определять аномальные плотностные<br />

параметры изучаемых глубинных зон земной коры. Использование параллельных<br />

алгоритмов решения СЛАУ с блочно-трехдиагональными матрицами применительно<br />

к задачам электроразведки позволяет достаточно быстро решать задачи с плохо<br />

обусловленными матрицами на ГВС.<br />

31


СПАСИБО ЗА ВНИМАНИЕ !<br />

32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!