You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
АЛГОРИТМЫ РЕШЕНИЯ ОБРАТНЫХ<br />
ГЕОФИЗИЧЕСКИХ ЗАДАЧ НА<br />
МНОГОПРОЦЕССОРНЫХ<br />
ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ<br />
Е.Н. Акимова 1 , Д.В. Белоусов 1 , В.Е. Мисилов 2<br />
1 Институт математики и механики УрО РАН<br />
2 Уральский федеральный университет<br />
г. Екатеринбург
Аннотация<br />
Для решения обратной задачи гравиметрии о нахождении плотности в слое<br />
итерационными методами градиентного типа и обратной задачи гравиметрии о<br />
восстановлении поверхности раздела между средами с помощью итеративно<br />
регуляризованного метода Ньютона, а также для решения СЛАУ с блочно-<br />
трехдиагональными матрицами применительно к задачам электроразведки<br />
построены параллельные прямые и итерационные алгоритмы.<br />
Алгоритмы реализованы на многопроцессорных системах различного типа:<br />
многопроцессорном комплексе МВС-ИММ, графических процессорах NVIDIA и<br />
многоядерном процессоре Intel с использованием новых вычислительных технологий.<br />
Параллельные алгоритмы встроены в разработанную систему удаленных<br />
вычислений «Специализированный Веб-портал решения задач<br />
на многопроцессорных вычислителях».<br />
Решены задачи с квази-модельными и реальными данными.<br />
Работа выполнена при поддержке УрО РАН в рамках программы фундаментальных<br />
исследований Президиума РАН № 18 «Алгоритмы и математическое обеспечение для<br />
вычислительных систем сверхвысокой производительности».<br />
2
1. Методы решения обратных задач гравиметрии<br />
Важнейшими задачами исследования структуры земной коры являются обратные<br />
задачи гравиметрии: нахождение плотности в слое и поверхности раздела.<br />
1.1. Задача о нахождении плотности в слое (линейная)<br />
Одной из важнейших моделей строения земной коры является модель горизонтальной<br />
слоистой среды. Плоскость xOy совпадает с дневной поверхностью, ось z направлена вниз.<br />
Рассм. линейная обратная задача гравиметрии о нахождении переменной плотности � xy<br />
в гориз. или кривол. слое<br />
3<br />
П �{( x, y, z) �R : ( x, y) �D, H ( x, y) � z � H ( x, y)}<br />
( , )<br />
1 2<br />
2<br />
D �{( x, y) �R : a � x � b, c � y � d}.<br />
по грав. данным, измеренным на площади земной поверхности<br />
Используется априорная информация об отсутствии аномалий плотности вне слоя с<br />
криволинейными границами H1 H1 ( x, y)<br />
и такими, что<br />
и выпол. условие Распределение плотности внутри слоя не зависит от z.<br />
� H2 H2 ( x, y)<br />
� H1�H2 �(<br />
x, y)<br />
H ( x, y) �h�const. i i<br />
Рис. 1. Модель среды<br />
3
Два этапа решения задачи гравиметрии<br />
1 этап – выделение аномального поля<br />
(методика П.С. Мартышко, И.Л. Пруткина, см. [1])<br />
2 этап – нахождение плотности в слое<br />
Задача сводится к решению линейного двумерного интегрального уравнения<br />
Фредгольма первого рода для нахождения искомой плотности [2]<br />
� �<br />
bd<br />
� 1 1<br />
�<br />
A� � f ���<br />
� 1 1 ��(<br />
x�, y�) dx�dy� � �g(<br />
x, y),<br />
2 2 2 2 2 2 2<br />
2<br />
a c���x�x����y�y���H1<br />
( x�, y�) � �� x � x�� � � y � y�� � H 2 ( x�, y�)<br />
� �<br />
��<br />
� � � �<br />
(1)<br />
f � ( , )<br />
где гравитационная постоянная, �gxy� гравитационный эффект,<br />
порождаемый источниками в горизонтальном или криволинейном слое.<br />
Задача гравиметрии (1) относится к классу некорректно поставленных задач, решение<br />
которой обладает сильной чувствительностью к погрешности правой части, полученной в<br />
результате измерений и предварительной обработки геофизических данных.<br />
____________________________________________________________________<br />
[1]. Мартышко П.С., Пруткин И.Л. Технология разделения источников гравитационного поля<br />
по глубине // Геофизический журнал. 2003. Т. 25. № 3. С. 159�168.<br />
[2]. Мартышко П.С., Кокшаров Д.Е. Об определении плотности в слоистой среде по гравитационным<br />
данным // Геофизический журнал. 2005. Т. 27. № 4. С. 678-684.<br />
4
Методы решения с регуляризацией<br />
После дискретизации уравнения (1) на сетке n �M�N, где задана правая<br />
часть �g(<br />
x, y),<br />
и аппроксимации интегрального оператора по квадратурным<br />
формулам задача (1) сводится к решению СЛАУ с плохо обусловленной<br />
либо симметричной матрицей (горизонтальный слой), либо несимметричной<br />
матрицей (криволинейный слой)<br />
( A��E) z �b,<br />
схема Лаврентьева (2)<br />
В случае криволинейного слоя СЛАУ предварительно преобразуется к виду<br />
�, ��� T T<br />
( A A���E) z �<br />
A b. схема Тихонова (3)<br />
где параметры регуляризации.<br />
Для решения СЛАУ (2) и (3) используются итерационные методы градиентного типа [3].<br />
____________________________________________________________<br />
[3]. Васин В.В., Еремин И.И. Операторы и итерационные процессы Фейеровского типа.<br />
Теория и приложения. Екатеринбург, 2005.<br />
5
Методы решения СЛАУ (заполненная матрица)<br />
1. Итеративно регуляризованный метод простой итерации (МПИ)<br />
� 1<br />
� � [( � ) � ], �max � A��E k 1 k k<br />
z z A �E<br />
z b<br />
где макс. соб. знач.<br />
�max<br />
(симм. случай)<br />
2. Метод минимальных невязок (ММН)<br />
k k<br />
k�1 k ( A( Az �b), Az �b)<br />
k<br />
z � z � ( Az �b);<br />
k<br />
2<br />
A( Az �b)<br />
3. Метод наискорейшего спуска (МНС)<br />
k�1 k<br />
z � z �<br />
T k<br />
A Az<br />
T<br />
2<br />
� A b T<br />
A<br />
k<br />
Az �b<br />
T k T<br />
A( A Az � A b)<br />
2 ( );<br />
4. Метод минимальной ошибки (ММО)<br />
k�1 k<br />
z � z �<br />
k<br />
2<br />
Az � b T<br />
A<br />
k<br />
Az � b<br />
T k<br />
A ( Az � b)<br />
2 ( );<br />
5. Метод сопряженных градиентов (МСГ)<br />
6. Прямой метод квадратного корня (МКК)<br />
(СЛАУ с симметр. положит. опред. матрицей)<br />
A � A��E k<br />
Az � b<br />
b<br />
��� останов по невязке<br />
6
Параллельная реализация на суперкомпьютере<br />
Для решения линейной обратной задачи гравиметрии устойчивые итерационные<br />
методы градиентного типа численно реализованы на МВС - российском суперкомпьютере<br />
кластерного типа с распределенной памятью.<br />
ИММ УрО РАН : суперкомпьютеры «Уран», МВС-1000/17EK, МВС-ИММ.<br />
МВС-ИММ: 14 2-х процессорных 2-х ядерных модулей AMD Opteron 64 bit (2.6 ГГц);<br />
интерфейс GbitEthernet; 112 Гб оперативной памяти.<br />
Параллельные численные алгоритмы реализованы с помощью библиотеки MPI [4]<br />
на языке Фортран. Распараллеливание итерационных методов основано на разбиении<br />
матрицы A горизонтальными полосами на m блоков, а вектора решения z и<br />
вектора правой части b СЛАУ на m частей так, что n �m�L, где n � размерность<br />
системы уравнений, m � число процессоров, L � число строк матрицы в блоке.<br />
На текущей итерации каждый процессор вычисляет свою часть вектора решения.<br />
Host – processor<br />
1– processor<br />
2 – processor<br />
…<br />
m – processor<br />
Рис. 2. Схема распределения данных по процессорам<br />
______________________________________________________________________<br />
[4]. Воеводин Вл.В. Технологии параллельного программирования. URL: http://parallel.ru/<br />
7
Реализация на ГВС с графическими процессорами<br />
ИММ УрО РАН : кластер NVIDIA Tesla включает 20 вычислительных узлов.<br />
Каждый узел содержит 8 GPU Тesla S20<strong>50</strong>, <strong>50</strong> Гб ОЗУ и 2 шестиядерных CPU.<br />
ГВС-1 (отдел некорректных задач анализа ИММ УрО РАН)<br />
ГВС-2 (кафедра ВМ и УМФ УрФУ)<br />
Характеристики СPU-1:<br />
Частота процессора (ГГц)<br />
Оперативная память (Гб)<br />
Характеристики GPU-1:<br />
Количество процессорных ядер<br />
Частота ядра (МГц)<br />
Частота процессора (МГц)<br />
Количество видеопамяти (Мб)<br />
Характеристики СPU-2:<br />
Частота процессора (ГГц)<br />
Оперативная память (Гб)<br />
Характеристики GPU-2:<br />
Количество процессорных ядер<br />
Частота ядра (МГц)<br />
Частота процессора (МГц)<br />
Количество видеопамяти (Мб)<br />
4-ядер. Intel Core I5-7<strong>50</strong><br />
2.66<br />
Таблица 1. Технические характеристики ГВС1 и ГВС2<br />
8<br />
NVIDIA GeForce GTX 285<br />
240<br />
648<br />
1476<br />
1024<br />
4-ядер. Intel Core I7-9<strong>50</strong><br />
3.06<br />
8<br />
NVIDIA GeForce GTX 480<br />
480<br />
700<br />
1401<br />
1536<br />
8
Оптимизация работы с памятью<br />
Для решения линейной обратной задачи гравиметрии о восстановлении плотности<br />
в слое итерационные методы градиентного типа реализованы на графических<br />
процессорах NVIDIA с помощью технологии CUDA [5].<br />
Для оптимизации работы с памятью при вычислениях используются два приема.<br />
1. Для сеток не очень большой размерности (размер СЛАУ ), когда данные входят<br />
в память видеокарты, матрица A порядка n и вектор z размерности n расширяются до<br />
размерности M и дополняются нулями таким образом, чтобы M было кратно числу<br />
блоков. Размер блока BLOCK_SIZE (threads) выбирается кратным 16, поскольку в одном<br />
блоке группируются до 512 потоков. Тогда количество блоков вычисляется по<br />
формуле: blocks=M/BLOCK_SIZE. Вычисления производятся без выгрузки данных в<br />
память Host-процессора. Данные находятся только в памяти видеокарты.<br />
2. Для сеток довольно большой размерности (размер СЛАУ), когда данные не<br />
входят в память видеокарты, наилучшим по быстродействию оказывается метод<br />
вычисления элементов матрицы A «на лету», т.е. вычисление значения элемента<br />
матрицы происходит в момент обращения к этому элементу без сохранения его в<br />
память видеокарты. Это позволяет существенно снизить количество обращений к<br />
памяти видеокарты и заметно ускорить процесс вычислений по сравнению с хранением<br />
матрицы A в памяти Host-процессора и порционной загрузкой в видеоускоритель для<br />
вычислений.<br />
______________________________________________________________________________________________________<br />
[5]. Берилло А. NVIDIA CUDA – неграфические вычисления на графических процессорах.<br />
URL: http://www.ixbt.com/video3/cuda-1.shtml<br />
9
1.2. Задача о нахождении поверхности раздела<br />
между средами (нелинейная)<br />
Рассматривается трехмерная структурная обратная задача гравиметрии<br />
о восстановлении поверхности раздела между средами по известному скачку плотности<br />
и гравитационному полю, измеренному на некоторой площади земной поверхности.<br />
Предполагается, что нижнее полупространство состоит из нескольких слоев<br />
постоянной плотности, разделенных искомыми поверхностями Si.<br />
Плоскость xOy совпадает с дневной поверхностью, ось направлена вниз.<br />
z<br />
Рис. 3. Модель среды<br />
10
В предположении, что гравитационная аномалия создана отклонением искомой<br />
поверхности S от горизонтальной плоскости z H,<br />
в декартовой системе координат<br />
функция z � z( x, y),<br />
описывающая искомую поверхность раздела, удовлетворяет<br />
нелинейному двумерному интегральному уравнению Фредгольма первого рода [6]<br />
�<br />
� �<br />
bd<br />
� 1 1<br />
�<br />
A[ z] � f �� ���<br />
� 1 1 �dx�dy��G(<br />
x, y),<br />
2 2 2 2 2 2 2 2<br />
a c���x�x����y�y���z(<br />
x�, y�) � �� x � x�� � � y � y�� � H � �<br />
��<br />
� � � �<br />
f � �<br />
где гравитационная постоянная, скачок плотности на границе раздела сред,<br />
G( x, y) � аномальное гравитационное поле,<br />
асимптотическая плоскость для данной поверхности раздела.<br />
z�H� � �<br />
Предварительная обработка гравитационных данных, связанная с выделением<br />
аномального поля, выполняется по методике [1].<br />
________________________________________________________________________________<br />
[6]. Нумеров Б.В. Интерпретация гравитационных наблюдений в случае одной контактной поверхности //<br />
ДАН СССР. 1930. № 21. С. 569-574.<br />
(4)<br />
11
Метод Ньютона<br />
Уравнение гравиметрии является существенно некорректной задачей, решение<br />
обладает сильной чувствительностью к погрешности правой части, полученной<br />
в результате измерений и предварительной обработки геофизических данных.<br />
n �M� N,<br />
G( x, y),<br />
После дискретизации уравнения (4) на сетке где задана правая часть<br />
и аппроксимации интегрального оператора по квадратурным формулам<br />
имеем систему нелинейных уравнений<br />
A [ z] � F . (5)<br />
n n<br />
Для решения системы (5) используется итеративно регуляризованный метод Ньютона [7]<br />
�1<br />
� � � �<br />
k�1 k k k k<br />
z � z � �A� n z �kI��Anz�k( z H) F �<br />
�<br />
�<br />
� �<br />
� � � n �<br />
. (6)<br />
k<br />
Здесь An�z�, Fn � конечномерные аппроксимации интегрального оператора и правой части (6),<br />
k<br />
k<br />
A' ( z ) � дискретизация производной оператора A в точке ; � �параметры<br />
регуляризации.<br />
n<br />
z<br />
z k<br />
k�1<br />
k<br />
Нахождение очередного приближения по найденному сводится к решению СЛАУ<br />
� �<br />
k k<br />
n n k<br />
A z F<br />
k k�1 k<br />
n � n<br />
, (7)<br />
A � A� z �� I � n�n где плохо обусловленная несимметричная заполненная матрица,<br />
� �<br />
� � � � � ��<br />
k k k k k<br />
F A z A z � z F<br />
n n вектор размерности<br />
� n k n �<br />
_______________________________________________________________________<br />
12<br />
[7]. Bakushinsky A., Goncharsky A. Ill-Posed Problems:Theory and Applications. London: Кluwer Publishers.1994.<br />
z<br />
n.
Методы решения СЛАУ<br />
Предварительно система (7) приводится к виду<br />
k k�1kTk'k�1kTk B z � �<br />
�( An ) An �� kI �<br />
�z�(<br />
An ) Fn � b.<br />
(8)<br />
k T<br />
( A ) �<br />
'<br />
� �<br />
где транспонированная матрица, параметры регуляризации.<br />
n<br />
На каждом шаге метода Ньютона используются итерационные методы градиентного типа.<br />
1. Итеративно регуляризованный метод простой итерации (МПИ)<br />
k�1 k 1 k<br />
z � z � [( A� �E)<br />
z �b],<br />
(9)<br />
�max<br />
� � A��E где максимальное собственное значение матрицы (симметр. случай),<br />
max<br />
2. Метод сопряженных градиентов в регуляризованном варианте (МСГ)<br />
� k<br />
k�1 k<br />
z � z<br />
�<br />
k k k k�1<br />
��k( B z �b) � �k(<br />
z � z ), (10)<br />
где k и вычисляются по известным формулам [8].<br />
k k<br />
B z � b<br />
Условие останова по невязке :<br />
�<br />
� .<br />
b<br />
Численная реализация и распараллеливание метода Ньютона с использованием<br />
итерационных градиентных методов выполнена на МВС-ИММ.<br />
___________________________________________________________________________<br />
[8]. Фаддеев В.К., Фаддеева В.Н. Выч. методы лин. алгебры. М.: Гос. изд. физ.�мат. лит., 1963.<br />
k<br />
13
2. Параллельные алгоритмы решения СЛАУ с<br />
блочно-трехдиагональными матрицами<br />
Важнейшими задачами исследования неоднородности земной коры являются задачи электроразведки.<br />
Одним из известных методов электроразведки является метод вертикального электрического зондирования<br />
(ВЭЗ). После использования конечно-разностной аппроксимации задача ВЭЗ сводится к решению СЛАУ с<br />
блочно-трехдиагональной матрицей [9]. Другой важной задачей электроразведки является задача бокового<br />
каротажного зондирования (БКЗ). В работе [10] показано, что после использования конечно-разностной<br />
аппроксимации задача БКЗ сводится к решению СЛАУ с блочно-трехдиаг. матрицей большой размерности.<br />
Рис. 4. Вид матрицы СЛАУ<br />
Для решения СЛАУ с блочно-трехдиаг. матрицами применительно к задачам электроразведки используются<br />
параллельные алгоритмы матричной прогонки (ПАМП), квадратного корня (ПАКК) и ПМСГ с предобуславливателем<br />
(СЛАУ с симметр. положит.-определ. матрицей).<br />
Реализация на многоядерном процессоре Intel с помощью OpenMP.<br />
______________________________________________________________________________________________<br />
[9]. Тихонов А.Н., Самарский А.А. Уравнения математической физики. М.: Наука, 1966.<br />
[10]. Дашевский Ю.А., Суродина И.В., Эпов М.И. Квазитрехмерное математическое моделирование<br />
диаграмм неосесим. зондов пост. тока в анизотропных разрезах // Cиб. ЖИМ. 2002. Т. 5. № 3(11). С. 76-91.
2.1. Параллельный алгоритм матричной прогонки<br />
где Yi и искомые и заданные векторы размерности n, квадратные матрицы порядка n.<br />
i<br />
Будем предполагать, что исходная область P – прямоугольник. Разобьем P на L подобластей вертикальными<br />
линиями так, что В качестве параметров выберем векторы связывающие неизвестные<br />
на сетке по вертикали. В подобластях, определяемых интервалами (K,K+M), рассмотрим задачи<br />
F � Ai , Bi , Ci �<br />
N �L� M .<br />
YK , K � 0, M,..., N ,<br />
Рис. 5. Разбиение области<br />
�С0Y0 � B0Y1 � F0 , i � 0<br />
�<br />
��AY<br />
i i�1�CiYi�BY i i�1 � Fi , i �1,..., N �1<br />
�<br />
��AN<br />
YN �1<br />
� CNYN � FN , i � N,<br />
�<br />
�1��0� 1 1 1 1 �<br />
0<br />
� 1 �<br />
..<br />
�<br />
��AU i i�1�CU i i � BU i i�1 � 0, U K � � �, U ,<br />
.. K �M<br />
� � �<br />
0<br />
�<br />
� � � �<br />
0 0<br />
�<br />
� � � �<br />
� . . . . . . . . . . . . .<br />
�<br />
�0��0� n n n n �<br />
..<br />
� n �<br />
AU ..<br />
�<br />
�� i i�1�CU i i � BU i i�1 � 0, U K � � �, U .<br />
0 K �M<br />
� � �<br />
� � �<br />
0<br />
��<br />
�<br />
�1��0� �0��1� � 1 1 1 1 �<br />
0<br />
� 1 �<br />
0<br />
�<br />
��AV<br />
i i�1�CV i i � BV i i�1 � 0, VK � � �, V ,<br />
.. K �M<br />
� � �<br />
� � �<br />
..<br />
�<br />
0 0<br />
�<br />
� � � �<br />
� . . . . . . . . . . . . .<br />
�0��0� � n n n n �<br />
..<br />
� n �<br />
AV ..<br />
�<br />
i i�1 CV i i BV i i�1 0, VK � �, V .<br />
0 K �M<br />
� �<br />
��<br />
� � � � �<br />
� � �<br />
0<br />
�<br />
�<br />
�0��1� �0��0� �<br />
0<br />
� �<br />
0<br />
�<br />
i i�1 i i i i�1 i, K<br />
� �, ,<br />
.. K M<br />
� �<br />
� �<br />
�<br />
�<br />
..<br />
�<br />
�0��0� �AW � CW � BW � F W � W � i � K �1, ..., K � M �1.<br />
_____________________________________________________________________<br />
[11]. Акимова Е.Н. Распараллеливание алгоритма матричной прогонки // Математическое<br />
моделирование. М.: Наука, 1994. Т. 6. № 9. C. 61- 67.<br />
(11)<br />
(12)<br />
(13)<br />
(14)
1 n<br />
1 n<br />
Утверждение 1. Если Ui,..., Ui �решения<br />
задач (12), Vi ,..., Vi � решения задач (13),<br />
W � решения задачи (14), Yi � решения исходной задачи (11) на ( K, K M),<br />
тогда<br />
�<br />
i<br />
После подстановки (15) в (11) получим систему относительно параметров<br />
U K<br />
1 2 n 1 2 n<br />
� � � �<br />
Y � U U ... U Y � V V ... V Y �W<br />
. (15)<br />
i i i i K i i i K �M<br />
i<br />
� 0 0 1� 0 � 0 1� M 0 0 1<br />
� � � � � �<br />
� C � B U Y � B V Y � F � B W , K � 0;<br />
�<br />
��<br />
AKU K �1 YK �M � CK � AKVK �1 � BKU K �1 YK � BKVK �1 YK<br />
�M<br />
�<br />
�<br />
��<br />
FK � AKWK �1�BKWK�1, K � M , 2 M , ..., N � M;<br />
�<br />
���<br />
ANU N �1�YN �M ��C N � ANVN �1�YN � FN � ANWN �1,<br />
K � N,<br />
где K и V � квадратные матрицы порядка n.<br />
Y , K � 0, M,..., N .<br />
Схема параллельного алгоритма матричной прогонки: (12)-(13)-(14) → (16) → (15).<br />
Задача (16) решается классическим алгоритмом матричной прогонки.<br />
Задачи (12)-(13)-(14) и (15) решаются независимо на L процессорах.<br />
Утверждение 2. Если для исходной системы (11) выполняются достаточные условия устойчивости<br />
метода матричной прогонки по А.А. Самарскому [12]<br />
C B C A C A C B i N<br />
�1 �1 �1 �1<br />
0 0 �1, N N �1, i i � i i �1, �1,..., �1,<br />
причем хотя бы одно из неравенств – строгое, то эти же условия достаточны и для устойчивости метода<br />
матричной прогонки при решении системы уравнений (15) относительно параметров Y<br />
(см. [11]).<br />
____________________________________________________________________________________________<br />
[11]. Акимова Е.Н. Распараллеливание алгоритма матричной прогонки // Математическое моделирование.<br />
М.: Наука, 1994. Т. 6. № 9. C. 61- 67.<br />
[12]. Самарский А.А., Николаев Е.С. Методы решения сеточных уравнений. М.: Наука, 1978.<br />
K<br />
K<br />
(16)
2.2. Параллельный метод сопряженных<br />
градиентов с предобуславливателем<br />
МСГ – эффект. итерационный метод решения СЛАУ с симметричной положительно-определенной матрицей [8].<br />
Введение предобуславливания применяется с целью сущест. ускорения сходимости итерационного процесса.<br />
Ax � b<br />
Исходная СЛАУ заменяется на<br />
Условием выбора предобуславливателя C является следующее:<br />
� �<br />
cond A cond A cond A cond A A C A<br />
� �<br />
Для СЛАУ (17) МСГ с предобуславливателем имеет вид<br />
�1 �1<br />
C Ax � C b.<br />
(17)<br />
max max<br />
�1<br />
( ) �� ( ), ( ) � , ( ) � , � . (18)<br />
0 0 0 �1<br />
0 0 0<br />
r � b � Ax , p � C r , z � p ,<br />
( r , z )<br />
, ,<br />
( Ap , p )<br />
k k<br />
k �1<br />
�<br />
k<br />
��k k<br />
�k<br />
� k k<br />
x x p<br />
k<br />
Az � b<br />
b<br />
��� условие останова по невязке.<br />
min min<br />
r � r �� Ap , z � C r ,<br />
k �1 k k k �1 �1 k �1<br />
k<br />
k�1 k�1<br />
k �1 k �1<br />
k ( r , z )<br />
� � �k �k<br />
� k k<br />
p z p<br />
Распараллеливание МСГ с предобуславливателем см. выше (рис. 2).<br />
, . (19)<br />
( r , z )<br />
__________________________________________________________________________________________________________<br />
[8]. Фаддеев В.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.: Гос. издат. физ.-мат. литературы, 1963.
2.3. Метод квадратного корня<br />
Метод квадратного корня – быстрый метод решения СЛАУ с симметричной положительноопределенной<br />
матрицей [8]. МКК основан на разложении матрицы А в произведение<br />
T<br />
A � S S , где S � верхняя треугольная матрица с положит. элементами на главной диагонали,<br />
T<br />
S � транспонированная матрица. Метод состоит в последовательном решении двух систем<br />
T<br />
S y �b, Sz � y.<br />
Решения (20) находятся по рекуррентным формулам<br />
�y<br />
� b s ,<br />
�<br />
�<br />
�<br />
�y �<br />
��<br />
i � n<br />
�z<br />
� y s<br />
n n nn<br />
1 1 11<br />
�<br />
i�1<br />
n �<br />
bi ��<br />
ski y<br />
� y<br />
k<br />
i � � sik zk<br />
k �1<br />
k�� i 1<br />
i<br />
, 2,3,...., ;<br />
i<br />
s<br />
s<br />
ii<br />
ii<br />
_________________________________________________________________________________________________________<br />
[8]. Фаддеев В.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.: Гос. издат. физ.-мат. литературы, 1963.<br />
,<br />
�z � , i � n �1, n � 2,...,1.<br />
��<br />
Распараллеливание МКК для вычислителя с общей памятью основано на параллельном вычислении<br />
s , j � i,..., n,<br />
каждой i � ой строки матрицы S.<br />
Строка с номером i разбивается на m<br />
частей.<br />
ij<br />
1 –<br />
процессор<br />
2 –<br />
процессор<br />
…<br />
m –<br />
процессор<br />
Рис. 6. Разбиение i � ой строки по процессорам<br />
(20)<br />
(21)
3. Специализированный Веб-портал<br />
Параллельные алгоритмы решения обратных задач гравиметрии и параллельные алгоритмы решения СЛАУ<br />
для задач электроразведки встроены в разработанную систему удаленных вычислений (ОНЗАП ИММ УрО РАН).<br />
Предназначен для запуска программ решения задач на МВС, кластере NVIDIA Tesla и GPU NVIDIA GeForce.<br />
Рис. 7.<br />
19
Специализированный Веб-портал<br />
Изначально Веб-портал предназ. для запуска программ решения задач гравиметрии на МВС-1000/17EK.<br />
Веб-портал предоставляет возможность пользователю через Веб-интерфейс выбирать тип вычислителя с<br />
указанием числа процессорных узлов, вид задачи и метод ее решения, загружать входные данные, получать<br />
выходные данные и графическое изображение результатов решения с помощью графических пакетов<br />
Surfer и gnuplot. Для каждой задачи выводится время счета.<br />
Веб-портал состоит из трех основных частей : HTTP-сервер IIS (информационные службы Интернета),<br />
на котором установлено Веб-приложение; база данных SQL Server 2000, в которой хранятся все задачи<br />
пользователей с входными и выходными данными; служба, выполняющая загрузку данных, запуск задач на<br />
многопроцессорных вычислителях различных типов, просмотр состояния задачи и загрузку результатов<br />
завершившихся задач на Веб-портал.<br />
Рис. 8. Архитектура Веб-портала<br />
20
4. Результаты моделирования (Восточный Урал)<br />
На протяжении многолетних исследований в ИГФ УрО РАН выделены протяженные<br />
линейные аномалии векового хода геомагнитного поля – Башкирская аномалия<br />
(юго-западый Урал) и Буткинская аномалия (восточный Урал).<br />
Аномалии связаны с изменением плотности в земной коре.<br />
Рис. 9. Пространственное распределение магнитовариационного поля<br />
(._._ профили наблюдений, V - наблюденное поле, /// - аномальные зоны )<br />
21
4.1. Результаты моделирования (восточный Урал)<br />
Для восточной части Урала обработан массив гравитационных данных,<br />
2<br />
измеренный на площади S : 59.4�144 км .<br />
Площадь пространственно совпадает с зоной Буткинской аномалии векового хода.<br />
Аномальное поле предоставлено сотрудниками ИГФ УрО РАН (г. Екатеринбург).<br />
По реальным наблюденным данным для изучения природы аномалии решены<br />
Задача 1 о нахождении плотности в слое между глубинами<br />
H �10 км, H �20<br />
км.<br />
1 2<br />
Задача 2 о восстановлении поверхности раздела.<br />
Расстояние до асимпт. плоскости<br />
H �15<br />
км.<br />
3<br />
Скачок плотности ���0.2 г / см . Шаги сетки:<br />
После дискретизации обе задачи сводятся к СЛАУ с матрицами<br />
�x�0.594, �y�1.44 км.<br />
10000�10000. Задача 1 решена параллельными МПИ и ММН на МВС-ИММ, NVIDIA Tesla и NVIDIA GeForce.<br />
Задача 2 решена методом Ньютона (на каждом шаге метода � ПМСГ) на МВС-ИММ.<br />
22
Линейная задача (восточный Урал)<br />
Рис. 10. Аномальное разностное гравитационное поле для области<br />
(разность полей, пересчитанных на 10 и 20 км)<br />
S<br />
23
Решение линейной задачи (восточный Урал)<br />
Рис. 11. Распределение восстановленной плотности в слое для области<br />
Интерпретация результатов проведена сотрудниками ИГФ УрО РАН.<br />
Выделен субмеридиональный блок земной коры пониженной плотности (0.2 – 0.3 г/см3).<br />
S<br />
24
Решение нелинейной задачи (восточный Урал)<br />
H �15<br />
км.<br />
Расстояние до асимп. плоскости Скачок плотности<br />
Рис. 12. Восстановленная поверхность раздела для области S<br />
3<br />
���0.2 г / см .<br />
Получены прогибы поверхности, связанные с зонами пониженной плотности.<br />
25
Времена решения линейной задачи гравиметрии<br />
Введем коэф. ускорения и эффективности m 1 m m m<br />
1 2<br />
где Tm � время выполнения параллельного алгоритма на MBC-ИММ либо на многоядерном<br />
процессоре с числом процессоров или ядер m ( m�1), T1 � время выполнения последовательного<br />
алгоритма на одном процессоре либо на одном ядре, T � время решения задачи на видеоускорителе.<br />
Вычислитель<br />
Intel Core I7 (1 ядро)<br />
Intel Core I7 (2 ядра)<br />
Intel Core I7 (4 ядра)<br />
NVIDIA GeForce (480 яд.)<br />
МВС─ИММ (1 проц.)<br />
МВС─ИММ (2 проц.)<br />
МВС─ИММ (4 проц.)<br />
МВС─ИММ (10 проц.)<br />
МВС─ИММ (20 проц.)<br />
МВС─ИММ (<strong>50</strong> проц.)<br />
Время T , мин.<br />
m<br />
Технол. OpenMP<br />
7.73<br />
4.05<br />
2.1<br />
0.2<br />
Технол. MPI<br />
24.33<br />
12.18<br />
6.10<br />
2.46<br />
1.24<br />
0.5<br />
S � T / T , E � S / m, S � T / T ,<br />
Ускорение<br />
либо m S<br />
—<br />
1.91<br />
3.68<br />
38.7<br />
—<br />
1.99<br />
3.99<br />
9.89<br />
19.6<br />
48.7<br />
k<br />
Az �b / b � 0.011, 749 итер, СЛАУ 10000�10000 Эффективность<br />
Em<br />
—<br />
0.96<br />
0.92<br />
—<br />
—<br />
0.99<br />
0.99<br />
0.99<br />
0.98<br />
0.97<br />
Таблица 1. Времена решения линейной задачи гравиметрии (восточный Урал)<br />
2<br />
S<br />
26
Решение нелинейной задачи на МВС-ИММ<br />
(восточный Урал)<br />
В табл. 2 приведены времена счета на МВС-ИММ и коэффициенты ускорения<br />
и эффективности решения нелинейной задачи гравиметрии для области S<br />
итеративно регуляризованным методом Ньютона с использованием ПМСГ<br />
(сетка 100 х 100, матрица СЛАУ 10000 х 10000).<br />
m m T m S m E<br />
(число проц.)<br />
1<br />
3<br />
9<br />
27<br />
(время, мин.)<br />
94.88<br />
40.46<br />
16.52<br />
11.49<br />
(ускорение)<br />
—<br />
2.34<br />
5.74<br />
8.25<br />
(эффективность)<br />
—<br />
0.78<br />
0.64<br />
0.30<br />
81 7.72 12.3 0.15<br />
Таблица 2. Времена решения нелинейной задачи о восстановлении<br />
поверхности раздела (восточный Урал)<br />
27
4.2. Решение задачи о нахождении распределения потенциала<br />
На ГВС решена задача о нахождении распределения потенциала в проводящей среде с известным<br />
квази-модельным решением с помощью параллельных алгоритмов матричной прогонки (ПАМП),<br />
предобусловленного метода сопряженных градиентов (ПМСГ) и метода квадратного корня (ПАКК).<br />
Исходные данные и решение задачи предоставлены лабораторией скважинной геофизики<br />
ИНГГ СО РАН (г. Новосибирск).<br />
После дискретизации задача сводится к решению СЛАУ с плохо обусловленной симметричной<br />
положительно-определенной блочно-трехдиагональной матрицей размерности 76136� 76136<br />
c квадратными блоками порядка 248.<br />
Приближенное решение задачи сравнивалось с модельным решением с помощью вычисления<br />
относительной погрешности<br />
M П M<br />
� � Y �Y / Y � � �<br />
критерий останова ПМСГ.<br />
M<br />
П<br />
Здесь Y � модельное решение, Y � приближенное решение задачи.<br />
cond A<br />
�<br />
max<br />
11 6 �5<br />
( ) � �1.3 �10 , �max�1.4�10 , �min�1.1�10�0,<br />
�min<br />
�<br />
cond A cond A<br />
�<br />
max<br />
9<br />
( ) � � 4.1�10 �<br />
( ).<br />
min
� � �<br />
�7 �7 �7<br />
ПМСГ �10 , ПАМП � 2�10 , ПМКК � 6�10 .<br />
Рис. 13. Численное решение задачи
Времена решения задачи<br />
Метод Вычислитель , сек. (Windows API) T , сек. (OpenMP)<br />
ПМСГ<br />
ПАМП<br />
ПАКК<br />
� � �<br />
�7 �7 �7<br />
ПМСГ �10 , ПАМП � 2�10 , ПМКК � 6�10 .<br />
Tm<br />
МСГ без предобусл: t=10 час.<br />
Intel Core I5 (1 ядро ) 57 21<br />
Intel Core I5 (2 ядра ) 46 16<br />
Intel Core I5 (4 ядра ) 36 14<br />
NVIDIA GeForce (240 яд.) ─ ─<br />
Intel Core I5 (1 ядро ) 52 21<br />
Intel Core I5 (2 ядра ) 28 18<br />
Intel Core I5 (4 ядра ) 16 14<br />
NVIDIA GeForce (240 яд.) ─ 10<br />
Intel Core I5 (1 ядро ) 12 7.4<br />
Intel Core I5 (2 ядра ) 9 4.6<br />
Intel Core I5 (3 ядра ) 10 3.8<br />
Intel Core I5 (4 ядра ) 12 4.2<br />
m
Основные результаты<br />
Для решения линейной обратной задачи гравиметрии о нахождении плотности<br />
в слое итерационными методами градиентного типа и нелинейной обратной задачи<br />
гравиметрии о восстановлении поверхности раздела между средами с помощью<br />
итеративно регуляризованного метода Ньютона, а также для решения СЛАУ<br />
с блочно-трехдиагональными матрицами применительно к задачам электроразведки<br />
построены параллельные прямые и итерационные алгоритмы.<br />
Алгоритмы реализованы на многопроцессорных вычислительных системах<br />
различного типа: многопроцессорном комплексе МВС-ИММ, графических процессорах<br />
NVIDIA и многоядерном процессоре Intel. Параллельные алгоритмы встроены в<br />
разработанную систему удаленных вычислений «Специализированный Веб-портал<br />
решения задач на многопроцессорных вычислителях».<br />
Решены задачи с квази-модельными и реальными данными.<br />
Результаты вычислений показывают, что использование метода Ньютона и<br />
параллельных методов градиентного типа при решении обратных задач гравиметрии<br />
позволяют получать корректные решения и определять аномальные плотностные<br />
параметры изучаемых глубинных зон земной коры. Использование параллельных<br />
алгоритмов решения СЛАУ с блочно-трехдиагональными матрицами применительно<br />
к задачам электроразведки позволяет достаточно быстро решать задачи с плохо<br />
обусловленными матрицами на ГВС.<br />
31
СПАСИБО ЗА ВНИМАНИЕ !<br />
32