Москвичи поддержали запрет на продажу алкоэнергетиков;pdf

Стохастическая оптимизация сопряженных градиентов на основе
метода наименьших квадратов для задач сейсмической инверсии
Вэй Хуан*, Хуа Вэй Чжоу, Хьюстонский Университет
Wei Huang*, Hua-Wei Zhou, University of Houston
Аннотация
С развитием вычислительных мощностей
отмечается повышение интереса к методам
сейсмической инверсии с использованием
аппроксимации
данных,
таким
как
полноволновая инверсия и миграция на основе
метода наименьших квадратов, которые
применяются для построения высокоточных
скоростных
моделей
и
сейсмических
изображений, Тем не менее, несмотря на
очевидные преимущества по сравнению
с традиционными методами, методы аппроксимации данных все же являются достаточно
затратными с точки зрения требований
к вычислительным мощностям. В последнее
время был разработан и внедрен целый ряд
методик, которые позволяют оптимизировать
решение задачи сейсмической инверсии
методом аппроксимации и обеспечивают
значительное повышение эффективности.
В данной работе рассматривается общая
методика стохастической оптимизации сопряженных градиентов для решения обратной
задачи сейсморазведки на основе аппроксимации данных. В первой части работы будет
охарактеризована
теоретическая
основа
предлагаемого метода. Во второй части мы
рассмотрим синтетические примеры. Проведенные численные расчеты демонстрируют
высокую эффективность и широкие возможности предложенного метода для реализации
крупномасштабных проектов сейсмической
инверсии.
Введение
Использование аппроксимации данных для
задач сейсмической инверсии было впервые
упомянуто в работах Тарантолы в 80-е годы
прошлого века (Tarantola, 1984). Тем не менее,
в связи с недостаточными вычислительными
мощностями перспективы применения метода
наименьших квадратов на основе аппроксимации данных были продемонстрированы лишь
совсем недавно, например, при полноволновой
инверсии в процессе построения скоростной
модели и сейсмических изображений для
решения задач сейсморазведки (Vigh et al.,
© 2014 SEG
2010).
При
полноволновой
инверсии
и сейсмическом моделировании на основе
волнового уравнения расчеты выполняются
для отдельных источников, и для обновления
скоростной модели используется разница
между расчетными и наблюденными возбуждениями (Krebs et al., 2009). Таким образом,
объем вычислений
при
полноволновой
инверсии (метод FWI) пропорционален
количеству физнаблюдений и может оказаться
чрезмерно большим, учитывая площади,
охваченные сейсморазведкой 3D.
Важным методом сейсмической инверсии,
который в последние годы привлекает к себе
много внимания, является миграция с использованием метода наименьших квадратов.
Данный метод применяется с целью подавления артефактов миграции и достижения
высокого разрешения сейсмических изображений (Nemethet al., 2001; Dai et al., 2012).
По аналогии с полной волновой инверсией,
миграция с использованием метода наименьших квадратов проводится путем итерационной аппроксимации данных в процессе
моделирования,
например,
на
основе
уравнения Борна. При построениях моделей,
как и в процессе полноволновой инверсии
требуются огромные вычислительные мощности. Последние достижения в области
технологий сейсмической съемки позволяют
осуществлять
регистрацию
сейсмических
данных с высокой плотностью и широким
азимутом, на основе которых можно строить
сейсмические изображения высокого качества
и достоверные скоростные модели. Например,
последние съемки кругового типа позволяют
получать наборы данных с плотностью
физнаблюдений, которые в несколько раз
больше, чем для типового проекта широкоазимутальной съемки (WAZ). В результате
достигается значительно более высокая
кратность и улучшенное отношение сигналпомеха. Такие преимущества особенно актуальны
при
построении
изображений
подсолевых отложений (Huang et al., 2013). Без
специальной оптимизации расчет инверсии на
основе аппроксимации для столь крупных
массивов данных требует серьезных затрат
времени и вычислительных мощностей.
SEG Denver 2014 Annual Meeting
В целом, предлагаемые методы оптимизации
для сейсмической инверсии с помощью метода
наименьших квадратов можно разделить на
несколько
групп:
супергруппирование,
кодирование источников и стохастическая
оптимизация. Супергруппирование является
достаточно стандартной практикой для
отраслевых проектов построения сейсмических
изображений, где сейсмограммы смещаются
в пространстве для объединения в гигантскую
«суперсейсмограмму».
Для
компенсации
пространственных изменений в этом случае
выполняется специальная обработка, например, частичная кинематическая коррекция.
Данный подход имеет ограниченную точность
и может привести к появлению артефактов при
перемещении полевых записей в заданную
точку. Вторым наиболее распространенным
методом оптимизации является кодирование
источника
(статистическое
кодирование).
Вместо перемещения сейсмограмм в пространстве для объединения нескольких сейсмограмм, методика кодирования источника
предполагает
моделирование
нескольких
физнаблюдений одновременно с назначением
для
разных
физнаблюдений
функции
случайной временной задержки, что приводит
к снижению вычислительных затрат на прямое
моделирование (Krebs et al., 2009). Хотя
методика кодирования источника эффективна
для большинства наборов 2D данных,
кодирование источников для значительно
более крупномасштабных съемок 3D может
привести к ряду проблем, например,
к увеличению числа случайных физнаблюдений, что приводит к увеличению сетки
скоростей для распространения данных,
и образованию
перекрестных
артефактов
между сейсмограммами. В результате мы
теряем огромные преимущества метода
кодирования по сравнению с традиционными
методами.
Популярным алгоритмом для множества
приложений в компьютерном обучении
является
стохастическая
оптимизация
(Schraudolgh and Greapel, 2003), когда для
снижения вычислительных затрат используются методы стохастического выбора. Последние
разработки в стохастической оптимизации
привлекли большое внимание относительно их
приложения для задач сейсмической инверсии.
В работе Лейфувена и др. (Leevuwen et al.,
2011) предлагается методика стохастической
оптимизации для полноволновой инверсии
© 2014 SEG
FWI, которая позволяет получать результаты,
сопоставимые с обычными методами только
для части стандартного метода последовательного анализа физнаблюдений. Вместо того,
чтобы комбинировать разные сейсмограммы
в одну
гигантскую
суперсейсмограмму
в пространстве или во времени, метод
стохастической выборки использует для
последующей итерации небольшие партии
исходных данных, что позволяет снизить
вычислительные затраты. Тем не менее, из-за
стохастического характера случайной выборки
при итерациях, трудно найти сопряженное
направление для последовательных итераций,
поэтому на практике всегда используется
метод самого крутого градиента (SG).
Последнее численное исследование функций
моделирования (Jiang and Wilford, 2012)
подтвердило преимущества метода стохастических сопряженных градиентов (SCG),
которые обеспечивают повышение эффективности решения сейсмической инверсии.
В данном исследовании используется метод
стохастических сопряженных градиентов для
решения общих задач сейсмической инверсии
с помощью аппроксимации данных по методу
наименьших квадратов. В теории, данный
метод должен обеспечить более высокую
скорость сходимости по сравнению с методом
стохастического градиента. Для подтверждения этой идеи в статье приведены численные результаты моделирования Кирхгофа
с использованием метода наименьших квадратов. Выводы авторов по результатам экспериментальных исследований представлены
в заключительной части работы.
Описание метода
В общем, задачу сейсмической инверсии
можно объяснить как поиск вектора
в модели по следующей формуле:
,
(1)
где
— вектор наблюденных данных,
—
оператор прямого моделирования, которое,
в принципе, для большинства геофизических
проблем является нелинейным, например,
волновое уравнение или оператор Киргоффа,
и
— вектор модели, которую мы хотим
восстановить. Необходимо отметить, что
уравнение (1) не имеет прямого решения. Как
правило, для решения
уравнения (1)
SEG Denver 2014 Annual Meeting
используется метод наименьших квадратов.
Целевая функция для инверсии модели
в среднеквадратичном
формате
выглядит
следующим образом:
‖
‖ .
(2)
Наиболее часто используется нормальная
форма инверсии
на основе метода наименьших квадратов с использованием целевой
функции на основе регуляризации Тихонова,
которая может быть записана в следующем
виде:
‖
‖
‖
‖ ,
(3)
‖ отражает невязку
где слагаемое ‖
между расчетными и наблюденными данными,
‖
‖
а
представляет регуляризацию.
Регуляризация служит для улучшения условий
решения задачи инверсии, обеспечивая прямое
численное решение, которое можно записать
в следующем виде (Tarantola, 1984):
.
(4)
Тем не менее, с учетом величины обратного
гессиана
, нецелесообразно искать
прямое решение для
, соответственно,
зачастую модель рассчитывается итеративно.
Одним из самых ранних итерационных методов является метод наиболее крутого спуска,
в котором модель уточняется таким образом,
чтобы свести к минимуму решение уравнения
(2) на основе расчета градиента
. Уточнение вектора модели можно выразить как:
,
где
— это градиент
по формуле:
(5)
, и определяется
.
(6)
Значение
можно получить методом поиска
стандартной квадратичной кривой или с помощью аналитического решения снижения значения целевой функции. Еще одним эффективным методом решения уравнения (2) является
метод сопряженных градиентов. Основная
идея метода сопряженных градиентов заключается в обновлении модели в сопряженном
направлении текущего градиента, что приводит к увеличению скорости сходимости по
сравнению с методом наиболее крутого спуска
(Schraudolgh and Greapel, 2003). После первой
итерации спуска
в направлении
наиболее крутого спуска выполняется одна
итерация по каждому последующему сопряженному направлению
. Расчет обновлен© 2014 SEG
ного вектора модели для вектора модели
можно записать следующим образом:
(7)
,
где
, а последующее сопряженное
направление
можно определить как:
(8)
.
При этом для расчета
существует несколько
разных формул, например, широко известное
уравнение Флетчера−Ривза (Fletcher-Reeves
(FR)):
.
(9)
Для решения задачи сейсмической инверсии
с помощью уравнения целевой функции (2)
требуется несколько итераций расчета модели.
Недавно был выполнен целый ряд успешных
исследований и работ по расчетам сейсмической инверсии с использованием метода
наименьших квадратов на основе сопряженных
градиентов (Netham et al., 2001; Dai et al.,
2012). Как упоминалось ранее, вычислительные затраты для решения задач сейсмической
инверсии методом наименьших квадратов
пропорциональны пространству выборки.
Стохастическая оптимизация заключается
в аппроксимации целевой функции стохастическим методом, при этом математическое
ожидание целевой функции остается неизменным:
,
(9)
где
— функция случайной выборки, как
правило в форме нормального распределения
с нулевым средним значением. При статистическом ожидании
равном
,
уравнение 9 можно привести к целевой
функции нормального вида, описываемой
уравнением (2). С увеличением размера
выборки
стохастичность
уравнения
(9)
снижается.
Большинство методов стохастического выбора
при расчете сейсмической инверсии на основе
наименьших квадратов предполагает изменение подмножества выборки на каждой
итерации (Leevuwen et al., 2011). В каждой
итерации используется новое подмножество
данных выборки для расчета направления
оптимизации, которое выражается в виде
градиента целевой функции. При полностью
нестохастическом подходе, когда множество
SEG Denver 2014 Annual Meeting
выборки включает в себя все данных, метод
стохастического выбора сводится к стандартному расчету градиента наиболее крутого
спуска. Для оценки целевой функции используются различные функции случайного выбора.
При стандартном нестохастическом решении
задачи инверсии на основе наименьших
квадратов метод сопряженных градиентов за
счет более быстрой сходимости имеет преимущество над методом градиента с наибольшим
спуском. Тем не менее, стохастическое решение для уравнения (9) на основе наименьших
квадратов сложнее, чем при стандартном
подходе на основе уравнения (2). При
стохастическом
формировании
выборки
глобальный минимум ограничен стохастическим вводом, что приводит к повышению
шумовой оценки истинного гессиана
и градиента
. Дополнительным
недостатком метода стохастической выборки
является то, что обычный метод сопряженных
градиентов может не дать решения при
выполнении итераций, поскольку изменение
подмножества выборки разрушает сопряженность направления поиска в процессе итераций
(Jiang and Wilford, 2012).
Для сглаживания разрыва сопряженности
направления поиска при использовании метода
стохастической выборки, мы предлагаем
методику,
аналогичную
аппроксимации
функции (Jiang and Wilford, 2012) для задачи
сейсмической инверсии на основе метода
наименьших квадратов. Допуская, что подмножество выборки может быть представительным для крупных собственных значений
исходной системы, мы рассчитываем заданное
число итераций для уточнения сопряженного
градиента на основе данных выборки.
Для каждого случайного подмножества
выборки с функцией выборки градиент рассчитывается по формуле:
,
(10)
где индекс — данные выборки, индекс —
номер итерации для фиксированных данных
выборки, и
— текущая уточненная модель.
Последующее
направление
сопряженных
градиентов
рассчитывается
следующим
образом:
,
© 2014 SEG
(11)
где
в начале инверсии на основе
текущей модели скорости по текущему
стохастическому набору данных выборки.
Уточненная (пересчитанная) модель имеет
формат, аналогичный формату, который
получают в случае использования стандартных
сопряженных градиентов, за исключением
того, что сопряженные градиенты рассчитываются только в рамках фиксированной выборки данных.
,
(12)
где
можно рассчитать путем линейного
поиска по подпространству выборки.
Очевидно, что наиболее существенным
отличием данного метода от стандартного
стохастического метода градиента наиболее
крутого спуска заключается в том, что мы
предлагаем проводить лишь несколько итераций сопряженных градиентов в пределах
каждого набора данных стохастической выборки. Тем не менее, для того, чтобы сохранить
стохастичность задачи инверсии, описываемой
уравнением (9), инверсию после нескольких
итераций следует сместить в сторону другого
подмножества, чтобы предотвратить прерывание модельных расчетов в районе локального
минимума.
Синтетические примеры
Для демонстрации возможностей метода стохастических сопряженных градиентов и численного подтверждения его преимущества, мы
провели временную миграцию Кирхгофа на
основе метода наименьших квадратов. В целях
упрощения идеи и выделения преимуществ
метода стохастических сопряженных градиентов на фоне других неопределенностей инверсии, были взяты достаточно идеализированные
параметры тестовых расчетов. Для целей
эксперимента была выбрана модель отражательной способности среды по Клербауту
(Claerbout, 1985) (рис. 1) с постоянной фоновой
скоростью 2000 м/с. Для тестовых расчетов
прямое моделирование и оператор миграции
принимаются сопряженными. На первом этапе
была проведена миграция Кирхгофа на основе
метода наименьших квадратов с использованием всех трасс. В качестве исходных данных
принимались
результаты
100
итераций
регулярных сопряженных градиентов. Сравнение результатов стандартной миграции
SEG Denver 2014 Annual Meeting
и миграции
с
использованием
метода
наименьших квадратов показано на рис. 2, где
наглядно видны преимущества использования
метода наименьших квадратов. Результаты
миграции с учетом наименьших квадратов
демонстрируют более высокое разрешение
и меньшее количество артефактов миграции.
Чтобы проверить методику стохастического
уточнения модели, мы использовали метод
случайного выбора, когда для перерасчета
модели скорости в каждой итерации
выбирались только 5% трасс.
Рис. 1. Модель отражательной способности среды.
Рис. 2. (A) Стандартная миграция; (B) Среднеквадратичная миграция.
© 2014 SEG
С использованием метода стохастического
наиболее крутого спуска и метода стохастических сопряженных градиентов было,
соответственно, проведено в общей сложности
100 итераций. В случае метода стохастических
градиентов формировалась выборка трасс для
последующих итераций, и поводился стандартный линейный поиск в комбинации со
стохастическим градиентом с целью обновления скоростной модели. В варианте
стохастических сопряженных градиентов, для
обеспечения
возможности
сопоставления
результатов
с
методом
стохастических
градиентов, было проведено 5 итераций пересчета сопряженных направлений для каждого
подмножества данных выборки. При этом для
уточнения модели в целом было взято 20
подмножеств данных выборки, причем
вычислительные затраты оказались такими же,
как и при использовании стохастических
градиентов.
Сопоставление результатов расчетов с использованием стохастических градиентов (SG)
и стохастических сопряженных градиентов
(SCG) приводится на рис. 3. Отмечается, что
разница мигрированных разрезов, построенных
по методу стохастических и сопряженных
градиентов (SCG и SG) незначительна,
поскольку для экспериментальных целей
использовался идеальный набор данных и оба
метода демонстрируют хорошую сходимость.
Анализ полученных результатов показывает,
что результаты стохастической оптимизации
вполне сопоставимы с результатами стандартного метода, в котором используется весь
объем данных (рис. 2). Разница между
результатами различных методов становится
более очевидной, если сравнить графики
невязок в зависимости от числа итераций
в логарифмическом
масштабе
(рис.
4).
В целом, при стохастической оптимизации
невязки снижаются не так быстро, как при
обычной оптимизации с использованием всех
наборов данных, из-за стохастического
характера аппроксимации матрицы гессиана
и градиента. Вполне естественно, что стохастическая оптимизация требует большего
количества итераций для достижения такого
же уровня невязок, как при стандартной
инверсии, что частично снижает экономию от
уменьшения размеров модели, используемой
при
итерации.
Сравнительный
анализ
результатов метода стохастических сопряженных градиентов и метода стохастических
SEG Denver 2014 Annual Meeting
градиентов
показывает,
что
метод
стохастических сопряженных градиентов дает
более высокую скорость сходимости, чем
метод стохастических градиентов.
Заключение
Рис. 3. А) Стохастический метод наиболее крутого
спуска; B) Метод стохастических сопряженных
градиентов.
Вместо того чтобы при каждой итерации
изменять подмножество выборки, пересчет
модели можно проводить для ограниченного
числа сопряженных градиентов, используя
одно и тоже подмножество выборки. Для
доказательства эффективности такого подхода
мы использовали миграцию Кирхгофа на
основе наименьших квадратов. Результаты
показывают, что метод стохастических сопряженных градиентов имеет более высокую
скорость сходимости по сравнению со
стандартным методом стохастического градиента наиболее крутого спуска.
Рис. 4. Нормированные невязки при использовании
сопряженных градиентов (CG), стохастических
градиентов (SG) и стохастических сопряженных
градиентов (SCG) в зависимости от количества
итераций.
© 2014 SEG
Серьезным недостатком метода среднеквадратичного решения задач сейсмической инверсии
являются высокие требования к вычислительным мощностям и сопутствующие расходы.
Для оптимизации решения сейсмической
инверсии предлагается использовать стохастический подход к формированию выборки
данных. Большинство стохастических методов
построения
сейсмических
изображений
и расчета инверсии по серии итераций
основано на разных подмножествах данных,
что, как правило, предполагает использование
метода градиента наиболее крутого спуска.
При этом типовой метод сопряженных
градиентов в общепринятой форме, предполагающий стохастический расчет
градиента,
в данном случае применить невозможно
вследствие потери сопряженности при условии
неперекрывающихся выборок. В то же время
метод стохастических сопряженных градиентов для аппроксимации функций потенциально
может обеспечить более высокую скорость
сходимости, чем стохастический метод градиента наиболее крутого спуска. Мы предлагаем
расширить область применения этого метода
для решения общих задач сейсмической
инверсии на основе расчета наименьших
квадратов.
Тем не менее, сходимость для реальных
наборов данных является в скоростной модели
предметом неопределенности, где оператор
моделирования и оператор изображения не
являются сопряженными, что и приводит
к проблемам
в
сходимости
скоростей.
Несмотря на это мы считаем, что применение
стохастических сопряженных градиентов для
решения крупномасштабных задач сейсмической инверсии вполне возможно.
SEG Denver 2014 Annual Meeting
http://dx.doi.org/10.1190/segam2014-1442.1
РЕДАКТИРОВАНИЕ СПИСКА ЛИТЕРАТУРЫ
Примечание:
Список литературы, представленный далее, является редакторской версией списка,
предоставленного автором. Выдержки технических публикаций из перечня литературы,
представленного на конференцию Общества специалистов по разведочной геофизике 2014 г.,
прошли техническое редактирование. В связи с этим, все ссылки, которые приводятся
в выдержках и имеют электронные адреса, могут использоваться для перехода на веб-страницы
авторов.
ЛИТЕРАТУРА
Claerbout, J., 1985, Imaging the earth's interior: Blackwell Scientific Publishing.
Dai, W., X. Wang, and G. T. Schuster, 2011, Least-squares migration of multisource data with a
deblurring filter: Geophysics, 76, no. 5, R135–R146, http://dx.doi.org/10.1190/geo2010-0159.1.
Huang, W., H. Ma, D. Vigh, J. Kapoor, K. Jiao, X. Cheng, and D. Sun, 2013, Velocity model building
with long-offset and full-azimuth data: A case history for full-waveform inversion: 83rd Annual
International Meeting, SEG, Expanded Abstracts, 4750–4754.
Jiang, H., and P. Wilford, 2012, A stochastic conjugate gradient method for approximation of functions:
Journal of Computational and Applied Mathematics, 236, no. 9, 2529–2544,
http://dx.doi.org/10.1016/j.cam.2011.12.012.
Krebs, J. R., J. E. Anderson, D. Hinkley, R. Neelamani, S. Lee, A. Baumstein, and M.-D. Lacasse, 2009,
Fast full-wavefield seismic inversion using encoded sources: Geophysics, 74, no. 6, WCC177–
WCC188, http://dx.doi.org/10.1190/1.3230502.
Leeuwen, T., A. Y. Aravkin, and F. Herrmann, 2011, Seismic waveform inversion by stochastic
optimization: International Journal of Geophysics, 2011, doi: 10.1155/2011/689041.
Nemeth, T., C. Wu, and G. T. Schuster, 1999, Least-squares migration of incomplete reflection data:
Geophysics, 64, 208–221, http://dx.doi.org/10.1190/1.1444517.
Schraudolph, N. N., and T. Graepel, 2003, Combining conjugate direction methods with stochastic
approximation of gradients: 9th International Workshop on Artificial Intelligence and Statistics
(AISTATS), Society for Artificial Intelligence and Statistic s, 7–13.
Tarantola , A., 1984, Inversion of seismic reflection data in the acoustic approximation: Geophysics, 49,
1259–1266.
Tarantola , A., 1986, A strategy for nonlinear elastic inversion of seismic reflection data: Geophysics, 51,
1893–1903, http://dx.doi.org/10.1190/1.1442046.
Vigh, D., and W. Starr, 2008, 3D prestack plane-wave, full-waveform inversion: Geophysics, 73, no. 5,
VE135–VE144, http://dx.doi.org/10.1190/1.2952623.
© 2014 SEG
SEG Denver 2014 Annual Meeting