Автоматизированная корреляция с применением машинного обучения

Латыпов И.Д., Марков А.В., Евграфов Н.А., Шагимарданова Л.Р.



ООО «РН-БашНИПИнефть»

(ОГ ПАО «НК «Роснефть»)

В статье предложен алгоритм внутрипластовой корреляции разреза скважин для целей повышения качества петрофизической интерпретации, приведены примеры его применения. При автоматической внутрипластовой корреляции может наблюдаться зависимость результатов от порядка рассмотрения скважин. Для устранения этой проблемы в работе представлен вариант определения путей обхода скважин на основе упорядочивания скважин поблизости Евклидовой нормы по данным кривых ГИС. Представлен подход к автоматической корреляции разреза при помощи алгоритмов кластерного анализа, метода главных компонент и динамической трансформации временной шкалы.
Введение
Внутрипластовая корреляция разреза скважин является важным инструментом для петрофизической интерпретации, позволяющим более точно оценить свойства, состав горных пород, снизить неопределенность геологического моделирования, принять более обоснованные решения при планировании бурения, оптимизации извлечения флюидов и повысить эффективность разработки месторождения. Этот метод становится особенно ценным при работе на сложных неоднородных месторождениях, где петрофизические свойства могут существенно отличаться внутри пласта. Внутрипластовая корреляция разреза скважин позволяет выявить связи между геофизическими исследованиями скважин (ГИС), проведенными на разных скважинах месторождения. Это дает возможность установить общие закономерности и тенденции в распределении петрофизических свойств внутри пласта, а также сделать выводы о потенциале литологических пачек в разрезе и перемещении флюида внутри пласта. Однако следует отметить, что внутрипластовая корреляция разреза имеет свои ограничения: различия в условиях бурения, изменчивость в свойствах породы и другие геологические факторы могут оказывать влияние на ее результаты, что особенно актуально при работе с гигантскими месторождениями. На основе результатов корреляции базируются все дальнейшие процессы моделирования свойств пласта [1]. Проведение внутрипластовой корреляции — это сложный и трудоемкий процесс, поэтому множество исследований направлено на реализацию алгоритмов частной или полной автоматизации данного процесса.
При проведении корреляции существует проблема зависимости результатов от порядка обхода скважин и оценки качества [2]. Одним из способов решения проблемы обхода скважин при автокорреляции разрезов скважин является использование самоорганизующихся карт Кохонена [3]. Входными данными в работе предлагается использовать следующие показания методов: самопроизвольной поляризации (СП), индукционного каротажа (ИК),
гамма-каротажа (ГК). Основная идея применения карт Кохонена заключается в том, что сеть подстраивается под закономерности во входных данных, а не под эталонные выходные значения.
В данной работе представлен вариант определения пути обхода скважин на основе упорядочивания скважин по близости в смысле некоторой нормы по данным кривых ГИС с применением алгоритмов кластерного анализа, метода главных компонент и динамической трансформации временной шкалы.
Описание процесса корреляции скважинных данных
В работе создан подход для автоматической корреляции по одной кривой ГИС (ГК или нейтронного каротажа по тепловым нейтронам (ННКт)), вопрос комплексирования нескольких ГИС не рассматривается. ГК и ННКт рассматриваются в первую очередь ввиду того, что эти исследования записаны на большинстве скважин.
Входными данными являются показания выбранного для корреляции метода ГИС, отметки кровли и подошвы коррелируемого интервала, также определяется число для разбиения скважин на группы (в дальнейшем кластеры), где показания ГИС скважин близки в смысле некоторой нормы. Число кластеров является параметром для оптимизации и может подбираться итерационно в зависимости от качества полученной корреляции.
Автоматическая корреляция скважинных данных выполняется по следующему алгоритму:
1. Подготовка ГИС на целевом фонде скважин для проведения корреляции: сшивка, увязка и нормализация ГК или ННКт.
2. Подготовка небольшой выборки скважин с экспертной разметкой целевых отметок.
3. Упорядочивание списка скважин для формирования корреляционной схемы. Рассматриваются две альтернативные схемы:
  • на основе методов кластерного анализа и главных компонент (Principal component analysis — PCA) по геофизическим откликам (геофизическое районирование целевого фонда скважин в рамках целевого интервала);
  • на основе учета пространственного взаиморасположения скважин (не рассматривается в работе).
4. Автоматическая корреляция отметок на целевом фонде скважин при помощи динамической трансформации временной шкалы (Dynamic Time Warping — DTW).
5. Контроль полученных результатов при помощи специальной визуализации кривых ГИС в виде цветовой развертки. Цветовая развертка представляет собой совместное отображение выборки кривых коррелируемых скважин, где каждая представлена в виде столбца пикселей, цвет которых характеризует значение соответствующего вида ГИС.
6. Уточнение корреляции на части скважин с помощью проведения ручной интерактивной корреляции (при необходимости).
Подготовка ГИС
Требования к подготовке ГИС основаны на необходимости проведения кластеризации скважин для формирования корреляционной схемы. Проведение кластеризации требует введения функции расстояния между векторами показаний кривых ГИС с разных скважин, а для этого необходимо, чтобы показания были одного масштаба и длины векторов были одного размера внутри целевого интервала. Например, кривые ГК и ННКт должны быть нормированы перед их использованием в корреляционной схеме.
Для нормализации данных ГК, ННКт по масштабу применяется метод дисперсии:
где vi — значения ГИС; vavr — среднее значение; num — количество данных в интервале нормализации; vi norm — нормированные значения ГИС.
Для приведения кривых к единому размеру проводится перенормализация по глубине, то есть число точек разбиения кривой на каждой скважине приводится к одному общему числу, обозначим его через n. Обозначим множество меток глубины q-й скважины как Dq = {dqj, j =
=1…mq} и множество значений кривой как Vq = {vqj, j = 1…mq}, где mq — число элементов множества точек на q-й скважине.
Определим шаг для пересчета глубин:
Определим новое множество глубин и соответствующее им множество значений кривой:
где g(x) — кусочно-линейная функция интерполяции, построенная по данным Dq, Vq.
В итоге для каждой скважины получена кривая с числом точек разбиения по глубине, равным n.
Группировка скважин методом кластеризации
Применение кластеризации позволяет сгруппировать скважины на заданное число кластеров по близости нормы, что потенциально упрощает корреляцию разреза внутри каждой из групп. Элементами кластера выступают векторы Vnewq размерности n. Результатом алгоритма кластеризации является соответствие между номером скважины и номером кластера. Наиболее популярным методом решения задач кластеризации остается неиерархический метод — алгоритм k-средних (k-means). Этот метод популярен за счет того, что он прост в реализации и его сложность линейна относительно мощности исследуемого множества O(m),
где m — число скважин.
Математически задача формулируется следующим образом. Пусть задано множество точек S и количество кластеров K, на которое требуется разбить данное множество. Необходимо найти такие положения центров кластеров ci, i=1…K, чтобы сумма квадратов расстояний точек кластеров до их центров была минимальной, при этом в качестве критерия близости точек используется Евклидова норма [4]:
где Сj — i-й кластер; ci — центр i-го кластера; sj — j-й текущий вектор i-го кластера.
Такая задача является корректно поставленной задачей оптимизации [5]. Так как число выборок K конечно, то и число возможных разделений конечно. Для решения задачи кластеризации чаще всего используются алгоритмы итеративной оптимизации, так как решение задачи путем перебора для больших n невыполнимо за разумное время.
Полное описание эвристического алгоритма метода k-средних можно найти в работах Дж. Хартигана и М. Вонга [6].
На рисунке 1 представлен пример кластеризации скважин по ННКт.
Рис. 1. Пример кластеризации скважин по ННКт

Отметим, что центры кластеров находятся только с учетом скважин, у которых нет пропущенных значений. А скважины, на которых есть пропущенные значения, приписываются к ближайшим кластерам только по данным, которые есть на скважине.
Упорядочивание списка скважин с применением метода главных компонент
Данные после кластеризации разделяются на определенные группы, однако внутри групп они не упорядочены (не отсортированы) в порядке уменьшения или увеличения взаимопохожести. Для обеспечения сортировки и получения более гладкой границы пластов внутри групп может быть применен метод PCA [7].
Пусть матрица X — массив данных, принадлежащий одному кластеру, где столбцами являются нормированные по глубине и по значениям показания ГИС по отдельной скважине.
С математической точки зрения метод анализа главных компонент — это декомпозиция исходной матрицы X, то есть представление ее в виде произведения двух матриц T и U, где матрица U есть матрица векторов нового базиса, а матрица T — представление матрицы X в новой системе координат. Суть метода заключается в том, что в первых компонентах матрицы T содержатся наиболее общие данные для исходной матрицы X.
Для задачи автоматической корреляции разреза будет применяться адаптивный метод анализа главных компонент. Алгоритм состоит в следующем:
1. Для матрицы X проводится стандартный метод анализа главных компонент. В результате находятся две матрицы T и U, такие, что X = U×T. Для этого применяется метод сингулярного разложения, который позволяет представить матрицу
Xn×m=Un×n×Sn×m×Vm×m=Un×n×Tn×m, где Tn×m=Sn×m×Vm×m, где Vm×m, Un×n — ортогональные матрицы.
2. Столбцы матрицы X сортируются в порядке возрастания значений первой строки матрицы T (или V). Этот шаг обоснован следующим соображением: значения элементов матрицы T можно воспринимать как коэффициенты схожести столбцов матрицы X в некоторой норме. Большая часть информации данных после разложения будет сосредоточена в первых координатах. Поэтому, отсортировав исходную матрицу по возрастанию значений первой строки матрицы T, можно выстроить столбцы в порядке похожести в смысле некоторой нормы. Если значения элементов одинаковые, то столбцы местами не меняются.
Отметим, что на скважинах встречаются пропущенные значения, связанные с отсутствием записи каротажа или неполным вскрытием скважиной исследуемого интервала. Метод PCA некорректно учитывает такие интервалы. В качестве решения в работе предлагается заполнять пропущенные значения соответствующими элементами центра кластера. Это позволяет избегать большого влияния пропущенных значений на формирование компонентов матрицы T в методе PCA.
Алгоритм динамической трансформации временной шкалы
Алгоритм DTW строит функцию соответствия двух векторов на общий набор точек так, чтобы расстояние между векторами было наименьшим [8, 9] по Евклидовой норме (7):
Результатом является взаимное соответствие элементов двух векторов через общий набор точек.
Далее отметки на коррелируемой скважине устанавливаются по данным самой близкой по расстоянию (8) опорной скважины. По опыту применения метод DTW может ошибаться при детальной корреляции, но при этом достаточно точно коррелировать выдержанные пласты большой толщины.
Результат применения
Корреляция верейского пласта
В рамках апробации приведенной методики на одном из объектов месторождений ПАО «НК «Роснефть» выполнена корреляция верейского пласта (C2vr) более чем на 300 скважинах. Выполнена подготовка исходных данных скважин (увязка, сшивка и нормировка по значениям), оценено распределение ошибки кровли и подошвы после интерактивной корреляции и экспертными отбивками.
На рисунке 2 представлена цветовая развертка кривых ГК (рис. 2а) и результат автоматической корреляции интервала (рис. 2б) на основе показаний кривой ГК на всех скважинах целевого фонда по всему стволу. По оси OX на картинках представлены скважины, по оси OY — относительная глубина. Фон отображается в тонах распределения тепла, когда наименьшему значению кривой соответствует самое «холодное» значение, а самому большому значению — самое «горячее». Шкала соответствия «значение — температурный цвет» приведена справа от каждого рисунка.
Рис. 2. Цветовая развертка кривых ГК — а, результат автоматической корреляции интервала — б

Красной линией отображен реперный интервал, относительно которого упорядочены кривые ГК на корреляционной схеме. Зелеными точками на рисунке отображены экспертные отметки опорного пласта C2vr. Была выполнена автокорреляция по показаниям ГК. Для этого среди скважин была выбрана опорная, имеющая четко выраженный опорный пласт, границы которого известны. На опорной скважине был определен интервал, содержащий опорный пласт и имеющий схожую структуру на большинстве скважин, проведена автокорреляция этого интервала.
На рисунке 3 изображен интервал на кривых ГК всего фонда скважин после кластеризации в более подробном масштабе. Зелеными точками выделен опорный пласт по результатам корреляции. Красные точки — заранее известные отметки экспертов.
Рис. 3. Результат корреляции опорного пласта на кривых ГК

В таблице 1 представлены статистические параметры сравнения результатов корреляции и экспертных отметок.
Табл. 1. Сравнение отметок интерактивной корреляции со всеми отметками экспертов

Корреляция каширского пласта
На рисунке 4 приведен пример внутрипластовой корреляции разреза на основе кластерного анализа: показаны данные до кластеризации, после кластеризации без применения PCA и с применением PCA, результаты корреляции отметок. Исходная выборка была представлена 98 скважинами. Количество кластеров является гиперпараметром, который необходимо подбирать под условия коррелируемого разреза. На исследуемом месторождении было выбрано разбиение на 4 кластера.
Рис. 4. Пример внутрипластовой корреляции разреза на основе кластерного анализа: до кластеризации — а, после кластеризации без PCA — б, после кластеризации с PCA — в, коррелированные отметки — г

После применения кластерного анализа с PCA наблюдается более гладкая граница разрезов внутри каждого из кластеров (алгоритмически порядок столбцов был изменен в сторону увеличения взаимопохожести) по сравнению с кластерным анализом без PCA.
Основные результаты данной работы были получены при участии безвременно покинувшего нас кандидата технических наук Надеждина Олега Владимировича. Мы с теплотой и благодарностью вспоминаем годы плодотворной совместной с ним работы.
Латыпов И.Д., Марков А.В., Евграфов Н.А., Шагимарданова Л.Р.

ООО «РН-БашНИПИнефть» (ОГ ПАО «НК «Роснефть»), Уфа, Россия

markovav@bnipi.rosneft.ru
В работе рассматриваются методы внутрипластовой корреляции разреза скважин.
Автоматическая корреляция разреза основана на использовании алгоритмов кластерного анализа, метода главных компонент и динамической трансформации временной шкалы. Методы главных компонент и кластерного анализа применяются для упорядочивания данных разных скважин по геофизическим откликам, что позволяет более эффективно проводить корреляцию разреза при помощи алгоритма динамической трансформации временной шкалы (DTW).
корреляция разреза, метод k-средних, алгоритм динамической трансформации временной шкалы, метод главных компонент
Латыпов И.Д., Марков А.В., Евграфов Н.А., Шагимарданова Л.Р. Разработка подходов к автоматизированной внутрипластовой корреляции по данным геофизических исследований скважин с применением машинного обучения // Экспозиция Нефть Газ. 2024. № 4. С. 47–51.
DOI: 10.24412/2076-6785-2024-4-47-51
23.04.2024
УДК 519.688:550.3
DOI: 10.24412/2076-6785-2024-4-47-51

Рекомендуемые статьи
© Экспозиция Нефть Газ. Научно-технический журнал. Входит в перечень ВАК
+7 (495) 414-34-88