Прогнозирование пластового давления методами машинного обучения
Байбуров Р.Р., Насыбуллин А.В. Институт «ТатНИПИнефть», АГТУ «Высшая школа нефти»
В представленной статье анализируется применение машинного обучения для оценки его эффективности и потенциала с целью определения и прогнозирования значений пластового давления при разработке нефтяных месторождений по сравнению с обычными статистическими моделями нефтегазовой инженерии. Исследование обусловлено необходимостью измерения пластового давления в зонах отбора и в зонах закачки залежи для рационального мониторинга разработки месторождений углеводородов. Непосредственные измерения давления пласта занимают продолжительное время и требуют остановки работы скважин, что чревато недобором добываемого сырья и затруднением последующих запусков скважин. Основной способ определения значения данного параметра — это гидродинамические исследования при неустановившихся режимах. После остановки фонда скважин процесс стабилизации забойного давления до величины пластового длится значительный период времени. Ввиду отсутствия возможности одновременной остановки всех скважин фонда становится затруднительно оценить действительное энергетическое состояние залежи. В представленной статье рассматривается применение машинного обучения для оценки пластового давления без остановки скважин на исследование. В качестве инструмента исследования были опробованы такие алгоритмы машинного обучения, как градиентный спуск и дерева решений. Высокая точность и работоспособность таких моделей требуют полноты и достоверности исходных данных. Данная технология позволяет вычислять пластовое давление в различные периоды разработки залежей или блоков месторождений.
Введение
Для мониторинга разработки нефтяных месторождений необходим постоянный сбор информации о динамике изменения дебитов нефти, газа и воды, закачки агента вытеснения, фонда скважин, пластового и забойного давления, газового фактора, контуров нефте- и газоносности. Измерение данных показателей осуществляется средствами автоматизированных и автоматических измерений физических величин.
В пределах данного исследования будут затронуты способы измерения пластового давления, а именно следующие: прямые замеры погружными датчиками (например ГДИС); расчеты забойного и пластового давлений по устьевым показаниям; контроль текущих статических уровней жидкостей в простаивающих скважинах на момент измерения или в скважинах-пьезометрах.
Направлением, набирающим популярность в последнее время, следует считать машинное обучение. Данная технология появилась в середине прошлого века, однако приобрела интенсивное развитие в современности благодаря широкому наличию мощных электронно-вычислительных машин.
Регрессионный анализ и прогнозирование числовых данных составляют фундаментальный раздел машинного обучения, связанный с построением моделей, способных предсказывать значения непрерывной целевой переменной на основе наблюдаемых признаков.
Авторами научных работ [1, 2] предложен новый способ определения текущего пластового давления в зонах отбора, основанный на построении многомерных математических моделей по данным геолого-технологических показателей разработки. В качестве исходных данных использованы значения пластового давления, определенные при обработке материалов гидродинамических исследований скважин, а также набор геолого-технологических показателей.
В ходе исследований использованы различные варианты статистического моделирования, в процессе которых установлены закономерности поведения пластового давления в процессе выработки запасов, индивидуальные для конкретного объекта разработки. Полученные модели характеризуются высокой степенью достоверности. Метод регрессии является широко распространенным и известным методом машинного обучения [2–5]. Следовательно, в данной работе представлены результаты исследований, основанных на этом методе, а также их сопоставление с фактическими значениями, полученными на основе измерений этих параметров.
Исходные данные для обучения и прогнозирования пластового давления
Как объект исследования выбрано месторождение с бобриковским горизонтом разработки (объект Сбр-2,3). Данное месторождение разрабатывается уже полвека, находясь практически на этапе падающей добычи. Данные по его эксплуатации накопили уже достаточно полный объем для обработки статистическими методами. Основные технологические показатели разработки представлены в таблице 1.
Табл. 1. Основные технологические показатели разработки бобриковского горизонта выбранного блока месторождения
Динамика пластового давления исследуемого периода в зоне отбора и нагнетания в сопоставлении с параметрами закачки и добычи выбранного блока показана на рисунке 1.
Рис. 1. Динамика технологических параметров объекта C1bb
Для визуализации пластового давления на рисунке 2 изображена карта пластовых давлений бобриковского горизонта (C1bb) визейского яруса нижнего карбона выбранного месторождения на момент второй половины 2023 года.
Рис. 2. Карта пластовых давлений бобриковского горизонта (C1bb) визейского яруса нижнего карбона выбранного месторождения за 2023 год
Существующая система заводнения не позволяет в полной мере поддерживать давление на всех участках, что следует из карты изобар на рисунке 2.
Выбранный блок исследуемого месторождения характеризуется в большей части высокой эффективностью системы заводнения ввиду сбалансированности соотношений: добывающего и нагнетательного фондов, приемистостей и дебитов по жидкости по скважинам. Южная часть данного блока имеет пониженную тенденцию энергетики.
Формирование обучающей выборки
В ходе анализа разработки выделено 11 параметров, которые включены в обучающую выборку, содержащую информацию по всем скважинам выбранного блока. Входными данными для обучения модели стали следующие параметры скважин: дата, номер скважины, дебит жидкости, дебит нефти, время добычи, приемистость по воде, время закачки, нефтенасыщенная толщина, коэффициент пористости, коэффициент нефтенасыщенности, забойное давление. Выходным параметром выбрано пластовое давление.
После выбора параметров была сформирована единая база данных, произведена очистка обучающей выборки (предобработка) от возможных выбросов для повышения прогностической способности.
На следующем этапе (структуризация) данные были нормализованы — приведены к единому максимальному значению (единице) с целью устранения дисбаланса в масштабе различных признаков.
Целевым параметром для прогнозирования является пластовое давление в зоне отбора и в зоне закачки. Построение модели: 1. Выбор входных данных для обучения модели. 2. Проведение предобработки базы данных. 3. Импорт библиотек Python. 4. Загрузка базы данных (с использованием библиотек Python) в виде книги Excel в среду разработки, разделение на тренировочную (обучающую) и тестовую выборки (в пропорции 67/33). 5. Нормализация данных. 6. Машинное обучение на тренировочной выборке и прогнозирование на тестовой.
Точность прогнозирования модели, как и в любых других задачах машинного обучения, характеризуется метриками (средняя абсолютная ошибка, среднеквадратическая ошибка и др.).
Методология
Алгоритм деревьев решений выбран ввиду его быстрого процесса обучения, высокой точности прогноза и построения непараметрических моделей. Дерево решений для регрессии представляет собой иерархическую структуру, где данные рекурсивно разделяются согласно определенным правилам. Главный принцип построения дерева решений для регрессии заключается в разбиении пространства признаков на области, где значение целевой переменной примерно одинаково. Каждый внутренний узел дерева представляет собой условие проверки определенного признака, а каждый листовой узел содержит среднее значение целевой переменной для всех наблюдений, попавших в эту область [6].
Преимущество алгоритма дерева принятия решений заключается в том, что при работе с нелинейными данными он не требует каких-либо трансформаций признаков, т. к. деревья принятия решений анализируют по одному признаку за раз, а не принимают во внимание взвешенные комбинации. Аналогичным образом для деревьев принятия решений не требуется нормализация или стандартизация признаков. Дерево принятия решений выращивается за счет последовательного разделения его узлов до тех пор, пока листовые узлы не станут чистыми или не будет удовлетворен критерий остановки [7].
Градиентный спуск. Рассмотрим алгоритмы градиентного спуска как одного из методов дерева решений. Он способен значительно улучшать качество прогнозирований за счет последовательного обучения слабых моделей, что позволит повысить общую точность прогнозирования. Преимущество заключается в достижении высокой точности при работе с нелинейными зависимостями.
Конкретно в данном исследовании рассмотрена библиотека CatBoost — реализация алгоритма градиентного спуска, которая имеет следующие основные особенности: • спуск с упорядочиванием обучающих примеров; • использование решающих таблиц; • упорядоченное целевое кодирование на категориальных признаках высокой размерности [8]. Преимущества использования CatBoost: • CatBoost позволяет проводить обучение на нескольких графических процессорах (GPU); • библиотека позволяет получить отличные результаты с параметрами по умолчанию, что сокращает время, необходимое для настройки гиперпараметров; • обеспечивает повышенную точность за счет уменьшения переобучения; • возможность быстрого прогнозирования с применением модели CatBoost; • способна обрабатывать пропущенные значения; • может использоваться для регрессионных и классификационных задач.
Прогнозирование пластового давления с помощью методов машинного обучения
С использованием методов машинного обучения воспроизведены исторические замеры пластового давления исследуемого блока выбранного месторождения. Сравнение рассчитанных и фактически измеренных пластовых давлений для всех скважин бобриковского объекта разработки показано в виде корреляционной зависимости на рисунках 3, 4.
Рис. 3. Диаграмма корреляции между фактическими и спрогнозированными значениями пластового давления методом машинного обучения алгоритмом дерева решений
Рис. 4. Диаграмма корреляции между фактическими и спрогнозированными значениями пластового давления методом машинного обучения алгоритмом градиентного спуска CatBoost
В результате анализа полученных показателей и диаграмм можно заключить, что алгоритмами прогнозирования пластового давления получаются адекватные результаты. Корреляция спрогнозированных значений с фактическими измеренными довольно высока, что говорит о хорошей сходимости результатов в целом по объекту исследования.
Далее показано поскважинное сопоставление результатов ввиду большого объема данных и широкого диапазона их значений. Для наглядности построены диаграммы сопоставления результатов фактических и расчетных значений пластового давления (рис. 5–7). Выбор скважин как объекта для демонстрации полученных данных произведен таким образом, чтобы отразить наиболее полную картину применимости используемых методов.
Рис. 5. Сопоставление фактических и рассчитанных средних значений пластового давления для скважины № 1
Рис. 6. Сопоставление фактических и рассчитанных средних значений пластового давления для скважины № 2
Рис. 7. Сопоставление фактических и рассчитанных средних значений пластового давления для скважины № 3
Примененные методы показали, что могут быть использованы для решения производственных задач с участием эксперта для правильной настройки и оценки отклонений в полученных данных. Возможно применение других алгоритмов машинного обучения для решения поставленной задачи, однако необходима их правильная настройка. Также не исключается расширение набора факторов для более точного моделирования пластового давления. Сравнение отклонений, полученных в результате применения алгоритмов машинного обучения по всей исследуемой выборке, перечислено в виде метрик в таблице 2.
Табл. 2. Метрики применения алгоритмов множественной линейной регрессии
Таким образом, можно отметить, что примененные методы машинного обучения имеют приблизительно одинаковые минимальные отклонения спрогнозированных значений пластового давления от фактических, что доказывает их точность, эффективность и перспективность в использовании. Также высокий коэффициент детерминации говорит об адекватности построенных моделей.
Исследования показывают свою эффективность при правильной настройке, подборе параметров и предобработке данных. Как и любая другая технология, она применима для решения конкретной правильно поставленной задачи.
Исследования, описанные в данной статье, посвящены построению моделей машинного обучения для прогнозирования пластового давления в зонах отбора добывающих скважин и закачки нагнетательных скважин выбранного блока месторождения. Примененные модели машинного обучения не всегда применимы для данного рода задач без контроля экспертом в качестве математической основы для методики определения пластового давления без остановки скважин на исследование. Для полноценного применения технологии необходимы точная настройка выбранной модели машинного обучения и тщательная предобработка данных. Преимуществами данной методики являются простота вычислений и использование в качестве исходных данных только тех параметров, которые измеряются регулярно и вполне достоверно средствами измерения на промысле.
Галкин В.И., Пономарева И.Н., Мартюшев Д.А. Прогноз пластового давления и исследование его поведения при разработке нефтяных месторождений на основе построения многоуровневых многомерных вероятностно-статистических моделей // Георесурсы. 2021. Т. 23. № 3. С. 73–82.
Галкин В.И., Пономарева И.Н., Черных И.А. Способ определения текущего пластового давления в эксплуатирующейся скважине турнейско-фаменской залежи без ее остановки. Патент RU2715490C1. 30.07.2019 Патентообладатель(и): Галкин В.И., Пономарева И.Н., Черных И.А.
Hanqin Shi, Liang Tao. Visual comparison based on linear regression model and linear discriminant analysis. Journal of Visual Communication and Image Representation, 2018, Vol. 57, P. 118–124. (In Eng).
Gomaa Sayed, Emara Ramadan, Mahmoud Omar, El-hoshoudy A.N. New correlations to calculate vertical sweep efficiency in oil reservoirs using nonlinear multiple regression and artificial neural network. Journal of King Saud University – Engineering Sciences, 2022, Vol. 34, № 7, P. 368–375. (In Eng).
Mohaghegh Shahab D. Subsurface analytics: Contribution of artificial intelligence and machine learning to reservoir engineering, reservoir modeling, and reservoir management. Petroleum Exploration and Development, 2020, Vol. 47, issue 2, P. 225–228. (In Eng).
Дерево решений для регрессии: основные принципы и применение. URL: https://sky.pro/wiki/analytics/derevo-reshenij-dlya-regressii-osnovnye-printsipy-i-primenenie/ (дата обращения: 18.03.2025).
Рашка С., Мирджалили В. Python и машинное обучение: машинное и глубокое обучение с использованием Python, scikit-learn и TensorFlow 2. СПб.: Диалектика, 2020. 848 с.
CatBoost, XGBoost и выразительная способность решающих деревьев. Хабр: сообщество IT специалистов. URL: https://habr.com/ru/companies/ods/articles/645887/ (дата обращения: 18.03.2025).
Байбуров Р.Р., Насыбуллин А.В.
Институт «ТатНИПИнефть», Альметьевск, Россия; АГТУ «Высшая школа нефти», Альметьевск, Россия
BayburovRobertR@tatnipi.ru
Машинное обучение для прогнозирования технологического параметра, предобработка и структуризация базы данных.
Байбуров Р.Р., Насыбуллин А.В. Прогнозирование пластового давления методами машинного обучения // Экспозиция Нефть Газ. 2025. № 7. C. 112–116. DOI: 10.24412/2076-6785-2025-7-112-116