Апробация подхода по автоматической интерпретации эхограмм методами машинного обучения
Ишкина Ш.Х., Закирьянов И.И., Сагдеев Э.И., Акрамов И.Р., Амекачев Р.М., Ишкин Д.З. Давлетбаев А.Я., Щутский Г.А., Мустафин Д.А.


ООО «РН-БашНИПИнефть»
(ОГ ПАО «НК «Роснефть»)
Описан подход по автоматизации определения динамического уровня жидкости в скважине методом эхометрирования с применением алгоритмов машинного обучения. Актуальность связана с тем, что на отдельных месторождениях Западной Сибири остается механизированный фонд скважин, на которых выходят из строя датчики давления в телеметрической системе. Результаты апробации реализованного подхода на промысловых данных позволяют сделать вывод о его применимости в задаче контроля достоверности интерпретации эхограмм, что поможет снизить риски потери дорогостоящего насосного оборудования и повысить эффективность разработки месторождения.
Введение
Уровнем жидкости в скважине называется расстояние от устья до уровня жидкости в межтрубном пространстве [1]. Величина уровня жидкости в нефтяной скважине является одним из важнейших параметров, который контролируют в процессе эксплуатации для прогнозирования/интенсификации добычи, а также для планирования и проведения различных мероприятий. Определение уровня жидкости, как правило, осуществляется периодически в тех случаях, когда неисправен датчик давления на приеме механизированной скважины с установкой электроцентробежного насоса (УЭЦН) и в скважинах со штанговыми насосными установками (ШГН), в которые не спущен датчик давления на кабеле/проволоке. На основе полученного значения уровня с помощью известных математических моделей многофазных течений [2] осуществляется расчет забойного давления.
Измерение статического уровня в остановленных скважинах и динамического уровня в работающих скважинах используется при выборе глубинного насосного оборудования, определения/контроля его режима работы и глубины спуска в скважину [1]. Если скорость откачки жидкости из ствола скважины насосом превышает скорость притока флюида из пласта, то наблюдается увеличение динамического уровня, что приводит к падению давления на приеме насоса. Дальнейшее увеличение динамического уровня приведет к срыву подачи. Если аварийное отключение не сработает, работа насоса в режиме сухого трения приведет к повреждению деталей и потере дорогостоящего оборудования.
Одним из основных методов определения уровня жидкости в межтрубном пространстве скважин, не оборудованных датчиками давления, является эхометрирование. При данном исследовании на устье скважины создается акустический импульс и с помощью эхолота регистрируется отклик от границы раздела «газ-жидкость» (динамического уровня). Пример эхограммы с однозначным откликом от границы раздела «газ-жидкость» приведен на рисунке 1. Интерпретация эхограммы заключается в том, что на графике определяется время пробега звуковой волны с момента создания импульса на устье скважины до прихода значимого отклика, т. е. от динамического уровня жидкости в межтрубном пространстве скважины. На основе полученного времени пробега по результатам интерпретации эхограммы [1] и принятой величины скорости звука [3–6] рассчитывается динамический уровень.
Рис. 1. Пример эхограммы

Процесс интерпретации эхограмм в большинстве случаев не автоматизирован и, как правило, выполняется специалистами по исследованиям скважин вручную. При наличии значительного количества измерений на большом фонде скважин этот процесс может потребовать существенных временных затрат при выполнении расчетов. Кроме того, интерпретация значительного массива данных может сопровождаться ошибками со стороны специалистов, в том числе по причине, связанной с субъективностью или отсутствием соответствующего опыта. В данной работе описан алгоритм на основе методов машинного обучения, разработанный с целью создания системы по автоматической интерпретации промысловых исследований методом эхометрирования для повышения скорости и достоверности определения динамического уровня жидкости в скважине.
Обзор существующих подходов по автоматической интерпретации эхограмм
Исследование методом эхометрирования может давать неоднозначный результат. Определение значимого отклика от уровня жидкости может быть осложнено зашумленностью графика амплитуды. На акустический сигнал также влияют колебания колонны насосно-компрессорной трубы (НКТ), отражение сигнала от неоднородностей затрубного пространства, отражения от муфт НКТ, акустический шум насоса [7]. Поэтому большинство работ по автоматическому определению уровня жидкости в скважине посвящено предобработке сигнала и дальнейшему вычислению искомого значения времени пробега сигнала. Другим направлением исследования является разработка методов по определению скорости звука, поскольку установлено, что она зависит от свойств газа в затрубном пространстве [3–6, 8], однако это большая задача, которая требует отдельного рассмотрения. В данной работе решается задача автоматизированного поиска значимого отклика на эхограмме.
В статье [9] для определения времени прохождения сигнала от источника до уровня жидкости сравнивают два подхода. В первом проводят предобработку данных эхограммы, а именно, удаление шума, с помощью преобразования Фурье. Далее на полученном ряде ищут пики амплитуды и расстояние между пиками принимают за искомую величину. Во втором подходе пики ищут на графике автокорреляции [10] эхограммы с различными смещениями. Смещение, при котором значение автокорреляции максимально, соответствует искомому значению. Показано, что при наличии шума второй подход дает более точные результаты, так как на графике автокорреляции пики имеют более высокие значения по амплитуде.
Авторы Zhou W. и др. проводят серию исследований [11–13] по определению динамического уровня жидкости в скважине. В статье [11] устанавливается связь между уровнем жидкости и резонансной частотой звукового поля трубы, согласно теории резонанса воздушного столба в трубе. В работе [12] применяются свeрточные фильтры для уменьшения влияния шума при решении задачи и определяют резонансную частоту с помощью оценки спектральной плотности мощности методом Уэлча [14]. Продолжая свою работу в статье [13], авторы используют преобразование Фурье и улучшают точность определения динамического уровня.
В статье [8] авторы строят вейвлет-преобразование сигнала, после чего вычисляют Ганкелеву матрицу для коэффициентов преобразования [15] и находят ее ранг с помощью сингулярного (SVD) разложения. Ранг Ганкелевой матрицы равен длине периода в исходном сигнале и, таким образом, определяет положение искомого отклика.
Эти исследования свидетельствуют об актуальности задачи определения динамического уровня с использованием эхометрирования и подтверждают возможность автоматизации процесса интерпретации эхограмм. Однако разработанные методы являются аналитическими и требуют адаптации значений параметров под каждый новый набор данных. Недостатком подхода [8] является также большая вычислительная сложность построения Ганкелевой матрицы и сингулярного разложения, что делает метод неприменимым в задаче разработки эффективного и быстродействующего алгоритма автоматической интерпретации. Для устранения ограничений аналитических алгоритмов в данной работе обсуждаются результаты апробации реализованного подхода на основе методов машинного обучения.
Описание разработанного подхода
В терминах машинного обучения поиск интервала отклика от динамического уровня на эхограмме формулируется как задача сегментации сигнала на две области точек: принадлежащих искомому отклику и остальных. Для обработки сигналов широко применяются сверточные нейронные сети (CNN) [16], так как они способны анализировать небольшие локальные области в упорядоченных данных и выделять в них особенности. Среди известных моделей на основе CNN при сегментации изображений хорошо показала себя архитектура U-Net [17], которая представляет собой два последовательных блока, называемых энкодером и декодером. В энкодере происходит выделение ключевой информации из данных путем увеличения фильтров свертки и снижения размерности входных данных. В декодере происходит генерация ответа путем уменьшения фильтров свертки и приведения данных к исходной размерности. Задачей энкодера является извлечение основного смысла из данных, задачей декодера — вычисление правильного ответа из выделенной энкодером информации.
Описанная архитектура была выбрана для реализации подхода и адаптирована под особенности решаемой задачи. Поскольку входные данные являются одномерным массивом значений амплитуды, энкодер и декодер были определены на основе одномерной CNN.
Целевая переменная задавалась как массив из 0 и 1. Единицы соответствуют тем моментам времени, где наблюдается отклик от динамического уровня. В качестве функции потерь была использована BCELoss [18], то есть для каждой точки решалась задача бинарной классификации принадлежности классу 1. Выходом модели является массив вероятностей принадлежности точек эхограммы к интервалу отклика.
Обучающая выборка для построения модели машинного обучения составила 20 тысяч исследований методом эхометрирования для скважин на ряде месторождений Западной Сибири. При подготовке данных были исключены неинформативные исследования, примеры которых приведены на рисунке 2. Такие эхограммы могут содержать различные шумы (рис. 2а) или аномалии (рис. 2б, 2в), в этом случае эксперт делает вывод о невозможности однозначного определения величины динамического уровня.
Рис. 2. Примеры неинформативных эхограмм: a — имеются зашумленные участки с высокой амплитудой шума, б и в — на начальном участке эхограммы имеются аномалии

Путем варьирования количества слоев сети, гиперпараметров свертки, шага обучения и количества эпох обучения были определены архитектура и оптимальные гиперпараметры разработанной модели. В качестве оптимизатора был использован Adam [19]. Подбор основывался на характере изменения функции потерь на обучающей и контрольной выборках. На рисунке 3 приведен график обучения, на котором было достигнуто наименьшее значение функции потерь (0,004637). Обучение модели более чем на 12 эпохах приводит к переобучению, когда функция потерь на контрольной выборке начинает постепенно увеличиваться.
Рис. 3. Изменение функции потерь при обучении нейронной сети

После получения ответа модели выделяются интервалы, на которых вероятность превышает заданное пороговое значение. В случае неоднозначности среди них выбирается тот интервал, на котором достигается наибольшее значение вероятности. Этот интервал определяется как искомый интервал отклика от динамического уровня жидкости.
Пример работы алгоритма показан на рисунке 4, где при пороговом значении 0,01 выделено три интервала. Среди них отбирается третий интервал, так как на нем достигается максимальное значение вероятности.
Рис. 4. Пример работы алгоритма поиска границ интервала отклика

Расчет динамического уровня проводится согласно следующему алгоритму. На двух интервалах — исходном отклике и найденном с помощью модели — находятся точки максимума амплитуды. Далее половина времени пробега сигнала между этими точками умножается на известную скорость звука. Полученное значение принимается за ответ алгоритма.
Тестирование подхода на промысловых данных
Тестирование проведено на выборке, состоящей из 2 тысяч исследований методом эхометрирования для добывающих механизированных скважин на месторождениях Западной Сибири, которые не были использованы во время обучения модели. Кроме того, предварительно исключены эхограммы, на которых, согласно заключению эксперта, динамический уровень не выделяется однозначно.
Оценкой точности являлось абсолютное отклонение ответа алгоритма от значения динамического уровня, определенного экспертом. Для интерпретации результатов тестирования выделены три категории эхограмм. На рисунке 5 приведены примеры эхограмм из каждой категории. Вертикальной линией отмечены точки максимума, по которым рассчитывался динамический уровень.
Рис. 5. Примеры эхограмм из трех категорий:
a — отклонение менее 20 м,
б — отклонение от 20 до 50 м,
в — отклонение более 50 м

Первую категорию составляют эхограммы, для которых отклонение ответа алгоритма находится в допустимом диапазоне и составляет менее чем 20 метров (рис. 5а). К данной категории ошибок относится большинство тестовых исследований.
Вторую категорию составляют тестовые примеры с ошибкой от 20 до 50 метров (рис. 5б). В данную группу попадают эхограммы, в которых ответ модели верен, но время пробега импульса на основе точек максимума амплитуды рассчитано некорректно. Это связано с тем, что отклики от уровня жидкости имеют нестандартную форму. Для устранения ошибок в дальнейшем планируется рассмотреть подход на основе автокорреляции.
Третью категорию составляют эхограммы с ошибкой более чем на 50 метров (рис. 5в). В данных примерах модель выдает неверный ответ, выбирая отклики от конструкции скважины, которые очень похожи на отклик от уровня жидкости. Поэтому в дальнейшем планируется учитывать в алгоритме дополнительную информацию об элементах конструкции скважины (реперы, муфты НКТ, изменения диаметра колонны НКТ и др.).
В таблице 1 представлены результаты сравнения описанного подхода (ML) с разработанным ранее аналитическим методом на основе автокорреляции (ACF) [9]. Показано распределение по трем категориям.
Табл. 1. Распределение исследований из тестовой выборки по категориям

Общая доля эхограмм второй и третьей категории составляет 2 %. Также можно отметить, что доля эхограмм в первой категории для алгоритма ML на 20 % больше по сравнению с алгоритмом ACF. Таким образом, можно сделать вывод, что разработанный алгоритм хорошо справляется с поставленной задачей и оказывается на 20 % точнее алгоритма на основе автокорреляции.
Примеры апробации на промысловых данных
Реализованный алгоритм позволил обнаружить пример некорректной интерпретации и определения заниженной величины динамического уровня при обработке эхограммы вручную интерпретатором сервисной компании.
Для иллюстрации подхода рассмотрены исходные данные по нескольким исследованиям в скважине 108ХХ месторождения Y, проведенные в период с 2021 по 2023 гг. На рисунке 6 приведены исходные данные одного из исследований в указанный период времени с двумя результатами интерпретации.
Рис. 6. Пример некорректной интерпретации вручную и автоматического уточнения величины динамического уровня с применением машинного обучения

Вертикальными линиями отмечены точки на эхограмме, по которым рассчитывается время пробега звукового сигнала и, соответственно, динамический уровень: фиолетовой линией — точка максимума на исходном импульсе, красной линией — точка, выбранная интерпретатором сервисной компании, зеленой линией — точка, выбранная алгоритмом с применением методов машинного обучения. Зеленая линия расположена на точке максимума на отклике, тогда как красная находится левее и приводит к определению заниженного значения динамического уровня.
На рисунке 7 приведены графики изменения динамического уровня, которые рассчитаны интерпретатором вручную (линия синим маркером), и величины динамического уровня, рассчитанные с помощью алгоритма с применением методов машинного обучения (линия красным маркером). Горизонтальной линией отмечена глубина спуска насоса в механизированной скважине.
Рис. 7. Сравнение динамик изменения динамического уровня жидкости, рассчитанных интерпретатором вручную и автоматически с применением методов машинного обучения

Можно видеть, что имеется период с апреля 2021 года по март 2022 года, когда значения уровня жидкости, полученные интерпретатором вручную, оказываются меньше величин динамического уровня, полученных алгоритмом с применением методов машинного обучения. При этом стоит отметить, что ответы интерпретатора оказываются меньше значения глубины спуска насоса, тогда как корректный расчет по алгоритму дает значения больше глубины спуска насоса. Причина этого заключается в неверно принятой величине скорости звука по данной скважине. Более детальное изучение результатов исследований за этот период показало, что все эхограммы имеют вид как на рисунке 6. Отсюда следует вывод, что интерпретатор намеренно занижал величину динамического уровня с целью получения значений меньше глубины спуска УЭЦН. Тогда как на основе установленных правил интерпретатор исследования обязан инициировать проверку принятых значений скорости звука по данной скважине и проведение дополнительных исследований для уточнения скорости звука в межтрубном пространстве скважины.
Анализ результатов интерпретации на случайной выборке из 2 500 исследований на месторождении N показал, что имеется 8 % исследований, где ответы алгоритма с применением методов машинного обучения расходятся с ответом интерпретатора сервисной компании более чем на 20 метров. Ответы алгоритма были верифицированы экспертом, таким образом, их можно считать корректными. Отклонения ответов интерпретатора на данной выборке были распределены по трем группам так, как показано на рисунке 8.
Рис. 8. Иллюстрация схемы скважины. Распределение исследований в случае ошибочной интерпретации вручную относительно истинного динамического уровня

Можно видеть, что для 4,5 % исследований ошибка интерпретатора сервисной компании находится в пределах 50 метров, для 3,2 % обнаружено занижение значений динамического уровня, для 0,3 % — завышение. Некорректное определение динамического уровня повышает риски при эксплуатации скважины: занижение может привести к срыву подачи вследствие неверной оценки потенциала и подбору насосного оборудования, завышение — к недополученной добыче вследствие недооценки потенциала. Использование алгоритма с применением методов машинного обучения поможет автоматически и своевременно обнаружить недостоверные данные в результатах интерпретации, которые потребуют отдельной выборочной проверки экспертом, и, соответственно, снизить риски в работе механизированного фонда скважин и повысить эффективность разработки месторождения.
Ишкина Ш.Х., Закирьянов И.И., Сагдеев Э.И., Акрамов И.Р., Амекачев Р.М., Ишкин Д.З., Давлетбаев А.Я., Щутский Г.А., Мустафин Д.А.

ООО «РН-БашНИПИнефть» (ОГ ПАО «НК «Роснефть»), Уфа, Россия;
ФГБОУ ВО «Уфимский государственный нефтяной технический университет», Уфа, Россия; ФГБОУ ВО «Уфимский университет науки и технологий», Уфа, Россия;
ООО «РН-Юганскнефтегаз», Нефтеюганск, Россия

ishkinashkh@bnipi.rosneft.ru
Разработанный подход основан на модели сверточной нейронной сети. Архитектура U-Net адаптирована под особенности входных данных и решаемой задачи. Апробация проведена на промысловых данных отдельных месторождений Западной Сибири.
машинное обучение, сверточная нейронная сеть, гидродинамические исследования скважин, эхометрирование, забойное давление, динамический уровень жидкости
Ишкина Ш.Х., Закирьянов И.И., Сагдеев Э.И., Акрамов И.Р., Амекачев Р.М., Ишкин Д.З, Давлетбаев А.Я., Щутский Г.А., Мустафин Д.А. Апробация подхода по автоматической интерпретации эхограмм методами машинного обучения // Экспозиция Нефть Газ. 2024. № 5. С. 51–56.
DOI: 10.24412/2076-6785-2024-5-51-56
16.08.2024
УДК 519.688, 553.98
DOI: 10.24412/2076-6785-2024-5-51-56

Рекомендуемые статьи
© Экспозиция Нефть Газ. Научно-технический журнал. Входит в перечень ВАК
+7 (495) 414-34-88