В начале октября я выступал на AI конференции, где рассказал о том, как искусственный интеллект меняет нефтегазовую отрасль. Один из кейсов вызвал особый интерес, и я хочу рассказать о нем подробнее.
🚀 Кейс: Определение высокопроницаемых интервалов на газовом месторождении
Одна нефтегазовая компания рассматривала возможность участия в проекте на севере Африки. Основной проблемой была высокая неопределенность геологической модели, особенно в части предсказаниия высокопроницаемых интервалов в скважинах. От этого зависела рентабельность всего проекта. Мы разработали модель, которая использовала данные каротажа и керна для предсказания высокопроницаемых интервалов. В результате модель выявила самую продуктивную скважину на месторождении, которая ранее не была протестирована. После уточнения геологической модели и пересмотра проницаемости, проект показал положительное значение EMV (ожидаемой денежной стоимости), что позволило клиенту войти в этот проект.
🛠️ Как мы этого достигли
Задачей проекта было сделать модель для предсказания типов горных пород по данным каротажных кривых. Каротажные кривые — это измерения различных физических полей (естественных и вызванных) вдоль ствола скважины. Разметкой являлись данные исследования керна. Керн — это образцы горной породы, извлеченные из скважины, на которых проводятся прямые измерения свойств, например пористости или проницаемости. Данные каротажных кривых и измерений на образцах керна можно объединить между собой по глубине. Таким образом был получен датасет для обучения модели бинарной классификации (высоко- и низкопроницаемые интервалы резервуара).
🔄 Преодоление сложности с данными
Основной вызов заключался в том, что данные были неравномерно распределены по глубине — нижние слои пласта были изучены меньше, чем верхние. При этом доля высокопроницаемого класса в нижней части пласта была ниже чем в верхней. После консультации со специалистами выяснилось, что нет оснований полагать, что нижняя часть резервуара имеет меньшую долю положительных классов. Поэтому такие признаки, как расстояние от кровли пласта или названия пропластков, не использовались в модели, чтобы не переносить смещение тренировочной выборки на тестовую.
☑️ Решение основной задачи проекта
Для проверки устойчивости и обобщающей способности модели мы провели кросс-валидацию с использованием стратификации по скважинам. Это позволило убедиться, что модель стабильно работает на различных подмножествах данных. Модель показала высокую эффективность: F1-мера для класса высокопроницаемых интервалов достигла 0.85. Обученную модель применили к скважинам, в которых отсутствовали истинные метки, а также к интервалам скважин без разметки.
🔎 Неожиданное открытие
Интересный момент возник, когда модель выявила значительный высокопроницаемый интервал в одной из скважин, которая ранее не была протестирована и не изучалась по керну. При презентации результатов клиент скептически отнесся к тому, что модель обнаружила то, что не было выявлено специалистами как со стороны sell-side (одной из топ-5 нефтяных компаний мира), так и со стороны buy-side (компания с которой я работал).
🔑 Интерпретация с помощью чисел Шепли
Чтобы подтвердить обоснованность предсказаний, мы использовали анализ чисел Шепли, который помог показать вклад каждого признака в итоговые предсказания. Числа Шепли — это концепция из теории игр, позволяющая оценивать вклад игроков в общий выигрыш. В данном случае в качестве игроков рассматривается вклад различных объясняющих переменных в предсказания модели.
🧩 Ключевой признак — содержание тория
При анализе сводных графиков Шепли обнаружилось, что предсказания модели повторяют решения петрофизиков при анализе каротажных кривых. Но это не отвечало на вопрос почему модель предсказывала мощный интервал в верхней части пласта. Тогда я продолжил анализ с помощью графиков частичной зависимости (Partial Dependence Plots), чтобы выявить более низкоуровневые зависимости в данных. С помощью модели я обнаружил, что содержание тория — химического элемента, который можно измерить с помощью каротажа, — является ключевым признаком для выделения высокопроницаемых интервалов. После презентации результатов команде клиента специалисты подтвердили, что это действительно так.
🌗 Результат, изменивший все
Убедившись в обоснованности предсказаний, sell-side решила протестировать скважину. Результаты превзошли ожидания: скважина оказалась самой продуктивной на всем месторождении. Это не только позволило найти самую продуктивную скважину на месторождении, но и укрепило авторитет покупателя перед sell-side как партнера с сильной экспертизой в предметной области.
💊 Выводы
Таким образом применение AI в этом кейсе позволило:
- Найти ключевой признак (содержание тория) для выделения высокопроницаемых интервалов.
- Сделать предсказания на интервалах скважин без разметки, повысить надежность геологической 3D-модели и снизить неопределенность
- Убедить клиента и sell-side испытать скважину с мощным высокопроницаемым интервалом, которая в итоге оказалась самой продуктивной на всем месторождении
- Обеспечить положительное значение EMV проекта, что позволило клиенту инвестировать в актив, недооцененный партнером
🎯 Заключение
Этот кейс показывает, как правильно примененные AI-модели могут выявить инсайты, которые традиционные методы или предметные специалисты могли бы упустить. Объединение данных и экспертных знаний приносит реальную пользу и может значительно повысить эффективность проектов в нефтегазовой отрасли. Разработанная модель масштабируема и может быть адаптирована для других месторождений с похожими характеристиками, что открывает возможности для ее применения в будущих проектах. Если у вас есть проекты, где неопределенность мешает принять решение, возможно, AI — это то решение, которое вы ищете.