Университетские исследования, 2010

Вид материалаДокументы

Содержание


Ключевые слова
2. Различные подходы к анализу данных
3. Теорема о проекции и её интерпретация
4. Пример рассчёта.
Application of the theorem on one-dimensional ranking to analyze the data
Подобный материал:

Университетские исследования, 2010

УДК 515.12; 519.237; 553.982.23

ПРИЛОЖЕНИЕ ТЕОРЕМЫ ОБ ОДНОМЕРНОМ РАНЖИРОВАНИИ
К АНАЛИЗУ ДАННЫХ



Чечулин Виктор Львович*, Русаков Сергей Владимирович (д. ф.-м. н.),

*chechulinvl@mail.ru

Пермский государственный университет, ММФ

614990, г. Пермь, ул. Букирева, 15


Описана теорема о существовании проекции односвязных непересекающихся областей на одномерное пространство (с трансформацией метрики), в отличие от теоремы о несуществовании такой проекции для неодносвязных областей (используемой в обосновании метода пространства состояний). Указано, что означенная теорема о проекции имеет приложение в построении метода одномерного ранжирования качества нефтяных месторождении, для выбора оптимального (зависящего от получаемого одномерного параметра) способа повышения отдачи нефтяного пласта.

Ключевые слова: односвязные кластеры, одномерное ранжирование, метод одномерного ранжирование месторождений для выбора способа повышения нефтеотдачи.

© Чечулин В. Л.. Русаков С. В., 2010.


1. Предисловие


Задачи моделирования свойств нефтяных месторождений, а также построения детерминистских моделей прогнозирования нефтеотдачи пласта относятся к задачам функционального представления действительности (используют интегрально-дифференц­иаль­ные уравнения, и относятся к 4-му, функциональному, уровню абстаркции1). Однако, с недавнего времени на практике стали применяться методы воздействия на нефтяные пласты с целью повышения коэффициента извлечения нефти, в этом случае возникают, обратные связи, которые для из описания требую использования более сложного математического аппарата, относящегося к следующему (5-му) уровню абстракции.

При этом предлагались аналогии с имеющимся методом пространства состояний управления сложными технологическими системами [8], для построения прогноза коэффициента нефтеотдачи по параметрам месторождения и предполагаемому методу повышения нефтеотдачи. Однако имеется теорема лежащая в основании этих методов, показавыющая их различие. В случае метода пространства состояний области в многомерном (пусть даже и с неупорядоченными осями) пространстве характеризующие состояния объекта не всегда односвязные,— имеются многосвязные области, их многосвязность обусловлена особенностью химизма протекания реакций (наличия циклов, сетей реакций и т. п.; наличия циклов экономического обмена, для экономических систем и т. п.).2 Это и является основанием того, чтобы искать существование минимального многомерного пространства описывающего (в обобщённых координатах) состояние объекта. Но при моделировании более простых механических систем (с отсутствием активного взаимодействия между частями системы) означенные выше топологические условия — иные: области соответствующие состояниям моделируемого объекта — односвязны.


Эта теоретически ожидаемая односвязность областей прослеживаема и на практике. При кластеризации параметров характеризующих скважины, получаются односвязные непересекающиеся кластеры, как это установлено в работе [9]. В этом случае применим иной вариант топологической теоремы о проекции, описанный ниже.

Далее также описан пример конкретно построения метода проецирования с решением модельной задачи на выборке данных.


2. Различные подходы к анализу данных


Основное предположение, необходимое для анализа данных о нефтяных месторождениях заключается в предположении наличия функциональной зависимости нефтеотдачи скважин от множества праметров месторождения:

fн=f(x1, x2,… xn),

где fн= fн(t),— поток нефти из скважины (прочие параметры для отдельного месторождения предполагаются неизменными).

Точно также предполагается и наличие зависимости коэффициента извлечения нефти (КИН) от неизменных параметров скважины:

gн=g(x1, x2,… xn).

В том случае, если применяется некоторый способ повышения нефтеотдачи, то добаваляется ряд дополнительных параметров (определяемых используемым методом повышения нефтеотдачи), по сравнению с предыдущими формулами:

hн=h(x1, x2,… xn, y1, y2,… ym). (1)

Тогда, при учёте наличия зависимости (1) допустимы различные подходы к решению задачи определения оптимального метода повышения нефтеотдачи 3.


Таблица 1. Ранжирование данных по коэффициенту K формулы (2).



K

КИН

ПН метод

порода

1

0,222869

0,67

Подача воды

Карбонат

2

0,351933

0,82

Подача воды

Карбонат

3

1,61429

0,78

Подача воды

Карбонат

4

1,62102

0,67

Подача воды

Карбонат

5

1,910732

0,64

Подача воды

Карбонат

6

2,310909

0,74

Подача воды

Карбонат

7

3,471424

0,83

Подача воды

Карбонат

8

8,749991

0,73

Подача воды

Карбонат

9

9,533343

0,75

Подача воды

Карбонат

10

36,85229

0,72

Подача CO2

Карбонат

11

40,58759

0,85

Подача воды

Карбонат

12

173,8921

0,84

Подача CO2

Карбонат

13

320,3611

0,84

Подача CO2

Карбонат

14

390,6056

0,88

Под. воздуха

Карбонат

15

5124,535

0,39

Подача CO2

Карбонат

16

0,080092

0,56

Подача воды

Песчаник

17

0,323097

0,78

Подача воды

Песчаник

18

0,60519

0,78

Подача воды

Песчаник

19

2,172339

0,84

Подача воды

Песчаник

20

6,757931

0,76

Подача воды

Песчаник

21

10,67135

0,69

Подача воды

Песчаник

22

13,99187

0,71

Подача воды

Песчаник

23

53,5875

0,67

Микробиол.

Песчаник

24

1077,225

0,69

Полимерн.

Песчаник

25

1166,81

0,24

Полимерн.

Песчаник

26

2007,04

0,83

Подача CO2

Песчаник
1. Использование нейронных сетей. Обучение нейронной сети на выборке данных по месторождениям с различными методами повышения нефтеотдачи, и затем для нового месторождения прогнозирование коэффициентов нефтеотдачи при различных методах её повышения и выбор оптимального метода. Этот способ требует значительного объёма выборки для обучения. Построить доверительный интервал для пргноза невозможно. К тому же нейросети обладают некоторыми принципиальными ограничениями (о чём подробно сказано отдельно [7]).

2. Использование методов кластреизации. Функция hн в зависимости от правых переменных (y1, y2,… ym) будет образовывать кластеры с определённым коэффициентом извлечения нефти, в зависимости от параметров применяемого метода повышения нефтеотдачи. Реализация этого метода описана в [9], см. рис. 1.

3. В предположении выпуклости кластеров применима теорема о сведении кластеризации к одномерному ранжированию, подробно описанная в [6].

Рассмотрим этот случай более подробно.


3. Теорема о проекции и её интерпретация


Пусть имеется n-мерное метрическое пространство Rn, пусть в нём имеются неперескающиеся односвязные области, тогда очевидно имеет место теорема:

Теорема 1. (о проекции). Существует отображение односвязных непересекающихся областей n-мерного пространства (с метрикой) на одномерное пространство, с сохранением непрерывности метрики.

Доказательство очевидно и изложено в [6]. □

Говоря иными словами в n-мерном пространстве имеется параметрически заданная кривая, проходящая через заданные k односвязных, непересекающихся, но граничащих областей, причём параметр, задающий кривую функционально выражается через координаты.

То есть в прикладной интерпртерации, в задаче выбора способа повышения нефтеотдачи, 6-мерное (или более -мерное) пространство, характеризующее местрождение, методом сокращения размерности преобразуемо к одномерному пространству — одному параметру, и интервалам значения параметра соответствует определённый способ повышения коэффициента извлечения нефти. (Выполнимо одномерное ранжирование.)

Из методов сокращения размерности в данном случае наиболее пригоден метод получения безразмерных коэффициентов [1], модифицируемый как метод получения коэффициентов пониженной физической размерности, что продемонстрировано далее в примере обсчёта данных по месторождениям нефти.

Одномерная параметризация свойств скважины приемлема в данном случае и из содержательных физических соображений (поскольку внутреннее взаимодействие изменяющее свойства частей системы, компонентов, отсутствует, или настолько мало, что им можно пренебречь, то параметр означающий характеристику нефтеизвлечения,— условный показатель "нефтетекучести из месторождения" — будет одномерным).


4. Пример рассчёта.


Метод выбора оптимального способа повышения нефтеотдачи пласта строится, на основании теоремы 1, следующим образом.

Одномерный коэффициент характеризующий месторождение определяется, например, в 1-м приближении по следующей формуле (соблюдение теоремы о размерности для кластеризации не всегда обязательно):


K = (Пористость_%)/100*(Проницаемость)*Ln(Температура_К)*(Давление)/ /(100+Плотность_API)/Вязкость (2)


Тогда остаётся ранжировать месторождения по получаемому коэффициенту, см. таблицу 1 (КИН — коэффициент извлечения нефти, ПН — повышения нефтеотдачи метод .). Легко видеть, что определённым диапазонам одномерного коэффициента K отвечают определенные способы повышения нефтеотдачи. Точное определение границ этих отрезков возможно по обработке большего, накопленного уже по эксплуатационным параметрам, массива данных о месторождениях.

Процедура обработки исключений из общего правила сводится к уточнению границ отрезков по максимизации коэффициента извлечения нефти. Внутри полученных отрезков, для новых месторождений коэффициент извлечения нефти прогнозируем по нелинейной регрессии данных внутри отрезка, соответствующего предполагаемому способу повышения коэффициента извлечения нефти.

Кроме того, по обработанным данным, отмечается, что получаемый метод ранжирования данных не зависит от пород месторождения, это означает, что физических параметров скважины достаточно для её одномерной характеризации коэффициентом K, получаемы по формуле (2). Это упрощает обработку данных.4

Максимум КИН наблюдается в середине отрезка соответствующего кластеру, см. рис. 3, что указывает на простой способ сравнения эффективности способов повышения нефтеотдачи на границах кластеров.


5. Заключение


Таким образом, на основании теоремы 1 о проекции, построен метод ранжирования месторождений по одномерному коэффициенту, позволяющий многократно сократить рассчёты при выборе способа повышения нефтеотдачи. Распространимость описанного метода на иные предметные области (газодобыча и проч.) подлежит отдельной проверке обработкой конкретных данных.

Кроме того, в интерпретации теоремы 1 к методам обработки данных, получается следующее достаточно общее рассуждение:

Теорема 2 (о сводимости кластеризации к ранжированию). В случае если имеется детерминировано определённая система (не стохастическая и не содержащая человека), то при известных внутренних характеристиках системы (пусть даже и обобщённых, усреднённых, без известности их изменчивости по длине и т. п. объекта) процедура кластеризации объектов таких систем сводима к процедуре ранжирования по параметру.

Доказательство следует из теоремы 1 и также очевидно. □

Из теоремы 2 следует следующее очевидное следствие.

Теорема 3. (о неранжируемости недетерминированных систем). В случае если система недетерминирована или в ней (в каждом её подъобъекте) как неотъемлемая часть присутствует активно действующий субъект (человек), то тогда объекты этой системы не ранжируемы по параметру и требуют многомерно описания. □

Прикладные следствия из теоремы 3, касающихся систем с субъектом также очевидны.

Таким образом, описанный метод выбора способа повышения нефтеотдачи является частным случаем более обобщённого утверждения о детерминированных системах (теоремы 2).


Библиографический список


1. Айвазян С. А. и др., Прикладная статистика, в 3-х тт., М., 1987–1989.

2. Арнольд В.И. О функциях трех переменных / В.И.Арнольд // Доклады АН СССР.– 1957, т. 114, № 4, с. 679-681.

3. Колмогоров А. Н. О представлении непрерывных функций нескольких переменных суперпозициями функций меньшего числа переменных // Докл. АН СССР. 1956, т. 108, сс. 179-182.

4. Колмогоров А. Н. О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения // Докл. АН СССР. 1957, т. 114., с. 953-956.

5. Чечулин В. Л., О последовательности 6-ти исторических этапов появления основных математических понятий // Вестник ПГУ, сдано в печать.

6. Чечулин В. Л. Об одном случае сведения кластеризации к одномерному ранжированию // Университетские исследования, 2009 (раздел: математика) ссылка скрыта

7. Чечулин В. Л., Ясницкий Л. Н., Об ограничениях нейронных сетей // Нейрокомпьютеры, 2010, сдано в печать.

8. Chechulin V. L., Informatization of the process of producing formalin / Chechulin V. L., Ardavichus V. G., Kolbasina O. V. // Russian Journal of Applied Chemistry, MAIK Nauka/ Interperiodica, 2008, vol. 81, no. 6 (июнь), рр. 1112-1116.

9. Alvarado V., Ranson A., Hernández K., Manrique E., Matheus J., Liscano T., Prosperi N., Selection of EOR/IOR Opportunities Based on Machine Learning // SPE 13th European Petroleum Conference held in Aberdeen, Scotland, U.K., 29–31 October 2002.

10. Hecht-Nielsen R. Kolmogorov’s Mapping Neural Network Existence Theorem // IEEE First Annual Int. Conf. On Neural Networks. San Diego, 1987. V. 3.



APPLICATION OF THE THEOREM ON ONE-DIMENSIONAL RANKING
TO ANALYZE THE DATA



V. L. Chechulin, S. V. Rusakov

Russia, Perm, 614990, Perm State University, Bukirev st., 15.


The theorem for the projection of disjoint simply connected domains on the one-dimensional space (the transformation of the metric) (the theorem about one dimensional rankog) was described, in contrast to the theorem on the nonexistence of such a projection for a multiply connected regions (which is used to justify the method of state space). It is indicated that the given theorem on the projection has an application in the construction of one-dimensional method of ranking the quality of the oil field to select the optimal (depending on the resulting one-dimensional parameter) method for increasing the impact of the oil reservoir.

Keywords: simply-connected clusters, one-dimensional ranking, the method of one-dimensional ranking of fields to choose how to increase oil output

1 Иерархическое структурирование различных математических теорий (по достигаемому уровню обобщённости представления действительности) описано отдельно, см. [2], поэтому пользуемся означенными результатами как известными.

2 Доказана теорема о непроецируемости совокупности многосвязных областей (n-мерного пространства) на одномерие ( (n-1)-мерие) с сохранением метрики (см. описание отдельно).

3 По теореме Колмогорова [4] о представлении функции многих переменных в виде суперпозиции непрерывных функций одного переменного и сложения в интерпретации Хехт-Нильсена [10] эту многомерную функцию можно аппроксимировать посредством нейронной сети. Формулировка теоремы Колмогорова, представляющей улучшенную комбинацию результатов [3], [2] такова:

При любом целом n>1 существую такие определённые на отрезке E=[0, 1] непрерывные действительные функции pq(x), что каждая определённая на n-мерном единичном кубе En непрерывная действительная функция f(x1, x2,… xn) представима в виде

,

где фунции q действительны и непрерывны.

Эта теорема не позволяет снизить размерность представления многомерной функции, даже увеличивает её до 2n+1, но этого достаточно для применения нейронных сетей, см. далее текст статьи. текст статьи.

4 Методологически же следуем заметить, что при использовании детерминистских моделей, означенный метод остаётся в пределах функционального описания действительности.



Чечулин В. Л., Русаков С. В. стр. из 29.09.2012