Київський національний університет імені Тараса Шевченка С.І. Сніжкo теорія І методи аналізу регіональних гідрохімічних систем монографія Київ Ніка-Центр 2005
Вид материала | Документы |
- Київський національний університет імені тараса шевченка герасимова світлана василівна, 682.99kb.
- Араса шевченка 175 річчю Київського університету І 75 річчю географічного факультету, 2611.19kb.
- Київський Національний університет імені Тараса Шевченка Кохановська Олена Велеонінівна, 751.92kb.
- Полтавський національний педагогічний університет імені В. Г. Короленка Історичний, 675.02kb.
- Текст роботи: київський національний університет імені тараса шевченка жуковська галина, 546.29kb.
- Київський національний університет імені тараса шевченка, 355.25kb.
- Исследование окислительно-антиокислительных процессов в крови антарктических рыб, 153kb.
- Київський національний університет імені тараса шевченка науково-дослідна робота, 4074.91kb.
- Програма конференції передбачає: пленарні доповіді провідних науковців та представників, 93.09kb.
- Київський національний університет імені тараса шевченка на правах рукопису мазур тамара, 1244.31kb.
Рядки цієї матриці відповідають об’єктам спостережень – пунктам гідрологічних та гідрохімічних спостережень ОN (О1, О2 . . . ОN), а колонки – відповідним показникам - ознакам процесу формування якості води (П1, П2 . . . ПN).
До цих показників відносимо окрім характеристик хімічного складу води, ще й необхідний оптимальний набір характеристик потенційно можливих природних та антропогенних факторів.
Таблиця 3.1
Матриця вихідних даних для факторного аналізу
Об'єкти Показники
П1
...
О1
...
О2
...
О3
...
...
...
...
...
...
...
ОN
...
Оскільки гідрохімічні показники та характеристика (ознаки) різних факторів формування якості води мають різну розмірність, то вони повинні бути унормовані або приведені до єдиного масштабу, щоб виключити вплив розмірності на результат аналізу.
Найбільш поширеним способом нормування матриць даних є їх стандартизація, що виконується за формулою
k = 1, …, n , (3.1)
де - нормоване значення показника ;
- вихідне значення показника ;
m ( ) – середнє значення показника , що розраховується за формулою
m ( ) = , (3.2)
а d ( ) – дисперсія показника ,
d ( ) = m [( ) ] - [m ( ) ] (3.3)
Нормування – це останнє перетворення матриці даних безпосередньо перед факторним аналізом. Матриця ”об’єкт-показник” набуває виду:
Нормовані показники мають такі властивості
m ( ) = 0;
d( ) = 1
Пошук, оцінка та інтерпретація факторів формування гідрохімічних систем. На основі унормованої “об’єктно – однакової” матриці ( ) формується кореляційна матриця даних R, з розрахунку якої і починається власне процес факторного аналізу.
Вона має такий вигляд:
Елементи кореляційної матриці розраховуються за наступною формулою
= (3.4)
Кореляційна матриця є основним об’єктом досліджень факторного аналізу. Адже суть факторного аналізу можна прокоментувати як пояснення розрахованих кореляцій шляхом виявлення тих факторів, які обумовлюють ці кореляції.
Шлях, що веде до цієї мети, пролягає через аналіз сукупностей коефіцієнтів кореляції, число яких достатнє для того, щоб можна було визначити фактори з необхідною точністю. На основі отриманої кореляційної матриці і проводиться факторний аналіз, що показує яким чином деякі схожі за походженням показники об’єднуються в групи. Крім того факторний аналіз розкриває основні загальні фактори, що впливають на утворення цих груп.
Усі включені в дослідження показники (П1, . . . Пn) можуть бути представлені у вигляді функції невеликого числа факторів: f1, f2, f3, . . .fm. Вид цієї функції заздалегідь невідомий, оскільки до проведення аналізу число факторів m теж невідоме. Тому використовуючи метод головних компонент, основний варіант факторного аналізу, з самого початку допускається, що число факторів дорівнює числу взятих показників (m = n). За цим співвідношенням в результаті аналізу кореляційної матриці розраховуються елементи ортогональної матриці. Остання зв’язує показники і фактори
Z1 = X11 f1 + X21 f2 + . . . + Xn1 fn
Z2 = X12 f2 + X22 f2 + . . . + Xn2 fn
. . . . . . . . . . . . . . . . .
Zn = X1N f1 + X1N f2 + . . . + XnN fn
Тут f1, f2, . . .fm - гіпотетичні фактори, що зв’язані з показниками Z1 , Z2 , . . . ZN з допомогою простої матриці
В найбільш загальному вигляді цей етап факторного аналізу (розклад показників на їх головні компоненти, що формуються під впливом різних факторів) можна виразити таким чином
Пj = aij Fi + aj Vj , ( j = 1,2, . . . , N) (3.5)
де Пj – показник якості води;
Fi - загальні фактори (і = 1,2, . . . , Р);
aij - факторні навантаження;
aj - коефіцієнти навантажень при характерних факторах;
Vj – характерні фактори.
Цей вираз можна прокоментувати з точки зору гідрохімії таким чином: концентрація будь-якого показника якості води формується головним чином за рахунок дії якогось загального (головного) фактора та частково за рахунок характерних (другорядних) факторів.
Далі для вираження факторів через показники з метою пояснення їх фізичної суті формується транспонована матриця. У ній з самого початку допускається, що число факторів, які розраховуються, дорівнює числу показників.
f1 = X11Z1 + X21Z2 + . . . + Xn1ZN
f1 = X12Z1 + X22Z2 + . . . + Xn2ZN
. . . . . . . . . . . . . . . . . . .
fn = X1nZ1 + X2nZ2 + . . . + XnnZN
Сучасні комп’ютерні програми факторного аналізу дозволяють провести процедуру розрахунку кореляційної матриці та її трансформації в ортогональну та транспоновану в автоматичному режимі після вводу вихідних даних.
Після розрахунку факторів виникає необхідність їх ранжування за значимістю. Фактор вважається тим важливіший, чим більше він варіює на сукупності усіх об’єктів. Оскільки характеристикою зміни випадкової величини є її динаміка, то чим більша дисперсія фактора, тим він важливіший [260].
Сумарна дисперсія усіх факторів d (fi) дорівнює сумарній дисперсії усіх показників d (Zi) і відповідає числу показників [263].
d (fi ) = d (Zi) = n (4.6)
де Zi - показники процесу формування якості води.
Визначення дисперсії кожного фактора проводиться за виразом
d (fi ) = lі,
де lі – власне значення вектора відповідного фактора, що визначається за ортогональною матрицею.
Фактори ранжуються в порядку зменшення дисперсії
d (f1 )> d (f2)> . . . d (fn )
Якщо головний фактор fm + 1 вносить малу частку дисперсії m + 1 в загальну дисперсію ознак lі = n, то ним і рештою наступних факторів fm + 1, fm+3, . . . , fn можна знехтувати і вважати, що явище (процес) приблизно описується факторами f1, f2, . . . fm.
Сучасні програми факторного аналізу дозволяють автоматично розрахувати величину дисперсії, яка є критерієм для відбору головних факторів процесу формування якості води.
Виконавши всі процедури факторного аналізу стосовно вихідного масиву даних можна здійснити ”стиснення” цього масиву, опираючись на результати аналізу та експертні оцінки вірогідних процесів, які можуть бути ідентифіковані за розрахунковими факторами. Ця процедура виконується наступним чином:
1. попередньо виділяються головні фактори формування якості води (критерій – загальна дисперсія факторів за аналізованими показниками);
2. аналіз структури виявлених факторів;
3. для кожного фактора виділяються ті показники, що входять в структуру кореляційних зв’язків цього фактора і мають найбільше факторне навантаження; досить 2-3 показників;
4. складаються ієрархічні списки пріоритетних показників, кожної структурної (факторної) групи показників.
В результаті проведених процедур вихідний масив даних зменшує свою розмірність у геометричній прогресії. Далі переходять безпосередньо до виділення головних факторів формування якості води.
Процедура ”стиснення” вихідної матриці опирається на факторний аналіз гідрохімічних даних. Але при наявності дуже великого переліку показників, які характеризують процес формування якості води, вихідна матриця може бути розчленована на групи окремих показників меншої розмірності, до яких і застосовується процедура ”стиснення” . Таким способом проведена обробка інформації в роботі [55].
Отже, використання факторного аналізу у даному випадку не зовсім відповідає його головній функції – розчленуванню кореляційної матриці вихідних даних на головні компоненти. Але завдяки йому в окремих частинах розчленованої за певними ознаками вихідної матриці даних досить об’єктивно виділяються пріоритетні показники для кожної їх групи.
Виділення головних факторів – це процедура застосування апарату факторного аналізу до пріоритетних показників, виділених на попередньому етапі обробки інформації і зведених в єдиний масив пріоритетних показників. Виділення головних факторів здійснюється за результатами розрахунків з врахуванням внеску кожного фактора в загальну дисперсію задіяних показників.
Ідентифікація факторів – це не механічний, а творчий процес, який вимагає від дослідника глибоких знань особливостей процесу формування якості води та його здатності до аналізу показників, що характеризують цей процес .
Для полегшення аналітичної роботи при ідентифікації знайдених факторів рекомендується кореляційні структури цих факторів зображати графічно, з включенням до них усіх показників, на основі яких виконані розрахунки [56].
Використання даної методики дозволяє дослідити процеси формування гідрохімічного режиму та якості поверхневих вод, виявити й ідентифікувати головні фактори формування гідрохімічних систем, опираючись лише на дослідження варіативного комплексу параметрів ГХС мультиваріаційними методами. Такий підхід дозволяє заощадити значні матеріальні ресурси на перших етапах досліджень водних об’єктів і визначити основні напрямки стратегії їх поглибленого вивчення у майбутньому.
3.4.2. Методика дослідження територіальної структури гідрохімічних систем. Специфіка дослідження гідрохімічних структур та підготовки даних
Одним із найважливіших напрямків дослідження гідрохімічних систем є виявлення їх просторової структури, тобто виділення в межах регіональної гідрохімічної системи (макросистеми) однорідних гідрохімічних об’єктів – локальних мезо- і мікросистем, параметри яких формуються під впливом одних і тих же місцевих факторів і в статистичному плані відповідають одним і тим же статистичним законам розподілу, однаково корелюють один з одним та з показниками зовнішніх факторних навантажень.
Знання просторової структури ГХС має надзвичайно важливе як теоретичне так і практичне значення. Спостереження за просторовою динамікою гідрохімічних систем може бути визнано найбільш вдалим науковим методом щодо дослідження закономірностей сучасних процесів еволюції хімічного складу поверхневих вод під впливом глобальних антропогенних процесів і місцевих як природних, так і антропогенних чинників.
Виявлення просторової структури ГХС на основі об’єктивного дослідження сучасними методами всього комплексу процесів формування гідрохімічного режиму та якості води конкретного регіону дозволяє науково обґрунтувати нову раціональну систему моніторингу якості поверхневих вод, яка б дозволила вирішувати усі актуальні проблеми водокористування та охорони водних ресурсів від забруднення.
Нами розроблено принципово нову методику вивчення просторової структури ГХС. Мова йде, перш за все, про просторову структуру макро - ГХС, яку за розмірами можна порівняти з площею фізико-географічної зони , чи області.
Ця методика базується на послідовному поєднанні класичних методів мультиваріаційної статистики – факторного та кластерного аналізів.
На першому етапі виконання структурного аналізу ГХС формується матриця її вихідних параметрів за методикою, яка викладена в попередньому підрозділі роботи.
Надійність та репрезентативність вихідної інформації є запорукою успішного проведення усієї послідовності методичних процедур. Відсутність репрезентативних показників якості води в інформаційній матриці, ненадійність введених у неї вихідних даних зводить нанівець використання розглядуваної методики аналізу просторової структури ГХС, приводить до отримання малоінформативних і помилкових результатів. Саме тому відбір репрезентативної інформації та її попередня статистична підготовка повинна виконуватися досвідченим фахівцем-гідрохіміком з використанням наших рекомендацій [55, 56] .
При формуванні просторової інформаційної матриці необхідно витримувати умову, щоб число об’єктів (пунктів гідрохімічних спостережень) було більшим від числа показників, які характеризують гідрохімічну систему в місцях розміщення цих пунктів. Як правило, на практиці виникає ситуація, коли дослідник отримує набагато більше параметрів, ніж об’єктів.
В такому випадку проводиться “стиснення” інформаційної матриці шляхом використання апарату факторного аналізу. Під цим поняттям розуміють зменшення розмірів матриці вихідних даних шляхом їх об’єктивного статистичного аналізу. Стиснення відбувається диференційовано до кожної характерної групи показників – індикаторів ГХС за методикою, описаною підпункті 3.4.1.
Після цього здійснюється відбір показників, репрезентативних для кожної проаналізованої групи (гідрохімічні показники, показники антропогенного впливу на ГХС, показники природного впливу (кліматичні, гідрологічні умови, ландшафтні особливості).
На основі вибраних показників формується редуційована матриця приоритетних ознак гідрохімічних системи, яка є одночасно вихідною матрицею для факторного аналізу процесів, що протікають в даній ГХС та подальшої інтерпретації факторів її формування.
Після виділення та інтерпретації головних факторів формування та функціонування ГХС, сам процес якого описано в підпункті 3.4.1 та в наших попередніх роботах [141, 142] , можна здійснити перехід до аналізу просторової структури ГХС.
Перш ніж розпочати дану процедуру, необхідно вирішити питання з вибором показників для проведення наступного районування території поширення ГХС.
Оскільки мова йде про необхідність об’єктивного районування території на основі вже отриманої інформації про основні фактори , що регулюють протікання основних природно-антропогенних процесів у ГХС, то для успішного проведення дослідження територіальної структури системи перш за все необхідно скористатися показниками-індикаторами цих факторів. Для цього із факторних транспонованих матриць вибираються по 2-3 показники з найбільшим факторним навантаженням , які в найбільшій мірі характеризують суть кожного з виявлених факторів.
Таким чином визначаються ключові (домінуючі) елементи системи, які визначають її головні функції і впливають на поведінку інших (другорядних) елементів та цілих блоків системи.
Виділені показники групуються (формується комплекс показників) та використовуються в подальших розрахунках для отримання об’єктивної картини територіальної структури ГХС або схеми гідрохімічного районування території поширення даної ГХС.
Обґрунтування вибору методики дослідження та основні принципи її використання. Гідрохімічним районуванням водних об’єктів території за комплексом системних показників або інтегральним гідрохімічним районуванням території слід вважати процес багатофакторного (багатопоказникового) ділення території на множину цілісних районів, що являють собою компактні згущення деяких вихідних точок (пунктів, що характеризують водні об’єкти території), як в тривимірному фізичному, так і в багатовимірному просторі ознак системних характеристик гідрохімічних систем.
В геоекологічних дослідженнях при вирішенні задач районування території найчастіше використовується метод виділення районів шляхом індивідуальної експертної оцінки (районування виконується з позиції описової концепції методики логічного ділення території) [264 - 266]. На другому місці за використовуваністю стоять методи провідного (домінуючого) фактора. Потім ідуть методи автоматичної класифікації та співставленого аналізу карт.
Щодо використання цих методів у практиці районування, незважаючи на їх широке розповсюдження, існує ряд застережень. Так, метод логічного розчленування території є занадто індивідуальним, тому охарактеризувати його через деяку сукупність операцій не вважається можливим. При використанні метода провідного фактора здійснюється логічне розчленування складного об’єкта на ряд складових (факторів); виконується ранжування факторів за їх вкладом у формування об’єкту та створюється його картографічна модель. Але всі ці операції проводяться цілком на інтуїтивній основі і таким чином, кінцевий результат залежить від компетентності дослідника. Головний недолік цього методу полягає в тому, що правильно класифікувати об’єкти шляхом послідовного аналізу кожного окремого фактора, не враховуючи його багаточисельних зв’язків з іншими факторами, неможливо.
Метод співставленого аналізу карт для виконання районування направлений на суміщення картографічних моделей окремих факторів (елементів, компонентів, груп зв’язків), пошук співпадаючих пофакторних меж, чи їх згущень і проведення в смугах таких згущень меж районів, як своєрідного компромісу між множиною близько розміщених пофакторних меж. Даний метод є досить ефективним, коли пофакторні межі проходять у вузьких територіальних смугах. Однак, частіше буває навпаки і тоді результат виділення районів виглядає суб’єктивним і неточним.
Найбільш перспективними і об’єктивними, на нашу думку, є методи автоматичної класифікації природних об’єктів, тому в даній методиці дослідження просторової структури ГХС і використано автоматичні алгоритми класифікації та районування , які закладені в апарат кластерного аналізу.
Кластерний аналіз є мультиваріаційним ієрархічним методом, що дозволяє виявити декілька (два і більше) взаємозв’язаних варіантів районування, кожен з яких отримується шляхом об’єднання (ділення) районів попереднього районування [267-270].
Суть цього методу зводиться до того, що спочатку N водних об’єктів розглядається як N окремих районів, а потім відбувається поступове групування районів на основі матриці мір подібності між ними. Загальну схему такого групування можна представити як застосування трьох операцій до мір подібності “об’єкт (район) – об’єкт (район)”, що повторяються:
знаходять найбільше значення подібності d(А,В) між сміжними об’єктами (районами) А і В;
об’єднують А і В в один район, присвоївши їм єдиний індекс, наприклад С;
розраховують міру подібності d(С,D), між районом C та любим другим районом D. Подібна процедура складається з n-1 кроків. На кожному кроці розраховується нова матриця мір подібності з врахуванням d(С,D).
Величину d можна розраховувати декількома способами. В розглядуваному випадку рекомендується в якості міри подібності d між районами використовувати Евклідову відстань, яка розраховується за формулою (XiA - XiB)2
= (4.7)
де XiA - розміщення координати об’єкту (пункту гідрохімічних спостережень) А в багатомірному просторі координат комплексу характеристик районування n ;
XiB - розміщення координати об’єкту (пункту гідрохімічних спостережень) В.
Таким чином, на основі величини міри подібності d між усіма пунктами гідрохімічного моніторингу в межах територіального поширення досліджуваної ГХС виконується ієрархічна процедура кластеризації. В результаті цього відбувається послідовне об’єднання пунктів спостережень з близькими характеристиками в один клас (кластер). Цей процес об’єднання відбувається до тих пір, доки всі пункти спостережень не попадуть в один кластер, причому міра подібності в такому випадку буде дорівнювати одиниці.
Використання кластерного аналізу для ідентифікації територіальної структури гідрохімічних систем має переваги перед іншими методами хоча б тому, що, по-перше за допомогою цього ієрархічного методу можна визначити основні таксономічні одиниці для нового виду районування, де ще теоретично не обґрунтована система таксонів. По-друге, використання ієрархічних методів дозволяє вибрати серед декількох варіантів районування найбільш оптимальний, тоді як неієрархічні методи дають лише один варіант районування, який не завжди оптимальний і не може бути замінений через відсутність інших варіантів.
Після закінчення процесу кластеризації сукупності пунктів спостережень за комплексом ознак (показників) здійснюється вибір одного із найбільш оптимальних варіантів районування гідрохімічної системи.
3.5. Третій етап аналізу: моделювання
та прогнозування розвитку системи
На третьому етапі дослідження гідрохімічної системи (рис. 3.4.) виконується двоступінчата процедура її моделювання з попереднім аналізом керованості системи та прогнозування її розвитку.
На основі отриманих результатів розробляються рекомендації щодо можливої оптимізації системи та, у разі необхідності, її стабілізації.
3.5.1. Візуалізація гідрохімічної системи.
Суть першої стадії моделювання, так званої візуалізації ГХС, полягає у створенні образно-знакових моделей системи. Такою моделлю є структурно-функціональна модель гідрохімічної системи за результатами дослідження факторів формування системи , системних структур та зв’язків. Вона сприяє формуванню уявлень про систему, як про сукупність взаємозв’язаних модулів .
Виконується інтерпретація результатів факторного та кластерного аналізу інформаційного масиву даних про систему. Для наглядності та зручності створюються структурні блок-схеми з крос-кореляційними зв’язками між елементами та окремими блоками системи.
Другим варіантом моделі ГХС є карта гідрохімічного районування території її поширення, на якій виділяються територіальні структури з однорідними умовами формування гідрохімічних процесів та рівнями антропогенного навантаження. Карта є найкращим способом візуалізації системних утворень.
Карти районування містять узагальнену інформацію про гідрохімічну систему. На їх основі можуть бути побудовані різноманітні тематичні гідрохімічні карти.
Одним із прикладів успішного застосування наведеної вище методики є дослідження просторової структури макро-ГХС р. Дунай від Відня до Кілії [55].