Головне управління державної служби україни

Вид материалаМетодичні рекомендації
ІІІ. Система оцінки діяльності державних органів щодо забезпечення дотримання законів України “Про державну службу” та “Про боро
Подобный материал:
1   2   3   4   5   6   7   8   9   10

ІІІ. Система оцінки діяльності державних органів щодо забезпечення дотримання законів України “Про державну службу” та “Про боротьбу з корупцією”

3.1. Частотно-ранговий аналіз законів


До початку визначення змістовних принципів законів доцільно провести їх частотно-ранговий аналіз. Це дасть змогу виявити базові категорії, на яких базується закон. З теорії інформації відомо, що частота (ранг) використання терміну може бути показником, який посередньо характеризує вагу цього терміну в змістовному навантаженню тексту. Для розрахунку вагомості терміну можна скористуватися методом, який описано у працях [21, 22]. Суть методу полягає в представленню рангового розподілу термінів тексту у логарифмічних координатах. Потім виділяються характерні відрізки, котрі визначаються або точками переходу одного лінійного відрізка до іншого [21], або за величиною емпірично обумовленого коефіцієнта λ у формулі Ципфа [22], що описує зв'язок між частотою та рангом терміна, який зустрічається:

,

де λ – частота терміна, що має ранг;

– постійна, що розраховується за експериментальними кривими рангового розподілу.

Перший відрізок (λ >1) називається зоною “ядра”. В нього потрапляють елементи з найбільшою частотою застосування. Як правило, це терміни загальнонаукового вжитку та базові терміни досліджуваної області знань. Відносно закону, це терміни, які пов’язані з призначенням закону. Другий відрізок (λ≈1) – центральна зона. В ньому розташовані терміни, що відображають специфічні знання досліджуваної області. Для закону це область термінів, яка пов’язана зі змістом визначення закону. Третій відрізок (λ<1) – зона термінів, які рідко з’являлися в документальному потоці та в основному відображають нові знання предметної області. В законі ці терміни виконують

Вагові коефіцієнти змістовних принципів

α з

Змістовні принципи закону

Вагові коефіцієнти головних функцій αф




Середня оцінка ступеню виконання принципу

αі

αп

αт

αл

αо

αу



















Головні функції

І

П

Т

Л

О

У

α1




Принцип 1



















К1




α2




Принцип 2



















К2




α




Принцип …



















К




αm




Принцип m



















Кm










Середня оцінка ступеню виконання функції

Кі

Кп

Кт

Кл

Ко

Ку























Рис. 1.3 Зведена матриця бальних оцінок ступеню виконання закону

функцію джерел додатково уточнюючої інформації.

У теорії інформації показано, що терміни першої зони володіють “більшу когнітивну значимість, співвідносяться з основними поняттями відповідної галузі знань. Більша частина їх має широке середовище функціонування. Їхня головна функція – індикативна” [23]. Тому їх називають індикативними маркерами.

Терміни другої та третьої зон мають більшу інформаційну ємність, виражають складні спеціальні поняття, що вживаються зрідка. Вони виконують роль інформаційних маркерів [23].

Зазначений метод доцільно застосовувати для великих за обсягом текстів. Враховуючи те, що закони не можна віднести до таких текстів і вони мають більш конкретне змістовне навантаження доцільно застосувати не математичні методи визначення границь зон, а змістовні.

Границю між зонами можливо визначити використовуючи принцип Парето 20:80 [24]. Стосовно нашого випадку він буде мати такі сутності:
  • 20% рангів містять 80% індикативних маркерів тексту;
  • 80% загальної кількості термінів, які найбільш часто вживаються, передають основний зміст тексту, а 20 % - уточнюють його.

Враховуючи приблизність кількісного відношення 20:80, воно може коливатися як у сторону збільшення, так і зменшення.

Слід відмітити, що неоднозначність визначення границь між зонами зумовлена специфічністю документальних інформаційних потоків, в яких можуть мати прояв тільки статистичні закономірності [25]. При цьому важливою є умова наявності тематичної взаємозв’язанності текстів за ознаками спільності предметів, об’єктів, процесів або методів. Для законів, які розглядаються, спільними є предмети і об’єкти.

Перед початком ранжування необхідно з тексту вилучити слова, які не відносяться до індикативних та інформаційних маркерів (в термінах праці [23]). Це усі прийменники, чисельники (маркери зв’язку). Крім того, необхідно об’єднати терміни з однаковим коренем, які відрізняються тільки закінченнями.

В додатках А – Б містяться таблиці частотно-рангового розподілу текстів законів після повної їх обробки згідно з процедурами, які були викладені вище. Реалізація процедур здійснювалась з застосуванням програмного продукту “Lingvo Stat” [26].

В таблиці 3.1 наведені основні статистичні показники законів України “Про державну службу” та “Про боротьбу з корупцією”, до яких застосовувався метод частотно-рангового аналізу текстів. Загальний аналіз таблиці 3.1 свідчить про те, що Закон Парето “працює” не тільки у тій сутності, яка була дана вище. Так, після вилучення маркерів зв’язку залишається приблизно 80% рангів від кількості вихідних рангів (другий рядок таблиці). А остаточна кількість рангів приблизно дорівнює 20% від кількості вихідних рангів (четвертий рядок таблиці).

При цьому для більшості текстів в зоні перших двох – трьох рангів знаходиться 20 – 25% загальної кількості термінів (таблиця 3.2, в подальшому в таблицях ці терміни виділені темно сірим кольором). Обсяг термінів 35 – 36 % від загальної кількості має більше розбіжностей по рангам (в подальшому в таблицях ці терміни виділені світло сірим кольором). Саме в цих зонах розташовані індикативні маркери.


Таблиця 3.2

Статистичні частотно-рангові показники законів України “Про боротьбу з корупцією”, “Про державну службу”

№ п/п

Статистичні показники

Закони

Про корупцію

Про державну службу

1

2

3

4

1

Кількість вихідних рангів у тексті

759

1355

2

Залишилося рангів після вилучення маркерів зв’язку (а, і, так, що, ні…)

Кількість

612

1197

% до ісходу

80,6

88,3

3

Ранг, з якого починаються терміни з вживанням один раз

Ранг

250

452

% до залишених

40,8

37,8

4

Остаточна кількість рангів після об’єднання термінів з однаковим коренем і виключення слів, частота вживання яких дорівнює одиниці

Кількість

133

208

% до вихідних рангів

17,5

15,4

5

Ранг з якого починаються слова з частотою вживання два

ранг

113

163

% до остаточної кількості

85

78,4

6

Частота вживання терміну, який має перший ранг

69

294

7

Частота терміну, яким закінчується 20 відсотковий ранг від остаточної кількості рангів

Ранг

26

42

Частота

12

11

8

Показники, які приблизно відповідають 80 відсоткам загальної частоти вживання починаючи з першого рангу

Ранг

55

76

Частота

6

7


Таблиця 3.3

Відносна частота застосування термінів перших десяти рангів і двадцяти відсоткового рангу

№ з/п

Ранг

Закони

Про боротьбу з корупцією

Про державну службу

1

2

3

4

1

1

6,1

12,5

2

2

5,1

11,4

3

3

4,8

4,2

4

4

4,0

3,9

5

5

3,8

2,5

6

6

3,7

2,4

7

7

3,2

2,0

8

8

2,3

1,6

9

9

2,0

1,5

10

10

1,8

1,4

11









12

Двадцяти відсотковий ранг

Ранг

26

42

Частота

1,1

0,47


Примітка: 1. В зоні знаходиться 20 – 25% загальної кількості термінів закону.

2. В зоні знаходиться близько 35 – 36% загальної кількості термінів закону.