1: Информационные системы (ИС)

Вид материалаДокументы

Содержание


Тема 5-6: Данные, информация и знания.Измерение и применение.
Данные – это фиксированные сведения о событиях и явлениях. Информация
Три аспекта рассмотрения информации.
О знаниях.
Измерение цены знаний.
Меры информации.
Объём данных
2. Семантическая мера информации.
Прагматическая мера информации.
Качество информации.
Типы информационных систем и различные аспекты информации.
Информация как предмет экономического анализа.
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   12

Тема 5-6: Данные, информация и знания.
Измерение и применение.



Информация, знания становятся равноправной и важнейшей компонентой экономического развития. Нам важно чётко определить базовые понятия, попытаться получить их количественные параметры и понять возможность их практического использования.

Данные – это фиксированные сведения о событиях и явлениях.

Информация – это обработанные данные, представленные в виде, пригодном для принятия решений или для проведения аналитических исследований.

Знания – это обработанная информация, используемая для принятия решений и решения задач, а также сведения о способах обработки информации для приведения её к виду, пригодному для принятия решений.

Три аспекта рассмотрения информации.



1) Синтаксический – отражает физические характеристики информации: способ представления, скорость передачи, тип носителя, способ кодирования, используемые каналы, надёжность и безопасность передачи. Информация, рассматриваемая только с точки зрения синтаксиса, обычно называется данными, т.к. в этом аспекте не рассматривается содержательная сторона.

В более широком смысле данные могут иметь семантический оттенок: есть косвенные данные о том, что он(а) вас любит. Если человек вас интересует, вы обращаете внимание на то, что он(а) сказал(а) и как, как посмотрел(а), как ответил(а) на важный для вас вопрос (не имеющий для других, может быть, смысла вообще). Постепенно набор этих данных может создать для вас информацию, которая даже превратится в знание, если вы рискнёте принять решение и пригласить юношу (девушку) в кино.

Любовь не наша сфера, но анализ косвенных данных, может быть, составляет основное содержание финансовых источников, пытающихся превратить косвенные данные в информацию.

При работе с информацией всегда имеется источник и потребитель. Пути и процессы, обеспечивающие передачу информации от источника к потребителю называются каналами связи или информационными коммуникациями.

2) Содержательная сторона характеризует семантический аспект информации, когда рассматривается состав содержащихся сведений и связь между ними.

3) Прагматический аспект информации связан с ценностью информации для пользователя при принятии им решения. Информацию, рассматриваемую в этом аспекте, можно назвать знанием.

О знаниях.


Знания могут существовать в виде:
  • предметном или конкретном, использующем информацию из конкретной области – это методики принятия решений для конкретно поставленной задачи (как спилить дерево, как обработать древесину, как сделать лодку и вёсла, как плыть на лодке по реке…);
  • концептуальном или обобщающем, использующем информацию из многих областей и определяющем, как извлекать знания из информации – это методологии (принципы кораблестроения, землеведения, управления компаниями…);
  • метазнаний – знаний о знаниях – генерирует новые знания – наука.

Метазнания в конкретной области:

химия – таблица Менделеева, предсказала появление новых химических элементов;

генетика – теория гомологических рядов Н.И. Вавилова, предсказывающая наличие растений с данными свойствами в данном районе;

физика – теория ценных реакций И.И. Семёнова, объясняющая происхождение химических или ядерных реакций, в результате которых появляется энергия или новые продукты, способные продолжать цепную реакцию.

Обобщающие или концептуальные метазнания – это теория научных заключений, выводов.

Метаметазнания – философия науки.

Измерение цены знаний.


Отметим наличие понятия общественное благо – это благо, предоставляемое потребителю бесплатно – воздух, солнце, ландшафт, дорога, медицина и т.д. – раньше – среднее образование в России. Некоторые общественные блага оплачиваются из средств налогоплательщиков.

За все остальные блага надо платить индивидуально. Отметим, что информация может быть как общественным благом, так и платным.

Так, информация о погоде, предоставленная ТВ – общественное благо. Информация о погоде для лётчика самолёта, предоставляемая в заданном виде и регламенте (стандарте) – платная услуга. Эта информация стоит дорого, т.к. для её получения используется мощная аппаратура, методика и квалифицированный труд специалистов, готовящих информацию в заданном стандарте. Информация, как общественное благо, предоставляется в стандарте Гидрометцентра.

Т.о., цена информации в данном случае может быть посчитана на основе известной методики определения рыночной цены товара, если иметь в виду синтаксическую компоненту:

мы снабжаем пилота или (автопилота) данными в требуемом формате, то есть информацией, на основе которой пилот принимает решение о курсе, скорости и т.п.

Цена информации с точки зрения семантики – это цена знания. Определение этой цены – задача сверхсложная, мы можем попытаться разобраться с одним подходом к такому оцениванию в случае конкретных знаний.

Рассмотрим пример выполнения проекта.

Пусть x = (x1,x2,…,xi,…,xn) – параметры "заказа" (дом x1 этажей, площадь - x2 м2, x3 – высота помещений…), y = (y1,y2,…,yj,…,yp) – параметры результата (стоимость, качество, надёжность, дизайн, удобство, экология…).

Для выполнения проекта можно воспользоваться знанием (метафизикой) z1. Применение к заказу с параметрами x даёт результат z1(x) = F(Y(1)) F(y1(1), y2(1) ,…, yp(1)).

В случае, если альтернативы нет, цена знания равна цене реализации проекта по единой (стандартной) методике (типовое строительство). Если альтернатива существует, то можно оценить выигрыш за счёт знаний. Методика z2.

z2(x) = F(Y(2)) = F(y1(2), y2(2) ,…, yp(2)).


Меры информации.




1. Синтаксическая мера информации.


Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Объём данных Vд в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:

В двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд). Наряду с минимальной единицей измерения данных "бит" широко используется укрупнённая единица измерения "байт", равная 8 бит.

Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределённости состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомлённости получателя о состоянии этой системы. Рассмотрим это понятие.

Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе . Мерой его неосведомлённости о системе является функция H(), которая в то же время служит и мерой неопределённости состояния системы.

После получения некоторого сообщения  получатель приобрёл некоторую дополнительную информацию I(), уменьшившую его априорную неосведомлённость так, что апостериорная (после получения сообщения ) неопределённость состояния системы стала H().

Тогда количество информации I() о системе, полученной в сообщении  определится так

I() = H()- H(),


т.е. количество информации измеряется изменением (уменьшением) неопределённости состояния системы.

Если конечная неопределённость H() обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации I() = H(). Иными словами энтропия системы H() может рассматриваться как мера недостаточности информации.

Энтропия системы H(), имеющая N возможных состояний, согласно формуле Шеннона (1995г.), равна:


,


где Pi – вероятность того, что система находится в i-м состоянии.

Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны , её энтропия определяется соотношением


.


Часто информация кодируется числовыми кодами в той или иной системе счисления. А особенно это актуально при представлении информации в компьютере. Естественно, одно и то же количество разрядов в разных системах счисления может передавать разное число состояний отображаемого объекта, что можно представить в виде соотношения


N = m n,


где N – число всевозможных отображаемых состояний;

m – основание системы счисления (разнообразие символов, применяемых в алфавите);

n – число разрядов (символов) в сообщении.

Пример: По каналу связи передаётся n-разрядное сообщение, использующее m различных символов. Так как количество всевозможных кодовых комбинаций равно N = m n, то при равновероятности появления любой из них количество информации, приобретённой абонентом в результате получения сообщения, будет равно I = n log m – формула Хартли.

Если в качестве основания логарифма принять m, то I = n. В данном случае количество информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объёму данных I = Vд, полученных по каналу связи.

Для неравновероятных состояний системы всегда I < Vд = n.

Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.

2. Семантическая мера информации.


Для измерения смыслового содержания информации, т.е. её количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

Тезаурус – это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp измеряется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рисунке №1.

Рассмотрим два предельных случая, когда количество семантической информации Ic равно 0:
  • при Sp = 0 пользователь не воспринимает, не понимает поступающую информацию;
  • при Sp   пользователь всё знает, и поступающая информация ему не нужна.


Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt ), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

С
ледовательно, количество семантической информации в сообщении, получаемых пользователем, является величиной индивидуальной, персонифицированной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к её объёму:


.

Прагматическая мера информации.


Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Пример: В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой.


In() = П(/) – П(),


где In() – ценность информационного сообщения  для системы управления ,

П() – априорный ожидаемый экономический эффект функционирования системы управления ,

П(/) – ожидаемый эффект функционирования системы  при условии, что для управления будет использована информация, содержащаяся в сообщении .

Глоссарий – толковый словарь.

Тезаурус – словарь терминов, указывающий их взаимосвязь.




Качество информации.



Возможность и эффективность использования информации обуславливаются такими основными её потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью её отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
  • правильность концепции, на базе которой сформулировано исходное понятие;
  • обоснованность отбора существенных признаков и связей отображаемого явления;
  • достаточный объём.

Нарушение репрезентативности информации приводит нередко к существенным её погрешностям.

Содержательность информации отражает семантическую ёмкость, равную отношению количества семантической информации в сообщении к объёму обрабатываемых данных, т.е. .

С увеличением содержательности информации растёт семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объём данных.

Наряду с коэффициентом содержательности C, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объёму данных .

Актуальность информации определяется степенью сохранения ценности информации для управления в момент её использования и зависит от динамики изменения её характеристик и от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает её поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
  • формальная точность, измеряемая значением единицы младшего разряда числа;
  • реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
  • максимальная точность, которую можно получить в конкретных условиях функционирования системы;
  • необходимая точность, определяемая функциональным назначением показателя.

Достоверность информации определяется ее свойствами отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать изменение исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой её отбора и формирования.

В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, ценность определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь её надёжность. При этом параметры актуальности и точности жёстко связаны соответственно с параметрами своевременности и достоверности.

Надёжность информации.

Типы информационных систем и различные аспекты информации.





Аспекты информации, сущность




Чем выражается




Что получаем на выходе





Реализующий элемент архитектуры ИС

Прагматика



















знания




методы, методики, методологии




документ, руководство к действию




система обработки знаний (СОЗ), менеджерские (управленческие) информационные системы (MIS), трансакционные ИС, САО

целевая ориентация, содержание



















Семантика



















информация




сообщение




осмысленное описание фактов




стратегические ИС (СИС), системы поддержки принятия решений (СППР), системы поддержки руководства (СПР)

понимание, смысл, значение



















Синтаксис



















данные




сигналы, символы, знаки




упорядоченная последовательность знаков и символов




информационные технологии

Информация как предмет экономического анализа.



Чем отличается информация от материальных ресурсов?

Главные отличия:
  1. неуничтожимость в процессе потребления,
  2. возможность многократного потребления не одним, а многими пользователями.

Производитель информации не утрачивает свой продукт при продаже, передаче потребителю.

Информация – неутрачиваемый ресурс обладателя.

Хотя информацию можно мыслить себе, как категорию, подобную основным фондам (здания, оборудование) – аналогия чисто внешняя, так как основные фонды расходуются либо изнашиваются в процессе эксплуатации. В случае информации - снашиваются носители информации (жёсткие и гибкие диски, машинные ленты), средства сбора, обработки, передачи, хранения – свои основные фонды информационной отрасли.

С экономической точки зрения информация характеризуется следующими чертами (по Е.З. Майминасу):
  1. Невозможность однозначной стоимости оценки полученного объёма информации.
  2. Особая неопределённость полезности информации.
  3. Иной механизм старения информации по сравнению с моральным износом основных фондов (амортизация) и со старением материальных потребительских благ. Иногда информация может жить мгновение – когда её цена неимоверно высока именно в момент появления, а затем падает до нуля. Иногда информация обретает цену лишь спустя 100 лет.

Признание и понимание информации, как товара произошло сравнительно недавно.

Нобелевский лауреат Кеннет Эрроу (получил премию сравнительно молодым) связал новое развитие экономической теории с двумя фундаментальными фактами:
  1. информация имеет экономическую ценность и поэтому её получение и передача стоят определённых издержек;
  2. разные индивиды обладают разной информацией (асимметрия информации).

Эти внешне простые факты позволяют К. Эрроу обосновать фундаментальные выводы о роли информации в действии рынка, в частности о том, что "свободный рынок информации не ведёт к эффективному распределению ресурсов".1

Качественный сдвиг в развитии экономической теории с информационной точки зрения внёс Рональд Коуз, также удостоенный нобелевской премии (в весьма зрелом возрасте), чётко сформулировавший понятие трансакционных издержек2 - т.е. затрат на обработку информации, её обмен между экономическими агентами, хранение и представление (затраты на информационное документальное сопровождение экономической активности). Коуз показал, что образование фирм, а также их размер тесно связаны со стремлением минимизировать трансакционные издержки, отмечая, что "все новшества, которые улучшают технику управления, способствуют увеличению размеров фирмы". (Он приводил в пример создание телефона и телевизора).

Теорема Коуза: если трансакционные издержки системы равны нулю, то распределение ресурсов осуществлено оптимально, независимо от форм собственности.

"В самом широком смысле слова "трансакционные издержки" состоят из тех издержек, существование которых невозможно себе представить в экономике Робинзона Крузо" (, 1978) (Тамбовцев В.Л. Трансакционные издержки и эффективность. В ст. "Фактор трансакционных издержек в теории и практике российских реформ". М., ТЕИС, 1998.)

"
Трансакционные издержки – понятие, полезность которого уменьшается пропорционально точности его определения" DAVIS, 1986.

АВ – эффект экономии на масштабах производства,

CD – эффект роста совокупных трансакционных издержек,

Е – точка равновесия,

Р* - оптимальный размер организации с точкой эффективности используемых ресурсов.
  • Д
    анные могут без ограничения многократно использоваться для переработки в информацию;
  • информация может изменяться;
  • данные изменяться не могут;
  • ценность (цена) данных зависит от их использования для производства информации и может меняться в зависимости от способа обработки, хранения и представления;
  • информация обусловливает расходы, определяемые способом сбора, обработки, хранения и представления данных и информации;
  • данные и информация могут быть уплотнены;
  • есть возможность злоупотребления информацией, полученной из конкретных данных, поэтому преобразование данных в информацию, равно как и информации в знания - должны следовать этическим нормам (Общеизвестны нечестные методы рекламы, выдающие информацию как знание – например, при представлении "чудодейственных" лекарств или методов лечения, позволяющих исцелить больных на все 100%).