Психология профессиональной деятельности

Вид материала

Содержание

Задачи и гипотезы
Результаты и их обсуждение
B = mx-pc
В (Bias) - смещение средней категории уверенности относительно правильности ответов (В = MX - PC)
В = mx-pc)
Межкультурные различия в реализме уверенности

Подобный материал:

1 2 3 4 5 6 7 8 9 10 ... 17

Задачи и гипотезы заключались в анализе состояний уверенности-сомнительности на материале типичной, но наименее изученной задачи сенсорного различения "такой-не такой" в сравнении с традиционной задачей "больше-меньше". А именно:

1. Выяснить, для каких ответов более характерна сомнительность: для верных или ошибочных.

2. Исследовать ключевую проблему "реализма уверенности": смещены ли оценки субъекта в

стр. 44

правильности решения в сторону недостаточной либо чрезмерной уверенности.

3. Проверить гипотезу Дж. Барански и У. Петрусика [27] о межкультурных и межнациональных различиях в реализме уверенности при решении сенсорно-перцептивных задач - на материале экспериментального сравнения российской и немецкой выборок в сопоставлении с данными литературы, полученными на выборках других национальностей.

4. Исследовать взаимосвязи между степенью уверенности в суждениях и индивидуальным когнитивным стилем "рефлективность-импульсивность". Гипотеза автора: импульсивные более уверены в своих суждениях, чем рефлективные.

5. Изучить взаимосвязи между скоростью решений, с одной стороны, и их правильностью и уверенностью, с другой.

6. Проанализировать соотношения между различными показателями реализма уверенности.

7. Разработать подход к математическому моделированию принятия решения и уверенности в нем в задаче сенсорного различения.

МЕТОДИКА

Методика экспериментов была разработана автором. Исследовалось пороговое зрительное различение длительностей в парах последовательных световых вспышек голубого люминесцентного индикатора прямоугольной формы яркостью около 20 нит и угловым размером 11.5°. Стимулы предъявлялись на экранах мониторов компьютеров РС-286 - 486, работающих в монохромном режиме с разрешением 800х600 пикселов. Эксперимент проводился в автоматическом режиме. Использовалась экспериментальная парадигма "да-нет" с процедурой различения "одинаковые-разные" (same-different) и техникой лестниц для определения разностного порога. Длительность одного сигнала всегда составляла 600 мс ("нейтральный интервал", наиболее адекватно воспринимаемый человеком [21]), длительность другого (600 мс - Δt ) подбиралась индивидуально для каждого испытуемого в предварительных сериях как соответствующая традиционному разностному порогу Δt для 70 - 80%-ного правильного различения (величины порогов индивидуально варьировали в диапазоне 55 - 250 мс). Погрешность формирования длительностей стимулов не превышала 0.008 с, т.е. 1 - 2% от их значений. Пары одинаковых (по 600 мс каждый) и разных стимулов (600 мс и 600 мс - Δt , а также место более длительного стимула в парах разных стимулов были равновероятны и чередовались в случайном порядке. Каждому испытуемому после тренировки в предварительной серии шагами по 25 мс предъявлялись 7 величин Δt в диапазоне 100 - 300 мс в блоках, состоящих из 10 - 30 проб каждый (всего не менее 70 проб в серии). Интервал между вспышками в паре составлял 1 с, время на ответ (интервал между парами) не ограничивалось. После определения индивидуального порога испытуемого и тренировочных опытов с использованием выбранной индивидуальной величины Δt проводился основной опыт из 100 проб.

В каждой пробе испытуемые давали два ответа: оценивали 1) длительности в каждой паре как "одинаковые" или "разные" и 2) уверены или сомневаются они в правильности первого ответа, т.е. в правильности различения. Нейтральная инструкция задавала симметричный критерий принятия решения и ориентировала испытуемых давать возможно более точные ответы. Фиксировались характер и время каждого моторного ответа.

Всего в эксперименте участвовал 71 испытуемый с нормальным или корректированным зрением, мужчины и женщины в возрасте 18 - 51 год, образовавшие две выборки. 1) 29 чел. - инженеры космической техники и студенты вузов; 2) 42 чел. - студенты и сотрудники вузов. Из них 15 чел. - немецкие граждане, с которыми автор проводила эксперименты в университете г. Гёттинген (ФРГ). С остальными российскими испытуемыми, вошедшими во вторую выборку, эксперименты вели под руководством автора Е. В. Головина (с 21 исп.) и Б. Херманн (с 6 исп.). Общее число измерений составило более 12000. Отметим, что специфика психофизических исследований такова, что требуется большая статистика измерений для каждого наблюдателя в целях получения достоверных показателей сенсорного исполнения. Поэтому подобные эксперименты проводятся, как правило, с участием хотя и небольшого количества испытуемых, но хорошо тренированных. Соответственно психофизические исследования выполняются обычно с участием не сотен испытуемых, как принято в дифференциально-психологических (когда с каждым проводится 1 - 2 измерения по конкретной методике), а лишь десятков или даже единиц, что достаточно для получения значимых результатов в силу большого объема сенсорных измерений.

Для участников первой выборки определялись характеристики когнитивного стиля "рефлективность-импульсивность" по тесту подбора сходных фигур Дж. Кагана [36] и опроснику В. Н. Азарова [1].

Оценивались три принципиальные психофизические характеристики различения (на материале различения длительностей): точность ответов, их скорость и Ув , а также показатели импульсивности испытуемых и соотношения всех переменных между собой. В целом в ходе статистической обработки полученных данных для каждого испытуемого вычислялись 20 показателей: порог раз-

стр. 45

Таблица 1. Пропорции верных-ошибочных-уверенных-сомнительных ответов для всего массива данных (левая часть); пропорции уверенных и сомнительных ответов среди верных и ошибочных ответов раздельно (правая часть)

	PC	РЕ	PC'	РЕ'
	d	а	d/c + d	a/a + b
con	0.656	0.229	0.916	0.832
	с	b	c/c + d	b/a + b
uncon	0.061	0.039	0.085	0.144

Обозначения. Для всего массива данных: PC (proportion correct) - пропорции верных уверенных и сомнительных ответов, РЕ (proportion erroneous) - пропорции ошибочных уверенных и сомнительных ответов, PC' - пропорции уверенных и сомнительных ответов среди верных ответов, РЕ' - пропорции уверенных и сомнительных ответов среди ошибочных ответов. Con (confident) - уверенные ответы, uncon (unconfident) - сомнительные ответы. Обозначения: a, b, c, d - см. рис. 3 и табл. 2.

личения длительностей (разностный порог Δt ); общая по эксперименту пропорция правильных ответов (PC); средние значения ВР в целом по эксперименту и раздельно для верных и ошибочных ответов; пропорции сомнительных и уверенных ответов по отношению к общему массиву ответов, а также раздельно для верных и ошибочных ответов; значения средней категории Ув в целом по эксперименту (MX). Общепринятые показатели реализма Ув: смещение (Bias - В) средней категории Ув относительно правильности ответов в целом по эксперименту; по первой выборке - также более детальные индексы реализма Ув: калибровка (Calibration - С ) и оценка Брайера (Brier Score - BS) - индексы, характеризующие степень соответствия между каждой категорией Ув и правильностью приходящихся на нее ответов; разрешение (Resolution - R) - распределение верных ответов по разным категориям Ув ; наклон функции ковариации (Slope - 5) - разность между средними категориями Ув для верных и ошибочных ответов. Величины MX, В, С, BS, R, S вычислялись по формулам [25, 29, 45, 54]:

где: п_uncon - число сомнительных ответов в целом по опыту; п_con - число уверенных ответов в целом по опыту; N - общее число проб в целом по опыту; x_i - вероятностная мера i-й категории Ув: для категории "сомневаюсь" она принимается за 0.5 (чистое гадание), для категории "уверен" - за 1 (полная уверенность); n_i - число проб при использовании i-й категории Ув ; с_i - пропорция верных ответов при использовании i-й категории Ув ; МХ_cor - средняя категория Ув для верных ответов; МХ_err - средняя категория Ув для ошибочных ответов (чем больше величины В, С, BS, S и чем меньше величина R, тем менее реалистичны оценки Ув ); стандартные показатели импульсивности для использованных методик ее оценки: среднее по первым шести картам теста Кагана время первого ответа, суммарное по этим картам число ошибок; индекс импульсивности Азарова (чем больше время первого ответа и число ошибок в тесте Кагана и чем ниже индекс Азарова, тем выше импульсивность).

Статистическая достоверность различий между показателями оценивалась по трем непараметрическим критериям: знаков, Вилкоксона и Манна-Уитни. Ранговые корреляции вычислялись тремя способами: Спирмена, Кендалла и "гамма" - между индивидуальными индексами точности, скорости и Ув различения, а также импульсивности. Методы непараметрической статистики использованы потому, что они неспецифичны относительно характера распределения эмпирических данных и оттого более универсальны и адекватны психологическим исследованиям, чем параметрические методы, применяемые лишь для нормальных распределений. Статистическая проверка гипотез о значимости различий между эмпирическими выборками начиналась с использования самого простого и оперативного критерия знаков и этим заканчивалась, если данный критерий оказывался достаточным для определения достоверности различий. В иных случаях применялись более мощные критерии Вилкоксона или Манна-Уитни (первый или второй в зависимости от имевшегося в тот момент статистического пакета анализа данных), на основе которых устанавливалась значимость либо незначимость различий.

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ³

1. Уверенность-сомнительность и правильность-ошибочность суждений

1.1. Частотный анализ суждений.

В среднем по всему массиву данных частотный анализ ошибочных и верных ответов в соотношении с их уверенностью-сомнительностью обнаружил следующее (см. левую часть табл. 1).

а) Частоты уверенных верных ответов (d = = 0.656) были в 2.8 раза больше частот уверенных ошибочных (а = 0.229), р < 0.001 (критерий Вилкоксона). Это согласуется с многочисленными данными для ">, <"-различения: d > а (табл. 2, см. также [29]).

б) Частоты сомнительных верных ответов (с = 0.061) тоже были больше частот сомнительных

³ В пунктах 2.2; 2.3 и 3 приведены данные, полученные для первой и второй выборок (29 и 42 испытуемых); в остальных пунктах - для первой выборки.

стр. 46

Таблица 2. Пропорции в общем массиве данных: уверенных ошибочных ответов (a ), сомнительных ошибочных (b), сомнительных верных (с), уверенных верных (d) и соотношения между этими пропорциями (данные автора по "=, ≠"-различению [46], работ [28, 41] по ">, < "-различению и усредненные результаты работ [28, 41])

	а	b	с	d	с + d = PC	a + b = PE	c/c + d	b/a + b	MX	B = MX-PC
"=, ≠" [46]	229	0039	061	656	716	267	085	144	934	+218
">, < "
[41]	084	166	390	360	750	250	520	664	722	-028
[28]	041	161	427	372	799	202	534	797	707	-068
Среднее [41, 28]	063	164	409	366	775	227	528	722	715	-048

Обозначения. MX - средняя категория Ув ; PC - пропорция верных ответов, РЕ - пропорция ошибочных ответов; В - смещение средней категории Ув относительно пропорции верных ответов. Нули целых и запятые после них опущены.

ошибочных (b = 0.039), т.е. с > b аналогично результатам тех же работ (табл. 2, см. также [29]), но в меньшей степени - в 1.56 раза (рис. 3, A), что тоже значимо: р < 0.01 (критерий Вилкоксона). Таким образом, подтвердился классический факт: в сомнительной категории больше верных ответов, чем ошибочных (см. рис. 2).

1.2. Введены новые показатели Ув , характеризующие пропорции сомнений среди верных и ошибочных ответов раздельно (правая часть табл. 1), тогда как ранее было принято рассчитывать эти пропорции только по отношению к общему массиву ответов (левая часть табл. 2). Математически доказано (см. [46]), что предложенные показатели не сводимы к прежним мерам - пропорциям верных ответов в разных категориях Ув , входящим в индекс "разрешение" (R), и тем более - к индексу "калибровка" (С). Введенные пропорции позволяют более дифференцированно оценить соотношения верных-ошибочных-уверенных-сомнительных ответов, чем пропорции уверенных и сомнительных ответов в общем массиве данных.

1.3. Введенные и прежние пропорции характеризуют разные аспекты соотношений между точностью суждений и их Ув. С использованием предложенных показателей обнаружено следующее (правая часть табл. 1, рис. 3, Б): доля сомнений среди ошибочных ответов (b/(а + b) = 0.144) в 1.7 раза больше, чем среди верных (с/(с + d) = 0.085). Ошибочные ответы были чаще сомнительными, чем верные - в 41 случае из 48 (р < 0.01, критерий знаков). Аналогичная тенденция описана для оценки эластичности растяжения в физкультурных упражнениях в процедуре кроссмодального уравнивания стимулов [37]. В отличие от этого, прежние, менее дифференцированные расчеты относительно общего массива ответов выявляли менее частую сомнительность ошибок (b < с, рис. 2, 3, А). Таким образом, соотношение частот сомнений среди верных и ошибочных ответов по отдельности (b/(a + b)> c/(c + d), рис. 3, A) противоположно соотношению частот сомнений для тех и других ответов по всему массиву данных (b < с, левая часть табл. 1, рис. 3, А). Проведенное автором сопоставление этого результата с немного-

Рис. 3. А - пропорции верных (РС_ипсоп ) и ошибочных (РЕ_ипсоп ) сомнительных ответов по отношению ко всем ответам; В - пропорции сомнительных ответов по отношению к количеству верных (РС'_ипсоп ) и ошибочных (РЕ'_ипсоп ) ответов раздельно.

Рис. 4. Пропорции уверенных ошибочных (а), сомнительных ошибочных (b), сомнительных верных (с), уверенных верных (d) ответов при двухкатегорийной оценке Ув : А - в задаче "=, ≠"-различения [46]; В - в задаче ">, <"-различения (усредненные автором данные работ [41] и [28]). Все результаты получены для порогового уровня различения (PC = 0.7 - 0.8).

стр. 47

Таблица 3. Средние оценки Ув, правильности и времени ответов для первой и второй выборок

Выборка	MX	PC	В	МБР	ВРв	ВРо
1-я	0.934	0.716	+0.218	0.799	0.775	1.011
2-я	0.890	0.735	+0.165

Обозначения. MX - средняя категория Ув; PC - пропорция верных ответов; В (Bias) - смещение средней категории уверенности относительно правильности ответов (В = MX - PC); МБР - среднее значение ВР для всех ответов; ВРв - среднее значение ВР для верных ответов; ВРо - среднее значение ВР для ошибочных ответов (все значения ВР даны в мс).

численными данными других исследователей, применявших, как и мы, двухкатегорийную оценку Ув для сходной трудности различения (PC = 0.7 - 0.8 [28, 41]), показало, что это общий феномен для "=, ≠" - и ">, <"-различения (табл. 2).

2. Реализм уверенности

2.1. Впервые для задачи "=, ≠" и двухкатегорийной оценки Ув ответов ("уверен-сомневаюсь") определены современные характеристики реализма Ув . А именно: индексы реализма и смещения оценок Ув (отражающие степень соответствия между уровнями Ув в правильности ответов и их фактической правильности), индексы разрешения и наклона функций ковариации (распределения верных и ошибочных ответов по разным категориям уверенности).

2.2. Этот анализ выявил у всех 29 наблюдателей первой выборки и у 39 (из 42) - второй резко выраженную сверхуверенность (Свув) - превышение Ув над правильностью. Средние по выборкам смещения оценок Ув по отношению к пропорциям верных ответов (В = MX-PC) составили: по первой выборке +0.218 (табл. 3), по второй +0.165.

СвУв у большинства испытуемых обнаружена также для аналогичного уровня различения (порогового: PC = 0.7 - 0.8) в независимом исследовании [8], где использована методика автора этой статьи. Как указывалось выше, канадскими специалистами в задаче ">, <" обнаружен выраженный эффект трудности - легкости: в области надпорогового (легкого) различения (при PC = 0.8 - 1.0) наблюдалась Ндув, а в пороговой области, где различение затруднено (PC = 0.7 - 0.8), Ндув снижалась и переходила в Свув, что еще более усиливалось при случайном угадывании и инвертированном различении (PC = 0.2 - 0.5 [25, 27]). СвУв при пороговом ">, <"-различении установлена также в работах [30, 49]. Таким образом, обнаруженная автором СвУв в задаче "=, ≠", наблюдавшаяся в пороговой области, согласуется с эффектом СвУв в задаче ">, <" при аналогичных пороговых условиях различения.

Вместе с тем как наши результаты, так и сходные данные перечисленных авторов не согласуются с фактами недостаточной Ув (Ндув), стойко наблюдавшейся шведскими исследователями в задаче ">, <", в том числе на пороговом уровне различения (при PC = 0.7 - 0.8 [28, 29, 35, 41, 42]). Анализ распределений ответов, полученных при двухкатегорийной оценке Ув ("уверен-сомневаюсь") в обоих основных классах задач сенсорного различения: по типу ">, <" [28, 41] и "=, ≠" (по нашим данным [46]), позволил выявить соотношения верных-ошибочных-уверенных-сомнительных ответов, приведших к Ндув в первом случае и к Свув во втором (рис. 4).

А. По данным первой выборки, в задаче "=, ≠" интервал сомнительности (пропорция сомнительных ответов в общем массиве ответов: b + с) составил 0.039 + 0.061 =0.1 (рис. 4, А), а в задаче ">, <": 0.164 + 0.409 = 0.573 (рис. 4, Б), т.е. в первом случае этот интервал оказался почти в 6 раз меньше, чем во втором (см. также табл. 2).

Б. Хотя при расчетах относительно общего массива ответов в обеих задачах доля сомнительных верных ответов была больше доли сомнительных ошибочных (с > b), однако это превышение оказалось гораздо менее выраженным в задаче "=, ≠" (в 1.56 раза), чем в ">, <" (в 2.5 раза). Таким образом, сам факт превышения не обязательно ведет к Ндув, что противоречит мнению М. Бьоркмана с соавт. [29], считающим его основной причиной Ндув, а последнюю в силу типичности этого факта, по данным этих и других шведских исследователей [35, 42], коренным свойством сенсорного различения. Наши данные показывают, что, несмотря на превышение с над b (особенно при условии менее чем двукратного превышения), может наблюдаться не Ндув, а Свув, если в распределении ответов интервал сомнительности меньше интервала уверенности.

2.3. Средние по первой и второй выборкам испытуемых величины Свув (В = +0.218; +0.165) оказались в несколько раз выше тех, что установлены для ">, <"-различения при аналогичном пороговом уровне трудности (PC = 0.68 - 0.81; В = = +0.013...+0.072 [25, 27]). Вычисленный по результатам первой выборки индекс реализма Ув (С = 0.063) сравним с максимальными значениями для задачи ">, <" (С = 0.000064 - 0.063, данные ряда авторов, см. [47]). Таким образом, по обоим основным показателям (В и С), характеризующим соответствие между Ув и правильностью ответов, Ув хуже оценивается в задаче "=, ≠" по сравнению с задачей ">, <".

Вместе с тем, как показывают данные автора, несмотря на то, что неупорядоченное "=, ≠"-различение считается сенсорно более легким для наблюдателя, чем ">, <"-различение ("упорядоченное") [33], тем не менее Свув в первом случае больше, чем во втором (хотя в соответствии с эффектом трудности-легкости должно быть на-

стр. 48

оборот). Однако сопоставление уровней трудности в обеих задачах оказывается непростым и неоднозначным. Возникает проблема соотнесения разных видов субъективной трудности сенсорных задач: по типу субъективной измерительной шкалы и величине предъявленной сенсорной информации. В задаче "=, ≠" наблюдатель использует наиболее простую шкалу наименований, тогда как в задаче ">, <" - более сложную шкалу порядков. Уровень же различимости в обоих случаях, казалось бы, одинаков: PC ~ 0.7 - 0.8. Фактически же в задаче "=, ≠" ("простом различении") порог достигается при меньших величинах стимульной разницы, чем в задаче ">, <" ("дифференцированном различении" [3, 20]). То есть реально в первом случае наблюдатель работает с более трудной сенсорной стимуляцией. Возможно, этот фактор более значим, чем роль простой шкалы наименований, что и порождает большую Свув. Однако меньшие величины порога "=, ≠"-различения в сравнении с ">, <" обнаруживаются в том случае, когда наблюдатель сам вынужден перейти от второй задачи к первой по мере уменьшения предъявляемой стимульной разницы: переставая различать стимулы как большие или меньшие и оставаясь способным лишь разграничивать их как равные или различные (см. [3, 20]). В отличие от этого, когда задача "=, ≠" изначально дается в инструкции, тогда наблюдателю достаточно выполнять только это простейшее разграничение, а не проводить более тонкое сравнение ">, <".

Такая инструкция на "=, ≠"-различение исходно предъявлялась в нашем эксперименте. Поэтому величины порога (стимульной разницы, при которой регистрировалось 70 - 80% правильных ответов) были достаточно велики: 100 - 225 мс, т.е. 17 - 37% от значения эталона, равного 600 мс [46]. В отличие от этого, в задаче ">, <" при аналогичном уровне различения длин отрезков (PC = 0.7 - 0.8) величины порога составили 1 - 5% от значения эталона [25, 27, 43], что в 7 - 17 раз ниже, чем в нашей задаче "=, ≠". Таким образом, при исходной инструкции на "=, ≠"-различение оно оказалось довольно грубым, приводящим к высоким порогам. Возможно, с этим и связаны высокая Свув и низкий реализм Ув. То есть грубый, приблизительный характер "=, ≠"-различения может формировать неосознанную установку на не слишком тщательную работу в целом, в частности, генерализоваться на процесс оценки Ув , провоцируя также приблизительность и этих оценок. В отличие от этого, более тонкий и точный характер ">, <"-различения, дающего на порядок меньшие пороги, сопровождается также и более точными оценками Ув.

Данная проблема требует: а) выяснения соотношения между двумя видами субъективной трудности сенсорного различения: определяемой величинами предъявленных стимулов (пороговое различение труднее надпорогового) либо типом субъективной измерительной шкалы (простейшей шкалы наименований в задаче "=, ≠" и более сложной шкалы порядков в задаче ">, <"); б) сравнения порогов различения и оценок Ув в задаче "=, ≠" по инструкции и как вынужденной задачи при уменьшении стимульной разницы в исходной задаче ">, <"; в) сопоставления величин порогов для временных сенсорных признаков, использованных в нашей задаче "=, ≠", и пространственных признаков, применявшихся в большинстве задач ">, <" (табл. 5).

3. Межкультурные различия в реализме уверенности

На материале сравнения российской и немецкой выборок проверялась гипотеза о том, что причинами расхождения величин Ув (и ее реализма), полученных исследователями разных стран, могут быть межкультурные различия. С этой целью в настоящей работе сопоставлялись данные 29 российских испытуемых (первая выборка) и 15 немецких испытуемых (вторая выборка) [16, 48]. Полученные результаты представлены в табл. 4.

Мы видим, что в немецкой выборке величины разностного порога (MΔt = 170) для 70 - 80%-ного различения немного (но все же значимо) выше, чем в российской выборке (MΔt = 143). Пропорции же верных ответов в обеих группах статистически аналогичны (МРС = 0.742; 0.716), что естественно, поскольку диапазон различения был одним и тем же (70 - 80%). Степень Ув немецких испытуемых в правильности своих ответов (М(МХ) = 0.866) существенно выше уровня их объективной правильности (МРС = 0.742), соответственно смещение Ув ответов относительно их правильности (МB = МРС - М(МХ) = 0.124) положительное (у 14 чел. из 15, р < 0.01, критерий знаков). То есть немецкие наблюдатели, как и российские, оказались сверхуверены в правильности своего различения временных интервалов. Вместе с тем уровень Ув в немецкой группе был высокозначимо ниже, чем в российской (М(МХ) = 0.866 против 0.934), и соответственно у немцев резко (почти вдвое) слабее выражена Свув (МБ = 0.124 против 0.218). Меньшая Ув немецких испытуемых (по сравнению с российскими) вряд ли может быть связана с несколько меньшими порогами первых по отношению ко вторым. Ведь для реализма Ув критичным является уровень трудности задачи (степень неопределенности ситуации), характеризуемый в пороговых задачах пропорцией верных ответов, а он был практически одинаков для обеих групп (их пропорции верных ответов различались незначимо).

Сравним полученные данные с результатами, описанными для других национальных групп (табл. 5).

стр. 49

Blog

Психология профессиональной деятельности

Содержание