ТВОРЧЕСТВО

ПОЗНАНИЕ

 

7.
Как же определить ошибку изм(
рения? На помощь приходят коррел?
ционные методы, позволяющие опр<
делить точность (надежность) чер(
устойчивость и согласованность р
зультатов, получаемых как на ypoal
целого теста, так и на уровне о
дельных его пунктов.
Рис. 7. Соотношение общего распре-
деления, распределения индивиду-
ального балла и распределения эм-
пирического среднего: Sm-стан-
дартное отклонение эмпирического
среднего, S" - стандартное отклоне-
ние (дисперсия) ошибки
Надежность целого теста. 1. Надежность-устойчивость (ретестов
надежность). Измеряется с помощью повторного проведения теста
той же выборке испытуемых, обычно через две недели после первс
тестирования. Для интервальных шкал подсчитывается хорошо изве
ный коэффициент корреляции произведения моментов Пирсона:
ltst
2х112х21
"12=
Vi - (2х1 In) (2х1, - (2x")2/n)
где хц - тестовый балл i-того испытуемого при первом измере1
X2i - тестовый балл того же испытуемого при повторном и:
рении;
ч - количество испытуемых.
Оценка значимости этого коэффициента основывается на неско.
иной логике, чем это обычно делается при проверке нулевой гипотез
о равенстве корреляций нулю. Высокая надежность достигается т(
когда дисперсия ошибки оказывается пренебрежительно малой. С
сительную долю дисперсии ошибки легко установить из формулы
STR.69
=--i-- (3.2.4)
"
Таким образом, для нас существеннее близость к единице, а не от-
даленность от нуля. Обычно в тестологической практике редко удает-
ся достичь коэффициентов, превышающих 0,7-0,8. При г==0,75 относи-
тельная доля стандартной ошибки равна 1-0,75 == 0,5. Этой ошиб-
кой, очевидно, нельзя пренебречь. При такой ошибке эмпирически по-
лученное отклонение индивидуального тестового балла от среднего по
выборке оказывается, как правило, завышенным. Для того чтобы вы-
яснить <истинное> значение тестового балла индивида, применяется
формула
x>=rXi+\\- r)x, (3.2.4.1)
где Xw - истинный балл;
х, - эмпирический балл i-того испытуемого;
т - эмпирически измеренная надежность теста;
х - среднее для теста.
Предположим, испытуемый получил балл ZQ по шкале Стэнфор-
да - Вине, равный 120 нормализованным очкам, М==100, г==0,9. Тог-
да истинный балл будет равен: Хоо=0,90Х120+0,10Х100=118.
Конечно, требование ретестовой надежности является корректным
лишь по отношению к таким психическим характеристикам индивидов,
которые сами являются устойчивыми во времени. Если мы строим
тест для измерения эмоциональных состояний (бодрости, тревоги
и т. д.), то, очевидно, требовать от него ретестовой надежности бес-
смысленно: у испытуемых быстрее изменится состояние, чем они за>
будут свои ответы по первому тестированию.
Для шкал порядка в качестве меры устойчивости к перетестирова-
нию используется коэффициент ранговой корреляции Спирмена:
Р=1- \. (3.2.5)
п (-i)
где di - разность рангов i-того испытуемого в первом и втором ранго-
вом ряду.
При наличии компьютера целесообразно использовать более на-
дежный, но более трудоемкий в вычислении коэффициент ранговой
корреляции Кендалла (1975).
2. Надежность - согласованность (одномоментная надежность}.
Эта разновидность надежности независима от устойчивости, имеет осо-
бую содержательную и операциональную природу. Простейший спо-
соб ее измерения состоит в коррелировании параллельных форм теста
Анастази А., 1982, кн. 1, с. 106). Чаще всего параллельные формы те-
ста получают расщеплением составного теста на <четную> и <нечетную>
половины: к первой относятся четные пункты, ко второй - нечетные.
По каждой половине рассчитываются суммарные баллы и между дву-.
мя рядами баллов по испытуемым рассчитываются допустимые (с уче-
том уровня измерения) коэффициенты корреляции. Если параллель-
ные тесты не нормализованы, то предпочтительнее использовать ран-
говую корреляцию. При таком расщеплении получается коэффициент,
относящийся к половинам теста. Для того чтобы найти надежность це-
лого теста, пользуются формулой Спирмена - Брауна:
(3.2.6)
69
STR.70
где fx - эмпирически рассчитанная корреляция для половин;
Гхх - надежность целого теста.
Делить тест на две части можно разными способами, и каждый раз
получаются несколько разные коэффициенты (Аванесов В. С., 1982,
с. 122), поэтому в психометрике предложен способ оценки синхронной
надежности, который соответствует разбиению теста на такое количе-
ство частей, сколько в нем отдельных пунктов. Такова формула Крон-
баха:
и- k \ \ /=1
Ut T- - \ 1 -~
k -1 \ S
где а - коэффициент Кронбаха;
k - количество пунктов (заданий) теста;
S)- дисперсия по ;-тому пункту теста;
Sc- дисперсия суммарных баллов по всему тесту.
Обратите внимание на структурное подобие формулы Кронбаха и фор-
мулы (3.2.2) Рюлона.
Несколько раньте была получена формула Кьюдера - Ричардсона,
аналогичная формуле Кронбаха для частного случая - когда ответы
на каждый пункт теста интерпретируются как дихотомические пере-
менные с двумя значениями (1 и 0):
-1 W
, i /w
KR --I- \_____fc-
~~k~l\
где K.R20 - традиционное обозначение получаемого коэффициента;
Р,Ц} - дисперсия J-ТОЙ дихотомической переменной, какой явля-
N (<верно>) .
ется J-ТЫЙ пункт теста; Р-- > q=\-р.
В 1957 г. Дж. Ките предложил следующий критерий для оценки ста-
тистической значимости коэффициента о:
_i == ""-, (3.2.9)
fe(l-et)+tt
где _i - эмпирическое значение статистики -квадрат с п-\
степенью свободы;
k - количество пунктов;
п - количество испытуемых;
a - надежность.
Формулы (3.2.7) и (3.2.8) позволяют оценить взаимную согласован
ность пунктов теста, используя при этом только подсчет дисперсий
Однако коэффициенты а и КРм позволяют оценить и среднюю корр<
ляцию между t-тым и ;-тым произвольными пунктами теста, так ка
связаны с этой средней корреляцией следующей формулой:
(х =- _ (3.2.Н
\+(k- \)п,
где гц - средняя корреляция между пунктами теста. Легко увиде
идентичность формулы (3.2.10) обобщенной формуле Спирмена - Бр
уна, позволяющей прогнозировать повышения синхронной надежное
STR.71
теста с увеличением численности пунктов теста в k раз Аванесов В. С.,
1982, с. 121). Из этой формулы видно, что при больших k малое зна-
чение гц может сочетаться с высокой надежностью. Пусть гfe==100, тогда по формуле (3.2.10)
_ ioo-0,1 __ io
1+99.0,1 10,9
Широкое распространение компьютерных программ факторного ана-
лиза для исследования взаимоотношений между пунктами теста иа
одномоментным данным) привело к обоснованию еще одной достаточ-
но эффективной формулы надежности теста, которой легко воспользо-
ваться, получив стандартную распечатку компьютерных результатов
факторного анализа по методу главных компонент:
(3.2.11)
где 6 - коэффициент, получивший название тета-надежности теста1
k - число пунктов теста;
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144