ТВОРЧЕСТВО

ПОЗНАНИЕ

 


i - наибольшее значение характеристического корня матрицы
интеркорреляций пунктов (наибольшее собственное значение, или абсо-
лютный вес первой главной компоненты).
Как и предыдущие, формула (3.2.11) также относится к оценке на-
дежности одномерного теста, направленного на измерение одной ха-
рактеристики. Но, кроме того, она применима и для многофакторного
теста, хотя и нуждается в пересчете после первоначального отбора
пунктов, релевантных фактору (после того как на основании много-
факторного анализа отобраны пункты по одному фактору, снова про-
водится факторный анализ - только для этих отобранных пунктов).
Надежность отдельных пунктов. Надежность теста обеспечивается
надежностью пунктов, из которых он состоит. Чтобы повысить ретесто-
вую (диахронную) надежность теста в целом, надо отобрать из исход-
ного набора пунктов, апробируемых в пилотажных психометрических
экспериментах, такие пункты, на которые испытуемые дают устойчи-
вые ответы. Для дихотомических пунктов (типа <решил - не решил>,
<да-нет>) устойчивость удобно измерять с использованием четырех-
клеточной матрицы сопряженности:
Тест 1
Да Нет
Здесь в клеточке А суммируются частота ответов <верно>, данных
испытуемым при первом и втором тестировании, в клеточке В - числа
случаев, когда испытуемый при первом тестировании отвечал <верно>,
а .при втором - <неверно> и т. д. В качестве меры корреляции вычис-
ляется фи-коэффициент:
(р , - (3.2.12)
y(a+b){c+d)(a+c)(b+d)
Как известно, значимость фи-коэффициента определяется с по-
мощью критерия хи-квадрат:
71
STR.72
x!=.q). (3.2.13)
Если вычисленное значение хи-квадрат выше табличного с одной
степенью свободы, то нулевая гипотеза (о нулевой устойчивости) от-
вергается. Удобство в использовании фи-коэффициента состоит в том,
что он одновременно оценивает степень оптимальности данного пункта
по силе (трудности): фи-койффициент оказывается тем меньше, чем
сильнее частота ответов <да> отличается от частоты ответа <нет>.
Кроме того, сама"четырехклеточная таблица позволяет нам про-
следить возможную несимметричность в устойчивости ответов <да> и
<нет> (это важнее для задач, чем для вопросов: например, может ока-
заться, что все испытуемые, уже решившие однажды данную задачу,
решают ее при повторном тестировании - это наводит на мысль о
том, что при втором тестировании происходит сбережение опыта, при-
обретенного при первом тестировании). Выявленные в результате та-
кого анализа неустойчивые и неинформативные (слишком сильные или
слишком слабые) пункты должны быть исключены из теста. Пункты
следует считать недостаточно устойчивыми, если на репрезентативной
выборке величина}-превышает 0,71. При этом (р<0,5.
Для того чтобы повысить одномоментную (синхронную) надежность
теста, следует из исходной пилотажной батареи пунктов отбросить те,
которые плохо согласованы с остальными В отсутствие компьютера
согласованность для пунктов также очень просто определяется с по-
мощью четырехклеточной корреляции. В этом случае в первом столбце
таблички суммируются ответы испытуемых из <высокой> группы (по
величине суммарного балла), во втором столбце - из <низкой>.
Высокая Низкая
"низкая " группаДа Нет (\АВ
СD
При нормальном распределении час-, " тот суммарных баллов <высокая> и группа <низкая> группы отсекаются справа \ и слева 27%-ными маргинальными IJ квантилями (рис. 8). ll Для оценки согласованности с сум- марным баллом применяется полная -%>. (
27/, 73% X фИ-К с. 8. Области (квантили) <высо-оэффициента: 2а -.Pi-Iп 1
VPiW-Pi
Рис. 8. Области (квантили) <высо- P - fp-lN_ Р\
кой> и <низкой> группы на графике
распределения тестовых баллов __ количество ответов <верно>
(<да>) на 1-тый пункт теста;
N -.сумма всех элементов таблички;
N= 11-0,54, где п - численность всей выборки;
В ряде пособий показатель согласованности для пунктов называется дискрими
иативностью пунктов (Гайда В. К., Захаров В. П., 1982).
Полная формула отличается от (3.2.12) наличием в числителе вычитаемог
(д+b+c+d)/2-поправки с учетом вклада, который i-тый пункт вносит в сумма]
ный балл X. п ,
- Если 2а-Р.<0, то числитель в формуле (3.2.14) выглядит так: ia- .+1.
STR.73
Pi==a+b. При включении в эстремальную группу 1/3 выборки N-.
=0,66-п.
В некоторых случаях подобный анализ позволяет уточнить ключ
для пункта: если пункт получает значимый положительный фи-коэф-
фициент, то ключ определяется величиной <+1>, если пункт получает
значимый отрицательный фи-коэффициент, то величиной <-1>. Если
пункт ролучает незначимый фи-коэффициент, то его целесообразно
исключить из батареи.
При ручных вычислениях фи-коэффициента удобно вначале с по-
мощью формул (3.2.13) и (3.2.14) определить граничное значение зна-
чимого (по модулю) фи-коэффициента. Например, при выборке в
100 человек и уровне значимости р<0,01 пороговое значение вычисля-
ется так:
f-~,___ ____ \
=V?-=V-iг -
При постоянном использовании компьютера при подсчете суммар-
ных баллов - ключ для каждого пункта С/ целесообразно определить
в виде самого фи-коэффициента (или другого коэффициента корреля-
ции), определенного при коррелировании ответов на пункт с суммар-
ным баллом. Тогда тестовый балл подсчитывается по формуле
1 Rifli, (3.2.16)
/-i
где Xi - суммарный балл i-того испытуемого;
Ra - ответ <верно> (+1) или <неверно> (-1) i-того испытуемого
на J-ТЫЙ пункт;
Cj - ключ для J-ТОГО пункта: С/=-Ц для прямого, С,=-1 для
обратного.
Более чувствительный коэффициент, который также применяется
для дихотомических пунктов,- это точечный бисериальный коэффи-
циент корреляции, учитывающий амплитуду отклонения индивидуаль-
ных суммарных баллов от среднего балла:
х - pix
т " - , (3.2.17)
Sx-r PW
где 2х"- сумма финальных баллов тех индивидов, которые дали
утвердительный ответ на t-тый пункт теста (решили i-тую задачку);
Sx - стандартное отклонение для суммарных баллов всех индиви-
дов из выборки;
У piOt- стандартное отклонение по i-тому пункту;
х - средний балл по всем пунктам.
А. Анастази относит критерий внутренней согласованности теста к
валидности (Анастази А., 1982, кн. 1, с. 143), однако если и можно
в данном случае говорить о валидности, то только в смысле особой
внутренней валидности теста. Как правило, слишком высокая согласо-
ванность снижает внешнюю валидность теста по критерию (см. 3.3).
Если проверяется согласованность пунктов, составленных одним авто-
ром (одним коллективом по стандартной инструкции), то выявление
достаточного набора согласованных пунктов свидетельствует о внут-
72 1:
STR.74
ИррЕлебантные
уактры
"Прямые пункты
ренней валидности (согласованности) разработанного диагностического
понятия (конструкта).
В компьютерных данных факторного анализа аналогом корреля-
ции пункта с суммарным баллом является нагрузка пункта на веду-
щий фактор (<факторная валидность> в терминах А.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144