Title | Отчет - Цель и задачи работы |
---|---|
Author | Елизавета Соловова |
Course | Психодиагностика |
Institution | НИУ ВШЭ Москва |
Pages | 11 |
File Size | 321.1 KB |
File Type | |
Total Downloads | 43 |
Total Views | 124 |
Отчет - Цель и задачи работы...
Цель и задачи работы Цель задания– сформировать базовые умения и навыки применения психометрических процедур для измерения психометрических свойства теста в ходе задачи конструирования однофакторной тестовой шкалы на базе банка тестовых заданий и некоторой критериальной информации для испытуемых (вопросов личностного тест-опросника).
Задачи: 1. выделить надежные (согласованные) задания - проверить надежностьсогласованность (обоснованность ключей) для отдельных заданий; 2. исключить ненадежные задания из первоначального варианта; 3. проверить
сокращенный
тест
в
целом
(после
отбрасывания
несогласованных заданий) по надежности-согласованности – путем расщепления теста на четные и нечетные задания; 4. проверить валидность сокращенного теста по внешним критериям валидности (пол, возраст, успеваемость, факторы L, F, K); 5. проверить валидность каждого отдельного вопроса по одному из шести внешних критериев (самому скоррелированному); 6. построить параметрические тестовые нормы для сокращенного теста (надежной шкалы); 7. построить конверсионную таблицу перевода сырых баллов в стены, zetшкалу и Т-баллы; 8. построить графики распределения сырых и нормализованных тестовых баллов (гистограмму и кумуляту) и проанализировать их.
Определения В ходе работы использовались следующие понятия:
Критериальнаявалидность− отражающий соответствие
это результатов
комплекс
характеристик,
тестирования
определенным
значениям критериальной переменной
или
вероятности
критериального события. Она предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста. Имеется два вида критериальной валидности – текущая и прогностическая. Текущая критериальная валидность отражает способность теста измерять некоторые
качества
личности.
Валидность
теста
подтверждается
корреляцией с некоторым внешним критерием, существующим в данное время. Прогностическая критериальная валидность характеризует способность теста предсказывать будущие качества, формирующиеся в результате воздействия внешних обстоятельств или целенаправленной собственной деятельности. Этот тип валидности характеризует корреляцию результатов тестирования с внешним критерием, который появится в будущем. Надёжность− устойчивость тестовых показателей относительно случайных, шумовых факторов, или относительно объекта измерения.Существует два вида надёжности: 1) надёжность как устойчивость (возможность получения одинаковых результатов у испытуемых в различных случаях); 2) надёжность как
внутренняя
согласованность
(характеризуется
связью
каждого
конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Репрезентативность−это
свойство
выборки,
предоставляющей
исследователю возможность сделать на ее основании правильные выводы о свойствах всей проверяемой совокупности.
Описание шкалы
В качестве измеряемого свойства личности была выбрана Тревожность. В психологическом словаре дано следующее определение: тревожность – это индивидуальная
психологическая
особенность,
заключающаяся
в
повышенной склонности испытывать беспокойство в самых различных жизненных ситуациях, в том числе и в таких, которые к этому не предрасполагают. Следует отличать тревогу от тревожности. Если тревога это эпизодические проявления беспокойства и волнения, то тревожность является устойчивым состоянием. В
соответствии
с
приведенным
определением
был
составлен
первоначальный список из 15 вопросов:
1. Если меня хвалят, я смущаюсь 2. Прежде, чем что-то спросить у человека, я стараюсь понять, в каком он настроении 3. У меня столько забот, что появление еще одной заботы, как правило, усиливает неприятное чувство, что мне не хватает времени и сил 4. Если у меня на лице появится некрасивый прыщ, я буду избегать появляться на глаза людям, оценка которых для меня значим 5. Когда кто-то плачет, мне трудно заниматься своим делом 6. Я пою и танцую хуже, чем большинство моих знакомых 7. При встрече я здороваюсь со всеми, в том числе, с теми, кто мне совсем не нравится, − просто из вежливости 8. Если кто-то из знакомых выглядит хмурым, то я на всякий случай думаю, что это как-то связано со мной 9. Когда у меня есть задание, я приступаю к его выполнению сразу, так какпредпочитаю отдыхать и развлекаться только после того, как все сделаю 10.Я, как правило, выхожу из дома заблаговременно, чтобы не опаздывать из-за непредвиденных задержек
11.Иногда я говорю и делаю что-то невпопад только потому, что испытываю желание сделать все как можно лучше 12.Я считаю себя обязанным(ой) убирать за собой, если насорил(а) или испачкал(а) что-то в общественном месте 13.Мне приходят в голову страшные мысли, если близкий человек задерживается где-то по непонятным причинам 14.Если мне предстоит выкинуть кипу устаревших газет и бумаг, я перебираю ее, опасаясь выкинуть что-нибудь важное 15.На улице меня иногда начинает беспокоить мысль, что в доме остались не выключены электроприборы, газ, вода и т.п.
Далее был задан ключ (прямой – обратный), после чего произведен подсчет сырого балла. Сырой балл рассчитывается как сумма ответов « верно» (1) на прямой вопрос и ответов «неверно» (3) на обратный. Для первых пяти испытуемых сырой балл был подсчитан вручную.
Подсчет сырых баллов
Задание:
7
11
17
26
39
56
74
90
100
113
142
182
183
245
250
Ключ:
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Балл
1:
3
3
3
1
3
3
1
3
1
3
3
3
1
1
3
5
2:
3
3
1
3
3
1
3
3
3
3
3
1
3
1
1
5
3:
3
1
3
3
3
3
3
1
3
3
3
3
3
1
3
3
4:
3
3
1
3
3
1
3
3
3
3
1
3
1
1
1
6
5:
3
3
3
3
1
1
1
3
1
3
1
3
3
3
1
6
Проверка надежности пунктов
Для проверки надежности пунктов были применены формулы подсчетафи-эмпирического и фи-критического: ad bc ( a b )( c d )( a c )( b d ) э мп
b c d a 2 крит
Где: a – количество испытуемых, попавших в высокую группы по результатам сформированной студентом тестовой шкалы и ответивших «верно» на данный вопрос, b – количество испытуемых, попавших в низкую группу по результатам сформированной студентом шкалы и ответивших «верно» на данный вопрос, и т.п.
Высокая Низкая группа группа «Верно» 15 4 «Неверно» 10 19
Высокая Низкая группа группа «Верно» 18 7 «Неверно» 7 16
Вопрос 7
ᵩ = 0,435 ᵩ = 0,282 эмп
ᵩ
кр
эмп
кр
эмп
Вопрос 17
= 0,303
ᵩ = 0,282 кр
Высокая Низкая группа группа «Верно» 13 5 «Неверно» 12 18 эмп
ᵩ
=0,416
ᵩ = 0,282 кр
Высокая Низкая группа группа «Верно» 20 8 «Неверно» 5 15
Вопрос 26
ᵩ =0,312 ᵩ = 0,282
Высокая Низкая группа группа «Верно» 14 6 «Неверно» 11 17
Вопрос 11
Вопрос 39
ᵩ = 0,458 ᵩ = 0,282 эмп
кр
После вычисления коэффициентов проводилось их сравнение по модулю. крит Если эмп , то можно сделать вывод: с вероятностью ошибки, не
превышающей 5% данный, вопрос может быть включен в тест. Также проводилась оценка верности ключа по значению фи-эмпирического: если фи-эмпирическое больше 0, то вопрос прямой, если меньше – то обратный. Выводы о надежности вопросов:
Вопрос 7: С вероятность ошибки 5% вопрос надежен. Вопрос 11: С вероятность ошибки 5% вопрос надежен. Вопрос 17: С вероятность ошибки 5% вопрос надежен. Вопрос 26: С вероятность ошибки 5% вопроснадежен. Вопрос 39: С вероятность ошибки 5% вопрос надежен.
Проверка ключа Номер вопроса
Знак ᵩэмп Авторский ключ
Вывод
7
+
прямой
верен
11
+
прямой
верен
17
+
прямой
верен
26
+
прямой
верен
39
+
прямой
верен
Проверка критериальной валидности шкалы
После проверки надежности шкалы осуществлялась проверка критериальной валидности шкалы по 6 внешним критериям: пол, возраст, успеваемость, L-, F- и K-критерии. Для этого
строятся четырехклеточные таблицы и
подсчитываются -критерии: Возраст В.гр. Н.гр. (тест) (тест) В.гр. (крит.) Н.гр. (крит.)
Успеваемость В.гр. Н.гр. (тест) (тест)
Пол В.гр. (тест)
Н.гр. (тест)
L В.гр. (тест)
Н.гр. (тест)
F В.гр. (тест)
Н.гр. (тест)
K В.гр. (тест)
Н.гр. (тест)
6
6
7
10
3
5
8
10
14
7
9
12
11
7
11
8
23
20
11
8
9
10
12
5
крит.
эмпирич. Вывод
Возраст
Успеваемость
Пол
L
F
K
0,352
0,327
0,274
0,322
0,31
0,318
-0,13 Не валиден
-0,167 Не валиден
-0,166 Не валиден
-0,135 Не валиден
0,195 Не валиден
-0,277 Не валиден
крит В случае, когда эмп , можно заключить, что с вероятностью ошибки 5%
шкала обладает валидностью по критерию. Таким образом, с вероятностью ошибки 5%, шкала не валидна ни по одному внешнему критерию. В связи с этим предложено выбрать критерий с наибольшим коэффициентом фи-эмпирического. Таким критерием в данной работе стал ММПО-K. 245 Верно Неверно
В.гр. (крит) 15 7
Н.гр. (крит) 15 5
Верно Неверно
В.гр. (крит) 11 11
Верно Неверно
В.гр. (крит) 14 8
Н.гр. (крит) 12 8 174 Н.гр. (крит) 11 9
183 В.гр. (крит) 9 13
Н.гр. (крит) 16 4
В.гр. (крит) 12 10
Н.гр. (крит) 12 8
11
182 В.гр. (крит) 12 10
Н.гр. (крит) 15 5
В.гр. (крит) 7 15
Н.гр. (крит) 11 9
250
39 В.гр. (крит) 12 10
Н.гр. (крит) 12 8
В.гр. (крит) 6 16
Н.гр. (крит) 10 10
142
90 В.гр. (крит) 7 15
Н.гр. (крит) 11 9
В.гр. (крит) 5 17
Н.гр. (крит) 15 5
26
7 В.гр. (крит) 6 16
Н.гр. (крит) 11 9
В.гр. (крит) 13 9
Н.гр. (крит) 10 10
17
100
После проведенных расчетов, мы получили следующие значения ϕ коэффициентов и сделали соответствующие выводы: ϕ эмпир. ϕ крит. Вывод
245 -0,075 0,302 Не связан
ϕ эмпир. ϕ крит. Вывод
11 -0,1 0,302 Не связан
ϕ эмпир. ϕ крит.
Вывод
183 -0,398 0,302 Связан 250 -0,055 0,302 Не связан
182 -0,213 0,302 Не связан
39 -0,055 0,302 Не связан
142 -0,234 0,302 Не связан
26 -0,234 0,302 Не связан
90 -0.234 0,302 Не связан 17 -0,523 0,302 Связан
7 -0,282 0,302 Не связан 100 0,091 0,302 Не связан
174 0,088 0,302 Не связан
Полученные итоги: 1. Вопросы № 183,17связаны с критерием «ММПО-K» с вероятностью ошибки 5%. 2. Вопросы № 245, 182, 39, 90, 7, 11, 250, 142, 26, 100, 174 не связаны с
критерием «ММПО-K» с вероятностью ошибки 5%.
Проверка надежности-согласованности шкалы Значение коэффициента корреляции Пирсона для четной и нечетной половины теста равно 0,424,
следовательно,
можно
сделать
вывод
о
надежности шкалы с вероятностью ошибки в 5%
Проверка репрезентативности и построение норм Для данного этапа была построена таблица со следующими данными: Колонка «Сырой балл» представлены все возможные значения сырого балла по созданной шкале «ММПО-К» − от 0 до 13. Колонка «f» представляет частоту балла, или сколько человек набрали данный балл. Колонка «F»– накопленная частота, или сколько людей набрали данный балл плюс люди, набравшие меньший. Колонка «F*» − это промежуточное значение для подсчета процентиля, которое высчитывается по формуле: 0,5f (F* = F – 0,5f). Процентиль для данного сырого балла рассчитывается как (F*/60)x100. Он показывает, какой процент от выборки составляют испытуемые, набравшие меньший балл, и половину испытуемых, набравших такой же балл. Стен табличный – показатель, определяемый по таблице перевода процентилей в стены. Стен линейный – стен, полученный по формуле:
Sten x , Lin
x x 2 5,5 S , где
x – сырой балл;
´x
– среднее арифметическое сырых баллов; S –
стандартное отклонение.
Среднее арифметическое сырых баллов = 6,75 Стандартное отклонение = 2,569
Таблица частот: Сыро f й балл 0 1 2 3 4 5 6 7 8 9 10 11 12 13
F
0 0 2 3 8 12 3 6 11 5 4 5 1 0
F*
0 0 0 0 2 1 5 3,5 13 9 25 19 28 26,5 34 31 45 39,5 50 47,5 54 52 59 56,5 60 59,5 60 60
Проценти ль
Стен табличн ый
0 0 1,666 5,833 15 31,666 44,166 51,666 65,833 79,166 86,666 94,166 99,166 100
1 1 1 2 3 4 5 6 6 7 8 9 10 10
Стен линейн ый 0 1 2 3 3 4 5 6 6 7 8 9 10 10
Если мы сравним таблицу стенов табличных и стенов линейных, то заметим что они не совпадают, а это значит, что выборка не репрезентативна. По данным таблицы построим следующие графики: 1) Гистограмма распределения сырых баллов. Гистограмма используется для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, как и для построения полигона, на оси абсцисс откладывают значения аргумента, а на оси ординат − значения частот или относительных частот.
Гистограмма сырых баллов 14 12 10 Частота
8 6 4 2 0 1
2
3
4
5
6
7
8
9
10
11
12
13
12 10 8 стен табличный стен линейный
6 4 2 0 1
2
3
4
5
6
7
8
9 10 11 12 13 14
Кумулята сырого балла 70 60 50 Накопленная частота сырых баллов
40 30 20 10 0 1
2
3
4
5
6
7
8
9 10 11 12 13 14...