^Наверх
logo
foto1 foto2 foto3 foto4 foto5

Психолого-педагогические измерения

Общие подходы к измерениям.
Измерительные шкалы.
Сводная таблица результатов.
Oписательные статистики:
- процентные показатели;
-меры центральной тенденции;
-меры изменчивости.

Распределение признака.
Проверка нормальности распределения. Асимметрия и эксцесс.
Критерии оценки психолого-педагогических измерений.
Принципы отбора и создания методов, методик и аппаратуры для системной диагностики человека.

Общие подходы к измерениям

Любая диагностика опирается на измерения. С философской точки зрения, измерение есть познавательный процесс определения характеристик материальных объектов с помощью средств измерения. Измерение оказывается возможным в силу наличия в объектах материальной действительности количественной стороны — величины, т. е. способности того или иного свойства этих объектов изменяться в широких пределах, не теряя качественных своеобразия и однородности.
С позиций общей теории измерений даются следующие определения понятию «измерение», принятые в психологии и педагогике.
Указывается, что одно из первых определений измерения как процедуры присваивания числовых значений измеряемому объекту для представления их свойств и качеств принадлежит Н. Кэмпбеллу .
Похожее представление об измерении принадлежит С. Стивенсу, который указывает на необходимость соблюдения определенных правил при измерении. Измерение - это приписывание числовых форм объектам или событиям в соответствии с определенными правилами'.
Сходные определения приняты многими психологами. Например, определение, сформулированное отечественными авторами теории психологических измерений, следующее: «Измерение есть определение степени выраженности какого-либо свойства предмета. Измерение осуществляется путем установления связи между числами и предметами, которые являются носителями подлежащих измерению свойств» .
В различных науках технологии проведения измерений основываются на такой области знаний, как метрология (наука об измерениях). Психологические и педагогические науки не исключение, и метрологические подходы обеспечивают в них единство и точность измерений свойств, характеризующих особенности личности человека. Кроме того, психолого-педагогические измерения опираются на подходы, разрабатываемые в такой относительно повой межотраслевой научной области, как квалиметрия, особенно там, где необходимо дать количественную оценку качества измеряемой характеристики личности.
Любые измерения состоят из таких элементов, как объект измерения, средство измерения, условия измерения, принцип измерения, метод измерения, субъект измерения и др.
Объектом измерения, как правило, является свойство или характеристика, которая подлежит измерению. В психолого-педагогической диагностике объектом измерения являются свойства и характеристики личности участников педагогического процесса.
В основе процедуры измерения лежит принцип измерений, т. е. явление или эффект, определяющее особенности процедуры измерения. Принцип измерения в психолого-педагогической диагностике учитывает особенности измеряемых феноменов, установленных в физиологии человека, психологии, педагогике, социологии и других науках.
Измеряемые величины имеют качественную и количественную характеристики. Формализованным отражением качественного различия измеряемых величин является их размерность. Количественной характеристикой измеряемой величины служит ее размер.
Любые измерения предусматривают использование средств измерения. Часто средствами измерения являются измерительные приборы, устройства, предметы, имеющие установленные нормированные характеристики. В психолого-педагогической диагностике к средствам измерений относятся тесты, карты наблюдений, анкеты, пробы и др., которые специально разрабатываются, апробируются и затем используются специалистами.
Каждое средство измерения должно иметь шкалу измерения, или упорядоченную совокупность значений величины свойства измеряемого объекта. В психолого-педагогической диагностике используются шкалы, принятые для любых измерений, но преломленные сквозь призму особенностей психолого-педагогических феноменов и имеющие собственные единицы измерения. Под единицей измерения понимают характеристику величины объекта, которая условно устанавливается для его измерения и используется для стандартизированного представления результатов измерений. В психолого-педагогических исследованиях единицами измерений могут быть баллы, стены, проценты, процеитили, частоты и др.
Точность измерения - это качественная характеристика измерений, отражающая близость полученных результатов к истинному значению измеряемой величины. Точность психолого-педагогических измерений обеспечивается принятым принципом измерения и соответствием средств измерения (методик) установленным требованиям надежности, валидности, репрезентативности и др.
В физических измерениях для обеспечения единства и сравнимости результатов измерений величины объекта используют стандартные средства или величины единиц измерений, называемые эталоном. В психологопедагогических измерениях эталонов нет, но есть нормы, которые соответствуют средним показателям измеряемой величины свойства личности.
Часто при измерениях используются различные методы. Под методом измерений понимают совокупность научных способов и приемов измерений, обусловленных принятым принципом измерения, реализованным в средствах измерений, и обеспечивающих измерение величины свойства объекта измерения. В психолого-педагогических измерениях разработан и применяется целый спектр методов, которые эмпирически сложились или специально разработаны для диагностических целей.
При проведении измерений важно соблюдать условия измерения - факторы, определяющие состояние объекта и эффективность использования средств измерения. Несоответствие условиям измерений приводит к отклонению результата измерения от истинного значения, а именно к погрешностям и ошибкам, которые имеют место и в психолого-педагогических измерениях при несоблюдении условий. При этом надо иметь в виду, что ошибки и погрешности в психолого-педагогических измерениях могут быть обусловлены и другими причинами, например несовершенством средства измерения или несоответствием выбранного метода измеряемому свойству.
Разницу в результатах измерения и измеряемого свойства называют валидностью (точность, правильность). Высокая валидность означает, что степень соответствия измеренного свойства истинному значению достаточно высока. Валидность измерительного инструмента призвана обеспечить надежность измерения.
Общие подходы к измерению нашли свое отражение в процедурах психолого-педагогической диагностики.
Измерительные шкалы
Для определения степени выраженности какого-либо свойства необходимо иметь измерительные шкалы. В теории измерений приняты четыре типа шкал, применяемых также и в психолого-педагогических измерениях:
• номинативная, или номинальная, или шкала наименований;
• порядковая, ранговая, или ординальная, шкала;
• интервальная шкала, или шкала равных интервалов, или метрическая шкала;
• шкала отношений.
Знание особенностей шкал дает возможность проводить измерения более правильно и точно.
Номинативная (номинальная) шкала - это шкала, классифицирующая объекты измерения по названию. Название нельзя измерить, но оно позволяет отличить один объект измерения от другого или одного индивида от другого.
Простейшая номинативная шкала - дихотомичная, состоящая из двух противоположных наименований. Например, мужчины - женщины, школьники - студенты и т. п. Дихотомичная номинативная шкала достаточно широко распространена в психолого-педагогических измерениях. На этой шкале всего два значения. Более сложный вариант номинативной шкалы состоит из трех и более значений.
Номинативная шкала позволяет подсчитывать частоты встречаемости разных «наименований», или значения признака, и затем работать с этими частотами с помощью математических методов. При математических расчетах в дихотомичиой шкале каждому из двух значений присваивается число, например: мужчины - 1, женщины - 2.
Порядковая (ранговая, ординальная) шкала - это шкала, предполагающая измерения по принципу «больше-меньше». В этой шкале важен порядок от самого маленького значения к самому большому. В порядковой шкале должно быть не менее трех значений. Например, «низкий уровень- средний уровень - высокий уровень» или «положительная реакция - нейтральная реакция - отрицательная реакция». В порядковой шкале нет истинного расстояния между значениями, но эти значения образуют порядок. От установленных значений легко перейти к числам, если условиться считать низший ранг за 1, средний ранг за 2, высший ранг за 3. Чем больше рангов в шкале, тем больше возможностей для математической обработки результатов и проверки статистических гипотез. Порядковые (ранговые) шкалы используют при ранжировании, упорядочении качеств по степени значимости. В этом случае количество рангов будет соответствовать количеству ранжируемых качеств, а их может быть достаточно много: 10, 20 или даже 100.
Шкала равных интервалов (метрическая) - эта шкала, предполагающая измерение по принципу «больше на определенное количество единиц- меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии. Измерение в этой шкале предполагает возможность использовать для оценки качества единицы измерения (метрики).
Шкала равных интерватов широко используется в психологии. Примерами интервальных шкал являются тестовые шкалы, которые специально вводятся при обосновании равпоинтервалыюсти шкалы - стены, IQ Векслера, Т-шкалы и т. д. В психологических измерениях шкалу интервалов можно получить путем преобразования порядковой шкалы в единицы стандартного отклонения и процентильпые шкалы при условии, что распределение измеренных значений было нормальным.
Шкала отношений - это шкала, измеряющая признак пропорционально степени его выраженности. Предполагается наличие абсолютной нулевой точки, которая указывает на полное отсутствие измеряемого качества. Возможности человеческой психики столь велики, что трудно представить себе абсолютный нуль в каком либо измеряемом психологическом признаке . В психологии это могут быть шкалы порогов абсолютной чувствительности. Абсолютный нуль может иметь место при подсчете количества объектов или субъектов измерений (например, при выборе альтер- катив испытуемые ие выбрали альтернативу А ни одного раза). Единицами измерений в этой шкале могут быть 1 наблюдение, 1 выбор, 1 реакция и т. п.
В педагогических измерениях также могут использоваться разные шкалы.
Номинативная шкала - «мальчики/девочки», «троечники / хорошисты / отличники» как название определенного класса диагностируемых.
Порядковая шкала используется как рейтинговая (балльная) оценка уровня подготовленности учащихся, рейтинга выполнения заданий.
Шкала интервалов используется, например, при оценке скорости выполнения упражнений.
Шкала отношений присутствует при оценке сформированное™ знаний или умений в процентном отношении.
Знание шкал необходимо по следующим причинам:
1) шкала позволяет измерить признак, найти его в ряду измерений;
2) особенности шкал учитываются при выборе статистического критерия для анализа результатов измерений.
Значения, выраженные в параметрах одной шкалы, могут быть подвергнуты преобразованиям, и тем самым шкала может поменять свое название. Иногда у студентов возникают сложности с определением видов шкал. Обычно идентификация номинативной шкалы Tie вызывает особых проблем. Сложнее бывает определить различие между порядковой и метрической (интервальной) шкалами .
Известно, что перечисленные шкалы характеризуются по признаку дифференцирующей способности (мощности). В этом отношении шкалы по мере возрастания располагаются следующим образом: номинативная, ранговая, интервальная, шкала отношений. Неметрические шкалы заведомо менее мощные - они отражают меньше информации о различии объектов (индивидов) по измеренному качеству, и напротив, метрические шкалы более мощные, они лучше дифференцируют испытуемых. Поэтому, если есть возможность выбора, следует применять более мощную шкалу2.
Сводная таблица результатов
В ходе проведения диагностики группы людей измерение признака производится у множества испытуемых. Каждый обследуемый может ха- растеризоваться не одним признаком, а целой группой признаков, измеренных к тому же в разных шкалах. Поэтому результаты измерения для дальнейшего анализа сводятся в одну таблицу, которая называется сводной таблицей или таблицей исходных данных.
Каждая строка таблицы соответствует одному объекту, индивиду, а каждый столбец - одному измеренному признаку. Важно отметить, что нумерация индивидов в списке исходных данных сквозная, вне зависимости от принадлежности к той или иной группе. Принадлежность к группе определяется значением соответствующей номинативной переменной (пол, возраст, класс и т. п.).
Сводная таблица лежит в основе анализа полученных эмпирических данных. Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения при определении измеряемого психологического признака в обследуемой группе людей. Результатом анализа является определение частоты проявления признака в группе. На основе анализа выполняется построение таблицы частот и графика распределения частот.
Если признак принимает всего лишь несколько возможных значений, то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это таблица абсолютных частот распределения; если указывается доля встречаемости признака, приходящаяся на то или иное значение признака, то говорят об относительных частотах распределения.
Например, абсолютные частоты: при выполнении контрольной работы получили двойки 3 учащихся, тройки — 7, четверки - 12, пятерки - 3 учащихся; относительные частоты: двойки - 12 %, тройки - 28, четверки - 48, пятерки - 12 % учащихся.
Определение частот встречаемости признака дает важную предварительную информацию о форме распределения признака: о том, какие значения встречаются чаще, а какие реже, насколько выражена изменчивость признака. Представление частот в виде таблиц и графиков позволяет сделать некоторые содержательные выводы при сравнении обследуемых между собой, а также сравнивать группы по степени выраженности индивидуальных различий. Относительные частоты позволяют быстро получить до- полнительпую информацию о том, какая доля обследуемых имеет выраженность признака выше или ниже определенного значения (например, психологической нормы).
Если есть необходимость анализа частоты встречаемости признака у двух и более подгрупп, обозначенных номинативными характеристиками в одной выборке обследуемых, то создают таблицы сопряженности, которые позволяют сопоставить эти подгруппы между собой (табл. 1). Столбцы такой таблицы соответствуют категориям одного номинативного признака, а строки - категориям (градациям) другого номинативного признака. Например, подгруппы могут быть разделены по признаку «мальчики - девочки», которые «справились» или «не справились» с выполнением контрольной работы.

Таблица 1

Форма контроля

Результаты
выполнения

Пол

Мужской
(мальчики)

Женский
(девочки)

Контрольная работа

Справились

6

8

Не справились

5

6

Всего

11

14

Описательные статистики
Диагностируемый признак может принимать много значений. Общее представление о полученных значениях и их разбросе позволяет получить описательные (дескриптивные) статистики. Они используются для описания главных характеристик полученных диагностических данных и дают возможность попять особенности группы людей, участвующих в обследовании. К базовым методам описательной статистики относятся процентные показатели, меры центральной тенденции и меры изменчивости (вариации).
Процентные показатели
Процентные показатели используются для того, чтобы определить частотное распределение по той или иной переменной и привести к основе 
100 (аналогично, пропорции используются для приведения данных к основе 1). В таком виде данные являются более предпочтительными в интуитивном смысле по сравнению с «сырым» частотным распределением (табл. 2).
Пример процентных показателей успешности сдачи сессии
Таблица 2

Успешность

Частота

Процент

Пропорции

Были тройки

28

45,2

0,452

 

Без троек, в основном на «четыре»

11

17,7

0,177

Без троек, в основном на «пять»

13

21,0

0,210

На отлично

10

16,1

0,161

Всего

62

100,0

1,000

Меры центральной тенденции
К мерам центральной тенденции относятся среднее арифметическое значение, мода, медиана. Они дают информацию о типичном, или центральном, значении распределения.
Среднее арифметическое значение - это отношение суммы всех значений данных к числу слагаемых. Среднее арифметическое обозначается Мх или М. Число слагаемых (объем выборки) обозначается буквой п (или N), а индивидуальные значения показателя - символом х,.
Среднее арифметическое вычисляется по формуле

Мх = ∑хi/ n


Пример: {2, 3, 5, 1, 4, 5, 6, 5, 2}, Мх = (2 + 3 + 5 + 1 + 4 + 5 + 6 + + 5 + 2) / 9 = 3,6. Если в ряду данных присутствуют числа со знаком «минус», то суммирование производится с учетом этих знаков.
Среднее арифметическое выборки показывает значение, около которого группируются величины индивидов, и характеризует общий уровень обследуемых по какому-либо показателю. Это наиболее ожидаемое значение.
Результаты вычисления среднего значения дают возможность:
1) дать характеристику всей группы обследуемых, исходя из одного значения;
2) сравнить значение индивида или отдельное значение «нормы» со средним значением по группе; 
3) определить тенденцию поведения и эмоционального реагирования в группе;
4) сравнить разные совокупности обследуемых;
5) вычислить другие статистические показатели, в которых среднее значение используется.
Безусловно, среднее арифметическое не характеризует обследуемых разносторонне. Его величина зависит от индивидуальных величин субъектов и от относительной частоты встречаемости величин, представленных в выборке. Если изменяется величина параметра у отдельных индивидов, меняется и среднее значение по группе.
Медиана разбивает выборку на две равные части. Для определения медианы рекомендуется сначала упорядочить данные. Например, в массиве значений {2, 3, 5, 1, 4, 5, 6, 5, 2} необходимо сначала упорядочить значения, выстроив их по возрастанию {1, 2, 2, 3, 4, 5, 5, 5, 6}. Медиана в этом случае равна 4. Обозначается Me = 4.
Если количество данных в выборке четное, то медиана равна среднему арифметическому показателю между двумя центральными значениями. В этом случае медиана может не соответствовать ни одному из значений выборки. Медиана может принимать и дробные значения.
Если средним арифметическим может быть такая величина значения, которая отсутствует в ряду значений выборки или вообще не существует, то величина медианы всегда принадлежит одному из индивидов группы или является величиной, очень близкой к значению, присутствующему в группе.
На основе медианы иногда можно дать довольно хорошую характеристику структуры ряда. Опираясь па величину медианы, можно определить, распределяются ли члены группы вокруг среднего значения равномерно, происходит ли накопление величин по возрастающим или убывающим интервалам и т. д.
Мода - это наиболее часто встречающееся значение. Например, в массиве значений {2, 3, 5, 1, 4, 5, 6, 5, 2} модой будет являться значение 5. Обозначается Мо = 5.
Если выборка содержит две моды, то распределение называется бимодальным. Если все значения встречаются одинаково часто, то моды у распределения нет. Бимодальное или полимодальпое распределение может рассматриваться как признак неоднородности выборки.
Мода важна в том случае, когда необходимо быстро дать характеристику совокупности на основе характеристики, встречающейся чаще всего.
При умеренно асимметричных распределениях значений медиана располагается между средним арифметическим и модой, причем находится ближе к среднему арифметическому. При абсолютно симметричном распределении частот все три показателя совпадают.
Меры изменчивости
Если использовать только среднее арифметическое значение для характеристики группы обследуемых, можно сделать ошибочные выводы. Поэтому лучшим методом является изучение варьирования значений в выборке, т. е. чисел, которые выражают разность, изменение величин значений у членов выборки.
Наиболее часто в качестве мер изменчивости используют такие, как минимальное значение, максимальное значение, размах, дисперсия, стандартное отклонение.
Минимальное значение - самое маленькое значение в выборке. Например, в выборке {2, 3, 5, 1, 4, 5, 6, 5, 2} минимальным является значение 1. Обозначается Xmin = 1.
Минимальное значение показывает, что в выборке присутствует индивид, у которого данная личностная характеристика проявляется в меньшей степени, чем у других членов группы. В определенных случаях этот индивид может не оказывать большого влияния па психологические проявления группы.
Максимальное значение - самое большое значение в выборке. Например, в выборке {2, 3, 5, 1, 4, 5, 6, 5, 2} максимальным является значение 6. Обозначается Хmах = 6.
Максимальное значение показывает, что в выборке присутствует индивид, у которого данная личностная характеристика проявляется в большей степени, чем у других членов группы, а значит, он может оказывать сильное влияние на группу.
Размах - это разница между максимальным и минимальным значениями. Обозначается размах буквой R и вычисляется по формуле
R= /Xmax- Xmin/
Для определения размаха выборку необходимо сначала упорядочить и найти разность между наибольшим и наименьшим значениями. Если выборка большая и не упорядочена, то найти минимальное и максимальное значения будет трудно.
Если величина значений в выборе однородна, то размах будет стремиться к нулю или будет равен нулю. Следует помнить, что размах выражает разность значений не всех членов выборки, а только тех, у кого имеется максимальная и минимальная величина значения измеряемой психологической характеристики.
Среднее отклонение определяет среднюю разность всех значений выборки от среднего арифметического значения.
Среднее отклонение ∆ х вычисляется по формуле
∆ х = = ∑/хi - Mx/ /n
Абсолютной величиной пользуются для того, чтобы ликвидировать отрицательные знаки отклонений; в противном случае при любом распределении Д.т = 0.
Для характеристики изменчивости значений в выборке чаще всего используют дисперсию. Дисперсия- это мера разброса данных выборки относительно среднего значения.
Обозначается дисперсия буквой D и вычисляется по формуле
D = ∑(хi - Mx)²/ n-1
Дисперсия характеризует рассеивание (разбросанность) значений в выборке около среднего арифметического значения. Для ликвидации отрицательных знаков между индивидуальными величинами и средним арифметическим вычисляется квадрат разности этих величин.
Если вычисление дисперсии производится вручную, то рекомендуется пользоваться специальной таблицей (табл. 3).
Таблица 3
Пример заполнения таблицы для вычисления дисперсии

№ п/п

Xi

мх

Xi - Мх

(хi - Mx)²

1

 

 

 

 

2

 

 

 

 

3

 

 

 

 

...

 

 

 

 

13

 

 

 

 

N= 13

мх

 

 

∑(хi - Mx)²


Стандартное отклонение представляет собой вычисление квадратного корня из дисперсии:

σ = √∑(хi - Mx)²/ n-1
или
σ = √D
При равномерном распределении величин D = 0 и ∆ х = 0, т. е. разбросанность отсутствует. Но данную величину можно использовать как ориентир для анализа действительного значения дисперсии и стандартного отклонения.

Распределение признака

Распределением признака называется закономерность встречаемости разных его значений . В зависимости от того, как выражена изменчивость значений признака, могут быть различные формы распределения. Например, равномерное распределение (когда все значения встречаются одинаково или почти одинаково), симметричное распределение (когда одинаково часто встречаются крайние значения) и нормальное распределение (когда крайние значения признака встречаются достаточно редко, а значения, близкие к средней величине, - достаточно часто).
В психологии и педагогике чаще всего обращают внимание на нормальное распределение. Свое название нормальное распределение получило из-за того, что оно достаточно часто встречалось в естественнонаучных исследованиях и казалось «нормой» всякого случайного проявления признаков. Так как одним из ученых, открывшим данную закономерность, был Карл Фридрих Гаусс (1809 г.), то данное распределение еще называют кривой Гаусса (рис. 1).
Эта особенность распределения учитывается и при стандартизации диагностических методик. При этом чем больше объем выборки, тем достовернее полученное эмпирическое распределение приближается к нормальному. Для оценки нормальности распределения значения рекомендуется, чтобы объем выборки был не менее 30 человек. 
Характерное свойство нормального распределения состоит в том, что 68,26 % из всех наблюдений всегда лежит в диапазоне «плюс-минус одно стандартное отклонение о от среднего арифметического значения»; 95,44 % - в пределах двух стандартных отклонений; 99,72 %- в пределах трех стандартных отклонений.

кривая гаусса

Рис. 1. Кривая нормального распределения (кривая Гаусса)

Принято считать, что в пределах Mx + 2 σ располагаются значения, относящиеся к статистической норме, т. е. значения, которые включены в так называемый 95 %-й доверительный интервал. Знание Мх и σ можно использовать для выведения статистической нормы, обязательное для этой процедуры условие - соответствие распределения нормальному.
Например, необходимо определить границы нормы для российской выборки у переведенного недавно с английского языка теста. После перевода теста и лингвистической адаптации проводим обследование на группе людей, чьим родным языком является русский. По окончании обработки результатов получаем: n = 80, Мх= 30, σ = 5.9. Границы статистической нормы для теста лежат в диапазоне 30 ± 11,8. Таким образом, верхняя граница нормы 18, нижняя 42.

Проверка нормальности распределения.
Асимметрия и эксцесс

В тех случаях, когда какие-либо причины способствуют частому появлению значений в распределении, которые выше или ниже среднего, образуются асимметричные распределения. 
Асимметрия - это показатель несимметричности (скошенности) кривой распределения.
При левосторонней асимметрии (рис. 2, а) ее показатель является положительным и в распределении преобладают более низкие значения признака. При правосторонней (рис. 2, б) - показатель отрицательный и преобладают более высокие значения.

кривые

Рис. 2. Отклонение от симметричности:


Если в распределении преобладают значения, близкие к среднему арифметическому, то формируется островершинное распределение (рис. 3). В этом случае показатель эксцесса стремится к положительной величине. У нормального распределения эксцесс равен нулю. Если у распределения две вершины (бимодальное распределение), т. е. преобладают крайние значения в распределении, го его эксцесс стремится к отрицательной величине. Показатель эксцесса Е определяется по формуле

формула

Распределение не считается нормальным, если эмпирический результат абсолютной величины показателей асимметрии А и эксцесса Е превышает их критические значения (Акр и Екр соответственно) или равен им.
Часто для определения критических значений используют таблицу критических точек Фишера - Снедекора или рассчитывают по формулам Е. И. Пустыльника.

отклонения

Применение нормального распределения в анализе полученных эмпирических данных применяется в следующих случаях:
1) при разработке тестовых шкал;
2) принятии решения о том, в какой шкале измерен психологический признак;
3) при статистической проверке гипотез, в частности при определении риска принятия неверного решения

Критерии оценки психолого-педагогических измерений

Педагогические и психологические средства для измерения тех или иных характеристик должны удовлетворять следующим основным требованиям:
• надежность;
• валидность;
• дискриминативпость;
• наличие нормативных данных или критериев, установленных экспертами.
Диагностическая и предсказательная значимость тестов, в частности дидактических, зависит от того, насколько они могут служить показателем относительно широкой и существенной области достижений. Любые тесты не имеют заранее определенных стандартов успешности или неспешности их выполнения. Индивидуальные показатели оцениваются в сравнении с показателями, полученными другими. Сам термин «норма» указывает па нормальное или среднее выполнение теста. Стандартизируется тест с помощью апробации на большой репрезентативной выборке испытуемых того типа, для которого он предназначен. Относительно этой группы испытуемых, называемой выборкой стандартизации, вырабатываются нормы, указывающие не только на средний уровень выполнения, но и на его относительную вариативность выше или ниже среднего уровня. Поэтому можно оценить различные уровни достижений испытуемых, достаточно лишь определить положение индивида относительно нормативной выборки или выборки стандартизации.
Объективная оценка тестов означает определение надежности и валидности в конкретных ситуациях. Надежность теста есть согласованность показателей, полученных у тех же самых испытуемых при тестировании тем же самым тестом или его эквивалентной формой. Валидность — это степень, в которой тест действительно измеряет то, для чего он предназначен. Валидность устанавливается на репрезентативной выборке испытуемых, чьи показатели удовлетворяют не диагностическим целям, а только целям подготовки теста. Если таким способом доказывается валидность теста, его можно применять на других выборках без изменения критерия. Валидность - это не только показатель степени соответствия теста своим функциям; он указывает на то, что именно измеряется данным тестом. Название теста должно отражать критериальные данные, с помощью которых оценивалась его валидность.
Статистическая обработка результатов тестирования лежит в основе дифференциации учащихся на «сильных», «средних» и «слабых».
Количественная обработка результатов диагностики с применением математической статистики дает величины, позволяющие сравнивать между собой разные по составу группы (среднее арифметическое), определять дифференцированные характеристики внутри каждой из групп, однородность состава или разбросанность его (среднее стандартное отклонение), а также охарактеризовать каждого учащегося в отдельности и указать место, занимаемое им в группе (медиана). Основываясь на медиане, характеризующей средний показатель исследуемого в группе качества в сторону лучших или худших показателей, можно выделить следующие группы учащихся:
• средние учащиеся - среднего уровня успеваемости;
• слабые учащиеся - ниже среднего уровня успеваемости;
• очень слабые учащиеся - гораздо ниже среднего уровня успеваемости;
• сильные учащиеся - выше среднего уровня успеваемости;
• очень сильные учащиеся - гораздо выше среднего уровня успеваемости.
Основанием для выделения групп являются объективные показатели успешной работы по конкретному диагностируемому качеству, а не субъективное мнение преподавателя

Принципы отбора и создания методов, методик и аппаратуры для системной диагностики человека

Для упорядочения работы при создании диагностических методик с позиций системного подхода были сформулированы следующие принципы.
1. Принцип достаточности: арсенал методик и устройств достаточен для диагностического охвата значимых свойств, находящихся па всех основных уровнях иерархической структуры свойств человека.
2. Принцип соответствия: диагностические методы и аппаратура соответствуют общенаучным стандартам (валидности, надежности, достоверности, точности, экологической чистоты).
3. Принцип универсальности: предпочтение отдается более универсальным диагностическим методам и устройствам, которые позволяют диагностировать как можно большую группу параметров. Такой подход, способствуя реализации принципа достаточности, одновременно ограничивает круг необходимых методов и устройств.
4. Принцип адекватности: диагностическая методика адекватна иерархическому положению и функциональным особенностям исследуемого свойства.
5. Принцип континиума: результат любого диагностического исследования должен быть представлен в виде точки па непрерывном континууме диагностируемого свойства.
6. Принцип сравнимости результатов: методы и аппаратура дают возможность представить результаты различных исследований в единой цифровой системе отсчета.
7. Принцип стандартизации: 1) стандартизация диагностических методов, методик и аппаратуры; 2) целесообразность проведения результатов диагностики различных параметров к стандартной общедиагпостической шкале.
8. Принцип портативности: преимущество портативных диагностических методов и аппаратуры в целях экономии времени диагностики и упрощения требований к ее материально-техническому оснащению.
9. Принцип моделируемости: правомерность и целесообразность изучения свойств в условиях моделирования соответствующей деятельности (ситуации), использование упрощенных моделей, взаимодействие которых отражает сложное свойство.
10. Принцип доступности: доступность диагностических методик и аппаратуры для массового использования в обычных (полевых) условиях. Включает в себя: 1) научно-практическую доступность в получении и интерпретации данных; 2) экономическую доступность в приобретении и эксплуатации.
11. Принцип автоматизации: целесообразность автоматизации процедуры исследования и обработки результатов.
12. Принцип относительности: приоритет относительных результатов над абсолютными .

Вопросы для самоконтроля
1. Какие существуют правила для проведения измерений?
2. Какие измерительные шкалы используются в психолого-педагогической диагностике? В чем их особенности?
3. Какие выводы позволяет сделать среднее арифметическое значение по выборке обследуемых?
4. Какие показатели характеризуют изменчивость диагностических данных в выборке?
5. Какие выводы о распределении данных в выборке позволяет сделать знание значений асимметрии и эксцесса?
6. Какие критерии позволяют оценить психолого-педагогические измерения?


Задания для самостоятельного выполнения
1. Прочитайте статью А. Н. Алехина «Методологический диагноз психологической диагностике» (журнал «Психодиагностика». 2014. №2), законспектируйте основные положения, связанные с использованием статистических процедур в психологической диагностике. Письменно прокомментируйте свое мнение о высказанных положениях.
2. Составьте словарь понятий, характеризующих качество и эффективность психолого-педагогических диагностических методик. Укажите литературные источники, на основе которых выполнено задание.

Список рекомендуемой литературы
Клайн П. Справочное руководство по конструированию тестов. Введение в психометрическое проектирование / П. Клайп; пер. Е. П. Савченко; науч. ред. Л. Ф. Бурлачук. Киев: Ника-Центр Лтд, 1994. 284 с.
Кутейников А. Н. Математические методы в психологии: учебное пособие/ А. Н. Кутейников. Санкт-Петербург: Речь, 2008. 172 с.
Митина О. В. Разработка и адаптация психологических опросников / О. В. Митина. Москва: Смысл, 2013. 235 с.
Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных: учебное пособие / А. Д. Наследов. 3-е изд., стер. Санкт-Петербург: Речь, 2008. 392 с.
Наследов А. Д. IBM SPSS 20 и AMOS: профессиональный статистический анализ данных / А. Д. Наследов. Санкт-Петербург: Питер, 2013. 416 с.
Немов Р. С. Психология: учебник для студентов высших учебных заведений: в 3 книгах / Р. С. Немов. 4-е изд. Москва: ВЛАДОС, 2003. Кн. 3: Психодиагностика. Введение в научное психологическое исследование с элементами математической статистики. 640 с.
Сидоренко Е. В. Методы математической обработки в психологии / Е. В. Сидоренко. Санкт-Петербург: Речь, 2001.350 с.
Источник: Дудина, Марина Михайловна. Основы психолого-педагогической диагностики [Электронный ресурс]: учебное пособие / М. М. Дудина, Ф. Т. Хаматнуров. Екатеринбург: Изд-во Рос. гос. проф.-нед. ун-та, 2017. 189 с.