Учебно-методический комплекс по дисциплине Специальность 033100 Физическая культура (очное отделение, срок обучения 5 лет)

Вид материалаУчебно-методический комплекс

Содержание


Шкалы измерений
Точность измерений.
Тема 1.3. Прикладные методы статистической обработки и анализа материалов контроля и область их применения
Корреляционные методы
Виды корреляции
Способы выражения корреляции
Коэффициент корреляции Браве-Пирсона
Коэффициент ранговой корреляции Спирмена
Регрессионный анализ
Дисперсионный анализ
Вариативность статистической совокупности
Тема 1.4. Основы теории тестов
Стандартизация измерительных процедур.
Логический метод
Эмпирический метод
Надежность тестов
Согласованность теста
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11
Тема 1.2. Основы теории измерений

Понятие об измерении. Шкалы измерений (наименований, порядка, интервалов и отношений). Точность измерений. Абсолютные, относительные, систематические и случайные ошибки измерений.


СЕМИНАР


Измерением является операция, в результате которой определяется, во сколько раз данная величина больше или меньше эталона (результаты измерений в прыжках и метаниях - в метрах, в беге - в секундах и т.д.)

Часто возникает необходимость оценивать выразительность исполнения (фигурное катание, художественная гимнастика), сложность движений (прыжки в воду, фристайл), утомление марафонцев, тактическое мастерство (футболистов, фехтовальщиков). Здесь узаконенных эталонов нет, но именно измерения во многих видах спорта наиболее информативны.

В этом случае измерением будет называться установление соответствия между изучаемым явлением с одной стороны и числами - с другой.

Все специалисты, оценивающие какие-то показатели, должны делать это одинаково, в соответствии с принятым стандартом.

Стандарт - это нормативно-технический документ, устанавливающий комплекс норм, правил, требований к спортивным измерениям и утверждённый компетентным органом (государственный стандарт России, лаборатория метрологии ВНИИФКа).

Использование стандарта повышает точность, экономичность и единство измерений. В зависимости от характера и полноты информации результаты измерений обрабатываются на основе приемлемой шкалы измерений.

Шкалы измерений
  1. Шкала наименований (номер спортсмена, амплуа) группирует объекты по определённому признаку и присваивает им условные обозначения (напр.: прыгуны в длину – 1, в высоту – 2, тройным – 3, с шестом – 4). В данной шкале символика означает, что объект 1 только отличается от объектов 2, 3 или 4. Насколько отличается – по этой шкале измерить нельзя. Для чего нужна такая шкала? Результаты измерений нужно обрабатывать, а математическая статистика имеет дело с числами. Поэтому группировать объекты лучше не по словесным характеристикам, а по числам.
  2. Шкала порядка (результаты ранжирования спортсменов в тесте). Пример: бег на 100 м - это определение уровня развития скоростно-силовых качеств. У победителя уровень этих качеств выше, чем у пришедшего вторым и т.д. Бегуны распределяются по рангам. Ранг победителя - 1 и т.д. Можно складывать и вычитать ранги. Однако необходимо помнить, что если между второй и четвёртой гимнасткой, например, 2 ранга, это вовсе не означает, что вторая вдвое артистичнее четвёртой.
  3. Шкала интервалов (t тела, суставные углы и т.д.). Измерения в этой шкале не только упорядочены по рангу, но и разделены определёнными интервалами. В шкале интервалов установлены единицы измерения (градус, секунды и т.д.). Измеряемому объекту здесь присваивается число, равное количеству единиц измерения, которое оно содержит. Например: t тела спортсмена А при выполнении упражнения равна 39,0С, спортсмена Б - 39,5С. Обработка результатов измерений в интервальной шкале позволяет определить на сколько больше один объект по сравнению с другим (на 0,5С). Нулевая точка шкалы выбирается произвольно.
  4. Шкала отношений (длина и масса тела, сила движений, ускорение и т.д.). Нулевая точка не произвольна, следовательно, измеряемое качество может быть равно нулю. В связи с этим, при оценке результатов измерений в этой шкале можно определить во сколько раз один объект больше другого.

Точность измерений.

Выделяют прямые измерения (с получением опытных данных) и косвенные (рассчитывают по формулам на основе результатов прямых измерений)

Следует помнить, что никакое измерение не может быть выполнено абсолютно точно и результат измерения всегда содержит в себе ошибку. Надо стремиться к тому, чтобы эта ошибка была минимальной. Поэтому в задачу измерений входит не только нахождение искомой величины, но и оценка допущенных при этом ошибок. Ошибки бывают систематическими и случайными, абсолютными и относительными

Различают 4 группы систематических ошибок:
  1. Ошибки, причина возникновения которых известна и величина которых может быть определена достаточно точно (напр.: при измерении прыжка рулеткой возможно изменение её длины за счёт различий в t воздуха. Это изменение можно оценить и внести поправки в результат прыжка).
  2. Ошибки, причина возникновения которых известна, а величина нет. Такие ошибки зависят от класса точности измерительной аппаратуры (напр.: если класс точности динамометра составляет 2,0, его показания правильны с точностью до 2%. Но при нескольких измерениях ошибка может быть равна 0,3%; 2%; 0,7% и т.д.).
  3. Ошибки, происхождение которых и величина неизвестны. Обычно они проявляются в сложных измерениях, когда не удаётся учесть все источники возможных погрешностей.
  4. Ошибки, связанные не столько с процессом измерения, сколько со свойствами объекта измерения. Различия в результатах измерений обусловлены внутренними свойствами спортсменов (стабильность реакций, текущее состояние, утомление, эмоциональное возбуждение).

В некоторых случаях ошибки возникают по причинам, предсказать которые заранее попросту невозможно. Такие ошибки называются случайными. Их выявляют и учитывают с помощью математического аппарата теории вероятностей (напр.: при обработке результатов отбрасывают минимальное и максимальное значения).

Абсолютная ошибка есть разность между показателями прибора и истинным значением.

Относительная ошибка отражает абсолютную ошибку, выраженную в процентах относительно измеряемого значения.

Тема 1.3. Прикладные методы статистической обработки и анализа материалов контроля и область их применения

Область применения и прикладные особенности использования методов математической статистики в системе комплексного контроля.

Корреляционные методы, их характеристика и применение в работе с тестами. Линейная и нелинейная корреляции. Параметрическая и непараметрическая корреляции. Использование коэффициентов корреляции Браве-Пирсона, Спирмена, корреляционного отношения, тетрахорического коэффициента корреляции.

Регрессионный анализ. Характеристика и область применения регрессионного анализа. Формы регрессии. Экстраполяция и интерполяция. Метод регрессионных остатков.

Дисперсионные методы. Характеристика дисперсионного анализа. Область применения дисперсионного анализа. Причина появления общей, факториальной, межгрупповой и индивидуальной дисперсий при проведении тестирования. Однофакторный и двухфакторный комплексы дисперсионного анализа.

Статистические показатели вариативности. Стандартное отклонение. Коэффициент вариации. Область использования стандартного отклонения и коэффициента вариации в разработке тестов и системе оценивания в физическом воспитании и спорте.


СЕМИНАР


Статистика представляет собой отрасль знаний, которая исследует совокупности массовых однородных явлений. Особенность этих явлений заключается, с одной стороны, в том, что они однородны, а с другой - отличаются друг от друга количественными показателями. Например, исследуя большую группу спортсменов одного возраста, пола, спортивной квалификации и стажа, необходимо измерить величину максимального потребления кислорода (МПК). В первом случае мы получим массовые однородные показатели, а во втором - индивидуальные показатели, где каждый показатель МПК соответствует конкретному спортсмену и отличается один от другого.

Таким образом, объектом исследования статистики будут массовые однородные явления, которые отличаются друг от друга, или варьируют по единичному показателю.

Предметом исследования статистики является оценка статистических совокупностей, где применяют специальные математико-статистические методы, которые имеют определенную цель при обработке своих результатов, а именно: измерения массовых статистических совокупностей заменяются такими показателями, от применения которых не происходит или почти не происходит потеря исходной информации. Таким образом, большие совокупности чисел заменяются несколькими параметрами, несущими в себе всю исходную информацию.

Сжатие информации до обозримых размеров позволяет проанализировать исследуемое явление и дать ему адекватную оценку, что невозможно осуществить при рассмотрении всей статистической совокупности. Кроме того, выявление параметров совокупности в ряде случаев позволяет установить природную закономерность в оценке исходных данных, как в части ее конкретного анализа, так и при ее сравнении с другими совокупностями.

Все эти рассуждения имеют место в практике спортивных исследований. За редким исключением, исследования в физической культуре и спорте основаны на наблюдениях, эксперименте и тестировании. Значительная часть научных методов опирается на результаты измерений больших групп спортсменов. Так, изначально практика физической культуры и спорта располагает исходными данными в виде статистической совокупности, где ее единичные показатели отражают достижения конкретного спортсмена, а их варьирование свидетельствует об индивидуальном различии спортсменов по измеряемому показателю. Итак, спортивная статистика - это наука о массовых однородных явлениях в практике физической культуры и спорта.

Корреляционные методы

Корреляционный анализ представляет собой статистический метод, отражающий связь между парой признаков.

Под признаком понимается некоторая совокупность (как генеральная, так и выборочная) варьирующих элементов. Таким образом, исследуется связь между двумя вариационными рядами. Взаимосвязь может быть значительной, и тогда говорят о тесном влиянии признаков друг на друга, или незначительной, выраженной слабым влиянием признаков. При этом всегда желательно располагать определенным методом для оценки тесноты взаимосвязи.

Существуют три способа анализа тесноты взаимо­связи: функциональная, статистическая и корреляционная связь.

Функциональная связь между признаками отражает максимально тесную связь, когда одному значению первого признака соответствует одно значение второго признака. Такая связь, как правило, наблюдается в точных науках, основные закономерности которых отражаются в виде формул.

Функциональная связь в практике физической культуры и спорта - редкое явление. Как правило, взаимосвязь в физической культуре и спорте выражается приближенно. Например, очевидно, что увеличение объема нагрузки в определенных границах влечет за собой подъем уровня функциональных возможностей спортсмена. Однако в этом случае пропорций не существует, и связь оценивается приближенно. Всем известен пример тесной связи между ростом и массой человека: с увеличением роста масса возрастает, но оценить это можно лишь приближенно.

Статистическая связь - это связь, при которой взаимное влияние признаков друг на друга имеет место, но выражается оно приближенно.

Корреляционная связь представляет собой некоторое объединение вышеназванных видов взаимосвязи. Она возникает тогда, когда между признаками определяется приближенная взаимосвязь, но вид этого приближения особый: каждому значению первого признака соответствует средняя арифметическая нескольких значений другого признака.

Виды корреляции

Характер связи между признаками отражает один из видов корреляции. Существует два вида корреляции: прямая (положительная) и обратная (отрицательная).

Прямая (положительная) корреляция отражает такую взаимосвязь между признаками, при которой с увеличением первого признака второй тоже увеличивается.

Обратная (отрицательная) корреляция - взаимосвязь между признаками, при которой с увеличением первого признака второй уменьшается.

Способы выражения корреляции

Существует два основных способа выражения корреляции: корреляционный график и коэффициент корреляции.

По сравнению с численными значениями графики не несут в себе никакой новой информации, их отличительная черта – наглядность. В самом деле, если данные наблюдений нанести на график, то по нему можно определить, есть ли корреляция и какова ее характеристика.

В целом по графику можно определить следующие моменты:
  • если экспериментальные точки рассеяны по полю графика хаотично и по ним невозможно провести линию, то корреляция отсутствует;
  • если точки группируются вдоль какой-либо линии, то корреляция есть, и она тем теснее, чем плотнее располагаются эти точки;
  • по направлению линии, вдоль которой группируются точки, можно определить вид корреляции (положительная или отрицательная).

Самым точным выражением корреляции является ее оценка при помощи специальных коэффициентов корреляции: 1) коэффициента корреляции в случае прямолинейной связи и 2) корреляционных отношений, если корреляция криволинейная.

Коэффициент корреляции Браве-Пирсона

Это параметрический парный коэффициент корреляции. Его вычисление возможно только в том случае, если измерения проводились с использованием равномерной шкалы (в физических единицах – в шкале интервалов или в шкале отношений) и распределение значений варьирующего признака в сопоставляемых факторах допустимо отличается от нормального. Этот коэффициент корреляции мощнее коэффициента корреляции по Спирмену, т.е. он более точно характеризует связь между факторами. Значения r могут находиться в лишь интервале от -1 до +1. Знак при r указывает на направленность зависимости («+» - прямая, «-» - обратная), а его абсолютное значение показывает тесноту (силу) связи (зависимости) между факторами.

Коэффициент ранговой корреляции Спирмена

Вычисление коэффициента предполагает перевод абсолютных значений признаков в ранги с последующих их сопоставлением на предмет наличия взаимосвязи. Может применяться во всех случаях при линейной связи между факторами.

Регрессионный анализ

Корреляционное поле графически отображает статистическую зависимость, при которой каждому конкретному значению одного фактора – например, фактора х – соответствует интервал значений у. Если же каждому конкретному значению фактора х сопоставить среднее значение у, подсчитанное в упомянутом выше интервале, на графике получится ряд точек, лежащих на некоторой линии, т.е. графическое отображение функциональной зависимости. Такой график называют линией регрессии, а отображаемую ею зависимость – регрессией (регрессионной зависимостью).

Сформулируем сущность этой зависимости: регрессия – это зависимость, при которой конкретному значению хi одного фактора соответствует среднее арифметическое уср по той области значений другого фаткора, которые возможны при заданном хi.

Таким образом, переход от корреляционной зависимости к регрессионной – это формальный переход от статистической зависимости к функциональной.

В практических исследованиях возникает необходимость аппроксимировать (математически описать приблизительно) корреляционную зависимость между двумя признаками уравнением. Для линейной зависимости сделать это относительно просто: вытянутое корреляционное поле заменить усредненной прямой линией и найти ее уравнение по статистическим данным коррелируемых признаков. В прямоугольной системе координат уравнение прямой линии записывается в виде: у = a + b · x

Это математическое выражение корреляционной зависимости называется уравнением регрессии. Коэффициенты a и b называются параметрами уравнения регрессии. Параметр а определяет на графике отрезок, отсекаемый графиком уравнения (прямой линией) на оси Y. Параметр b показывает, как изменяется признак Y при изменении признака X. Его еще называют коэффициентом регрессии. Изменение коэффициента регрессии влечёт за собой изменение угла наклона линии регрессии, тогда как изменение величины коэффициента а, не меняя угла наклона, ведёт к её смещению вверх или вниз параллельно самой себе на величину а.

Уравнение регрессии тем лучше описывает корреляционную зависимость, чем ближе она к линейной и чем больше ее достоверность. В случае нелинейной зависимости математически запись может выражаться в виде более сложных уравнений различных кривых линий (экспоненциальной кривой, параболы, гиперболы и т.д.).

Дисперсионный анализ

Дисперсионный анализ, так же, как и корреляционный анализ, позволяет выявить влияние одного признака на другой. В отличие от корреляционного анализа, факторный признак имеет сложную структуру. Он может состоять из ряда подгрупп. Дисперсионный анализ позволяет оценивать влияние отдельных факторов или их сочетаний на рассматриваемый признак.

Идея дисперсионного анализа как статистического метода заключается в том, что производится сравнение двух сумм квадратов отклонений.

Вариативность статистической совокупности

Разброс значений, составляющих выборку, харакетризуется размахом, дисперсией, средним квадратическим отклонением, но во многих случаях лучше всего коэффициентом вариации. Вариативность – одна из основных характеристик статистической совокупности.


Тема 1.4. Основы теории тестов

Общие понятия теории тестов. Тесты в практике и научных исследованиях физического воспитания, спорта. Информативность тестов. Эмпирическая информативность. Логическая информативность. Информативность по определению.

Разновидности информативности: различительная, диагностическая и прогностическая.

Эмпирическая информативность. Информативность при наличии единичного критерия. Конкурентная информативность. Факторная информативность.

Методы оценки информативности: коэффициент информативности.

Процедура проведения тестирования при оценке различных видов информативности: статистические методы оценки информативности; корреляционный метод оценки информативности; дисперсионный метод оценки информативности.

Информативность тестов в практической работе: контингент тестируемых и информативность; интервал времени между тестированиями и информативность. Пути повышения информативности тестов.

Надежность тестов. Основные понятия. Факторы, определяющие надежность. Разновидности надежности. Коэффициент надежности.

Оценка надежности по экспериментальным данным. Процедуры при оценке надежности. Корреляционные методы оценки надежности. Дисперсионные методы оценки надежности.

Воспроизводимость результатов теста. Понятие воспроизводимости. Факторы, определяющие воспроизводимость. Методы оценки воспроизводимости результатов тестирования.

Стабильность теста. Понятие стабильности. Факторы, определяющие стабильность. Оценка стабильности.

Согласованность теста. Понятие и разновидности согласованности. Факторы, определяющие согласованность: влияние внешних факторов, влияние на результат оценивания показателей тестирования.

Эквивалентность тестов. Понятие эквивалентности. Коэффициент эквивалентности. Гомогенные и гетерогенные тесты. Статистические методы оценки эквивалентности: корреляционный анализ, факторный анализ.

Надежность тестов в практической работе. Доверительные границы коэффициента надежности. Определение количества попыток при тестировании, необходимого для удовлетворяющей надежности.

Пути повышения надежности: практические, математические (коррекция на уменьшение).

ЛЕКЦИЯ


Тестом называется измерение или испытание, проводимое для определения состояния или способностей спортсмена.

Требования к тестам:
  1. должна быть определена цель любого теста;
  2. должны быть стандартизированы методика измерений результатов и процедура тестирования;
  3. необходимо определить надёжность и информативность тестов;
  4. должна быть разработана система оценок результатов в тестах;
  5. необходимо указать вид контроля (оперативный, текущий или этапный).

В зависимости от цели тесты подразделяются на несколько групп:
  1. Тесты, измеряемые в покое:
  • показатели физического развития (длина и масса тела, толщина жировых складок, объём мышечной и жировой ткани и др.);
  • показатели, характеризующие функционирование основных систем организма (ЧСС, ЧД, АД, состав крови, мочи и т.д.);
  • психические тесты.

Информация, полученная с помощью этих тестов используется:
  1. для оценки физического состояния спортсменов,
  2. для фиксации исходного уровня показателей с последующим сравнением с уровнем, достигнутым в процессе тренировки (все расчёты ведутся относительно исходного уровня).
  1. Стандартные тесты всем испытуемым предлагается выполнить одинаковое задания). Эти тесты отличает выполнение непредельной нагрузки, следовательно, отсутствует мотивация на достижение максимального результата.

Результат такого теста зависит от способа задания нагрузки:
  1. если задаётся механическая величина нагрузки, то измеряются медико-биологические показатели (проба Летунова, индекс Рюффье, Гарвардский степ-тест);
  2. если задаётся величина сдвигов медико-биологических показателей, то измеряются физические величины нагрузки (время, расстояние и т.д.; РWС170 - определяется длительность выполнения физической работы на заданном уровне ЧСС).
  1. Максимальные функциональные тесты - при их выполнении необходимо показать максимальный результат, при этом измеряются значения различных функциональных систем (ЧСС, МПК и т.д.). Эти тесты отличает высокая мотивация на достижение максимального результата (тест Купера).

Тесты бывают:
  • гетерогенные - результат зависит от многих факторов;
  • гомогенные - результат зависит преимущественно от одного фактора.

Оценка подготовленности спортсменов, как правило, проводится по нескольким тестам ("батарея" тестов).

Стандартизация измерительных процедур.

Эффективность соревновательной деятельности напрямую зависит от успешности реализации тренировочных программ, которые формируются на основе результатов контроля в ходе тренировочного процесса. Точность результатов контроля, в свою очередь, зависит от стандартности проведения тестов, требующей соблюдения ряда правил:
  1. Режим дня должен строиться по одной схеме.
  2. Разминка перед тестированием должна быть стандартной (по длительности, подбору упражнений, последовательности выполнения упражнений).
  3. Тестирование должны проводить одни и те же люди.
  4. Схема выполнения теста не должна меняться.
  5. Отдых между повторениями должен быть полным.
  6. Спортсмен должен стремиться показать максимальный результат.

Информативность тестов

Информативность теста это степень точности, с которой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется.

В настоящее время информативность подразделяют на несколько видов. Так, в частности, если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, тест должен обладать прогностической информативностью. Тест может быть диагностически информативен, а прогностически нет, и наоборот.

Степень информативности может характеризоваться количественно - на основе опытных данных (так называемая эмпирическая информативность) и качественная на основе содержательного анализа ситуации (логическая информативность). В этом случае тест называют логически, информативным на основе мнений экспертов, специалистов.

Если говорить об оценке подготовленности спортсменов, то наиболее информативным показателем является результат в соревновательном упражнении. Однако он зависит от большого количества факторов, и один и тот же результат в соревновательном упражнении могут показывать люди, заметно отличающиеся друг от друга по структуре подготовленности. Например, спортсмен с отличной техникой плавания и относительно невысокой физической работоспособностью и спортсмен со средней техникой, но с высокой работоспособностью будут соревноваться одинаково успешно (при прочих равных условиях).

Для выявления ведущих факторов, от которых зависит результат в соревновательном упражнении, и используются информативные тесты. Но как узнать меру информативности каж­дого из них? Например, какие из перечисленных тестов информативны при оценке подготовленности теннисистов: время простой реакция, время реакции выбора, прыжок вверх с места, бег на 60 м? Для ответа на эти вопросы необходимо знать методы определения информативности. Их два: логический (содержательный) и эмпирический.

Логический метод определения информативности тестов. Суть этого метода определения информативности заключается в логическом (качественном) сопоставлении биомеханических, физиологических, психологических и других характеристик критерия и тестов.

Предположим, что мы хотим подобрать тесты для оценки подготовленности высококвалифицированных бегунов на 400 м. Расчеты показывают, что в этом упражнении при результате 45 с примерно 72% энергии поставляется за счет анаэробных ме­ханизмов энергопродукции и 28 % - за счет аэробных. Следовательно, наиболее информативными будут тесты, позволяющие выявить уровень и структуру анаэробных возможностей бегуна: бег на отрезках 200-300 м с максимальной скоростью, прыжки с ноги на ногу в максимальном темпе на дистанции 100-200 м, повторный бег на отрезках до 50 м с очень короткими интервалами отдыха. Как показывают клинико-биохимические исследования, по результатам этих заданий можно судить о мощности и емкости анаэробных источников энергии и, следовательно, их можно использовать в качестве информативных тестов.

Приведенный выше простой пример имеет ограниченное значение, так как в циклических видах спорта логическая информативность может быть проверена экспериментально. Чаще всего логический метод определения информативности используется в таких видах спорта, где нет четкого количественного критерия. Например, в спортивных играх логический анализ фрагментов игры позволяет вначале сконструировать специфический тест, а затем проверить его информативность.

Эмпирический метод определения информативности тестов при наличии измеряемого критерия. Ранее говорилось о важности использования единичного логического анализа для предварительной оценки информативности тестов. Эта процедура позволяет отсеять заведомо неинформативные тесты, структура которых мало соответствует структуре основной деятельности спортсменов или физкультурников. Остальные тесты, содержательная информативность которых признана высокой, должны пройти дополнительную эмпирическую проверку. Для этого результаты теста сопоставляют с критерием. В качестве критерия обычно используют:
  • результат в соревновательном упражнении;
  • наиболее значимые элементы соревновательных упражнений;
  • результаты тестов, информативность которых для спортсменов данной квалификации была установлена ранее;
  • сумму очков, набранную спортсменом при выполнении комплекса тестов;
  • квалификацию спортсменов.

Эмпирический метод определения информативности тестов при отсутствии единичного критерия. Эта ситуация наиболее типична для массовой физической культуры, где единичного критерия либо нет, либо форма его представления не позволяет использовать описанные выше методы для определения информативности тестов. Предположим, что нам необходимо составить комплекс тестов для контроля за физической подготовленностью студентов. С учетом того, что студентов в стране несколько миллионов и такой контроль должен быть массовым, к тестам предъявляются определенные требования: они должны быть просты по технике, выполняться в простейших условиях и иметь несложную и объективную систему измерений. Таких тестов сотни, но нужно выбрать наиболее информативные.

Сделать это можно следующим способом: 1) отобрать несколько десятков тестов, содержательная информативность которых кажется бесспорной; 2) с их помощью оценить уровень развития физических качеств у группы студентов; 3) обработать полученные результаты на ЭВМ, используя для этого факторный анализ.

В основе этого метода лежит положение о том, что результаты множества тестов зависят от сравнительно небольшого количества причин, которые для удобства названы факторами. Например, результаты в прыжке в длину с места, метании гранаты, подтягивании, жиме штанги предельного веса, в беге на 100 и 5000 м зависят от выносливости, силовых и скоростных качеств. Однако вклад этих качеств в результат каждого из упражнений неодинаков. Так, результат в беге на 100 м сильно зависит от скоростно-силовых качеств и немного - от выносливости, жим штанги - от максимальной силы, подтягивание - |от силовой выносливости и т.д.

Кроме того, результаты некоторых из этих тестов взаимосвязаны, так как в их основе лежит проявление одних и тех же качеств. Факторный же анализ позволяет, во-первых, сгруппировать тесты, имеющие общую качественную основу, и, во-вторых (и это самое главное), определить их удельный вес в этой группе. Тесты с наибольшим факторным весом считаются самыми информативными.


Надежность тестов

Надежностью тестов называется степень совпадения резуль­татов при повторном тестировании одних и тех же людей в оди­наковых условиях. Вполне понятно, что полное совпадение ре­зультатов при повторных измерениях практически невозможно.

Вариацию результатов при повторных измерениях называют внутрииндивидуалъной, внутригрупповой или внутриклассовой. Основными причинами такой вариации результатов тестирования, которая искажает оценку истинного состояния подготовленности спортсмена, т.е. вносит определенную ошибку или погрешность в эту оценку, являются следующие обстоятельства:
  1. Случайные изменения состояния испытуемых в процессе тестирования (психологический стресс, привыкание, утомление, изменение мотивации к выполнению теста, изменение концентрации внимания, нестабильность исходной позы и других условий процедуры измерений при тестировании);
  2. Неконтролируемые изменения внешних условий (температура, влажность, ветер, солнечная радиация, присутствие посторонних лиц и т.п.);
  3. Нестабильность метрологических характеристик технических средств измерения (ТСИ), используемых при тестировании. Нестабильность может быть вызвана несколькими причинами, обусловленными несовершенством применяемых ТСИ: погрешностью результатов измерения из-за изменений напряжения сети, нестабильностью характеристик электронных измерительных приборов и датчиков при изменениях температуры, влажности, наличием электромагнитных помех и т.п. Следует отметить, что по этой причине погрешности измерений могут составлять значительные величины;
  4. Изменения состояния экспериментатора (оператора, тренера, педагога, судьи), осуществляющего или оценивающего результаты тестирования, и замена одного экспериментатора другим;
  5. Несовершенство теста для оценки данного качества или конкретного показателя подготовленности.
  6. Для определения коэффициента надежности теста существуют специальные математические формулы.

Говоря о надежности тестов, различают их стабильность, согласованность, эквивалентность.

Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом. Стабильность теста зависит от следующих компонентов:
  • вида теста;
  • контингента испытуемых;
  • временного интервала между тестом и ретестом.

Для количественной оценки стабильности используется дисперсионный анализ по той же схеме, что и в случае расчета обычной надежности.

Согласованность теста характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Если результаты спортсменов в тесте, который проводят разные специалисты (эксперты, судьи), совпадают, то это свидетельствует о высокой степени согласованности теста. Это свойство зависит от совпадения методик тестирования у разных специалистов.

Когда создается новый тест, обязательно нужно проверить его на согласованность. Делается это так: разрабатывается унифицированная методика проведения теста, а потом два или более специалиста по очереди в стандартных условиях тестируют одних и тех же спортсменов.

Эквивалентность тестов. Одно и то же двигательное качество (способность, сторону подготовленности) можно измерить с помощью нескольких тестов. Например, максимальную скорость - по результатам пробегания с ходу отрезков в 10, 20 или 30 м. Силовую выносливость - по числу подтягиваний на перекладине, отжиманий в упоре, количеству подъемов штанги в положении лежа на спине и т.д.

Эквивалентность тестов определяется следующим образом: спортсмены выполняют одну разновидность теста и затем после небольшого отдыха - другую и т.д.

Если результаты оценок совпадают (например, лучшие в подтягивании оказываются лучшими и в отжимании), то это свидетельствует об эквивалентности тестов. Коэффициент эквивалентности определяется с помощью корреляционного или дисперсионного анализа.

Применение эквивалентных тестов повышает надежность оценки контролируемых свойств моторики спортсменов. Поэтому если нужно провести углубленное обследование, то лучше применить несколько эквивалентных тестов. Такой комплекс называется гомогенным. Во всех остальных случаях лучше использовать гетерогенные комплексы: они состоят из неэквивалентных тестов.

Не существует универсальных гомогенных или, гетерогенных комплексов. Так, например, для слабо подготовленных людей такой комплекс, как бег на 100 и 800 м, прыжок в длину с места, подтягивание на перекладине, будет гомогенным. Для спортсменов высокой квалификации он может оказаться гетерогенным.

До определенной степени надежность тестов может быть повышена путем:
  • более строгой стандартизации тестирования;
  • увеличения числа попыток;
  • увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнений;
  • увеличения числа эквивалентных тестов;
  • лучшей мотивации испытуемых;
  • метрологически обоснованного выбора технических средств измерений, обеспечивающих заданную точность измерений в процессе тестирования.