ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ

Статистика нс лжет.

Лгут только статистики.

Я. Вишневский

После изучения главы 6 студенты должны:

знать

  • • предмет математической статистики;
  • • основные понятия математической статистики: случайная величина и ее значение, дискретный и интервальный ряд, статистическое распределение выборки, объем выборки, мода, медиана, выборочное среднее, размах, математическое ожидание, дисперсия, среднее квадратичное отклонение, коэффициент вариации;
  • • отличительные признаки использования статистических методов обработки информации;

уметь

  • • читать математический текст и распознавать статистические термины и понятия в сюжетных профессиональных задачах;
  • • выбирать адекватные статистические методы для решения поставленных задач;

владеть

  • • приемом учета количественных данных;
  • • табличным способом вычисления значений выражений на множестве;
  • • способами наглядного представления статистической информации в виде полигона частот и гистограммы.

Основные понятия и задачи математической статистики

В любом разделе педагогики обоснование теоретических положений происходит в большинстве случаев за счет обработки опытных данных. Выпускники бакалавриата на четвертом курсе пишут выпускную квалификационную работу, которая предполагает первичную обработку результатов апробации их педагогических, методических разработок. Таким образом, всем студентам направления «Педагогическое образование» необходимо уметь грамотно собрать, проанализировать и компактно, наглядно представить количественные характеристики своих методических исследований так, чтобы они имели статус доказательности, могли экспериментально подтвердить авторские выводы. В этой ситуации не обойтись без знакомства с элементами математической статистики. Грамотное использование математической статистики может позволить обобщить данные эксперимента, выявить зависимость между экспериментальными данными, наличие существенных различий между группами испытуемых, сформулировать статистическую гипотезу и многое другое.

Определение 6.1. Математическая статистика — раздел математики, разрабатывающий методы изучения массовых явлений на основе обработки опытных данных.

Принципиальной характеристикой объектов математической статистики является их массовость. Опытные данные становятся статистическими данными, если они получены в результате исследования большого количества объектов или явлений. Какое количество объектов считается достаточно большим, определяют законы статистики, и оно может быть разным для разных методов исследования.

Определение 6.2. Множество всех мысленно возможных объектов определенного вида, над которыми проводится эксперимент с целью исследования свойств этого множества, называется генеральной совокупностью.

Например, при проведении референдума генеральной совокупностью является население определенной территории в возрасте, ограниченном избирательным правом. В педагогике в качестве генеральной совокупности часто рассматривается множество учащихся определенного возраста всех школ России. В сельском хозяйстве генеральная совокупность может представлять собой весь урожай определенной культуры в прошедшем году.

Всю генеральную совокупность объектов, которую можно мысленно представить, практически исследовать сложно, а зачастую невозможно. Поэтому обычно рассматривают только часть генеральной совокупности.

Определение 6.3. Подмножество генеральной совокупности называется выборкой.

Выборка должна быть репрезентативной, т.е. давать представление обо всей генеральной совокупности. Например, группа студентов не может стать репрезентативной выборкой при исследовании мнений избирателей даже внутри одного города, так как интересы студентов могут отличаться от интересов других групп населения: пенсионеров, рабочих, ученых. В соответствии с целями исследования выборка должна давать наиболее полную, адекватную информацию об особенностях генеральной совокупности. Поэтому к выборке выдвигается ряд требований. Каждый из объектов, составляющих генеральную совокупность, должен иметь одинаковую вероятность попасть в выборку. Все основные свойства исследуемых объектов должны быть представлены в объектах выборки в той же пропорции, что и в генеральной совокупности. Выборка должна быть достаточно велика для реализации целей данного исследования.

Определение 6.4. Объемом выборки называется количество объектов в выборке.

Эта универсальная статистически важная характеристика выборки обозначается буквой п. Объем генеральной совокупности обозначается заглавной буквой N.

Каждый элемент выборки обычно исследуется на наличие какого-либо свойства, которое может быть измерено. Таким образом, каждому элементу выборки ставится в соответствие некоторое число. Какое именно число будет соответствовать определенному объекту, исследователь заранее предсказать не может. Поэтому говорят, что эти числа получаются случайно, а свойство объектов выборки, измеряемое в ходе эксперимента, задает случайную величину.

Определение 6.5. Величина, измеряемая в ходе эксперимента, которая может изменяться при многократном повторении одного и того же эксперимента в независимых друг от друга условиях, называется случайной величиной.

Опытные данные как предмет математической статистики представляют собой значение случайной величины, поскольку появление в результате опыта, эксперимента той или иной числовой характеристики исследуемого свойства можно рассматривать как случайное событие.

Определение 6.6. Результат измерения некоторого свойства элемента выборки называется значением случайной величины.

Примерами значений случайной величины могут быть скорость преодоления данной дистанции разными участниками забега, масса плодов томата данного сорта, выращенных в разных условиях, расстояние от точки попадания пули до центра мишени, число учащихся из разных школ, решивших данную задачу. Многие педагогические эксперименты связаны с измерениями свойств изучаемых объектов, причем результаты таких измерений являются случайными числами, закономерность получения которых требуется установить. Например, интеллект измеряют в IQ-eдиницах, и у разных людей или у одного человека в разном возрасте или в разных климатических условиях он может принимать (или не принимать) разные значения.

Определение 6.7. Множество чисел, являющихся значениями некоторой случайной величины, которые получены в ходе данного эксперимента, будем называть массивом значений.

Пример 6.1

При проверке партии семян на всхожесть из 10 кг семян свеклы была взята случайным образом выборка из 10 семян. Случайной величиной в данном случае является всхожесть семян, которая может принимать значения 0 или 1 (не взошло или взошло). Предположим, был получен следующий массив значений случайной величины всхожести: 0; 1; 1; 1; 1; 0; 0; 1; 0; 1. Объем выборки п- 10.

Поскольку каждому объекту выборки соответствует значение случайной величины, то объем выборки равен количеству элементов в полученном массиве опытных данных.

Пример 6.2

В качестве эксперимента проводилась контрольная работа по геометрии среди 25 учащихся. Оценивалась такая случайная величина, как осознанность знаний. Эта случайная величина могла принимать значения от 1 до 5 баллов. Были получены следующие результаты в баллах: 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3. Этот массив содержит 25 чисел и представляет собой значения случайной величины «осознанность знаний» для выборки из 25 учащихся (объем выборки п = 25). Среди 25 значений в массиве встречаются одинаковые и различные числа. Различных значений в этом ряду только 4.

Определение 6.8. Различные элементы массива значений случайной величины называются вариантами.

Варианты будем обозначать д

Пример 6.3

На той же контрольной работе у тех же 25 учащихся, что и в примере 6.2, оценивалось время, затраченное на решение сложной задачи. Был получен другой массив значений случайной величины «время, затраченное на решение данной задачи»: 3,7; 4,3; 5,1; 6,2; 6,3; 5,4; 5,3; 4,7; 6,4; 6,5; 6,8; 4,6; 4,8; 3,9; 8,5; 3,8; 4,9; 5,7; 5,9; 6,6; 4,5; 7,1; 5,8; 5,2; 7,5. В данном примере при том же объеме выборки п = 25 повторяющихся значений в числовом ряду нет, поэтому количество вариант 25.

Случайные величины в последних двух примерах относятся к разным типам, и их значения обрабатываются по-разному. Различают непрерывные, дискретные и смешанные случайные величины.

Если при достаточно больших значениях объема выборки п значения случайной величины не повторяются, а возможными значениями данной случайной величины являются все действительные числа из некоторого промежутка, то изучаемая величина относится к непрерывным величинам. При этом число вариант не отличается от достаточно большого объема выборки п. Например, непрерывными величинами могут считаться температура, вес, длина, если они принимают много неповторяющихся значений в данном эксперименте. К какому типу величин следует отнести возраст, зависит от того, в каких единицах возраст измеряется. Если возраст измеряют в целых годах, то возраст может быть отнесен к смешанным или дискретным случайным величинам.

Если при достаточно большом объеме выборки п среди большого количества различных значений есть несколько повторяющихся, то такую величину относят к смешанным величинам. При этом число вариант достаточно близко к объему выборки п, а частоты, с которыми встречаются варианты в массиве, малы и мало отличаются друг от друга.

Если даже при большом объеме выборки число вариант мало, то рассматриваемая величина относится к дискретным величинам.

В предыдущих определениях использовалось выражение «достаточно большие значения объема выборки», которое, конечно же, должно быть уточнено. Для определения необходимого объема выборки в статистике выведены формулы, зависящие от многих показателей.

В разной статистической литературе по различным областям знаний приводятся разные границы определения достаточно большого числа вариант в выборке. Важно соблюдать сам принцип выбора способа обработки статистических данных в зависимости от типа исследуемой величины. Наглядность, информативность, обозримость результатов первичной обработки статистических данных зависит в том числе и от того, сколько различных значений исследуемой величины необходимо проанализировать. В учебных целях будем считать при рассмотрении примеров в данной главе число вариант не меньше 25 достаточно большим. Тогда в примере 6.2 исследуется дискретная величина, прежде всего потому, что различных баллов, которые получили объекты эксперимента было всего 4. Случайную величину из примера 6.3 будем рассматривать как непрерывную, так как время в принципе может измеряться в любых долях секунды и для 25 учащихся было получено 25 различных числовых характеристик времени.

Определение типа случайной величины важно для выбора того или иного алгоритма описания и первичной обработки опытных данных. Описание значений случайной величины любых типов и их отличие основыва- ется на учете того, как часто встречаются в массиве опытных данных одинаковые значения.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >