LearningApps - Логин: stu10a98 Пароль: baum22

четверг, 8 февраля 2018 г.

Анализ статистических данных в Excel. Нормальное распределение

Результаты практической работы "Нормальное распределение":

Фамилия, имя
Оценка
Воронина, Машир
11
Мельник, Пюрко
9
Шкуренко, Лижанкова
10
Вакуленко, Белов
9
Пономаренко, Алексеева
8
Попович, Пилипенко
9
Луценко, Поставной
9
Игнатьева, Якимец
8
Хохлов, Гаража
9
Гусак, Замякин
8




Как можно найти закономерность в случайности?

Оказывается, даже случайные величины подчиняются законам статистики. Если выйти на улицу любого города и случайным образом выбранных прохожих спросить о том, какой у них рост, вес, возраст, доход, и т.п., а потом построить график любой из этих величин, например, роста, то мы получим случайные данные.

Отсортируем всех людей по группам, так чтобы каждый попал в свой диапазон роста, например, "от 180 до 181 включительно". 

Подсчитаем количество людей в каждой подгруппе-диапазоне, это будет частота попадания роста жителей города в этот диапазон.

Эти частоты построим по оси Y, а диапазоны отложим по оси X, в результате получим  гистограмму:




Если вам попалось достаточно много жителей, то ваша схема будет выглядеть примерно так:


Это значит, что случайная величина подчиняется нормальному закону распределения. Эту функцию называют в шутку «колоколом» или «удавом, проглотившим слона».

Если вдруг увидите термин «колоколообразная кривая», знайте, что речь идет о нормальном распределении.
Как видно, у графика имеется «горб» в середине и резкое снижение плотности по краям. В этом заключается суть нормального распределения. Другими словами, вероятность того, что случайная величина окажется около центра гораздо выше, чем то, что она сильно отклонится от середины. Смотрим на картинку:

Как анализировать нормально распределенные данные?

Теперь посмотрим на формулу, по которой нарисована колоколообразная кривая, т.е. на функцию Гаусса:


Выглядит немного пугающе, но сейчас разберемся. В функции плотности нормального распределения присутствуют: 
  • π – соотношение длины окружности и его диаметра, равно примерно 3,142;
  • е – основание натурального логарифма, равно примерно 2,718;
  • два параметра, которые задают форму конкретной кривой
  • m - математическое ожидание (в различных источниках могут использоваться другие обозначения, например, µ или a);
  • σ2 - дисперсия;
  • ну и сама переменная x, для которой высчитывается значение функции, т.е. плотность вероятности.

Константы, понятное дело, не меняются. Зато параметры - это то, что придает окончательный вид конкретному нормальному распределению. 

Итак, конкретная форма нормального распределения зависит от 2-х параметров: математического ожидания (m) и дисперсии (σ2). Кратко обозначается N(m, σ2) или N(m, σ). Параметр m (матожидание) определяет центр распределения, которому соответствует максимальная высота графика. Дисперсия σ2 характеризует размах вариации, то есть «размазанность» данных.

Параметр математического ожидания смещает центр распределения вправо или влево, не влияя на саму форму кривой плотности, что хорошо видно на самодвижущейся картинке:

А вот дисперсия определяет остроконечность кривой. Когда данные имеют малый разброс, то вся их масса сконцентрирована у центра. Если же у данных большой разброс, то они «размажутся» по широкому диапазону.


Статистические функции, которые понадобятся вам в работе:


Функция
Русское название
Что делает
AVERAGE()
СРЗНАЧ()
Находит среднее значение по выборке
COUNT()
СЧЕТ()
Подсчитывает число непустых ячеек в диапазоне
STDEVA()
СТАНДАРТОТКЛА()
Находит стандартное отклонение в выборке
COUNTIF()
СЧЕТЕСЛИ()
Подсчитывает число ячеек в выборке, удовлетворяющих заданному условию



Откройте рабочую книгу "Нормальное распределение" и загрузите копию.

Комментариев нет:

Отправить комментарий