Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ
Посмотреть оригинал

В2.2. Центр и рассеяние: вычисление

В системе МатЛаб есть функции mean(X) и median(Ar). Они могут быть применены не только к векторам, но и к матрицам. Они возвращают строку, содержащую средние значения или медианы, соответственно, столбцов матрицы. Чтобы найти середину размаха, можно воспользоваться комбинацией двух функций тг= (тах(Х) + тт(Х)) / 2.

Стандартное отклонение вычисляется с использованием функции std(.r), если знаменатель формулы (2.3) равен N - 1, или std(x, 1), если равен N.

Стабильная версия размаха, которую можно использовать при больших значениях N или при наличии выбросов в данных, определяется с использованием понятия «квантиль». Сначала зададим величину доли р, например 1 или 5%. Верхний (нижний) /жваитиль — это такое число хр из множества X, что доля объектов с большими (меньшими), чем хр значениями признака, составляет р. Р-квантиль для вектора х в МатЛабе вычисляется так: сначала необходимо отсортировать х в убывающем порядке командой sx=sort(x, ‘descent’), а после этого квантиль вычисляется как sx(k), где k=ceil(p*length(x)).

Размах между 2/?-квантилями определяется как интервал между значениями р-квантилей, «растянутый» в соответствии с долей наблюдений, не попавших в него, {хр - рх) /(1 - 2р), где xpwpx это верхний и нижний р-кваитили соответственно. Например, при р = 0,05% и N = 100 000, хр отрезает 50 наибольших, а рх 50 наименьших чисел из X.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы