Главная · Бытовая техника · Для чего нужен коэффициент вариации. Определение показателей вариации

Для чего нужен коэффициент вариации. Определение показателей вариации

Вариация - это принятие единицами совокупности или группами различных, отичающихся друг от друга, значений знака. Вариация является результатом воздействия на единицу совокупности множества факторов. Синонимами терминация являются понятия изменение (изменчивость, вариативность’).

Вариация - одна из важнейших категорий статистической науки. Явления, подверженньие вариации, лежат в области исследования статистической науки, в то время как явления неизменные, статистические, постоянные в статистике не рассматриваются.

Практически все явления, имеющие естественный характер происхождения, подвержены изменчивости (например, химические процессы, изменчивость наследственных признаков у каждого человека и др.). Явления, а также ряд естественных законов могут иметь неизменный характер (например, минимальный размер заработной платы)

Необходимо подчеркнуть значение исследования вариации в статистической науке:

1 . Выявление измеычввости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов, в свою очередь подверженньих изменчивости, или, другими словами, - оценить степень устойчивоти явленияк внешним воздействиям.

2. Вариация предполагает оценку однородности изучаемого явления, т. е. меру типичности, рассчитанной для этого явления средней величины.

Вариационным рядом называется последовательность различных вариант, записанных в возрастающем порядке вместе с соответствующими частотами.

В зависимости от типа признака различают дискретньие и интервальные вариационньие ряды. В зависимости от объема исходных данных и области допустимых значений одномерного количествснного признака, частотные распределения также подразделяются на дискретньие и интервальные. Если различных очень много (более 10-15), то эти варианты группируют вьибирая определенное число интервалов группировки и таким образом интервальное частотное распределение.

Первым шагом при построении интервального вариационого ряда является выбор определенного принципа, который дается в основу построения интервального ряда. Выбор этого принципа зависит от степени однородности рассматриваемой совокуности. Если совокупность однородна, то при построении ряда используют принцип равных интервалов. При этом вопрос однородности решается содержательным анализом изучаемых явлений.

Изменчивость явления в статистическом анализе отображается с помощью целого ряда характеристик, называемых системой показателей вариации . В нее входят:

абсолютные показатели вариации :

1) размах вариации;

2) средние величины (групповые и общие):

- степенные средние величины;

- структурные средние величины;


3) среднее линейное отклонение;

4) дисперсии (групповая, межгрулповая и общая) и среднее квадратическое отклонение;

относительные показатели вариации:

1) коэффициент осцилляции;

2) коэффициенты вариации (в том числе линейный);

3) коэффициенты детерминации (эмпирические и теоретические).

Размах вариации отражает пределы изменчивости признака или, другими словами, амплитуду вариации. Размах вариации рассчитывается как разность между максимальной величиной при знака (х) и минимальной величиной признака (х), т.е. по фор муле:

х - наибольшее значение признака;

х. - наименьшее значение признака.

Дисперсия - средний квадрат отклонений индивидуальньх значений признака от их средней величины:

Для вариационного ряда дисаерсия вычисляется по следующей формуле: (см. таблицу 2.)

Часто для исследования удобно представлять меру рассеяния в тех же единицах измерения, что и варианты. Тогда вместо дисперсии используют среднее квадратическое отклонение , которое является квадратным корнем из дисперсии, т.е. среднее квадратичное отклонение вычисляется по формуле: (см. таблицу 2)

Рассмотренные выше меры рассеявия (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными величинами, судить по ним о степени колеблимости признака не всегда возможно, в некоторых задачах необходимо использовать относительные показатели рассеяния. Таким показателем является коэффициент вариации (V), который представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах:

Коэффициент вариации позволяет:

Сравнивать вариацию одного и того же признака у разных групп объектов;

Выявить степень различия одного и того же признака одной и той же группы объектов в разное время;

Сопоставить вариацию разных признаков у одних и тех групп объектов.

Если значение коэффициента вариации не превышает 33 то изучаемая совокупность считается однородной .

Рассмотрим на примере методику расчёта среднего квадратического отклонения и дисперсии признака.

ПРИМЕР 5 . В результате выборочной проверки расфасовки чая получены следующие данные:

Масса пачки чая, г. Число пачек чая, шт.

52 и выше 3

Исчислить среднюю массу пачки чая,среднее квадратическое отклонение,дисперсию признака.

Для расчёта используем формулы из таблицы 2.

Все расчёты желательно оформить в виде таблицы. Для определения середины интервала

В каждой группе,т.е. среднего значения,необходимо от интервального перейти к дискретному ряду. Величина интервала равна 1 (например,50 – 49 =1).Значит среднее значение для первой группы составит ((48 +49) /2 = 48,5 ;для второй и третьей групп соответственно 49,5 и 50,5 и т. д.

Масса Число Середина Х*f Х – Х (Х – Х) (Х – Х) * f

В этом же документе приводятся правила определения коэффициента вариации. Разработано несколько методик выявления НМЦК: нормативная, тарифная, проектно-сметная, затратная. Самым приоритетным считается метод сопоставимых рыночных цен. Именно его рекомендуется использовать при определении стартовой цены. Он предполагает сравнение коммерческих предложений, предоставляемых потенциальными поставщиками по запросу заказчика. Для проведения такого анализа и применяется коэффициент вариации. Он выражается в процентах. Под коэффициентом вариации понимается мера относительного разброса предлагаемых цен. Он показывает, какую долю занимает средний разброс цен от среднего значения цены. Этот показатель может принимать следующие значения:

  1. Меньше 10%. В таком случае разница в ценах признается незначительной.
  2. От 10% до 20%. Разброс считается средним.
  3. От 20% до 33%.

Коэффициент вариации

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке. Показатель асимметрии Показатель асимметрии (A) и его ошибка (ma) рассчитывается по следующим формулам: , где А — показатель асимметрии, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге.


Показатель эксцесса Показатель эксцесса (E) и его ошибка (me) рассчитывается по следующим формулам: , где Е — показатель эксцесса, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Если А < 0, то больше данных с меньшими значениями, чем среднеарифметическое.
Если Е < 0, то данные сконцентрированы около среднеарифметического значения.

Инфо

X – отдельные значения, X̅– среднее арифметическое по выборке. Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.


Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. В то же время не все так плохо.
При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.
Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности.

Что характеризует коэффициент вариации

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой: , где 2 — дисперсия,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Среднеквадратическое отклонение Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического.
В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле: , где — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Коэффициент вариации Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического: , где V — коэффициент вариации, — среднеквадратическое отклонение,a — среднее арифметическое.

Вариация (статистика)

Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением. На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N).

В виде формулы это рассчитывается понятнее: Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример: Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии.

Коэффициент вариации в статистике: примеры расчета

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя.

Внимание

Разгадка заключается всего в трех словах. Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа.


У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Статистические параметры

Было получено четыре коммерческих предложения цен: 2500 рублей, 2800 рублей, 2450 рублей и 2600 рублей. В первую очередь необходимо рассчитать среднеарифметическое значение цены Следующим шагом становится расчет среднеквадратичного отклонения Осталось только рассчитать коэффициент вариации Полученное значение коэффициента меньше 33%, следовательно, все собранные данные подходят для расчета стартовой цены контракта. Расчет НМЦК и коэффициента вариации оформляются в форме отчета, который становится обязательной частью закупочной документации. Коэффициент вариации – важный инструмент, позволяющий оценить правильность ценовых предложений, полученных от поставщиков. Поэтому при составлении документации заказчикам необходимо учитывать правила расчета этого показателя и особенности его применения.

Для чего нужен коэффициент вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой. Оглавление:

  • Показатели описательной статистики
  • Среднее арифметическое
  • Стандартное отклонение
  • Коэффициент вариации
  • Расчёты в Microsoft Ecxel 2016

Одним из основных статистических показателей последовательности чисел является коэффициент вариации. Для его нахождения производятся довольно сложные расчеты. Инструменты Microsoft Excel позволяют значительно облегчить их для пользователя.

Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.

В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.

Шаг 1: расчет стандартного отклонения

Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из . Для расчета стандартного отклонения используется функция СТАНДОТКЛОН . Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В .

Синтаксис данных функций выглядит соответствующим образом:

СТАНДОТКЛОН(Число1;Число2;…)
= СТАНДОТКЛОН.Г(Число1;Число2;…)
= СТАНДОТКЛОН.В(Число1;Число2;…)


Шаг 2: расчет среднего арифметического

Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция – СРЗНАЧ . Вычислим её значение на конкретном примере.


Шаг 3: нахождение коэффициента вариации

Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.


Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.


Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.

Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

ПРАКТИЧЕСКАЯ РАБОТА 3

Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы :

1. Определить вид и форму (простая или взвешенная) показателей вариации.

3. Сформулировать выводы.

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где – наибольшее значение варьирующего признака;

– наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили 1 и 3 определяются по формулам:

,

Где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

где Ме – медиана ряда;

,

условные обозначения те же, что и для величин .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.



Невзвешенное среднее линейное отклонение,

- взвешенное среднее линейное отклонение.

Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

- невзвешенная,

- взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции (относительный размах вариации) рассчитывается по формуле:

,

Линейный коэффициент вариации (относительное линейное отклонение):

Относительный показатель квартильной вариации :

или

Коэффициент вариации :

,

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .



Рис. 1. Распределение:

1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где - центральный момент третьего порядка:

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

.

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

,

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где - центральный момент четвертого момента;

- для несгруппированных данных;

- для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .



Рис. 2. Распределение:

1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

,

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

В статистике под вариацией величин того или иного показателя в совокупности понимается различие его уровней у тех или иных единиц анализируемого состава в один и тот же период либо момент исследования. В том случае, когда выполняется анализ отличий величин показателя у одного и того же предмета, у одной и той же единицы совокупности в различные периоды или моменты времени, то это будет уже именоваться не вариацией, а колебаниями или изменениями в течении определенного периода.

Размещено на www.сайт

Для изучения таких колебаний применяются свои методы анализа, имеющие отличия от методов анализа вариации. Объективным фактором возникновения явления вариации выступает различие в условиях деятельности тех или иных исследуемых объектов совокупности. Например, на работу торгового предприятия оказывает влияние уровень конкуренции, налогов, применение передовых технологий в своей деятельности, состояние оборудования и т.п. Колеблемость характерна практически для всех природный явлений и граней общественной жизни. Однако имеются и неварьируемые показатели, которые образуются в случае фиксации тех или иных явлений в правовых актах. Например, не может варьировать количество генеральных директоров у предприятия, согласно законодательству он должен быть один. Такие неварьирующие объекты, как правило, не являются предметом или объектом статистического исследования. В нашей жизни колеблемость признаков выступает важным фактором, оказывающим на нее влияние. Например, изменение гаммы типоразмеров деталей позволяет сформировать оптимальный ассортимент, но при этом высокий уровень вариации в рамках одного типоразмера говорит о высоком уровне брака и необходимости внедрения соответствующих мероприятий. Значительный уровень вариации товарооборота или цен может свидетельствовать о монополизации рынка или о плохом управлении запасами и требовать соответствующих мер и т.п. Сказанное позволяет утверждать, что в общественной жизни, которая с точки зрения статистики выступает массовой совокупностью, объективно присутствует изменчивость различных признаков и элементов, что диктует актуальность исследования данного явления с применением специальных показателей для формирования оптимальных методов управления им. Коэффициент вариации является одним из таких показателей. При этом он относится к группе относительных показателей вариации. Рассматриваемый коэффициент - это относительный показатель, характеризующий отношение среднего квадратического отклонения к средней величине изучаемого признака, и выражается, как правило, в процентах. В указанном критерии отражается соотношение уровня влияния факторов, которые приводят к возникновению колеблемости, и общих условий всех элементов совокупности, которые порождают типическую величину признака - его среднее значение. Коэффициент вариации применяется для изучения степени изменчивости различных признаков одной и той же совокупности и изменчивости в различных совокупностях, которые обладают разными значениями средних величин.