Главная · Сети · Среднее квадратическое отклонение. Расчет показателей вариации

Среднее квадратическое отклонение. Расчет показателей вариации

Нам приходится сталкиваться с расчётом таких значений, как дисперсия, среднеквадратичное отклонение и, разумеется, коэффициент вариации. Именно расчёту последнего стоит уделить особое внимание. Очень важно, чтобы каждый новичок, который только приступает к работе с табличным редактором, мог быстро подсчитать относительную границу разброса значений.

Что такое коэффициент вариации и для чего он нужен?

Итак, как мне кажется, нелишним будет провести небольшой теоретический экскурс и разобраться в природе коэффициента вариации. Этот показатель необходим для отражения диапазона данных относительно среднего значения. Иными словами, он показывает отношение стандартного отклонения к среднему значению. Коэффициент вариации принято измерять в процентном выражении и отображать с его помощью однородность временного ряда.

Коэффициент вариации станет незаменимым помощником в том случае, когда вам необходимо будет сделать прогноз по данным из заданной выборки. Этот индикатор выделит главные ряды значений, которые будут наиболее полезными для последующего прогнозирования, а также очистит выборку от малозначительных факторов. Так, если вы видите, что значение коэффициента равно 0%, то с уверенностью заявляйте о том, что ряд является однородным, а значит, все значения в нём равны один с другим. В случае, если коэффициент вариации принимает значение, превышающее отметку в 33%, то это говорит о том, что вы имеете дело с неоднородным рядом, в котором отдельные значения существенно отличаются от среднего показателя выборки.

Как найти среднее квадратичное отклонение?

Поскольку для расчёта показателя вариации в Excel нам необходимо использовать среднее квадратичное отклонение, то вполне уместно будет выяснить, как нам посчитать этот параметр.

Из школьного курса алгебры мы знаем, что среднее квадратичное отклонение - это извлечённый из дисперсии квадратный корень, то есть этот показатель определяет степень отклонения конкретного показателя общей выборки от её среднего значения. С его помощью мы можем измерить абсолютную меру колебания изучаемого признака и чётко её интерпретировать.

Рассчитываем коэффициент в Экселе

К сожалению, в Excel не заложена стандартная формула , которая бы позволила рассчитать показатель вариации автоматически. Но это не значит, что вам придётся производить расчёты в уме. Отсутствие шаблона в «Строке формул» никоим образом не умаляет способностей Excel, потому вы вполне сможете заставить программу выполнить необходимый вам расчёт, прописав соответствующую команду вручную.

Для того чтобы рассчитать показатель вариации в Excel, необходимо вспомнить школьный курс математики и разделить стандартное отклонение на среднее значение выборки. То есть на деле формула выглядит следующим образом - СТАНДОТКЛОН(заданный диапазон данных)/СРЗНАЧ(заданный диапазон данных). Ввести эту формулу необходимо в ту ячейку Excel, в которой вы хотите получить нужный вам расчёт.

Не забывайте и о том, что поскольку коэффициент выражается в процентах, то ячейке с формулой нужно будет задать соответствующий формат. Сделать это можно следующим образом:

  1. Откройте вкладку «Главная».
  2. Найдите в ней категорию «Формат ячеек » и выберите необходимый параметр.

Как вариант, можно задать процентный формат ячейке при помощи клика по правой кнопке мыши на активированной клеточке таблицы. В появившемся контекстном меню, аналогично вышеуказанному алгоритму нужно выбрать категорию «Формат ячейки» и задать необходимое значение.

Выберите «Процентный», а при необходимости укажите число десятичных знаков

Возможно, кому-то вышеописанный алгоритм покажется сложным. На самом же деле расчёт коэффициента так же прост, как сложение двух натуральных чисел. Единожды выполнив эту задачу в Экселе, вы больше никогда не вернётесь к утомительным многосложным решениям в тетрадке.

Всё ещё не можете сделать качественное сравнение степени разброса данных? Теряетесь в масштабах выборки? Тогда прямо сейчас принимайтесь за дело и осваивайте на практике весь теоретический материал, который был изложен выше! Пусть статистический анализ и разработка прогноза больше не вызывают у вас страха и негатива. Экономьте свои силы и время вместе с

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

ПРАКТИЧЕСКАЯ РАБОТА 3

Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы :

1. Определить вид и форму (простая или взвешенная) показателей вариации.

3. Сформулировать выводы.

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где – наибольшее значение варьирующего признака;

– наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили 1 и 3 определяются по формулам:

,

Где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

где Ме – медиана ряда;

,

условные обозначения те же, что и для величин .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.



Невзвешенное среднее линейное отклонение,

- взвешенное среднее линейное отклонение.

Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

- невзвешенная,

- взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции (относительный размах вариации) рассчитывается по формуле:

,

Линейный коэффициент вариации (относительное линейное отклонение):

Относительный показатель квартильной вариации :

или

Коэффициент вариации :

,

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .



Рис. 1. Распределение:

1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где - центральный момент третьего порядка:

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

.

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

,

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где - центральный момент четвертого момента;

- для несгруппированных данных;

- для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .



Рис. 2. Распределение:

1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

,

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

Коэффициент вариации:

где - среднее квадратическое отклонение, - средняя арифметическая.

Линейный коэффициент вариации:

где - среднее линейное отклонение.

Коэффициент осцилляции:

где - размах вариации.

Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11

Коэффициент вариации будет равен: , что превышает 33%, следовательно, совокупность неоднородна.

Вычислим линейный коэффициент вариации: . Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%

Найдем коэффициент осцилляции: . Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.

Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).

Вычислим коэффициент вариации по формуле (5.9):

. Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.

Рассчитаем линейный коэффициент вариации по формуле (5.10):

. Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.

Найдем коэффициент осцилляции по формуле (5.11):

. Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.

РАСЧЕТ И ПОСТРОЕНИЕ СТРУКТУРНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА

Немного больше по теме

Политическая экономия Д. Рикардо как идеолога промышленного переворота
В последней трети XVIII в. в Англии начался промышленный переворот (промышленная революция). В течение нескольких десятилетий в легкой промышленности одно изобретение следовало за другим. Весь процесс производства в этой отрасли был переведен на машинную основу. Постепенно переворот распространился на другие отрасли легкой, а затем и тяжелой промышленности. Начался повсеместный пе...

В статистике под вариацией величин того или иного показателя в совокупности понимается различие его уровней у тех или иных единиц анализируемого состава в один и тот же период либо момент исследования. В том случае, когда выполняется анализ отличий величин показателя у одного и того же предмета, у одной и той же единицы совокупности в различные периоды или моменты времени, то это будет уже именоваться не вариацией, а колебаниями или изменениями в течении определенного периода.

Размещено на www.сайт

Для изучения таких колебаний применяются свои методы анализа, имеющие отличия от методов анализа вариации. Объективным фактором возникновения явления вариации выступает различие в условиях деятельности тех или иных исследуемых объектов совокупности. Например, на работу торгового предприятия оказывает влияние уровень конкуренции, налогов, применение передовых технологий в своей деятельности, состояние оборудования и т.п. Колеблемость характерна практически для всех природный явлений и граней общественной жизни. Однако имеются и неварьируемые показатели, которые образуются в случае фиксации тех или иных явлений в правовых актах. Например, не может варьировать количество генеральных директоров у предприятия, согласно законодательству он должен быть один. Такие неварьирующие объекты, как правило, не являются предметом или объектом статистического исследования. В нашей жизни колеблемость признаков выступает важным фактором, оказывающим на нее влияние. Например, изменение гаммы типоразмеров деталей позволяет сформировать оптимальный ассортимент, но при этом высокий уровень вариации в рамках одного типоразмера говорит о высоком уровне брака и необходимости внедрения соответствующих мероприятий. Значительный уровень вариации товарооборота или цен может свидетельствовать о монополизации рынка или о плохом управлении запасами и требовать соответствующих мер и т.п. Сказанное позволяет утверждать, что в общественной жизни, которая с точки зрения статистики выступает массовой совокупностью, объективно присутствует изменчивость различных признаков и элементов, что диктует актуальность исследования данного явления с применением специальных показателей для формирования оптимальных методов управления им. Коэффициент вариации является одним из таких показателей. При этом он относится к группе относительных показателей вариации. Рассматриваемый коэффициент - это относительный показатель, характеризующий отношение среднего квадратического отклонения к средней величине изучаемого признака, и выражается, как правило, в процентах. В указанном критерии отражается соотношение уровня влияния факторов, которые приводят к возникновению колеблемости, и общих условий всех элементов совокупности, которые порождают типическую величину признака - его среднее значение. Коэффициент вариации применяется для изучения степени изменчивости различных признаков одной и той же совокупности и изменчивости в различных совокупностях, которые обладают разными значениями средних величин.

Многие сталкиваются с изменчивостью изучаемого признака у отдельных единиц совокупности, его колебанием относительно некоторого значения, то есть с его вариацией. Вот ее-то и следует обязательно учитывать, чтобы получить наиболее достоверные сведения о ходе выполнения того или иного научного исследования.

Большинство исследователей, производя определение интервала изменения значения того или иного параметра, чаще всего прибегают к абсолютным и Среди последних наибольшее распространение получил коэффициент вариации, который в случае, если исследуемая величина характеризуется нормальным распределением, является критерием однородности совокупности. Данный показатель позволяет определить, какую степень разбросанности будут иметь значения исследуемого параметра, не обращая внимания на масштаб и единицу измерения.

Коэффициент вариации можно вычислить, разделив на среднее арифметическое значение переменной, выраженное в процентах. Результат данного вычисления может попадать в интервал от нуля до бесконечности, возрастая по мере увеличения вариации признака. Если полученное значение менее 33,3% - вариация признака слабая. Если больше - сильная. В последнем случае исследуемая совокупность данных является неоднородной, ее признается нетипичной, а потому не может быть обобщающим показателем. Поэтому для данной совокупности стоит применить другие показатели.

Стоит отметить, что коэффициент вариации не только характеризует однородность некоторой совокупности, но также применяется в качестве сравнительной ее оценки. Например, его применяют, если необходимо колебания того или иного признака в совокупностях, для которых рассчитанная величина среднего значения различна. В этом случае разброс полученных данных не позволяет произвести объективную оценку обретенного значения. Коэффициент вариации характеризует относительную изменчивость переменной, а потому может являться относительной мерой колебания значения изучаемого параметра.

Однако здесь существуют некоторые ограничения. В частности, оценить степень колебания значений параметра можно лишь для конкретного признака и если совокупность имеет определенный состав. При этом равенство данных показателей может свидетельствовать как о сильной, так и о слабой вариации. Это в случае, если признаки различны или исследования проводятся на разных совокупностях. Такой результат формируется под действием весьма объективных причин, и это следует обязательно учитывать во время обработки полученных экспериментальных данных.

Коэффициент вариации находит широкое применение при проведении в различных отраслях науки и техники. В том числе, его активно задействуют при выполнении оценки колебания параметров в экономике и социологии. При этом применение коэффициента делается невозможным в случае, если необходимо дать оценку изменчивости переменных, которые способны менять свой знак на противоположный. Ведь тогда в результате расчетов будут получены некорректные значения данного показателя: либо оно будет очень маленьким, либо будет иметь отрицательный знак. В последнем случае стоит проверить правильности выполненных расчетов.

Таким образом, можно сказать, что коэффициент вариации - это параметр, который позволит вам оценить степень разброса и относительную изменчивость средней величины. Применение данного показателя позволяет выявить наиболее значимые факторы, акцентирование внимания на которых позволит достичь поставленных целей и решить необходимые задачи.