Половина россиян получает зарплату меньше 34,3 тыс. рублей

Лабораторная работа 2.

описательная статистика и графики

Описательные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода и т.д. Идея этих статистик очень проста: вместо того чтобы рассматривать все значения переменной, а их может быть очень много (тысячи и миллионы), вначале стоит просмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная.

В программе STATISTICA (Statistics — Basic Statistics/Tables — Descriptive Statistics) можно посчитать:

· Количество значений (Valid N)

· Сумма всех значений (Sum)

· Минимум и максимум (Minimum & Maximum) — это минимальное и максимальное значения переменной.

· Среднее (Mean) — сумма значений переменной, деленная на N (число значений переменной).

· Дисперсия (Variance) и стандартное отклонение (Standard deviation) — наиболее часто используемые меры изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны. Стандартное отклонение вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего. Часто стандартное отклонение — более удобная характеристика, т. к измерена в тех же единицах, что исходная величина.

· Медиана (Median) разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например, при описании доходов населения, медиана более удобна, чем среднее.

· Мода (Mode) представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д. Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды — выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-либо, то мультимодальность может означать, что существует несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями.

· Доверительный интервал (95% confidence limits of mean) для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия находится «истинное» (неизвестное) среднее генеральной совокупности. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

· Стандартная ошибка среднего значения (Standard error of mean) – это стандартное отклонение, деленное на квадратный корень из объема выборки. В интервале шириной, равной удвоенной стандартной ошибке, отложенному вокруг среднего значения, располагается среднее значение генеральной совокупности с вероятностью примерно 67%. Стандартная ошибка, как и стандартное отклонение, может использоваться в качестве меры разброса переменной. По так называемому правилу кулака, в одном диапазоне стандартного отклонения (охватывающем ширину стандартного отклонения в обе стороны от среднего значения) располагается примерно 67% значений, в диапазоне удвоенного стандартного отклонения – примерно 95%, а в диапазоне утроенного стандартного отклонения – примерно 99% значений. С другой стороны, стандартная ошибка позволяет задать доверительный интервал для среднего значения. В диапазоне удвоенной стандартной ошибки по обе стороны от среднего значения с вероятностью примерно 95% находится среднее значение генеральной совокупности. С вероятностью примерно 99% оно лежит в диапазоне утроенной стандартной ошибки. Часто указывают только одну из мер разброса, обычно – стандартную ошибку, так как ее значение меньше. Но у нас на факультете почти всегда используется стандартное отклонение.

· Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам. Таким образом, медиана и квартили делят диапазон значений переменной на четыре равные части. Различают верхний квартиль, который больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижний квартиль, который меньше медианы и делит пополам нижнюю часть выборки (Lower and Upper quartiles). Нижний квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижнего квартиля. Верхний квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхнего квартиля.

· Размах (Range) – разница между наибольшим и наименьшим значением переменной

· Квартильный (внутриквартильный) размах (Quartile Range) – равен разности значений верхнего и нижнего квартиля. Таким образом, это интервал, содержащий медиану, в который попадает 50% наблюдений.

· Асимметрия (Skewness), или коэффициент асимметрии, является мерой несимметричности распределения. Если этот коэффициент значительно отличается от 0, распределение является асимметричным, т.е. несимметричным. Формально имеем:

А =

,

где

— среднее, s — стандартное отклонение (сигма), n — число наблюдений.

· Эксцесс (Kurtosis), или коэффициент эксцесса измеряет остроту пика распределения. Оценка эксцесса вычисляется по формуле:

E=

Коэффициент эксцесса равен нулю, если наблюдения подчиняются нормальному распределению. Если он значительно отличается от нулю, гипотезу о том, что данные взяты из нормального распределенной генеральной совокупности, следует отвергнуть.

· Стандартные ошибки асимметрии и эксцесса (Standard error of skewness, Standard error of kurtosis) – это и есть стандартные ошибки асимметрии и эксцесса, аналогичные стандартной ошибке среднего.

Задание 2: данные о стаже и зарплате

1. Загрузите файл данных.

1.1. Скопируйте файл Empl_Data.sta в свою рабочую папку.

1.2. Загрузите файл Empl_Data.sta: File — Open Data -…

В файле приведены следующие данные

ID – номер испытуемого;

Gender – пол испытуемого;

Educ – образование испытуемого (количество лет, которые бедняга потратил на учебу);

JCAT – вид профессиональной деятельности (job category: 1 — клерк, 2 — охранник, 3 — менеджер);

Salary – зарплата в настоящий момент (тыс. долларов в год);

SAL_BEG – начальная зарплата на этой работе (тыс. долларов в год);

JTIME – трудовой стаж на данном рабочем месте (число месяцев);

PREVEX – предыдущий опыт – стаж до поступления на данную работу (число месяцев);

MINORITY – принадлежит ли испытуемый к национальному меньшинству (0 – нет, 1 – да).

2. Посчитайте всю ту описательную статистику, которую можно считать, для всех переменных.

2.1. Загружаем модуль описательной статистики:

Statistics — Basic Statistics/Tables — Descriptive Statistics — OK

и выбираем переменные — Variables (кнопка слева вверху) -….

2.2. В разделе Advanced выбираем те статистики, которые нам нужны. Если надо посчитать все, можно нажать на кнопку Select all stats. В том же разделе можно выбрать доверительный интервал (Conf. limits for means, Interval), если не устраивает 95%, заданный по умолчанию.

2.3. Чтобы посчитать описательную статистику можно нажать кнопку Summary или кнопку Summary: Descriptive Statistics. Получится таблица для всех переменных со всеми статистиками.

3. Теперь посчитайте описательную статистику отдельно для группы мужчин и для группы женщин.

Для этого есть кнопочка Select cases – выбрать строки (справа посередине). Нажмите ее. Задайте условие Enable selection condition (включить условия выбора), а затем Include cases — Specific, selected by. В окне By expression введите условия выбора, например, GENDER=’м’. Обратите внимание на одиночные кавычки, в которые следует заключать строковые значения!

Должно получиться что-то вроде этого:

Посчитайте описательную статистику для мужчин. Затем поменяйте условия выбора и посчитайте описательную статистику для женщин. Ответьте на вопросы:

Что такое медианная зарплата

Для раскрытия термина «медианная зарплата» следует сначала уточнить понятие «средняя зарплата». На сайте Росстата www.gks.ru дано следующее определение: это средняя заработная плата одного работника / за единицу рабочего времени, рассчитываемая посредством деления фонда оплаты труда (ФОТ) на среднесписочную численность работников (ССЧР) / на количество фактически отработанных человеко-часов за определенные периоды, к примеру час, рабочий день, месяц, квартал, год и т. д.

ФОТ включает оплату труда всех штатных и внештатных сотрудников в денежной и неденежной формах, компенсации, доплаты, надбавки, премии, систематическую оплату питания и проживания и т. п.

Формула расчета средней зарплаты:

Средняя зарплата = ФОТ / ССЧР.

На этом же сайте дано определение понятия «медианная заработная плата». Ее величина разделяет совокупность размеров зарплат пополам: одна половина работников получает зарплату выше этого значения, другая половина — ниже. Там же дана формула расчета медианы, но для понимания этого термина формула не требуется.

Важно понять, что для нахождения величины медианной зарплаты на предприятии, в регионе, в стране нужно выстроить зарплатную платежную ведомость за месяц в порядке возрастания начисленной оплаты труда и найти в этой ведомости средний номер по порядку — он и будет показывать значение медианной заработной платы.

Примеры расчета медианной зарплаты

Давайте рассмотрим на примерах расчет медианной заработной платы.

Пример 1

В компании 5 работников. Их зарплаты в тыс. руб.: 18, 35, 60, 82, 180.

Проведенные расчеты для наглядности представлены в таблице.

Таблица 1

№ п/п

Должность

Размер зарплаты, тыс. руб.

Уборщица

Секретарь

Менеджер

Бухгалтер

Директор

ФОТ

Средняя зарплата

Медианная зарплата

%, медиана/средняя зарплата

80,00

Как видно, только два человека получают зарплату выше средней. Оплата труда трех сотрудников (60% от ССЧР!) значительно ниже.

Более полную информацию по теме вы можете найти в КонсультантПлюс.
Полный и бесплатный доступ к системе на 2 дня.

Медианная зарплата равна значению посередине ведомости — под номером 3. Два сотрудника выше в ведомости получают зарплату меньше, два сотрудника ниже имеют зарплату выше этого значения.

Соотношение медианной и средней зарплат в данной компании 80% (60 / 75 × 100%).

Пример 2

В фирме 8 работников. Их зарплаты в тыс. руб.: 18, 35, 60, 60, 82, 120, 150, 435.

Расчеты приведены в таблице 2.

№ п/п

Должность

Размер зарплаты, тыс. руб.

Уборщица

Секретарь

Менеджер

Менеджер

Завскладом

Заместитель директора

Главный бухгалтер

Генеральный директор

ФОТ

Средняя зарплата

Медианная зарплата

%, медиана/средняя зарплата

59,17

Два человека получают зарплату выше средней. Один сотрудник получает именно эту сумму. Оплата труда пятерых сотрудников (63% от ССЧР!) намного ниже.

Подпишитесь на рассылку

Здесь четное число сотрудников, посредине ведомости два номера — 4 и 5. Медианная зарплата в этом случае равна среднему арифметическому значений этих номеров — 71 ((60 + 82) / 2).

Соотношение медианной и средней зарплат на фирме — 59,17% (71 / 120 × 100%).

Расчет медианной зарплаты в России в 2020 году

В обоих предложенных примерах именно медианная зарплата является более справедливым показателем для характеристики средних доходов сотрудников, т. к. она больше приближена к реальности.

Теперь обсудим медианную зарплату в масштабах всей страны.

Медианная зарплата в России официально рассчитывается Росстатом один раз в два года — в апреле нечетных годов. Последние показатели были опубликованы по данным апреля 2019 года по стране, регионам, отраслям и даже по профессиям.

Медианная заработная плата так же растет с каждым годом, как и средняя.

За 2016 год она была равна 26 544 руб. (при средней зарплате 32 667 руб.). Соотношение между ними составляет 81,3%.

По итогам 2017 года медианная зарплата в России составила 28 345 руб. (при средней зарплате в 39 167 руб.). Соотношение равно 72,37%.

По данным 2019 года, медианная зарплата в России составила 34 335 руб., а средняя — 48 030 руб. Соотношение составляет 71,49%. То есть за 2 года разрыв между средней и медианной зарплатой увеличился. Разница между медианной и средней зарплатой показывает степень расслоения граждан по уровню доходов. Чем эта разница больше, тем больше разрыв между заработком самых бедных и самых богатых слоев населения.

Следующий расчет будет произведен и опубликован весной 2021 года.

***

Несмотря на то, что не существует такого дохода, как медианная зарплата, фактически именно ее величина максимально правильно показывает реальное состояние дел с оплатой труда в стране. Размер медианного дохода всегда значительно ниже, чем показатель средней зарплаты. Но именно эта величина показывает, сколько денег наш соотечественник может потратить в действительности.

Еще больше материалов по теме — в рубрике «Зарплата».

About the author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *