Что такое среднее значение и почему оно не всегда верно

Когда мы имеем дело со статистическими данными, их нужно как-то структурировать. Сами по себе демографические и экономические показатели, такие как заработная плата и ожидаемая продолжительность жизни, оценки, баллы и многое другое, представляют собой просто набор цифр.

Чтобы привести их в порядок, можно использовать среднее арифметическое. Для этого складываем все числа и делим на количество слагаемых:

(8+7+10+4+6+9)/6=7,3

И хотя среднее арифметическое легко вычислить, у него есть серьезный недостаток: если один показатель сильно отличается от других, то это серьезно искажает конечный результат. Ситуацию хорошо описывает анекдот: "Офицеры едят мясо, а я капусту. В среднем мы едим голубцы".

Среднее арифметическое может быть значительно больше или меньше большинства чисел. Так, в ряду «1, 2, 1, 1, 3, 8, 10, 1, 587» оно будет равно 68,2. А если в общий расчет попасть девять человек со сбережениями в 100 тысяч рублей и один банкрот с полумиллионным долгом, то средняя сумма сбережений составит 40 тысяч.

Проще говоря, среднее арифметическое может не отражать реальность.

Что такое медиана и почему она лучше

Чтобы избежать таких ошибок, вместо среднего можно использовать медиану.

Медиана поможет найти именно тот показатель, который наиболее близок к истинному среднему. На него не влияют цифры, выделяющиеся из общей массы, поэтому он считается одним из самых надежных и стабильных индикаторов. Так, для упомянутого выше ряда «1, 2, 1, 1, 3, 8, 10, 1, 587» медиана будет равна 2. Если вместо 587 поставить 87, то она все равно будет равна 2, если 7 тоже 2. Среднее арифметическое в подобных случаях изменится: 12,7 и 3,8 соответственно.

С помощью медианы можно получить более точные данные и более правильно интерпретировать статистику. Например, при расчете средней зарплаты, когда 19 сотрудников получают по 20 тысяч рублей, а директор - миллион. Среднее арифметическое в этом случае будет равно 69 тысячам рублей, а медиана — 20. Поэтому последней отдают предпочтение люди, работающие с числами: от бухгалтеров до ученых.

Медианное значение рассчитывается из числа или пары чисел, которые больше одной половины показателей и меньше другой. Чтобы найти медиану, нужно заказать набор чисел и просто найти в нем середину. Вот так: "1, 1, 1, 1, 2, 3, 8, 10, 587".

Если в серии четное количество индикаторов, например, "1, 1, 1, 1, 2, 3, 8, 10", необходимо взять два средних числа. Это 1 и 2. Их нужно сложить, а сумму разделить пополам:

(1+2)/2=1,5

Как рассчитать медиану при большом количестве данных

В этом случае можно использовать специальные средства.

Онлайн

Например, на сайте Calculator Soup. Достаточно скопировать данные в нужное окно и нажать на кнопку «Рассчитать». Помимо медианы, калькулятор сразу рассчитает кучу других вещей: среднее арифметическое, минимальное и максимальное значение, количество показателей, общую сумму и так далее.

Excel

В редакторе таблиц есть функция "Медиана". Достаточно найти его в специальном окне и выбрать массив данных для расчета индикатора. То же самое можно сделать в Google Docs.

Есть ли альтернативы медиане

Иногда может потребоваться найти не максимальный средний показатель, а самый частый. Например, когда нужно узнать самый популярный размер в магазине одежды. В этом случае нужно использовать моды. Это значение встречается чаще всего. Так, в ряду «1, 2, 1, 1, 3, 8, 10, 1, 87» мода равна 1. Мода может быть сразу несколькими числами. Как и медиану, его можно рассчитать с помощью онлайн-калькулятора и Excel.

В дополнение к медиане могут использоваться процентили, квантили и квартили. Они нужны для более сложных расчетов. Например, подсчитать, какой процент населения страны зарабатывает 50 тысяч рублей и меньше. Показатели делят данные на равные части: процентили - на 100, квантили - на 10, квартили - на четыре. Итак, медиана — это 50-й процентиль или второй квартиль.