квинтили
Что такое квинтили?
Квинтиль — это статистическое значение набора данных, которое представляет 20 % данного населения, поэтому первый квинтиль представляет самую низкую пятую часть данных (от 1 % до 20 %); второй квинтиль представляет вторую пятую часть (от 21% до 40%) и так далее.
Квинтили используются для создания пороговых значений для данной совокупности; социально-экономическое исследование, спонсируемое государством, может использовать квинтили для определения максимального богатства, которым может обладать семья, чтобы принадлежать к низшему квинтилю общества. Эта точка отсечения затем может быть использована в качестве предварительного условия для получения семьей специальной государственной субсидии,. направленной на помощь менее удачливым слоям общества.
Понимание квинтилей
Квинтиль — это тип квантиля, который определяется как равные по размеру сегменты населения. Медиана, одна из наиболее распространенных метрик в статистическом анализе, на самом деле является просто результатом деления совокупности на два квантиля. Квинтиль — это одно из пяти значений, которые делят диапазон данных на пять равных частей, каждая из которых составляет 1/5 (20 процентов) диапазона. Совокупность, разделенная на три равные части, делится на тертили, а одна, разделенная на четверти, делится на квартили. Чем больше набор данных, тем проще его разделить на большие квантили. Экономисты часто используют квинтили для анализа очень больших наборов данных, таких как население Соединенных Штатов.
Например, если бы мы посмотрели на все цены закрытия для определенной акции за каждый день в прошлом году, верхние 20% этих цен представляли бы верхний квинтиль данных. Нижние 20% этих цен будут представлять нижний квинтиль данных. Между верхним и нижним квинтилями будет три квинтиля. В то время как среднее значение всех цен на акции обычно находится между вторым и четвертым квинтилями, что является средней точкой данных, выбросы как в верхней, так и в нижней части данных могут увеличивать или уменьшать среднее значение. В результате стоит учитывать распределение точек данных и учитывать любые существенные выбросы при попытке понять данные и средние значения.
Обычное использование квинтилей
Политики используют квинтили, чтобы проиллюстрировать необходимость изменений в политике. Например, политик, выступающий за экономическую справедливость, может разделить население на квинтили, чтобы проиллюстрировать, как 20% самых богатых людей контролируют то, что, по его мнению, является несправедливо большой долей богатства. На другом конце спектра политик, призывающий положить конец прогрессивному налогообложению, может использовать квинтили, чтобы аргументировать, что 20% самых богатых несут слишком большую долю налогового бремени.
В спорной книге 1994 года о коэффициенте интеллекта (IQ) The Bell Curve авторы используют квинтили по всему тексту, чтобы проиллюстрировать свое исследование, показывая, что IQ сильно коррелирует с положительными результатами в жизни.
Альтернативы Quintiles
Для определенных групп населения использование других методов для изучения распределения данных имеет больше смысла, чем использование квинтилей. Для небольших наборов данных использование квартилей или тертилей помогает предотвратить слишком разброс данных. Сравнение среднего или среднего значения набора данных с его медианой или точкой отсечки, в которой данные разделены на два квантиля, показывает, равномерно ли распределены данные или они смещены вверх или вниз. Среднее значение, которое значительно выше медианы, указывает на то, что данные перегружены, в то время как более низкое среднее значение говорит об обратном.
Особенности
Они обычно используются для больших наборов данных и часто используются политиками и экономистами для обсуждения концепций экономической и социальной справедливости.
В зависимости от численности населения альтернативы квинтилям включают квартиль и тертиль.
Квинтиль репрезентативен для 20% данного населения. Таким образом, первый квинтиль представляет самую низкую пятую часть данных, а последний квинтиль представляет собой последнюю или последнюю пятую часть данных.