Investor's wiki

Описательная статистика

Описательная статистика

Что такое описательная статистика?

Описательная статистика — это краткие описательные коэффициенты, обобщающие заданный набор данных, который может быть либо представлением всей совокупности, либо выборкой совокупности. Описательная статистика подразделяется на меры центральной тенденции и меры изменчивости (разброса). Меры центральной тенденции включают среднее значение, медиану и моду, в то время как меры изменчивости включают стандартное отклонение, дисперсию, минимальные и максимальные переменные, эксцесс и асимметрию.

Понимание описательной статистики

Короче говоря, описательная статистика помогает описать и понять особенности определенного набора данных, давая краткие сводки о выборке и показателях данных. Наиболее признанными типами описательной статистики являются меры центра: среднее,. медиана и мода,. которые используются почти на всех уровнях математики и статистики. Среднее или среднее значение рассчитывается путем сложения всех цифр в наборе данных и последующего деления на количество цифр в наборе.

Например, сумма следующего набора данных равна 20: (2, 3, 4, 5, 6). Среднее значение равно 4 (20/5). Мода набора данных — это наиболее часто встречающееся значение, а медиана — цифра, расположенная в середине набора данных. Это цифра, отделяющая более высокие цифры от более низких цифр в наборе данных. Однако есть менее распространенные типы описательной статистики, которые по-прежнему очень важны.

Люди используют описательную статистику, чтобы преобразовать трудные для понимания количественные выводы из большого набора данных в краткие описания. Средний балл учащегося (GPA), например, обеспечивает хорошее понимание описательной статистики. Идея GPA заключается в том, что он берет точки данных из широкого спектра экзаменов, классов и оценок и усредняет их вместе, чтобы дать общее представление об общей успеваемости учащегося. Личный средний балл учащегося отражает его среднюю академическую успеваемость.

Типы описательной статистики

Все описательные статистики являются либо мерами центральной тенденции, либо мерами изменчивости , также известными как меры дисперсии.

Главная тенденция

Меры центральной тенденции сосредоточены на средних или средних значениях наборов данных, тогда как меры изменчивости сосредоточены на дисперсии данных. Эти два показателя используют графики, таблицы и общие обсуждения, чтобы помочь людям понять значение проанализированных данных.

Меры центральной тенденции описывают положение центра распределения для набора данных. Человек анализирует частоту каждой точки данных в распределении и описывает ее, используя среднее значение, медиану или моду, которые измеряют наиболее распространенные закономерности анализируемого набора данных.

Показатели изменчивости

Меры изменчивости (или меры разброса) помогают анализировать, насколько рассредоточено распределение набора данных. Например, хотя показатели центральной тенденции могут дать человеку среднее значение набора данных, они не описывают, как данные распределяются в наборе.

Таким образом, хотя среднее значение данных может быть 65 из 100, все же могут быть точки данных как 1, так и 100. Меры изменчивости помогают сообщить об этом, описывая форму и разброс набора данных. Диапазон, квартили,. абсолютное отклонение и дисперсия — все это примеры мер изменчивости.

Рассмотрим следующий набор данных: 5, 19, 24, 62, 91, 100. Диапазон этого набора данных равен 95, который рассчитывается путем вычитания наименьшего числа (5) в наборе данных из наибольшего (100).

Особенности

  • Описательная статистика состоит из двух основных категорий показателей: показателей центральной тенденции и показателей изменчивости (или разброса).

  • Описательная статистика обобщает или описывает характеристики набора данных.

  • Меры изменчивости или разброса описывают разброс данных внутри набора.

  • Меры центральной тенденции описывают центр набора данных.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Можно ли использовать описательную статистику для вывода или предсказания?

Нет. Хотя эти описания помогают понять атрибуты данных, статистические методы логического вывода — отдельная ветвь статистики — необходимы для понимания того, как переменные взаимодействуют друг с другом в наборе данных.

Что такое среднее значение и стандартное отклонение?

Это две широко используемые описательные статистики. Среднее значение — это средний уровень, наблюдаемый в некоторой части данных, а стандартное отклонение описывает дисперсию или то, насколько рассеянные данные, наблюдаемые в этой переменной, распределяются вокруг ее среднего значения.

Зачем нам статистика, которая просто описывает данные?

Описательная статистика используется для описания или обобщения характеристик выборки или набора данных, таких как среднее значение переменной, стандартное отклонение или частота. Логическая статистика может помочь нам понять коллективные свойства элементов выборки данных. Знание среднего значения выборки, дисперсии и распределения переменной может помочь нам понять мир вокруг нас.