Центральная предельная теорема (ЦПТ)
Что такое Центральная предельная теорема (ЦПТ)?
В теории вероятностей центральная предельная теорема (ЦПТ) утверждает, что распределение переменной выборки приближается к нормальному распределению (т. е. «колокольной кривой») по мере увеличения размера выборки, при условии, что все выборки одинаковы по размеру и независимо от того, фактической формы распределения населения.
Иными словами, CLT — это статистическая предпосылка, согласно которой при достаточно большом размере выборки из совокупности с конечным уровнем дисперсии среднее значение всех выборочных переменных из одной и той же совокупности будет приблизительно равно среднему значению всей совокупности. Более того, эти выборки аппроксимируют нормальное распределение,. а их дисперсии примерно равны дисперсии генеральной совокупности по мере увеличения размера выборки в соответствии с законом больших чисел.
Хотя эта концепция была впервые разработана Абрахамом де Муавром в 1733 году, она не была формализована до 1930 года, когда известный венгерский математик Джордж Полиа назвал ее центральной предельной теоремой.
Понимание центральной предельной теоремы (CLT)
Согласно центральной предельной теореме среднее значение выборки данных будет ближе к среднему значению всей рассматриваемой совокупности по мере увеличения размера выборки, независимо от фактического распределения данных. Другими словами, данные точны независимо от того, является ли распределение нормальным или аберрантным.
Как правило, размеры выборки около 30-50 считаются достаточными для выполнения CLT, а это означает, что распределение выборочных средних распределено довольно нормально. Следовательно, чем больше выборок берется, тем больше графические результаты принимают форму нормального распределения. Обратите внимание, однако, что центральная предельная теорема по-прежнему будет аппроксимироваться во многих случаях для гораздо меньших размеров выборки, таких как n = 8 или n = 5.
Центральная предельная теорема часто используется в сочетании с законом больших чисел, который гласит, что среднее значение выборочных средних и стандартных отклонений будет приближаться к среднему значению генеральной совокупности и стандартному отклонению по мере роста размера выборки, что чрезвычайно полезно в точное предсказание характеристик популяций.
Ключевые компоненты центральной предельной теоремы
Центральная предельная теорема состоит из нескольких ключевых характеристик. Эти характеристики в значительной степени связаны с выборками, размерами выборок и совокупностью данных.
Выборка является последовательной. Это означает, что некоторые единицы выборки являются общими с единицами выборки, отобранными в предыдущих случаях.
Выборка случайная. Все выборки должны быть выбраны случайным образом, чтобы они имели одинаковую статистическую вероятность быть отобранными.
Выборки должны быть независимыми. Выборка или результаты одной выборки не должны влиять на будущие выборки или результаты других выборок.
Выборки должны быть ограничены. Часто упоминается, что выборка не должна превышать 10 % от генеральной совокупности, если выборка проводится без замены. Как правило, большие размеры населения требуют использования больших размеров выборки.
** Размер выборки увеличивается. ** Центральная предельная теорема актуальна по мере того, как выбирается больше выборок.
Центральная предельная теорема в финансах
CLT полезен при изучении доходности отдельных акций или более широких индексов, потому что анализ прост из-за относительной простоты получения необходимых финансовых данных. Следовательно, инвесторы всех типов полагаются на CLT для анализа доходности акций, построения портфелей и управления рисками.
Скажем, например, инвестор хочет проанализировать общую доходность фондового индекса, состоящего из 1000 акций. В этом сценарии этот инвестор может просто изучить случайную выборку акций, чтобы получить расчетную доходность общего индекса. Чтобы быть в безопасности, необходимо отобрать по крайней мере 30-50 случайно выбранных акций из различных секторов, чтобы центральная предельная теорема выполнялась. Кроме того, ранее выбранные акции должны быть заменены другими названиями, чтобы устранить предвзятость.
Особенности
Центральная предельная теорема (ЦПТ) утверждает, что распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки, независимо от распределения генеральной совокупности.
Размеры выборки, равные или превышающие 30, часто считаются достаточными для проведения CLT.
Ключевым аспектом CLT является то, что среднее значение выборочных средних и стандартных отклонений будет равно среднему значению генеральной совокупности и стандартному отклонению.
Достаточно большой размер выборки может более точно предсказать характеристики совокупности.
CLT полезен в финансах при анализе большого набора ценных бумаг для оценки распределения портфеля и характеристик доходности, риска и корреляции.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Чем полезна центральная предельная теорема?
Центральная предельная теорема полезна при анализе больших наборов данных, поскольку позволяет предположить, что выборочное распределение среднего значения в большинстве случаев будет нормально распределенным. Это позволяет упростить статистический анализ и выводы. Например, инвесторы могут использовать центральную предельную теорему для агрегирования данных об эффективности отдельных ценных бумаг и создания распределения выборочных средних, которые представляют большее распределение населения для доходов от ценных бумаг за определенный период времени.
Что такое формула центральной предельной теоремы?
Центральная предельная теорема не имеет собственной формулы, но опирается на выборочное среднее и стандартное отклонение. По мере того, как средние значения выборки собираются из генеральной совокупности, стандартное отклонение используется для распределения данных по кривой распределения вероятностей.
Почему центральная предельная теорема минимизирует размер выборки до 30?
Размер выборки 30 довольно распространен в статистике. Размер выборки в 30 часто увеличивает доверительный интервал вашего набора данных о населении настолько, чтобы оправдать утверждения против ваших выводов. Чем больше размер вашей выборки, тем больше вероятность того, что она будет репрезентативной для вашего набора населения.