Распределение Пуассона
Что такое распределение Пуассона?
В статистике распределение Пуассона — это распределение вероятностей,. которое используется, чтобы показать, сколько раз событие может произойти в течение определенного периода. Другими словами, это счетное распределение. Распределения Пуассона часто используются для понимания независимых событий, которые происходят с постоянной скоростью в течение заданного интервала времени. Он был назван в честь французского математика Симеона Дени Пуассона.
Распределение Пуассона является дискретной функцией, что означает, что переменная может принимать только определенные значения в (потенциально бесконечном) списке. Иными словами, переменная не может принимать все значения в любом непрерывном диапазоне. Для распределения Пуассона переменная может принимать только целые числа (0, 1, 2, 3 и т. д.), без дробей или десятичных знаков.
Общие сведения о распределениях Пуассона
Распределение Пуассона можно использовать для оценки вероятности того, что что-то произойдет «X» раз. Например, если среднее количество людей, которые покупают чизбургеры в сети быстрого питания в пятницу вечером в одном и том же ресторане, составляет 200 человек, то распределение Пуассона может ответить на такие вопросы, как: «Какова вероятность того, что более 300 человек купят? купить бургеры?" Таким образом, применение распределения Пуассона позволяет менеджерам вводить оптимальные системы планирования, которые не будут работать, скажем, при нормальном распределении.
Одним из самых известных исторических и практических применений распределения Пуассона была оценка ежегодного числа прусских кавалерийских солдат, убитых в результате ударов ногами. Современные примеры включают оценку количества автомобильных аварий в городе заданного размера; в физиологии это распределение часто используется для расчета вероятностных частот различных типов секреции нейротрансмиттеров. Или, если бы в видеомагазине каждую пятницу вечером в среднем было 400 покупателей, какова была бы вероятность того, что 600 покупателей пришли бы в любой конкретный вечер пятницы?
Формула распределения Пуассона
Где:
e — число Эйлера (e = 2,71828...)
x — количество вхождений
Икс! является факториалом x
λ равно ожидаемому значению (EV) x, когда оно также равно его дисперсии
Учитывая данные, которые следуют распределению Пуассона, это выглядит графически как:
В примере, изображенном на графике выше, предположим, что некоторый рабочий процесс имеет частоту ошибок 3%. Если мы дополнительно предположим 100 случайных испытаний, распределение Пуассона описывает вероятность получения определенного количества ошибок за некоторый период времени, например, за один день.
Если среднее значение очень велико, то распределение Пуассона является приблизительно нормальным распределением.
Распределение Пуассона в финансах
Распределение Пуассона также обычно используется для моделирования данных финансового подсчета, где сумма невелика и часто равна нулю. В качестве примера в финансах его можно использовать для моделирования количества сделок, которые типичный инвестор совершит в определенный день, что может быть равно 0 (часто), 1, 2 и т. д.
В качестве другого примера, эту модель можно использовать для прогнозирования количества «шоков» на рынке, которые произойдут в заданный период времени, скажем, за десятилетие.
Особенности
Распределение Пуассона, названное в честь французского математика Симеона Дени Пуассона, можно использовать для оценки того, сколько раз событие может произойти в течение "X" периодов времени.
Распределения Пуассона используются, когда интересующая переменная является дискретной счетной переменной.
Многие экономические и финансовые данные появляются как переменные подсчета, например, сколько раз человек становится безработным в данном году, что позволяет анализировать их с помощью распределения Пуассона.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Когда следует использовать распределение Пуассона?
Распределение Пуассона лучше всего применять для статистического анализа, когда рассматриваемая переменная является переменной счета. Например, сколько раз X встречается на основе одной или нескольких независимых переменных. Например, чтобы оценить, сколько бракованных изделий сойдет с конвейера при различных исходных данных.
Какие предположения делает распределение Пуассона?
Чтобы распределение Пуассона было точным, все события независимы друг от друга, скорость событий во времени постоянна, и события не могут происходить одновременно. При этом среднее значение и дисперсия будут равны друг другу.
Является ли распределение Пуассона дискретным или непрерывным?
Поскольку оно измеряет дискретные значения, распределение Пуассона также является дискретным распределением. Это можно противопоставить нормальному распределению, которое является непрерывным.