Distribution de probabilité
Qu'est-ce qu'une distribution de probabilité ?
Une distribution de probabilité est une fonction statistique qui décrit toutes les valeurs et probabilités possibles qu'une variable aléatoire peut prendre dans une plage donnée. Cette plage sera délimitée entre les valeurs minimales et maximales possibles, mais l'endroit précis où la valeur possible est susceptible d'être tracée sur la distribution de probabilité dépend d'un certain nombre de facteurs. Ces facteurs incluent la moyenne de la distribution (moyenne), l'écart type,. l' asymétrie et l' aplatissement.
Comment fonctionnent les distributions de probabilité
La distribution de probabilité la plus courante est peut-être la distribution normale, ou «courbe en cloche », bien qu'il existe plusieurs distributions couramment utilisées. En règle générale, le processus de génération de données d'un phénomène dictera sa distribution de probabilité. Ce processus est appelé la fonction de densité de probabilité.
Les distributions de probabilité peuvent également être utilisées pour créer des fonctions de distribution cumulatives (CDF), qui additionnent la probabilité d'occurrences de manière cumulative et commencent toujours à zéro et se terminent à 100 %.
Les universitaires, les analystes financiers et les gestionnaires de fonds peuvent déterminer la distribution de probabilité d'une action particulière pour évaluer les rendements attendus possibles que l'action pourrait générer à l'avenir. L'historique des rendements de l'action, qui peut être mesuré à partir de n'importe quel intervalle de temps, ne sera probablement composé que d'une fraction des rendements de l'action, ce qui soumettra l'analyse à une erreur d'échantillonnage. En augmentant la taille de l'échantillon, cette erreur peut être considérablement réduite.
Types de distributions de probabilité
Il existe de nombreuses classifications différentes des distributions de probabilité. Certains d'entre eux incluent la distribution normale, la distribution du chi carré,. la distribution binomiale et la distribution de Poisson. Les différentes distributions de probabilité ont des objectifs différents et représentent différents processus de génération de données. La distribution binomiale, par exemple, évalue la probabilité qu'un événement se produise plusieurs fois sur un nombre d'essais donné et compte tenu de la probabilité de l'événement dans chaque essai. et peut être généré en gardant une trace du nombre de lancers francs qu'un joueur de basket-ball effectue dans un match, où 1 = un panier et 0 = un raté. Un autre exemple typique serait d'utiliser une pièce équitable et de déterminer la probabilité que cette pièce tombe face en 10 lancers consécutifs. Une distribution binomiale est discrète, par opposition à continue, puisque seul 1 ou 0 est une réponse valide.
La distribution la plus couramment utilisée est la distribution normale, qui est fréquemment utilisée dans la finance, l'investissement, la science et l'ingénierie. La distribution normale est entièrement caractérisée par sa moyenne et son écart type, ce qui signifie que la distribution n'est pas asymétrique et présente un aplatissement. Cela rend la distribution symétrique et elle est représentée comme une courbe en forme de cloche lorsqu'elle est tracée. Une distribution normale est définie par une moyenne (moyenne) de zéro et un écart type de 1,0, avec un biais de zéro et un kurtosis = 3. Dans une distribution normale, environ 68 % des données collectées seront comprises dans +/- une norme écart de la moyenne ; environ 95 % à +/- deux écarts-types ; et 99,7 % dans les trois écarts-types. Contrairement à la distribution binomiale, la distribution normale est continue, ce qui signifie que toutes les valeurs possibles sont représentées (par opposition à seulement 0 et 1 sans rien entre les deux).
Distributions de probabilité utilisées dans l'investissement
Les rendements des actions sont souvent supposés être distribués normalement, mais en réalité, ils présentent un aplatissement avec d'importants rendements négatifs et positifs semblant se produire plus que ce qui serait prédit par une distribution normale. En fait, comme les cours des actions sont limités par zéro mais offrent un potentiel de hausse illimité, la distribution des rendements des actions a été décrite comme log-normale. Cela apparaît sur un graphique des rendements boursiers avec les queues de la distribution ayant une plus grande épaisseur.
Les distributions de probabilité sont également souvent utilisées dans la gestion des risques pour évaluer la probabilité et le montant des pertes qu'un portefeuille d'investissement subirait sur la base d'une distribution des rendements historiques. La valeur à risque (VaR) est une mesure de gestion des risques populaire utilisée dans les investissements. La VaR donne la perte minimale qui peut survenir compte tenu d'une probabilité et d'un délai pour un portefeuille. Alternativement, un investisseur peut obtenir une probabilité de perte pour un montant de perte et une période en utilisant la VaR. L'utilisation abusive et la dépendance excessive à l'égard de la VaR ont été considérées comme l'une des principales causes de la crise financière de 2008.
Exemple d'une distribution de probabilité
Comme exemple simple d'une distribution de probabilité, regardons le nombre observé lors du lancement de deux dés standard à six faces. Chaque dé a une probabilité de 1/6 de lancer n'importe quel nombre, de un à six, mais la somme de deux dés formera la distribution de probabilité illustrée dans l'image ci-dessous. Sept est le résultat le plus courant (1+6, 6+1, 5+2, 2+5, 3+4, 4+3). Deux et douze, en revanche, sont beaucoup moins probables (1+1 et 6+6).
Points forts
Les investisseurs utilisent des distributions de probabilité pour anticiper les rendements d'actifs tels que les actions au fil du temps et pour couvrir leur risque.
Les distributions de probabilité se présentent sous de nombreuses formes avec différentes caractéristiques, telles que définies par la moyenne, l'écart type, l'asymétrie et l'aplatissement.
Une distribution de probabilité décrit les résultats attendus des valeurs possibles pour un processus de génération de données donné.