Investor's wiki

Intervalle de confiance

Intervalle de confiance

Qu'est-ce que l'intervalle de confiance ?

Un intervalle de confiance, dans les statistiques, fait référence à la probabilité qu'un paramètre de population tombe entre un ensemble de valeurs pendant une certaine proportion de fois.

Comprendre les intervalles de confiance

Les intervalles de confiance mesurent le degré d'incertitude ou de certitude d'une méthode d'échantillonnage. Ils peuvent prendre n'importe quel nombre de limites de probabilité, la plus courante étant un niveau de confiance de 95 % ou 99 %. Les intervalles de confiance sont déterminés à l'aide de méthodes statistiques, telles qu'un test t.

Les statisticiens utilisent des intervalles de confiance pour mesurer l'incertitude d'une variable échantillon. Par exemple, un chercheur sélectionne différents échantillons au hasard dans la même population et calcule un intervalle de confiance pour chaque échantillon pour voir comment il peut représenter la vraie valeur de la variable de population. Les jeux de données résultants sont tous différents ; certains intervalles incluent le vrai paramètre de population et d'autres pas.

Un intervalle de confiance est une plage de valeurs, délimitée au-dessus et au-dessous de la moyenne de la statistique,. qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l'intervalle de confiance contienne le vrai paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire. Ou, dans la langue vernaculaire, "nous sommes certains à 99 % (niveau de confiance) que la plupart de ces échantillons (intervalles de confiance) contiennent le véritable paramètre de population".

La plus grande idée fausse concernant les intervalles de confiance est qu'ils représentent le pourcentage de données d'un échantillon donné qui se situe entre les limites supérieure et inférieure. Par exemple, on pourrait interpréter à tort l'intervalle de confiance à 99 % susmentionné de 70 à 78 pouces comme indiquant que 99 % des données d'un échantillon aléatoire se situent entre ces chiffres. Ceci est incorrect, bien qu'une méthode distincte d'analyse statistique existe pour faire une telle détermination. Cela implique d'identifier la moyenne et l'écart type de l'échantillon et de tracer ces chiffres sur une courbe en cloche.

L'intervalle de confiance et le niveau de confiance sont interdépendants mais ne sont pas exactement les mêmes.

Calcul de l'intervalle de confiance

Supposons qu'un groupe de chercheurs étudie les hauteurs des joueurs de basket-ball du secondaire. Les chercheurs prennent un échantillon aléatoire de la population et établissent une taille moyenne de 74 pouces.

La moyenne de 74 pouces est une estimation ponctuelle de la moyenne de la population. Une estimation ponctuelle en elle-même est d'une utilité limitée car elle ne révèle pas l'incertitude associée à l'estimation ; vous n'avez pas une bonne idée de la distance entre cette moyenne d'échantillon de 74 pouces et la moyenne de la population. Ce qui manque, c'est le degré d'incertitude dans cet échantillon unique.

Les intervalles de confiance fournissent plus d'informations que les estimations ponctuelles. En établissant un intervalle de confiance à 95 % à l'aide de la moyenne et de l'écart-type de l'échantillon,. et en supposant une distribution normale représentée par la courbe en cloche, les chercheurs arrivent à une limite supérieure et inférieure qui contient la vraie moyenne 95 % du temps.

Supposons que l'intervalle se situe entre 72 pouces et 76 pouces. Si les chercheurs prennent 100 échantillons aléatoires de la population de joueurs de basket-ball du secondaire dans son ensemble, la moyenne devrait se situer entre 72 et 76 pouces dans 95 de ces échantillons.

Si les chercheurs veulent une confiance encore plus grande, ils peuvent étendre l'intervalle de confiance à 99 %. Cela crée invariablement une plage plus large, car cela fait de la place pour un plus grand nombre de moyennes d'échantillons. S'ils établissent l'intervalle de confiance à 99 % comme étant compris entre 70 pouces et 78 pouces, ils peuvent s'attendre à ce que 99 des 100 échantillons évalués contiennent une valeur moyenne entre ces nombres.

Un niveau de confiance de 90 %, en revanche, implique que nous nous attendrions à ce que 90 % des estimations d'intervalle incluent le paramètre de population, et ainsi de suite.

Points forts

  • Ils sont le plus souvent construits avec des niveaux de confiance de 95% ou 99%.

  • Un intervalle de confiance affiche la probabilité qu'un paramètre tombe entre une paire de valeurs autour de la moyenne.

  • Les intervalles de confiance mesurent le degré d'incertitude ou de certitude d'une méthode d'échantillonnage.

FAQ

Qu'est-ce qu'une idée fausse courante sur les intervalles de confiance ?

La plus grande idée fausse concernant les intervalles de confiance est qu'ils représentent le pourcentage de données d'un échantillon donné qui se situe entre les limites supérieure et inférieure. En d'autres termes, il serait incorrect de supposer qu'un intervalle de confiance de 99 % signifie que 99 % des données d'un échantillon aléatoire se situent entre ces limites. Cela signifie en réalité que l'on peut être certain à 99 % que la plage contiendra la moyenne de la population.

Qu'est-ce qu'un test T ?

Les intervalles de confiance sont déterminés à l'aide de méthodes statistiques, comme un test t. Un test t est un type de statistique inférentielle utilisé pour déterminer s'il existe une différence significative entre les moyennes de deux groupes, qui peut être liée à certaines caractéristiques. Le calcul d'un test t nécessite trois valeurs de données clés. Ils incluent la différence entre les valeurs moyennes de chaque ensemble de données (appelée différence moyenne), l'écart type de chaque groupe et le nombre de valeurs de données de chaque groupe.

Que révèle un intervalle de confiance ?

Un intervalle de confiance est une plage de valeurs, délimitée au-dessus et au-dessous de la moyenne de la statistique, qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l'intervalle de confiance contienne le vrai paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire.

Comment les intervalles de confiance sont-ils utilisés ?

Les statisticiens utilisent des intervalles de confiance pour mesurer l'incertitude dans une variable d'échantillon. Par exemple, un chercheur sélectionne différents échantillons au hasard dans la même population et calcule un intervalle de confiance pour chaque échantillon pour voir comment il peut représenter la vraie valeur de la variable de population. Les ensembles de données résultants sont tous différents, certains intervalles incluant le vrai paramètre de population et d'autres non.