Investor's wiki

Quartile

Quartile

Qu'est-ce qu'un quartile ?

Un quartile est un terme statistique qui décrit une division d'observations en quatre intervalles définis en fonction des valeurs des données et de leur comparaison avec l'ensemble des observations.

Comprendre les quartiles

Pour comprendre le quartile, il est important de comprendre la médiane comme une mesure de tendance centrale. La médiane en statistique est la valeur médiane d'un ensemble de nombres. C'est le point auquel exactement la moitié des données se situe en dessous et au-dessus de la valeur centrale.

Ainsi, étant donné un ensemble de 13 nombres triés (croissant ou décroissant), la médiane serait le septième nombre. Les six nombres précédant cette valeur sont les nombres les plus bas dans les données, et les six nombres après la médiane sont les nombres les plus élevés dans l'ensemble de données donné. Étant donné que la médiane n'est pas affectée par les valeurs extrêmes ou les valeurs aberrantes de la distribution, elle est parfois préférée à la moyenne.

La médiane est un estimateur robuste de l'emplacement mais ne dit rien sur la façon dont les données de part et d'autre de sa valeur sont réparties ou dispersées. C'est là qu'intervient le quartile. Le quartile mesure la répartition des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes.

Comment fonctionnent les quartiles ?

Tout comme la médiane divise les données en deux de sorte que 50 % de la mesure se situe en dessous de la médiane et 50 % au-dessus, le quartile décompose les données en quarts de sorte que 25 % des mesures sont inférieures au quartile inférieur, 50 % sont inférieurs à la médiane et 75 % sont inférieurs au quartile supérieur.

Un quartile divise les données en trois points (un quartile inférieur, un quartile médian et un quartile supérieur) pour former quatre groupes de l'ensemble de données. Le quartile inférieur, ou premier quartile, est noté Q1 et est le nombre médian qui se situe entre la plus petite valeur de l'ensemble de données et la médiane. Le deuxième quartile, Q2, est également la médiane. Le quartile supérieur ou troisième, noté Q3, est le point central qui se situe entre la médiane et le nombre le plus élevé de la distribution.

Maintenant, nous pouvons cartographier les quatre groupes formés à partir des quartiles. Le premier groupe de valeurs contient le plus petit nombre jusqu'à Q1 ; le deuxième groupe comprend Q1 jusqu'à la médiane ; le troisième ensemble est la médiane de Q3 ; la quatrième catégorie comprend Q3 jusqu'au point de données le plus élevé de l'ensemble complet.

Chaque quartile contient 25 % du total des observations. Généralement, les données sont classées du plus petit au plus grand :

  1. Premier quartile : les 25 % des nombres les plus bas

  2. Deuxième quartile : entre 0 % et 50 % (jusqu'à la médiane)

  3. Troisième quartile : 0 % à 75 %

  4. Quatrième quartile : les 25 % des nombres les plus élevés

Exemple de quartile

Supposons que la distribution des scores en mathématiques dans une classe de 19 élèves par ordre croissant est :

  • 59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Tout d'abord, notez la médiane, Q2, qui dans ce cas est la 10ème valeur : 75.

Q1 est le point central entre le plus petit score et la médiane. Dans ce cas, Q1 se situe entre le premier et le cinquième score : 68. (Notez que la médiane peut également être incluse lors du calcul de Q1 ou Q3 pour un ensemble impair de valeurs. Si nous devions inclure la médiane de chaque côté du point médian , alors Q1 sera la valeur médiane entre le premier et le 10th score, qui est la moyenne du cinquième et du sixième score—(cinquième + sixième)/2 = (68 + 69)/2 = 68,5).

Q3 est la valeur médiane entre Q2 et le score le plus élevé : 84. (Ou si vous incluez la médiane, Q3 = (82 + 84)/2 = 83).

Maintenant que nous avons nos quartiles, interprétons leurs nombres. Un score de 68 (Q1) représente le premier quartile et est le 25th centile. 68 est la médiane de la moitié inférieure du score défini dans les données disponibles, c'est-à-dire la médiane des scores de 59 à 75.

Q1 nous dit que 25% des scores sont inférieurs à 68 et 75% des scores de classe sont supérieurs. Q2 (la médiane) est le 50th centile et montre que 50 % des scores sont inférieurs à 75 et 50 % des scores sont supérieurs à 75. Enfin, Q3, le 75th centile, révèle que 25 % des scores sont supérieurs et 75% sont inférieurs à 84.

Considérations particulières

Si le point de données pour Q1 est plus éloigné de la médiane que Q3 ne l'est de la médiane, alors nous pouvons dire qu'il y a une plus grande dispersion parmi les plus petites valeurs de l'ensemble de données que parmi les plus grandes valeurs. La même logique s'applique si Q3 est plus éloigné de Q2 que Q1 ne l'est de la médiane.

Alternativement, s'il y a un nombre pair de points de données, la médiane sera la moyenne des deux nombres du milieu. Dans notre exemple ci-dessus, si nous avions 20 étudiants au lieu de 19, la médiane de leurs scores sera la moyenne arithmétique des nombres 10th et 11th.

Les quartiles sont utilisés pour calculer l'intervalle interquartile, qui est une mesure de la variabilité autour de la médiane. L'écart interquartile est simplement calculé comme la différence entre le premier et le troisième quartile : Q3–Q1. En effet, c'est la plage de la moitié médiane des données qui montre à quel point les données sont réparties.

Pour les grands ensembles de données, Microsoft Excel dispose d'une fonction QUARTILE pour calculer les quartiles.

Points forts

  • Un quartile divise les données en trois points (un quartile inférieur, un quartile médian et un quartile supérieur) pour former quatre groupes de l'ensemble de données.

  • Le quartile mesure la dispersion des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes.

  • Les quartiles sont utilisés pour calculer l'écart interquartile, qui est une mesure de la variabilité autour de la médiane.