Investor's wiki

Statistiques descriptives

Statistiques descriptives

Que sont les statistiques descriptives ?

Les statistiques descriptives sont de brefs coefficients descriptifs qui résument un ensemble de données donné, qui peut être soit une représentation de l'ensemble de la population, soit un échantillon d'une population. Les statistiques descriptives sont décomposées en mesures de tendance centrale et en mesures de variabilité (spread). Les mesures de la tendance centrale incluent la moyenne, la médiane et le mode, tandis que les mesures de la variabilité incluent l'écart type, la variance, les variables minimum et maximum, l' aplatissement et l' asymétrie.

Comprendre les statistiques descriptives

En bref, les statistiques descriptives aident à décrire et à comprendre les caractéristiques d'un ensemble de données spécifique en donnant de brefs résumés sur l'échantillon et les mesures des données. Les types de statistiques descriptives les plus reconnus sont les mesures du centre : la moyenne,. la médiane et le mode,. qui sont utilisées à presque tous les niveaux des mathématiques et des statistiques. La moyenne, ou la moyenne, est calculée en additionnant tous les chiffres de l'ensemble de données, puis en divisant par le nombre de chiffres de l'ensemble.

Par exemple, la somme de l'ensemble de données suivant est 20 : (2, 3, 4, 5, 6). La moyenne est de 4 (20/5). Le mode d'un jeu de données est la valeur apparaissant le plus souvent, et la médiane est le chiffre situé au milieu du jeu de données. C'est le chiffre séparant les chiffres supérieurs des chiffres inférieurs dans un ensemble de données. Cependant, il existe des types moins courants de statistiques descriptives qui sont toujours très importantes.

Les gens utilisent des statistiques descriptives pour réutiliser des informations quantitatives difficiles à comprendre sur un grand ensemble de données dans des descriptions succinctes. La moyenne pondérée cumulative (GPA) d'un élève, par exemple, permet de bien comprendre les statistiques descriptives. L'idée d'un GPA est qu'il prend des points de données à partir d'un large éventail d'examens, de classes et de notes, et les fait la moyenne ensemble pour fournir une compréhension générale de la performance académique globale d'un étudiant. Le GPA personnel d'un étudiant reflète ses performances académiques moyennes.

Types de statistiques descriptives

Toutes les statistiques descriptives sont soit des mesures de tendance centrale, soit des mesures de variabilité,. également appelées mesures de dispersion .

Tendance centrale

Les mesures de la tendance centrale se concentrent sur les valeurs moyennes ou intermédiaires des ensembles de données, tandis que les mesures de la variabilité se concentrent sur la dispersion des données. Ces deux mesures utilisent des graphiques, des tableaux et des discussions générales pour aider les gens à comprendre la signification des données analysées.

Les mesures de tendance centrale décrivent la position centrale d'une distribution pour un ensemble de données. Une personne analyse la fréquence de chaque point de données dans la distribution et la décrit à l'aide de la moyenne, de la médiane ou du mode, qui mesure les modèles les plus courants de l'ensemble de données analysé.

Mesures de la variabilité

Les mesures de variabilité (ou les mesures de propagation) aident à analyser la dispersion de la distribution pour un ensemble de données. Par exemple, alors que les mesures de tendance centrale peuvent donner à une personne la moyenne d'un ensemble de données, elles ne décrivent pas comment les données sont distribuées au sein de l'ensemble.

Ainsi, alors que la moyenne des données peut être de 65 sur 100, il peut toujours y avoir des points de données à la fois à 1 et à 100. Les mesures de variabilité aident à communiquer cela en décrivant la forme et la propagation de l'ensemble de données. La plage, les quartiles,. l'écart absolu et la variance sont tous des exemples de mesures de la variabilité.

Considérez l'ensemble de données suivant : 5, 19, 24, 62, 91, 100. La plage de cet ensemble de données est de 95, qui est calculée en soustrayant le nombre le plus bas (5) dans l'ensemble de données du plus élevé (100).

Points forts

  • Les statistiques descriptives consistent en deux catĂ©gories fondamentales de mesures : les mesures de tendance centrale et les mesures de variabilitĂ© (ou propagation).

  • Les statistiques descriptives rĂ©sument ou dĂ©crivent les caractĂ©ristiques d'un ensemble de donnĂ©es.

  • Les mesures de variabilitĂ© ou de propagation dĂ©crivent la dispersion des donnĂ©es au sein de l'ensemble.

  • Les mesures de tendance centrale dĂ©crivent le centre d'un ensemble de donnĂ©es.

FAQ

Les statistiques descriptives peuvent-elles être utilisées pour faire des inférences ou des prédictions ?

Non. Bien que ces descriptifs aident à comprendre les attributs des données, des techniques statistiques inférentielles (une branche distincte des statistiques) sont nécessaires pour comprendre comment les variables interagissent les unes avec les autres dans un ensemble de données.

Qu'est-ce que la moyenne et l'Ă©cart type ?

Ce sont deux statistiques descriptives couramment utilisées. La moyenne est le niveau moyen observé dans certaines données, tandis que l'écart type décrit la variance ou la dispersion des données observées dans cette variable autour de sa moyenne.

Pourquoi avons-nous besoin de statistiques décrivant simplement les données ?

Les statistiques descriptives sont utilisées pour décrire ou résumer les caractéristiques d'un échantillon ou d'un ensemble de données, telles que la moyenne, l'écart type ou la fréquence d'une variable. Les statistiques inférentielles peuvent nous aider à comprendre les propriétés collectives des éléments d'un échantillon de données. Connaître la moyenne, la variance et la distribution de l'échantillon d'une variable peut nous aider à comprendre le monde qui nous entoure.