Investor's wiki

Méthode non paramétrique

Méthode non paramétrique

Qu'est-ce que la méthode non paramétrique ?

La méthode non paramétrique fait référence à un type de statistique qui ne fait aucune hypothèse sur les caractéristiques de l'échantillon (ses paramètres) ou sur le caractère quantitatif ou qualitatif des données observées.

Les statistiques non paramétriques peuvent inclure certaines statistiques descriptives,. des modèles statistiques, des inférences et des tests statistiques. La structure du modèle des méthodes non paramétriques n'est pas spécifiée a priori mais est plutôt déterminée à partir des données.

Le terme « non paramétrique » ne signifie pas que ces modèles manquent complètement de paramètres, mais plutôt que le nombre et la nature des paramètres sont flexibles et non fixés à l'avance. Un histogramme est un exemple d'estimation non paramétrique d'une distribution de probabilité.

En revanche, des méthodes statistiques bien connues telles que l' ANOVA,. la corrélation de Pearson,. le test t et d'autres font des hypothèses sur les données analysées. L'une des hypothèses paramétriques les plus courantes est que les données démographiques ont une «distribution normale ».

Comment fonctionne la méthode non paramétrique

Les méthodes paramétriques et non paramétriques sont souvent utilisées sur différents types de données. Les statistiques paramétriques nécessitent généralement des données d'intervalle ou de rapport. Un exemple de ce type de données est l'âge, le revenu, la taille et le poids dans lequel les valeurs sont continues et les intervalles entre les valeurs ont une signification.

En revanche, les statistiques non paramétriques sont généralement utilisées sur des données nominales ou ordinales. Les variables nominales sont des variables dont les valeurs n'ont pas de valeur quantitative. Les variables nominales courantes dans la recherche en sciences sociales, par exemple, incluent le sexe, dont les valeurs possibles sont des catégories discrètes, "masculin" et "féminin". (salariés versus chômeurs).

Les variables ordinales sont celles dans lesquelles la valeur suggère un certain ordre. Un exemple de variable ordinale serait si un répondant à l'enquête demandait : "Sur une échelle de 1 à 5, 1 étant Extrêmement insatisfait et 5 étant Extrêmement satisfait, comment évalueriez-vous votre expérience avec le câblodistributeur ?"

les statistiques paramétriques peuvent également être appliquées à des populations avec d'autres types de distribution connus. Les statistiques non paramétriques n'exigent pas que les données démographiques satisfassent aux hypothèses requises pour les statistiques paramétriques. Les statistiques non paramétriques entrent donc dans une catégorie de statistiques parfois appelées sans distribution. Souvent, des méthodes non paramétriques seront utilisées lorsque les données de population ont une distribution inconnue ou lorsque la taille de l'échantillon est petite.

Considérations particulières

Bien que les statistiques non paramétriques aient l'avantage de devoir répondre à peu d'hypothèses, elles sont moins puissantes que les statistiques paramétriques. Cela signifie qu'ils peuvent ne pas montrer de relation entre deux variables alors qu'en fait il en existe une.

Les statistiques non paramétriques ont gagné en popularité en raison de leur facilité d'utilisation. Au fur et à mesure que le besoin de paramètres est soulagé, les données deviennent plus applicables à une plus grande variété de tests. Ce type de statistiques peut être utilisé sans la moyenne, la taille de l'échantillon, l'écart type ou l'estimation de tout autre paramètre connexe lorsqu'aucune de ces informations n'est disponible.

Étant donné que les statistiques non paramétriques font moins d'hypothèses sur les données de l'échantillon, leur application a une portée plus large que les statistiques paramétriques. Dans les cas où les tests paramétriques sont plus appropriés, les méthodes non paramétriques seront moins efficaces. En effet, les statistiques non paramétriques ignorent certaines informations disponibles dans les données, contrairement aux statistiques paramétriques.

Les tests non paramétriques courants incluent le Chi-Square,. le test de Wilcoxon rank-sum , le test de Kruskal-Wallis et la corrélation d'ordre de Spearman.

Exemples de la méthode non paramétrique

Prenons l'exemple d'un analyste financier qui souhaite estimer la valeur à risque (VaR) d'un investissement. L'analyste rassemble les données sur les bénéfices de centaines d'investissements similaires sur un horizon temporel similaire. Plutôt que de supposer que les revenus suivent une distribution normale, elle utilise l'histogramme pour estimer la distribution de manière non paramétrique. Le 5e centile de cet histogramme fournit alors à l'analyste une estimation non paramétrique de la VaR.

Pour un deuxième exemple, considérons un chercheur différent qui veut savoir si le nombre moyen d'heures de sommeil est lié à la fréquence à laquelle on tombe malade. Étant donné que de nombreuses personnes tombent rarement malades, voire pas du tout, et que d'autres tombent parfois malades beaucoup plus souvent que la plupart des autres, la distribution de la fréquence des maladies est clairement non normale, étant asymétrique à droite et sujette aux valeurs aberrantes.

Ainsi, plutôt que d'utiliser une méthode qui suppose une distribution normale pour la fréquence des maladies, comme cela se fait dans l'analyse de régression classique, par exemple, le chercheur décide d'utiliser une méthode non paramétrique telle que l'analyse de régression quantile.

Points forts

  • Cela contraste avec les méthodes paramétriques, qui font des hypothèses sur la forme ou les caractéristiques des données. Des exemples de telles méthodes comprennent le modèle de distribution normale et le modèle de régression linéaire.

  • La méthode non paramétrique est une branche de la statistique dans laquelle les données ne sont pas supposées provenir de modèles prescrits déterminés par un petit nombre de paramètres.

  • L'analyse non paramétrique est souvent la mieux adaptée lorsque l'on considère l'ordre de quelque chose, où même si les données numériques changent, les résultats resteront probablement les mêmes.