Goûter

Qu'est-ce qu'un échantillon ?

Un échantillon fait référence à une version plus petite et gérable d'un groupe plus important. Il s'agit d'un sous-ensemble contenant les caractéristiques d'une population plus large. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop grande pour que le test inclue tous les membres ou observations possibles. Un échantillon doit représenter la population dans son ensemble et ne refléter aucun biais vers un attribut spécifique.

Il existe plusieurs techniques d' échantillonnage utilisées par les chercheurs et les statisticiens, chacune avec ses propres avantages et inconvénients.

Comprendre les échantillons

Un échantillon est un nombre non biaisé d'observations tirées d'une population. En termes simples, une population est le nombre total d'observations (c'est-à-dire d'individus, d'animaux, d'éléments, de données, etc.) contenues dans un groupe ou un contexte donné. En d'autres termes, un échantillon est une portion, une partie ou une fraction de l'ensemble du groupe et agit comme un sous-ensemble de la population. Les échantillons sont utilisés dans une variété de contextes où la recherche est menée. Les scientifiques, les spécialistes du marketing, les agences gouvernementales, les économistes et les groupes de recherche font partie de ceux qui utilisent des échantillons pour leurs études et leurs mesures.

L'utilisation de populations entières pour la recherche comporte des défis. Les chercheurs peuvent avoir des difficultés à accéder facilement à des populations entières. Et, en raison de la nature de certaines études, les chercheurs peuvent avoir des difficultés à obtenir les résultats dont ils ont besoin en temps opportun. C'est pourquoi des échantillons de personnes sont utilisés. L'utilisation d'un plus petit nombre de personnes qui représentent l'ensemble de la population peut toujours produire des résultats valables tout en réduisant le temps et les ressources.

Les échantillons utilisés par les chercheurs doivent ressembler à l'ensemble de la population afin de faire des inférences ou des prédictions précises. Tous les participants de l'échantillon doivent partager les mêmes caractéristiques et qualités. Donc, si l'étude porte sur des étudiants de première année à l'université, l'échantillon devrait être un petit pourcentage d'hommes qui correspondent à cette description. De même, si un groupe de recherche mène une étude sur les habitudes de sommeil des femmes célibataires de plus de 50 ans, l'échantillon ne devrait inclure que les femmes de ce groupe démographique.

Considérations particulières

Considérez une équipe de chercheurs universitaires qui veulent savoir combien d'étudiants ont étudié pendant moins de 40 heures pour l' examen CFA et ont quand même réussi. Étant donné que plus de 200 000 personnes passent l'examen dans le monde chaque année, tendre la main à chaque participant à l'examen consommerait du temps et des ressources.

En fait, au moment où les données de la population ont été collectées et analysées, quelques années se seraient écoulées, rendant l'analyse sans valeur puisqu'une nouvelle population aurait émergé. Ce que les chercheurs peuvent faire à la place, c'est prendre un échantillon de la population et obtenir des données à partir de cet échantillon.

Afin d'obtenir un échantillon impartial, la sélection doit être aléatoire afin que chaque membre de la population ait une chance égale et probable d'être ajouté au groupe échantillon. Ceci est similaire à un tirage de loterie et constitue la base d' un échantillonnage aléatoire simple.

Pour un échantillon non biaisé, la sélection doit être aléatoire afin que chaque membre de la population ait une chance égale d'être ajouté au groupe.

Types d'échantillonnage

Échantillonnage aléatoire simple

L'échantillonnage aléatoire simple est idéal si chaque entité de la population est identique. Si les chercheurs ne se soucient pas de savoir si les sujets de leur échantillon sont tous des hommes ou des femmes ou une combinaison des deux sexes sous une forme ou une autre, un échantillonnage aléatoire simple peut être une bonne technique de sélection.

Disons qu'il y avait 200 000 candidats qui se sont présentés à l'examen CFA en 2021, dont 40 % étaient des femmes et 60 % étaient des hommes. L'échantillon aléatoire tiré de la population devrait donc compter 400 femmes et 600 hommes pour un total de 1 000 personnes testées.

Mais qu'en est-il des cas où connaître le ratio hommes/femmes ayant réussi un test après avoir étudié pendant moins de 40 heures est important ? Ici, un échantillon aléatoire stratifié serait préférable à un échantillon aléatoire simple.

Échantillonnage aléatoire stratifié

Ce type d'échantillonnage, également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quota, divise la population globale en groupes plus petits. Celles-ci sont appelées strates. Les personnes au sein des strates partagent des caractéristiques similaires.

Et si l'âge était un facteur important que les chercheurs aimeraient inclure dans leurs données ? En utilisant la technique d'échantillonnage aléatoire stratifié, ils pourraient créer des couches ou des strates pour chaque groupe d'âge. La sélection à partir de chaque strate devrait être aléatoire afin que tout le monde dans la tranche ait une chance d'être inclus dans l'échantillon. Par exemple, deux participants, Alex et David, ont respectivement 22 et 24 ans. La sélection de l'échantillon ne peut pas choisir l'un plutôt que l'autre sur la base d'un mécanisme préférentiel. Ils devraient tous deux avoir une chance égale d'être sélectionnés dans leur groupe d'âge. Les strates pourraient ressembler à ceci :

TTT

À partir du tableau, la population a été divisée en groupes d'âge. Par exemple, 30 000 personnes âgées de 20 à 24 ans ont passé l'examen CFA en 2021. En utilisant cette même proportion, le groupe d'échantillon aura (30 000 ÷ 200 000) × 1 000 = 150 candidats qui appartiennent à ce groupe. Alex ou David – ou les deux ou aucun – peuvent être inclus parmi les 150 participants à l'examen aléatoire de l'échantillon.

Il y a beaucoup plus de strates qui pourraient être compilées lors du choix d'une taille d'échantillon. Certains chercheurs peuvent renseigner les fonctions professionnelles, les pays, l'état matrimonial, etc., des candidats au test lorsqu'ils décident comment créer l'échantillon.

Exemples d'échantillons

En 2021, la population mondiale était de près de 7,9 milliards, dont 49,6 % de femmes et 50 % d'hommes. Le nombre total de personnes dans un pays donné peut également être une taille de population. Le nombre total d'étudiants dans une ville peut être considéré comme une population, et le nombre total de chiens dans une ville est également une taille de population. Des échantillons peuvent être prélevés sur ces populations à des fins de recherche.

En suivant notre exemple d'examen CFA, les chercheurs pourraient prélever un échantillon de 1 000 participants CFA parmi les 200 000 candidats au total - la population - et exécuter les données requises sur ce nombre. La moyenne de cet échantillon serait prise pour estimer la moyenne des candidats à l'examen CFA qui ont réussi même s'ils n'ont étudié que pendant moins de 40 heures.

Le groupe échantillon prélevé ne doit pas être biaisé. Cela signifie que si la moyenne de l'échantillon des 1 000 participants à l'examen CFA est de 50, la moyenne de la population des 200 000 candidats devrait également être d'environ 50.

Points forts

En statistique, un échantillon est un sous-ensemble analytique d'une population plus large.
Dans l'échantillonnage aléatoire simple, chaque entité de la population est identique, tandis que l'échantillonnage aléatoire stratifié divise la population globale en groupes plus petits.
L'utilisation d'échantillons permet aux chercheurs de mener leurs études avec des données plus gérables et en temps opportun.
Les échantillons tirés au hasard n'ont pas beaucoup de biais s'ils sont suffisamment grands, mais la réalisation d'un tel échantillon peut être coûteuse et prendre du temps.

FAQ

Qu'est-ce qu'un échantillon aléatoire simple ?

Cette méthode d'échantillonnage utilise des répondants ou des points de données sélectionnés au hasard dans la population plus large. Avec une taille d'échantillon suffisamment grande, un échantillon aléatoire supprime les biais.

Pourquoi les échantillons aléatoires permettent-ils l'inférence ?

Les lois de la statistique impliquent que des mesures et des évaluations précises peuvent être faites sur une population en utilisant un échantillon. L'analyse de la variance (ANOVA),. la régression linéaire et les techniques de modélisation plus avancées sont valables en raison de la loi des grands nombres et du théorème central limite.

Pourquoi les analystes utilisent-ils des échantillons au lieu de mesurer la population ?

Souvent, une population est trop grande ou étendue pour mesurer chaque membre et mesurer chaque membre serait coûteux et prendrait du temps. Un échantillon permet de faire des inférences sur la population à l'aide de méthodes statistiques.

De quelle taille d'échantillon avez-vous besoin ?

Cela dépendra de la taille de la population et du type d'analyse que vous souhaitez effectuer (par exemple, quels intervalles de confiance vous utilisez). L'analyse de puissance est une technique d'évaluation mathématique de la plus petite taille d'échantillon nécessaire en fonction de vos besoins. Une autre règle empirique est que votre échantillon doit être suffisamment grand, mais pas plus de 10 % de la taille de la population.