Table des matières:
Pour faire des estimations sur une population, les statisticiens utilisent un échantillon aléatoire représentatif de la population. Par exemple, si vous pesez 50 femmes américaines au hasard, vous pouvez estimer le poids de toutes les femmes américaines en fonction de leur poids moyen. Une erreur d'échantillonnage se produit lorsque les résultats de votre échantillon s'écartent de la valeur de population réelle. Autrement dit, si vos 50 femmes ont eu un poids moyen de 135 livres alors que la moyenne réelle était de 150 livres, alors votre erreur d'échantillonnage est de -15 (la différence observée moins la valeur réelle), ce qui signifie que vous avez sous-estimé la valeur réelle de 15 points. La valeur réelle étant rarement connue, les statisticiens utilisent d'autres estimations telles que l'erreur type et les intervalles de confiance pour estimer l'erreur d'échantillonnage.
Étape
Calculez le pourcentage que vous mesurez. Par exemple, si vous souhaitez savoir quel pourcentage d’élèves d’une école fument des cigarettes, prenez un échantillon aléatoire (par exemple, n, notre échantillon est égal à 30), demandez-leur de remplir un sondage anonyme et calculez le pourcentage de les étudiants qui disent fumer. Par exemple, six étudiants ont dit fumer. Ensuite, le pourcentage de fumeurs = (# de fumeurs) / (nombre total d'étudiants mesurés) x 100% = 6/30 x 100% = 20%.
Étape
Calculez l'erreur type. Comme nous ne connaissons pas le pourcentage réel d’élèves qui fument, nous ne pouvons approximer l’erreur d’échantillonnage qu’en calculant l’erreur type. En statistique, nous utilisons proportion, p, au lieu de pourcentages pour les calculs, convertissons donc 20% en proportion. En divisant 20% par 100%, vous obtenez p = 0,20. Erreur standard (SE) pour les échantillons de grande taille = sqrt p x (1 - p) / n, où sqrt x signifie prendre la racine carrée de x. Dans cet exemple, nous obtenons SE = sqrt 0.2 x (0.8) / 30 = sqrt 0.00533…? 0,073.
Étape
Créez un intervalle de confiance. Limite inférieure: proportion estimée - 1,96 x SE = 0,2 - 1,96 (0,073) = 0,0569 Limite supérieure: proportion estimée + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Nous dirions donc que nous sommes à 95% sûrs de la proportion réelle de fumeurs est compris entre 0,0569 et 0,343, ou en pourcentage, 5,69% ou 34,3% des élèves fument. Cet écart important indique la possibilité d'une erreur d'échantillonnage assez importante.
Étape
Mesurez tout le monde pour calculer l'erreur d'échantillonnage exacte. Demandez à tous les élèves de l’école de répondre au sondage anonyme et calculez le pourcentage d’élèves qui ont déclaré fumer. Disons que ce sont 120 étudiants sur 800 qui ont déclaré fumer, notre pourcentage est alors de 120/800 x 100% = 15%. Par conséquent, notre "erreur d'échantillonnage" = (estimée) - (réelle) = 20 - 15 = 5. Plus on se rapproche de zéro, meilleure est notre estimation et moins l'erreur d'échantillonnage est dite. Dans le monde réel, toutefois, vous ne connaîtrez probablement pas la valeur réelle et devrez vous fier à l'intervalle de confiance et à l'intervalle de confiance pour les interpréter.