Prévision dun
effectif ou dune fréquence dans un échantillon au
hasard (loi binomiale) |
Quest quune prévision statistique ?
Sommaire
II.1 Distribution des probabilités dun effectif (loi binomiale)
IV Calculs de probabilités dans la loi binomiale
V Cas des échantillons sans remise dans une population finie
V.1 Distribution des probabilités dun effectif (loi hypergéométrique)
Leffectif ou la fréquence dont on cherche une prévision dans léchantillon de taille n, concerne la modalité A dune variable dintérêt qualitative. Chaque individu de la population présente la modalité A ou son contraire . La proportion ppop des individus A dans la population est connue.
On prévoit de prélever au hasard dans la population n individus avec remise. Dans ces conditions à chaque prélèvement dun individu de léchantillon la proportion de A dans la population reste constante, et par conséquent la probabilité ppop dobtenir A, égale à cette proportion, aussi. Mais quand la taille de la population est infinie, le fait de prélever léchantillon sans remise ne modifie pas non plus les conditions du tirage au fur et à mesure du prélèvement de léchantillon.
II.1 Distribution des probabilités dun effectif (loi binomiale)
Le nombre Yéch dindividus A dans léchantillon à lissue des n tirages (Y est donc une deuxième variable, qui, elle, est quantitative), peut prendre, a priori, les valeurs k = 0, 1, , k, , n, avec les probabilités :
P(Yéch = k) = |
Cette distribution est appelée loi binomiale, et notée B(n ; ppop).
Exemple de la loi B (n = 350 ; ppop = 0,0125) :
On voit quon obtiendra un effectif compris entre 0 et 12. La probabilité dobtenir un effectif supérieur (qui peut théoriquement aller jusquà 350) est négligeable. Leffectif qui a la plus grande probabilité de se produire est 4. La probabilité dobtenir un effectif de 3 ou 5 est supérieure à celle dobtenir un effectif de 4.
Lespérance mathématique de Yéch est la limite de leffectif moyen dindividus A parmi les n prélevés si lon répète indéfiniment le prélèvement de n individus :
E(Yéch) = n.ppop |
Cette espérance mathématique nest pas forcément une valeur entière (dans lexemple 4,38).
La valeur entière la plus proche de lespérance mathématique est celle dont la probabilité de réalisation est la plus grande.
Lintervalle de confiance correspondant à un niveau de confiance a donné ne peut être ni aisément, ni exactement calculé. Pour certaines valeurs de n et ppop, on peut aisément et assez précisément construire une approximation dun I.C. centré sur lespérance mathématique en fonction de lécart-type de la distribution de leffectif, comme au § IV.2.a).
s(Yéch) = |
III.1 Distribution des probabilités dune fréquence (loi binomiale)
La fréquence féch = de A dans léchantillon de taille n étant la simple division de leffectif par la taille de léchantillon, prend les valeurs 0, , , ... , , ... , , 1, avec les mêmes probabilités que Yéch pour les valeurs de k.
Lespérance mathématique de féch est :
E( féch) = ppop |
Lintervalle de confiance de la fréquence se déduit de celui de leffectif. La variance et lécart-type de la fréquence sont :
V(féch) = | s(féch) = |
IV Calculs de probabilités dans la loi binomiale
La plupart des calculettes financières ont une touche (2nd nCr pour la TI BA2+) ou une fonction pour calculer les combinaisons ..
La fonction dExcel LOI.BINOMIALE(k ; n ; p ; vrai ou faux)
renvoie avec faux la probabilité ponctuelle P(Y=k).
Avec vrai cette fonction renvoie la probabilité cumulée de
lintervalle P(Y £ k).
En pratique on ne calcule des probabilités ponctuelles P(Y=k) que pour des valeurs de k voisines de lespérance mathématique, et seulement quand cette espérance est faible (n.ppop < 8 pour fixer les idées).
Pour calculer "à la main" des probabilités ponctuelles, on a intérêt à les enchaîner à partir de k = 0 :
Exemple : calcul de P(Y>3) = 1 P(Y=0) P(Y=1) P(Y=2) P(Y=3) avec n =10, p = 0,2 :
Le calcul direct savère techniquement difficile, voire impossible, même avec un ordinateur lorsque n et k sont grands, à moins que ppop ne soit très petit. On distingue plusieurs cas.
Les probabilités ponctuelles P(Y=k) sont toutes faibles, voire négligeables, et ne présentent donc pas dintérêt. On sintéresse aux probabilités dintervalles P(Y £ k) ou P(Y >k) dont on peut calculer une valeur approchée avec la loi de Gauss de même moyenne m = et écart-type .
Mais il faut parfois faire une correction de continuité car, dans la loi binomiale, P(Y£k) = P(Y<k+1), alors que dans la loi de Gauss ces deux valeurs peuvent être dautant plus différentes que n..ppop est faible.
Approximation de lintervalle de confiance. En fonction de niveau de confiance a, lintervalle de confiance, dans la loi de Gauss est, pour leffectif :
n.ppop - ta £ Yéch £ n.ppop + ta |
et, pour la fréquence :
ppop - ta £ féch £ ppop + ta |
Avec les principales valeurs :
a | 0,80 | 0,90 | 0,95 | 0,98 | 0,99 | 0,998 |
ta | 1,28 | 1,64 | 1,96 | 2,33 | 2,58 | 3,09 |
Quand n.ppop est peu différent de n.ppop.(1 ppop), on peut obtenir une valeur approchée de P(Y=k) ou de P(Y £ k) par lecture de la table de la loi de Poisson de paramètre n.ppop.
V Prévision dun effectif dun échantillon sans remise dune population finie
On parle aussi de tirage "exhaustif". On tire simultanément n individus parmi N. Ceci revient à prélever successivement mais sans remise léchantillon. Il y a toujours, au départ, la proportion ppop dindividus A parmi les N. Mais, évidemment, cette proportion fluctue de façon aléatoire au fur et à mesure du prélèvement de léchantillon, cest-à-dire que p(A) dépend à chaque prélèvement des résultats des prélèvements précédents.
V.1 Distribution des probabilités des effectifs (loi hypergéométrique)
La prévision de Yéch est une loi hypergéométrique de moyenne n.ppop (inchangée par rapport à lespérance mathématique de la loi binomiale) et de variance n.ppop.(1 ppop)..
Lapproximation par la loi de Gauss nest plus possible, ni la prévision par intervalle de confiance de Gauss, sauf quand le taux de sondage () est faible (en pratique < 10%), et que ppop (ou 1 ppop ) nest pas trop petit. On peut alors écrire :
P(ppop - ta £ féch £ ppop + ta) = a
Quest quune prévision statistique
Erreurs, omissions, remarques ?
Dernière mise-à-jour de cette page : lundi 5 février 2001.