Prévision d'un total, d'une moyenne, ou d'un écart-type dans un échantillon au hasard |
Qu'est qu'une prévision statistique ?
Sommaire
I Contexte
III Prévision de la moyenne méch
IV Prévision de l'écart-type séch
V Intervalle de confiance dune moyenne déchantillon pour le niveau de confiance
Le total ou la moyenne dont on cherche à prévoir la valeur dans un échantillon au hasard de taille n concerne une variable d'intérêt quantitative continue,
qu'on appelle Y. On note Yéch ce
total, méch cette moyenne . On note séch
lécart-type de Y dans l'échantillon.
La moyenne et l'écart-type
spop
de Y dans la population sont connus.
Par contre la distribution L(Y) de Y dans la population n'est pas forcément connue. Le cas d'une distribution de Gauss dans la population est courant.
On prévoit de prélever au hasard et avec remise n individus dans la population.
La distribution des probabilités dépend de la distribution de Y dans la population.
Quand la distribution de Y dans
la population est de Gauss, L(Y)
= N (; spop),
la distribution du total Yéch de l'échantillon
au hasard avec remise est alors aussi de Gauss :
L(Yéch)= N (n. , spop´
).
Dans tous les cas, son espérance
mathématique est n ´, sa variance n ´ s2pop, et son
écart-type spop´
.
III Prévision de la moyenne méch
Les résultats sont similaires aux précédents.
La distribution des probabilités de la moyenne dépend de
la distribution de Y dans la population. Elle a pour espérance
mathématique , pour variance
, et
pour écart-type
. Cette moyenne est une prévision
ponctuelle de la moyenne de l'échantillon.
Quand la distribution de Y dans la population est de Gauss, la distribution de la moyenne méch de léchantillon au hasard avec remise est alors aussi, quelque soit sa taille n, de Gauss.
Dans le cas contraire, la distribution de la moyenne méch tend vers une loi de Gauss quand la taille de l'échantillon au hasard avec remise tend vers l'infini (théorème de la limite centrale). En pratique, dés que n >15 à 20, lapproximation est suffisante.
IV Prévision de l'écart-type séch
La distribution des probabilités
dépend de la distribution de celle de Y dans la
population. Son espérance mathématique est s pop
´ .
V Intervalle de confiance dune moyenne déchantillon au hasard
V.1 Echantillon avec remise dans une population Gaussienne
Quand la distribution de Y dans
la population est de Gauss (ou peut être ajustée par une
loi de Gauss) N (; spop), et que l'échantillon est
au hasard avec remise, l'intervalle de confiance au niveau
de confiance a est :
P( ta
£ méch £
+ ta
) = a
avec t lu dans la table de la loi de Gauss en fonction de a :
a |
95% |
90% |
98% |
99,8% |
80% |
t |
1,96 # 2 |
1,6449 |
2,5758 |
3,09 |
1,2816 |
V.2 Grand échantillon avec remise dans une population non Gaussienne
Quand la distribution de Y dans la population nest pas de Gauss, ou, ne peut pas être ajustée par une loi de Gauss le théorème de la limite centrale affirme que le résultat précédent n'est vrai que lorsque la taille de l'échantillon n tend vers l'infini. Mais la convergence est très rapide, et dés que n est grand, en pratique dés que n > 15, le résultat précédent s'applique.
V.3 petit échantillon avec remise dans une population non Gaussienne
Pour un petit échantillon on peut appliquer le théorème de Bienaymé-Chebitchef :
P( (1
a )
¹/²
£ méch £
+ (1 a ) ¹/²
) = a
V.4 échantillon sans remise dans une population Gaussienne ou non
Quand léchantillon au hasard est sans
remise, la loi de sa moyenne nest plus, ni ne tend plus
vers une loi de Gauss. Sa moyenne est toujours . Sa variance
est multipliée par le coefficient dexhaustivité
. On
admet que, lorsque le taux de sondage (
) est inférieur à 10%,
on peut encore utiliser la loi de Gauss, et écrire :
P( ta
£ méch £
+ ta
) = a
avec t lu, comme plus haut, dans la table de la loi de Gauss en fonction de a.
Qu'est qu'une prévision statistique
Erreurs, omissions, remarques ?
Dernière mise-à-jour de cette page : jeudi 01 février 2001.