V.1.7 - Dernière mise à jour : 18/01/2008
Quel que soit le tirage
(calculée sur l'échantillon) estime sans biais
la moyenne (inconnue) recherchée sur l'univers
équation n°1 - fm32
équation n°2 - fm32
- Exemple 1 (suite de celui de la fm31) :
- Quelle est la distance moyenne parcourue par les habitants de la ville de Trifouillis (20 000 hab.) pendant le week-end de la Toussaint pour acheter des chrysanthèmes et se rendre au cimetière ?
Téléchargement de la feuille de calcul : efm32ta1.xls onglet Exemple1
Ce fichier est au format Excel98 (.xls) et "pèse" 97 ko..
On en sonde 900 d'entre eux :
- la distance moyenne est de 120 km ;
- la variabilité, connue par l'écart type (s) est de 5 km.
- Pour un tirage avec remise TAR, au risque
de se tromper dans seulement 5 % des cas (
= 0,05) :
- 2 *
<
<
+ 2 *
120 - 2 *
<
< 120 + 2 *
120 - 2 * (5 / 30) <
< 120 + 2 * (5 / 30)
120 - 2 * 0,1667 <
< 120 + 2 * 0,1667
119,6666 <
< 120,3334
- Pour un tirage sans remise TSR, au risque
de se tromper dans seulement 5 % des cas (
= 0,05) :
- 2 *
<
<
+ 2 *
120 - 2 *
<
< 120 + 2 *
120 - 2 *
<
< 120 + 2 *
120 - 2 * 0,1629 <
< 120 + 2 * 0,1629
119,6742 <
< 120,3257
- L'écart entre les deux modes de tirage est de (TSR - TAR) :
0,3334 - 0,3257 = 0,0077 en faveur du TSR
soit 7,7 m !!!
En pratique, on tire toujours sans remise
=> la précision est meilleure
Mais plus m est petit devant M
=> m <<<<<< M
moins la différence entre le TSR et le TAR est forte
Pour passer de la moyenne sur l'échantillon à l'estimation de la population totale
Par exemple pour passer du salaire moyen par ouvrier au "salaire total" de l'entreprise
- On estime sans biais la somme
équation n°3 - fm32
par
équation n°4 - fm32
où :
- M est le nombre total d'habitants ;
-
est la distance moyenne calculée sur l'échantillon.
- On estime sans biais la variance de cette somme
équation n°5 - fm32
par
équation n°6 - fm32
- Quelle est la distance totale parcourue par les habitants de la ville de Trifouillis (20 000 hab.) pendant le week-end de la Toussaint pour acheter des chrysanthèmes et se rendre au cimetière ?
- Dans le cas d'un TAR, pour les 20 000 habitants de Trifouillis, la distance totale parcourue (DT) est de :
DT = M *
= 20 000 * 120 = 2 400 000 km
L'intervalle de confiance est de :
DT +/- 2 *
= 2 400 000 +/- 2 * (20 000^2)^(1/2) * 0,1667 = 2 400 000 +/- 6 668 km
Au risque de se tromper pour 5 p.100 des tirages, les Trifouillois parcourent
=> 2,4 millions de km à 0,6 % près pour la Toussaint
- Dans le cas d'un TSR, pour les 20 000 habitants de Trifouillis, la distance totale parcourue (DT) est de :
DT = M *
= 20 000 * 120 = 2 400 000 km
L'intervalle de confiance est de :
DT +/- 2 *
= 2 400 000 +/- 2 * (20 000^2)^(1/2) * 0,1629 = 2 400 000 +/- 6 516 km
Au risque de se tromper pour 5 p.100 des tirages, les Trifouillois parcourent
=> 2,4 millions de km à 0,5 % près pour la Toussaint
- La précision relative (Pr) de 0,5 ou 0,6 p.100 se calcule comme suit
TAR => Pr = 2 *
/
= 6 668 / 2 400 000 = 0,0056ou 0,6 p.100
TSR => Pr = 2 *
/
= 6 516 / 2 400 000 = 0,0054 ou 0,5 p.100
Quel que soit le tirage
p (calculée sur l'échantillon) estime sans biais P la proportion (inconnue) recherchée sur l'univers
équation n°7 - fm32
équation n°8 - fm32
- Exemple 2 (prendre vos résultats du TP1 sur La Courneuve en 1990 et 2000) :
On va prendre les résultats d'une manip' sur les stéréogrammes de Volx en 1960 et 1990
- Quelle est le pourcentage de terrains bâtis à Volx (04) en 1960 ?
À titre d'exemple (d'après un tirage par grille de papier millimétré sur les stéréogrammes avec un pas de 5 mm) :
bâti = 98 points total échantillon = 1 280 pts = m non bâti = 1 182 pts nb de points total possible = (40 *5)* (32 * 5) = 32 000 = M
La proportion de terrains bâtis :
p = 98 /1 280 = 7,7 %
La proportion de terrains non bâtis :
q = (1 - p) = 92,3 %
Soit un taux de sondage de 1 280 / 32 000 = 4 %
- Dans le cas d'un TSR, pour les 32 000 mm2 de l'image considérés comme des points d'enquête potentiels, la vraie proportion "P" de bâtis (qui restera toujours inconnue) est estimée par :
On peut dire qu'en 1960, au risque de 5 p.100, pour la partie centrale du stéréogramme
la vraie proportion P du bâti est de 7,7 p.100 plus ou moins 1,5 p.100
Soit P compris dans l'intervalle [6,2 p.100 ; 9,1 p.100] au risque
= 5 p.100
- On estime sans biais l'effectif :
M * P par M * p
- On estime sans biais la variance de l'effectif :
M2 * V(P) par M2 * v(p)
- Quelle est la surface totale de terrains bâtis à Volx (04) en 1960 ?
M = 32 000 mm2
avec 1 mm = 13,3 m (soit une échelle d'environ 1/13 333,33333...)
donc 1 mm2 = 13,333 * 13,333 = 177,7 m2
M = 32 000 * 177,7 = 5,69 km2
Alors
Sb = M * p = 5,69 * 0,077 = 0,436 km2
donc
On peut dire avec 1 risque d'erreur de 5 % qu'en 1960,
entre 0,35 et 0,52 km2 (sur 5,7 km2 ) de la partie centrale du stéréogramme de Volx était bâtie
Soit 0,436 km2 ± 19% ou 43,6 ha ± 19%
Résultat en rapport avec le nombre de points bâtis et non avec le taux de sondage !
On veut une certaine précision
"e" sur la
valeur moyenne d'un paramètre
pour un seuil de probabilité donné
.
Par exemple :
- une précision e = 10% (c'est-à-dire un intervalle de confiance à 10%)
- avec une probabilité (risque d'erreur)
= 0,05
- On utilise la formule suivante pour déterminer m la taille de l'échantillon :
équation n°9 - fm32 (cf. SCHWARTZ 1990, p. 134)
avec :
estimé sans biais par s2, la variance sur un pré-échantillon ;
l'écart-réduit correspondant au risque
lu dans la table de l'écart-réduit.
=> c'est le t de Student
- Quel est le nombre de points d'enquête nécessaire ?
- Dans le cas de Volx, n'a t-on pas été trop travailleur ?
![]()
- Combien de points de sondage estimez-vous nécessaires ?
tab. 1 - nombre d'échantillons en fonction de la précision e et du risque d'erreur
risque \ précision e = 10% e = 5% e = 1,5% = 0,05
27 109 1207 = 0,10
20 79 876
La détermination du nombre d'unités d'enquête doit donc être estimée par une pré-enquête (pré-inventaire) ou à partir de données d'inventaires réalisés dans des conditions comparables.
|
Communiquez-moi par courrier électronique les réponses aux questions suivantes Question n°3.2.1. Quand m est petit devant M, la différence entre le tirage avec remise (TAR) et le tirage sans remise (TSR) est :
Question n°3.2.2. Le sondage à l'aide d'une grille (tirage systématique) est un :
|
NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.