Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.7 - Dernière mise à jour : 18/01/2008

 

Fiche Mémo n°3.2. du cours d'enquête :

Quelques estimations courantes

Applications pratiques

 

1. Estimation d'une moyenne

Quel que soit le tirage

(calculée sur l'échantillon) estime sans biais la moyenne (inconnue) recherchée sur l'univers

 

a) TAR = tirage avec remise (indépendant*)

équation n°1 - fm32

b) TSR = tirage sans remise (exhaustif*)

équation n°2 - fm32

- Exemple 1 (suite de celui de la fm31) :

- Quelle est la distance moyenne parcourue par les habitants de la ville de Trifouillis (20 000 hab.) pendant le week-end de la Toussaint pour acheter des chrysanthèmes et se rendre au cimetière ?

Téléchargement de la feuille de calcul : efm32ta1.xls onglet Exemple1

Ce fichier est au format Excel98 (.xls) et "pèse" 97 ko..

On en sonde 900 d'entre eux :

- la distance moyenne est de 120 km ;

- la variabilité, connue par l'écart type (s) est de 5 km.

- Pour un tirage avec remise TAR, au risque de se tromper dans seulement 5 % des cas ( = 0,05) :

- 2 * < < + 2 *

120 - 2 * < < 120 + 2 *

120 - 2 * (5 / 30) < < 120 + 2 * (5 / 30)

120 - 2 * 0,1667 < < 120 + 2 * 0,1667

119,6666 < < 120,3334

- Pour un tirage sans remise TSR, au risque de se tromper dans seulement 5 % des cas ( = 0,05) :

- 2 * < < + 2 *

120 - 2 * < < 120 + 2 *

120 - 2 * < < 120 + 2 *

120 - 2 * 0,1629 < < 120 + 2 * 0,1629

119,6742 < < 120,3257

- L'écart entre les deux modes de tirage est de (TSR - TAR) :

0,3334 - 0,3257 = 0,0077 en faveur du TSR

soit 7,7 m !!!

 

En pratique, on tire toujours sans remise

=> la précision est meilleure

Mais plus m est petit devant M

=> m <<<<<< M

moins la différence entre le TSR et le TAR est forte

 

2. Estimation d'une somme

Pour passer de la moyenne sur l'échantillon à l'estimation de la population totale

Par exemple pour passer du salaire moyen par ouvrier au "salaire total" de l'entreprise

- On estime sans biais la somme

équation n°3 - fm32

par

équation n°4 - fm32

où :

- M est le nombre total d'habitants ;

- est la distance moyenne calculée sur l'échantillon.

 

- On estime sans biais la variance de cette somme

équation n°5 - fm32

par

équation n°6 - fm32

- Exemple 1b (suite) :

- Quelle est la distance totale parcourue par les habitants de la ville de Trifouillis (20 000 hab.) pendant le week-end de la Toussaint pour acheter des chrysanthèmes et se rendre au cimetière ?

- Dans le cas d'un TAR, pour les 20 000 habitants de Trifouillis, la distance totale parcourue (DT) est de :

DT = M * = 20 000 * 120 = 2 400 000 km

L'intervalle de confiance est de :

DT +/- 2 * = 2 400 000 +/- 2 * (20 000^2)^(1/2) * 0,1667 = 2 400 000 +/- 6 668 km

Au risque de se tromper pour 5 p.100 des tirages, les Trifouillois parcourent

=> 2,4 millions de km à 0,6 % près pour la Toussaint

- Dans le cas d'un TSR, pour les 20 000 habitants de Trifouillis, la distance totale parcourue (DT) est de :

DT = M * = 20 000 * 120 = 2 400 000 km

L'intervalle de confiance est de :

DT +/- 2 * = 2 400 000 +/- 2 * (20 000^2)^(1/2) * 0,1629 = 2 400 000 +/- 6 516 km

Au risque de se tromper pour 5 p.100 des tirages, les Trifouillois parcourent

=> 2,4 millions de km à 0,5 % près pour la Toussaint

 

- La précision relative (Pr) de 0,5 ou 0,6 p.100 se calcule comme suit

TAR => Pr = 2 * / = 6 668 / 2 400 000 = 0,0056ou 0,6 p.100

TSR => Pr = 2 * / = 6 516 / 2 400 000 = 0,0054 ou 0,5 p.100

 

3. Estimation d'une proportion P

Quel que soit le tirage

p (calculée sur l'échantillon) estime sans biais P la proportion (inconnue) recherchée sur l'univers

a) TAR = tirage avec remise (indépendant*)

équation n°7 - fm32

b) TSR = tirage sans remise (exhaustif*)

équation n°8 - fm32

- Exemple 2 (prendre vos résultats du TP1 sur La Courneuve en 1990 et 2000) :

On va prendre les résultats d'une manip' sur les stéréogrammes de Volx en 1960 et 1990

- Quelle est le pourcentage de terrains bâtis à Volx (04) en 1960 ?

À titre d'exemple (d'après un tirage par grille de papier millimétré sur les stéréogrammes avec un pas de 5 mm) :

bâti = 98 points

total échantillon = 1 280 pts = m

non bâti = 1 182 pts

nb de points total possible = (40 *5)* (32 * 5) = 32 000 = M

La proportion de terrains bâtis :

p = 98 /1 280 = 7,7 %

La proportion de terrains non bâtis :

q = (1 - p) = 92,3 %

Soit un taux de sondage de 1 280 / 32 000 = 4 %

- Dans le cas d'un TSR, pour les 32 000 mm2 de l'image considérés comme des points d'enquête potentiels, la vraie proportion "P" de bâtis (qui restera toujours inconnue) est estimée par :

On peut dire qu'en 1960, au risque de 5 p.100, pour la partie centrale du stéréogramme

la vraie proportion P du bâti est de 7,7 p.100 plus ou moins 1,5 p.100

Soit P compris dans l'intervalle [6,2 p.100 ; 9,1 p.100] au risque = 5 p.100

 

4. Estimation d'un effectif

- On estime sans biais l'effectif :

M * P par M * p

- On estime sans biais la variance de l'effectif :

M2 * V(P) par M2 * v(p)

- Exemple 2 (suite) :

- Quelle est la surface totale de terrains bâtis à Volx (04) en 1960 ?

M = 32 000 mm2

avec 1 mm = 13,3 m (soit une échelle d'environ 1/13 333,33333...)

donc 1 mm2 = 13,333 * 13,333 = 177,7 m2

M = 32 000 * 177,7 = 5,69 km2

Alors

Sb = M * p = 5,69 * 0,077 = 0,436 km2

donc

On peut dire avec 1 risque d'erreur de 5 % qu'en 1960,

entre 0,35 et 0,52 km2 (sur 5,7 km2 ) de la partie centrale du stéréogramme de Volx était bâtie

Soit 0,436 km2 ± 19% ou 43,6 ha ± 19%

Résultat en rapport avec le nombre de points bâtis et non avec le taux de sondage !

 

5. Nombre d'unités de sondage

On veut une certaine précision "e" sur la valeur moyenne d'un paramètre pour un seuil de probabilité donné .

Par exemple :

- une précision e = 10% (c'est-à-dire un intervalle de confiance à 10%)

- avec une probabilité (risque d'erreur) = 0,05

- On utilise la formule suivante pour déterminer m la taille de l'échantillon :

équation n°9 - fm32 (cf. SCHWARTZ 1990, p. 134)

avec :

estimé sans biais par s2, la variance sur un pré-échantillon ;

l'écart-réduit correspondant au risque lu dans la table de l'écart-réduit.

=> c'est le t de Student

- Exemple 2 (suite ter) :

- Quel est le nombre de points d'enquête nécessaire ?

- Dans le cas de Volx, n'a t-on pas été trop travailleur ?

- Combien de points de sondage estimez-vous nécessaires ?

tab. 1 - nombre d'échantillons en fonction de la précision e et du risque d'erreur

risque \ précision

e = 10%

e = 5%

e = 1,5%

= 0,05

27

109

1207

= 0,10

20

79

876

 

La détermination du nombre d'unités d'enquête doit donc être estimée par une pré-enquête (pré-inventaire) ou à partir de données d'inventaires réalisés dans des conditions comparables.

 

6. Test de compréhension

Communiquez-moi par courrier électronique les réponses aux questions suivantes

Question n°3.2.1. Quand m est petit devant M, la différence entre le tirage avec remise (TAR) et le tirage sans remise (TSR) est :

a) forte

b) faible

Question n°3.2.2. Le sondage à l'aide d'une grille (tirage systématique) est un :

a) tirage avec remise (TAR)

b) tirage sans remise (TSR)

Précisez à la rubrique objet :

EC enquête

puis dans le corps du message vos

n° d'étudiant, nom et prénom

puis vos

réponses

vgodard@univ-paris8.fr

 

 

Retour au début de la fiche Mémo

 

Fiche Mémo suivante

 

NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.