SURISTATLe portail des enquêtes en ligne et de l'analyse de donnéesSuristat
 Suri qui ? MéthodologieMédiaRessources
Site en français
English website
 
 Espaces dédiés
Bloqué(e) dans le cadre d'une de vos études ou de vos recherches ? Besoin de vous rafraîchir la mémoire ou de vous perfectionner ?
L'information ou l'outil dont vous avez besoin est sans doute sur Suristat !
 
IdentifiantMot de passe 
Accueil > Méthodologie > Collecter > L'échantillonnage > Estimation statistique et intervalle de confiance : la loi des grands nombresS'inscrire

Estimation statistique et intervalle de confiance : la loi des grands nombres

La loi des grands nombres exprime le fait que, lorsqu’on extrait au hasard des éléments d’un ensemble, plus le nombre d’éléments sélectionnés est grand, plus on s’approche de la composition de l’ensemble dont il est extrait.
Cette propriété formalisée par les mathématiciens Bernouilli et Tchebytchev est à l’origine de la théorie des sondages.
Lorsque le sondage est aléatoire (tous les individus de la population ont la même chance de faire partie de l’échantillon) cette théorie permet d’énoncer les règles suivantes.

  1. Il est possible de connaître les caractéristiques de la population à partir de celles de l’échantillon.
  2. Cette connaissance est une estimation : l’information exacte (% ou moyenne) calculée dans l’échantillon, permet de déterminer la fourchette, ou intervalle de confiance dans lequel se situe la valeur correspondante pour la population totale. Le risque d’erreur de l’estimation peut être contrôlé. Moins on souhaite prendre de risque, plus l’intervalle sera large et  l’estimation imprécise.
  3. Pour un niveau de risque donné, l’imprécision de l’estimation dépend de la taille de l’échantillon et de la proportion, ou de l’écart type observés dans l’échantillon. La précision croît donc avec l’augmentation de la taille de l’échantillon. Les grands échantillons sont préférables aux petits, mais l’effet de l’accroissement de l’échantillon est de moins en moins sensible. Pour les % l’imprécision est maximum lorsque le caractère étudié est équi réparti (50%).
  4. Enfin contrairement à une idée fausse assez répandue, la précision ne dépend pas du taux de sondage. Par exemple l’intervalle de confiance pour un échantillon de 200 personnes est le même que le sondage porte sur la population parisienne, la population française ou la population des Etats unis. Cette règle comporte néanmoins un cas particulier : le cas de l'échantillon exhaustif.

L’intervalle de confiance ne dépend en effet que de la proportion p observée et de la taille n de l’échantillon :
Intervalle de confiance : [p-1,96*racine(p*(1-p)/n), p 1,96*racine(p*(1-p)/n)]. Le facteur multiplicateur 1,96 correspond à l’acceptation d’un risque d’erreur de 5%.

Une animation en flash, très pédagogique est disponible, pour illustrer ce principe.

 
simulation flash
Sphinx Version 5.1
Télécharger gratuitement une version d'évaluation du logiciel Sphinx.

>> Télécharger Sphinx
>> Exemples d'enquêtes
Suristat Le portail des enquêtes et de l'analyse de données· © 2007
Tous droits réservés. Pix-m.com
Mentions légales | Contact | Webmestre