Différence entre l’écart-type et l’erreur type


Introduction

L'écart-type et l'erreur type sont apparemment des terminologies similaires; toutefois, elles sont conceptuellement si variées qu'elles sont utilisées presque indifféremment dans la littérature statistique. Les deux termes sont généralement précédés d'un symbole plus-moins (+/-) qui indique qu'ils définissent une valeur symétrique ou représentent une plage de valeurs. Invariablement, les deux termes apparaissent avec une moyenne (moyenne) d'un ensemble de valeurs mesurées.

Il est intéressant de noter qu'une SE n' a rien à voir avec les normes, les erreurs ou la communication de données scientifiques.

Un examen détaillé de l'origine et de l'explication du DD et du SE révélera pourquoi les statisticiens professionnels et ceux qui l'utilisent de façon cursive ont tendance à commettre des erreurs.

Écart-type (ED)

Un SD est une statistique descriptive décrivant la propagation d'une distribution. En tant que métrique, elle est utile lorsque les données sont normalement distribuées. Cependant, elle est moins utile lorsque les données sont fortement biaisées ou bimodales parce qu'elle ne décrit pas très bien la forme de la distribution. Généralement, nous utilisons le DD pour présenter les caractéristiques de l'échantillon, car nous avons l'intention de décrire dans quelle mesure les données varient autour de la moyenne. D'autres statistiques utiles pour décrire la diffusion des données sont les intervalles interquartiles, les 25e et 75e percentiles et l'intervalle des données.

Figure 1. SD est une mesure de l'étendue des données. Lorsque les données sont un échantillon d'une distribution normalement distribuée, on s'attend à ce que les deux tiers des données se situent à l'intérieur d'un écart-type de la moyenne.

La variance est aussi une statistique descriptive, définie comme le carré de l'écart-type. Il n'est généralement pas rapporté lors de la description des résultats, mais il s'agit d'une formule plus mathématiquement traçable (alias la somme des écarts carrés) et joue un rôle dans le calcul des statistiques.

Par exemple, si nous avons deux statistiques P & Q avec des variances connues var (P) & var (Q), alors la variance de la somme P+Q est égale à la somme des variances: var (P) +var (Q). Il est maintenant évident pourquoi les statisticiens aiment parler de variances.

Mais les écarts-types ont une signification importante pour l'écart, en particulier lorsque les données sont normalement distribuées: on peut s'attendre à ce que la moyenne de l'intervalle +/- 1 SD capture 2/3 de l'échantillon, et la moyenne de l'intervalle +- 2 SD capture 95 % de l'échantillon.

Le DD donne une indication de la mesure dans laquelle les réponses individuelles à une question varient ou "s'écartent" de la moyenne. Le DD explique au chercheur à quel point les réponses sont dispersées - sont-elles concentrées autour de la moyenne ou dispersées à grande échelle? Est-ce que tous vos répondants ont évalué votre produit au milieu de votre échelle, ou est-ce que certains l'ont approuvé et d'autres l'ont désapprouvé?

Envisagez une expérience où on demande aux répondants d'évaluer un produit sur une série d'attributs sur une échelle de 5 points. La moyenne d'un groupe de dix répondants (étiquetés "A" à "J" ci-dessous) pour un "bon rapport qualité-prix" était de 3,2 avec un SD de 0,4 et la moyenne pour la "fiabilité du produit" était de 3,4 avec un SD de 2,1.

À première vue (en regardant les moyennes seulement), il semblerait que la fiabilité ait été jugée supérieure à la valeur. Toutefois, le niveau de fiabilité plus élevé du DC pourrait indiquer (comme le montre la distribution ci-dessous) que les réponses étaient très polarisées, la plupart des répondants n'ayant aucun problème de fiabilité (cotes de "5" pour l'attribut), mais un segment plus petit, mais important, ayant un problème de fiabilité et une cote de "1" pour l'attribut. Si l'on considère la moyenne seule, elle ne raconte qu'une partie de l'histoire, mais la plupart du temps, c'est sur cela que les chercheurs se concentrent. Il est important de tenir compte de la distribution des réponses et le DD fournit une mesure descriptive utile à cet égard.

Première enquête: Répondants évaluant un produit sur une échelle de 5 points

Deux distributions très différentes des réponses à une échelle de cotation en cinq points peuvent donner la même moyenne. Prenons l'exemple suivant, qui montre les valeurs de réponse pour deux cotes différentes.

Dans le premier exemple (Cotes "A"), SD est nul parce que TOUTES les réponses correspondaient exactement à la valeur moyenne. Les réponses individuelles ne s'écartent pas du tout de la moyenne.

Dans la cote " B ", même si la moyenne du groupe est la même (3,0) que la première distribution, l'écart-type est plus élevée. L'écart-type de 1,15 montre que les réponses individuelles, en moyenne*, se situaient à un peu plus d'un point de la moyenne.

Deuxième enquête: Répondants évaluant un produit sur une échelle de 5 points

Une autre façon d'examiner le développement durable consiste à tracer la distribution sous forme d'histogramme des réponses. Une distribution avec un SD faible s'afficherait comme une

Pour des raisons pratiques, le calcul n'est pas important. La plupart des programmes de tabulation, des tableurs ou d'autres outils de gestion des données calculeront le SD pour vous. Il est plus important de comprendre ce que les statistiques transmettent.

Erreur standard

Une erreur type est une statistique inférentielle qui sert à comparer les moyennes d'un échantillon à l'autre. C'est une mesure de la précision de la moyenne de l'échantillon. La moyenne de l'échantillon est une statistique dérivée de données ayant une distribution sous-jacente. Nous ne pouvons pas le visualiser de la même manière que les données, puisque nous avons réalisé une seule expérience et n'avons qu'une seule valeur. La théorie statistique nous dit que la moyenne de l'échantillon (pour un échantillon "suffisant" et dans quelques conditions de régularité) est approximativement distribuée normalement. L'écart-type de cette distribution normale est ce que nous appelons l'écart-type.

Figure 2. La distribution du bas représente la distribution des données, tandis que celle du haut représente la distribution théorique de la moyenne de l'échantillon. Le SD de 20 est une mesure de la propagation des données, tandis que le SE de 5 est une mesure de l'incertitude autour de la moyenne de l'échantillon.

Lorsque nous voulons comparer les moyennes des résultats d'une expérience à deux échantillons du traitement A par rapport à ceux d'une expérience à deux échantillons. Traitement B, nous devons estimer la précision avec laquelle nous avons mesuré les moyennes.

En fait, nous nous intéressons à la précision avec laquelle nous avons mesuré la différence entre les deux moyens. Nous appelons cette mesure l'erreur type de la différence. Vous ne serez peut-être pas surpris d'apprendre que l'erreur type de la différence dans les moyennes d'échantillon est fonction des erreurs types des moyennes:

Maintenant que vous avez compris que l'erreur type de la moyenne (SE) et l'écart-type de la distribution (SD) sont deux bêtes différentes, vous vous demandez peut-être comment elles ont été confondues au départ. Bien qu'ils diffèrent sur le plan conceptuel, ils ont une relation simple d'un point de vue mathématique:

où n est le nombre de points de données.

Notez que l'erreur type dépend de deux composantes: l'écart-type de l'échantillon et la taille de l'échantillon n. Cela a un sens intuitif: plus l'écart-type de l'échantillon est grand, moins nous pouvons être précis sur notre estimation de la vraie moyenne.

En outre, plus l'échantillon est grand, plus nous disposons d'informations sur la population et plus nous pouvons estimer avec précision la vraie moyenne.

L'ES est une indication de la fiabilité de la moyenne. Une petite SE est une indication que la moyenne de l'échantillon reflète plus fidèlement la moyenne réelle de la population. Une taille d'échantillon plus grande se traduira normalement par un SE plus petit (alors que le SD n'est pas directement affecté par la taille de l'échantillon).

La plupart des recherches par sondage consistent à prélever un échantillon d'une population. Nous faisons ensuite des inférences sur la population à partir des résultats obtenus à partir de cet échantillon. Si un deuxième échantillon a été prélevé, les résultats ne correspondront probablement pas exactement au premier échantillon. Si la valeur moyenne d'un attribut de notation était de 3,2 pour un échantillon, elle pourrait être de 3,4 pour un deuxième échantillon de même taille. Si nous devions prélever un nombre infini d'échantillons (de taille égale) de notre population, nous pourrions afficher les moyennes observées sous forme de distribution. Nous pourrions alors calculer une moyenne de toutes les moyennes de notre échantillon. Cette moyenne serait égale à la moyenne réelle de la population. Nous pouvons également calculer le SD de la distribution des moyens d'échantillonnage. Le SD de cette distribution des moyens d'échantillonnage est l'SE de chaque moyenne d'échantillon individuelle.

Nous avons donc notre observation la plus significative: SE est le SD de la moyenne de population.

Tableau illustrant la relation entre SD et SE

Il est maintenant clair que si le SD de cette distribution nous aide à comprendre à quel point une moyenne d'échantillon est éloignée de la moyenne réelle de la population, alors nous pouvons l'utiliser pour comprendre à quel point une moyenne d'échantillon individuelle est exacte par rapport à la vraie moyenne. C'est l'essence même de l'ES.

En réalité, nous n'avons prélevé qu'un seul échantillon de notre population, mais nous pouvons utiliser ce résultat pour fournir une estimation de la fiabilité de la moyenne de notre échantillon observé.

En fait, l'ES nous indique que nous pouvons être assurés à 95 % que la moyenne de notre échantillon observé est d'environ 2 erreurs types (1,96) de plus ou moins par rapport à la moyenne de la population.

Le tableau ci-dessous montre la distribution des réponses de notre premier (et unique) échantillon utilisé pour notre recherche. L'ES de 0,13, étant relativement faible, nous donne une indication que notre moyenne est relativement proche de la moyenne réelle de l'ensemble de notre population. La marge d'erreur (à un niveau de confiance de 95 %) pour notre moyenne est (en gros) deux fois cette valeur (+/- 0,26), ce qui nous indique que la vraie moyenne se situe très probablement entre 2,94 et 3,46.

Les idées Clis #P

Une question ? Nous avons oublié quelque chose ? n'hésitez pas à participer aux commentaires. Nous compléterons cet article avec plaisir.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *