Assistance scolaire personnalisée

un partenariat rue des écoles Maif
Lundi 22 décembre 2014. Bonjour S'inscrire gratuitement       > Se connecter
icone FicheFiche
ExercicesExercices
Icône de rechercheRechercher

Mesures de dispersion d'une série statistique

Une étude statistique se déroule normalement de la manière suivante :
1. classement des données en un tableau : c'est le tableau de la série statistique ;
2. représentation graphique de cette série ;
3. caractérisation de la série à l'aide de paramètres, afin, par exemple, de la comparer à d'autres séries statistiques.
Deux paramètres dits de position (la moyenne et la médiane) ont déjà été étudiés dans les classes antérieures. Sont définis ici des paramètres dits de dispersion : les quartiles, la variance, l'écart type et l'intervalle interquartile, ainsi qu'un nouveau type de représentation graphique, le diagramme en boîte, qui permet de comparer rapidement deux séries.
1. Comment calculer une variance et un écart type ?
Soit la série statistique de taille n suivante :
X
x1
x2

xp
 
Effectif
n1
n2

np
n

On remarque que n_1 + n_2 + ... + n_p = n .
On rappelle que la moyenne de X est le nombre :
\overline X = \frac{1}{n}\left( {n_1 x_1 + n_2 x_2 + ... + n_p x_p } \right).
• On appelle variance de la série statistique X le nombre :
V\left( X \right) = \frac{1}{n}\left( {n_1 \left( {x_1 - \overline X } \right)^2 + n_2 \left( {x_2 - \overline X } \right)^2 + .... + n_p \left( {x_p - \overline X } \right)^2 } \right).
Ce que l'on écrit de manière plus compacte : V\left( X \right) = \frac{1}{n}\sum\limits_{i = 1}^p {n_i \left( {x_i - \overline X } \right)^2 }.
• L'écart type de X est le nombre : s \left( X \right) = \sqrt {V\left( X \right)}.
Remarques
• La variance et l'écart type mesurent la façon dont les valeurs de X se dispersent autour de la moyenne. Ce sont des paramètres de dispersion (alors que la moyenne et la médiane sont des paramètres de position, ils précisent vers quelles valeurs se situe la série).
• On peut aussi calculer la variance à l'aide de la formule suivante :
V\left( X \right) = \frac{1}{n}\left( {n_1 x_1 ^2 + n_2 x_2 ^2 + ... + n_p x_p ^2 } \right) - \overline X ^2 = \frac{1}{n}\sum\limits_{i = 1}^p {n_i } x_i ^2 - \overline X ^2.
• Dans le cas où les valeurs de la variable sont réparties par classes, on remplace dans les formules xi par le centre de l'intervalle.
Exercice n°1Exercice n°2
2. Comment calculer la médiane d'une série statistique ?
La médiane me est le nombre qui sépare la série ordonnée en deux groupes de même effectif.
Pour la déterminer, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elle répétée autant de fois que son effectif.
Si l'effectif total n est un nombre impair, la médiane est le terme de rang \frac{{n + 1}}{2}.
Si l'effectif total n est un nombre pair, la médiane est le centre de l'intervalle formé par les termes de rang \frac{n}{2} et \frac{n}{2} + 1.
Remarque
Quand la série est regroupée par classes, on détermine la médiane graphiquement à partir de la courbe des effectifs cumulés ou des fréquences cumulées.
Exercice n°3Exercice n°4
3. Comment déterminer les quartiles d'une série statistique ?
• Soit une série statistique X de taille n.
Le premier quartile Q1 est la plus petite valeur de la série telle qu'au moins 25 % des données soient inférieures ou égales à Q1.
Le troisième quartile Q3 est la plus petite valeur de la série telle qu'au moins 75 % des données soient inférieures ou égales à Q3.
L'intervalle interquartile est l'intervalle \left[ {Q_1~;~Q_3 } \right].
Le nombre I = Q_3 - Q_1 s'appelle l'interquartile.
• Pour déterminer les quartiles Q1 et Q3, on procède un peu de la même façon que pour la médiane. On dresse la liste de toutes les valeurs de la série par ordre croissant, chaque valeur étant répétée autant de fois que son effectif.
Si \frac{n}{4} est un entier p, Q1 est le terme de rang p et Q3 est le terme de rang 3p ;
Si \frac{n}{4} n'est pas un entier, Q1 est le terme de rang immédiatement supérieur à \frac{n}{4} et Q3 est le terme de rang immédiatement supérieur à 3\frac{n}{4}.
Remarque
Comme dans le cas de la médiane, lorsque la série est regroupée par classes, on détermine les quartiles graphiquement à partir de la courbe des effectifs ou des fréquences cumulés.
Exercice n°5
4. Comment se transforment les paramètres d'une série lors d'un changement affine ?
Soit la série statistique de taille n suivante :
X
x1
x2

xp
 
Effectif
n1
n2

np
n

On considère la série statistique Y = aX + b. C'est-à-dire la série :
Y
y1
y2

yp
 
Effectif
n1
n2

np
n

y_i = ax_i + b.
• En reprenant les notations précédentes, on a :
\overline Y = a\overline X + b, {V}\left( Y \right) = a^2 {V}\left( X \right) et {s}\left( Y \right) = \left| a \right| {s}\left( X \right).
• Si m_e ,Q_1 ,Q_2 sont respectivement la médiane, le 1er quartile et le 3e quartile de X et, si m_e ',Q_1 ',Q_2 ' sont respectivement la médiane, le 1er quartile et le 3e quartile de Y, alors on a :
m_e ' = am_e + b.
Et, si a > 0, alors Q_1 ' = aQ_1 + b et Q_3 ' = aQ_3 + b.
Mais, si a < 0, alors Q_1 ' = aQ_3 + b et Q_3 ' = aQ_1 + b.
Exercice n°6Exercice n°7
5. Comment tracer un diagramme en boîte ?
On construit un diagramme en boîte de la façon suivante :
  • sur un axe vertical ou horizontal, on repère les valeurs de la série statistique ;
  • on place le minimum et le maximum de la série, le 1er quartile, le 3e quartile et la médiane ;
  • on construit le rectangle (la boîte) parallèle à l'axe, de longueur l'interquartile et de largeur arbitraire.
Ce diagramme en boîte est aussi appelé diagramme à moustaches ou diagramme à pattes.
Exemple
Soit une variable statistique X dont le maximum est 55, le minimum 20, la médiane 38, le 1er quartile 32,5 et le 3e quartile 45. On construit alors le diagramme en boîte suivant :
À retenir absolument
Soit X une série statistique.
• La variance de X est {V}\left( X \right) = \frac{1}{n}\sum\limits_{i = 1}^p {n_i \left( {x_i - \overline X } \right)^2 = \frac{1}{n}\sum\limits_{i = 1}^p {n_i } x_i ^2 - \overline X ^2 }.
• L'écart type de X est le nombre {s}\left( X \right) = \sqrt {{V}\left( X \right)}.
• Le premier quartile de X, Q1, est la plus petite valeur de la série telle qu'au moins 25 % des données soient inférieures ou égales à Q1.
• Le troisième quartile de X, Q3, est la plus petite valeur de la série telle qu'au moins 75 % des données soient inférieures ou égales à Q3.
• L'intervalle interquartile est l'intervalle \left[ {Q_1~;~Q_3 } \right].
© rue des écoles. Tous droits réservés.
Partager
Partager sur Tweeter