Moyenne, médiane, classe modale et dispersion d'une série statistique

Une étude statistique comprend en général les étapes suivantes :
1. on précise les questions auxquelles on veut répondre ;
2. on procède à une enquête, on collecte les données ;
3. on présente ces données dans un tableau ;
4. on représente cette série statistique à l'aide d'un diagramme ;
5. intervient enfin le mathématicien qui procède au calcul de paramètres permettant de caractériser toute la série statistique à l'aide de quelques nombres.
1. Comment établir le tableau d'une série statistique ?
• En statistique, on appelle population l'ensemble sur lequel on travaille.
Dans cette population, on étudie un caractère que l'on appelle variable statistique. On étudie principalement des variables quantitatives, c'est-à-dire des variables qui prennent des valeurs numériques.
• La variable quantitative peut être :
– soit discrète, quand elle prend un nombre fini de valeurs ;
– soit continue, quand elle prend toute valeur comprise entre deux nombres donnés.
Quand la variable statistique X est discrète, on compte, pour chaque valeur de X, le nombre d'individus prenant cette valeur ; c'est l'effectif de la valeur. On aboutit à un tableau du type :
Valeur de X
x_1
x_2
...
x_p
Effectif
n_1
n_2
...
n_p

Quand la variable statistique X est continue, on regroupe les valeurs en classes.
Les classes sont des intervalles semi-ouverts \left[ {x_i,\; x_{i + 1}} \right[. Leur amplitude est le nombre : x_{i + 1} - x_i et leur centre, le nombre : \frac{{x_{i + 1} + x_i }}{2}.
Pour chaque classe, on compte le nombre d'individus qui prennent une valeur supérieure ou égale à x_i et inférieure à x_{i + 1} : c'est l'effectif de la classe. On aboutit à un tableau du type :
Valeur de X
\left[ {x_1,\; x_2} \right[
\left[ {x_2,\; x_3} \right[
...
\left[ {x_p,\; x_{p + 1}} \right[
Effectif
n_1
n_2
...
n_p

Remarques
• Quand le nombre de valeurs prises par la variable statistique est trop grand, on traite la variable discrète comme une variable continue.
• Quand on regroupe les valeurs par classes, on essaye d'avoir des classes de même amplitude et pas trop nombreuses. Mais, souvent, les valeurs extrêmes posent problème, c'est pourquoi les premières ou dernières classes sont soit ouvertes, soit d'amplitude différente des autres classes.
Exercice n°1
2. Comment représenter une série statistique ?
• Pour représenter une variable statistique discrète, on utilise un diagramme en bâtons (chaque bâton a une hauteur proportionnelle à l'effectif et/ou à la fréquence) ou un diagramme circulaire (chaque secteur est proportionnel à l'effectif et/ou à la fréquence).
Par exemple, la répartition sociologique de 60 étudiants est la suivante : 8 ouvriers ; 23 cadres ; 15 professions libérales ; 11 enseignants et 3 autres.
Pour représenter cette série par un diagramme circulaire, on calcule pour chaque secteur l'angle au centre. Pour le secteur « ouvriers », l'angle au centre est de (360 \div 60) \times 8 = 48, soit 48°.
On procède de même pour les autres secteurs et on obtient le diagramme suivant :
Moyenne, médiane, classe modale et dispersion d'une série statistique - illustration 1
• Pour représenter une variable statistique continue, on trace un histogramme. L'histogramme est constitué de rectangles juxtaposés dont la surface est proportionnelle à l'effectif de la classe correspondante.
Si les classes ont des amplitudes égales, la hauteur des rectangles est proportionnelle à l'effectif. Si les classes ont des amplitudes inégales, on représente la classe ayant la plus petite amplitude ; puis on compense une amplitude k fois plus grande par une hauteur k fois plus petite.
Exercice n°2Exercice n°3
3. Comment calculer une moyenne ?
• Quand la série statistique est discrète, de taille n, on peut la représenter sous forme d'un tableau du type :
Valeur de X
x_1
x_2
...
x_p
 
Effectif
n_1
n_2
...
n_p
n

n_{1} + n_{2} + \ldots + n_{p} = n.
On appelle moyenne de X le nombre :
\overline X = \frac{1}{n}\left( {n_{1} x_{1} + n_{2} x_{2} + \ldots + n_{p} x_{p}} \right).
• Quand la série statistique est continue, de taille n, on a un tableau du type :
Valeur de X
\left[ {x_1,\; x_2} \right[
\left[ {x_2,\; x_3} \right[
...
\left[ {x_p,\; x_{p + 1}} \right[
 
Effectif
n_1
n_2
...
n_p
n

Pour calculer la moyenne d'une telle série, on utilise la formule précédente en remplaçant x_i par le centre c_i de l'intervalle \left[ {x_i,\; x_{i+1}}\right[.
La moyenne de X est alors le nombre :
\overline X = \frac{1}{n}\left( {n_1 c_1 + n_2 c_2 + \ldots + n_p c_p} \right), où c_i = \frac{{x_{i + 1} + x_i }}{2}.
Exercice n°4Exercice n°5
4. Comment utiliser les propriétés de la moyenne ?
Lorsque l'on modifie les valeurs d'une série statistique par des opérations simples, il n'est pas toujours nécessaire de recommencer le calcul de la moyenne.
On utilise les propriétés suivantes :
– si \overline X est la moyenne des nombres x_1,\; x_2,\; \ldots,\; x_n et \overline Y celle des nombres y_1,\; y_2,\; \ldots,\; y_n, alors la moyenne des nombres x_1 + y_1,\; x_2 + y_2,\; \ldots,\; x_n + y_n est \overline {X + Y} ;
– si k est un réel quelconque et \overline X la moyenne des nombres x_1,\; x_2,\; \ldots,\; x_n, alors la moyenne des nombres k + x_1,\; k + x_2,\; \ldots,\; k + x_n est k + \overline X ;
– si λest un réel quelconque et \overline X la moyenne des nombres x_1,\; x_2,\; \ldots,\; x_n, alors la moyenne des nombres \lambda x_1,\; \lambda x_2,\; \ldots,\; \lambda x_n est \lambda \overline X.
Exercice n°6
5. Comment calculer une médiane ?
• La médiane est le nombre qui sépare la série ordonnée en valeurs croissantes en deux groupes de même effectif.
Pour la trouver, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elles étant répétée autant de fois que son effectif.
On distingue ensuite deux cas :
– si l'effectif total n est un nombre impair, la médiane est le terme de rang \frac{{n + 1}}{2}
– si l'effectif total n est un nombre pair, la médiane est le centre de l'intervalle formé par les termes de rang \frac{n}{2} et \frac{n}{2} + 1
• Quand la série est regroupée par classes, on détermine la médiane graphiquement à partir du polygone des effectifs ou des fréquences cumulés.
On calcule pour chaque classe \left[ {x_i,\; x_{i + 1}} \right[ l'effectif cumulé croissant N_i, c'est-à-dire le nombre d'individus qui prennent une valeur inférieure à x_{i + 1}. On place ensuite dans un repère les points \left( {x_{i + 1},\; N_i } \right), on obtient ainsi le polygone des effectifs cumulés croissants.
La médiane est l'abscisse du point dont l'ordonnée est \frac{n}{2}.
Exercice n°7
6. Quels autres paramètres peut-on calculer ?
Les mathématiciens disent parfois qu'il existe autant de paramètres statistiques que de statisticiens. Sans aller jusque-là, on peut donner ou calculer, outre la moyenne et la médiane, les paramètres suivants :
– les valeurs extrêmes, c'est-à-dire la plus grande valeur X_{max} et la plus petite valeur X_{min} atteintes par la série ;
– l'étendue, c'est-à-dire la différence entre la plus grande et la plus petite valeur prises par la variable, soit X_{max} - X_{min} ;
– le mode (ou la classe modale), c'est-à-dire la valeur (ou la classe) ayant le plus grand effectif ;
– le premier quartile Q1, qui est la valeur de la variable au-dessous de laquelle on trouve le quart de l'effectif. Si la série est discrète, c'est la valeur de la variable dont le rang est égal ou immédiatement supérieur au quart de l'effectif. Si la série est continue, on lit la valeur correspondant à 25 % de l'effectif sur le polygone des fréquences ou des effectifs cumulés. On peut calculer une valeur plus précise par interpolation linéaire.
– le troisième quartile Q3, qui est la valeur de la variable au-dessous de laquelle on trouve les trois-quarts de l'effectif. Si la variable est discrète, c'est la valeur de la variable dont le rang est égal ou immédiatement supérieur aux trois-quarts de l'effectif. Si la série est continue, on lit la valeur correspondant à 75 % de l'effectif sur le polygone des fréquences ou des effectifs cumulés. On peut aussi calculer une valeur plus précise par interpolation linéaire.
– l'intervalle interquartile, qui est égal à la différence Q3 − Q1.
Exemple :
Le tableau indique la répartition des logements d'une ville en fonction du nombre de pièces.
Nombre de pièces xi
1
2
3
4
5
6
7
Pourcentages ni
10
15
20
30
12
8
5
Pourcentages cumulés croissants
10
10 + 15 = 25
25 + 20 = 45
45 + 30 = 75
87
95
100
Pourcentages cumulés décroissants
100
100 − 10 = 90
90 − 15 = 75
75 − 20 = 55
25
13
5

Mode = 4.
Médiane = 3,5.
Q1 = 2 car 25 % des logements ont deux pièces ou moins.
Q3 = 4 car 75 % des logements ont quatre pièces ou moins, c'est à dire que 25 % ont cinq pièces ou plus.
Remarque
Un paramètre quel qu'il soit n'a guère de sens en lui-même. Les enseignements que l'on peut tirer d'une série statistique proviennent plus souvent de la comparaison des paramètres entre eux.
Exercice n°8Exercice n°9Exercice n°10
À retenir
• La moyenne de X est le nombre : \overline X = \frac{1}{n}\left( {n_1 x_1 + n_2 x_2 + \ldots + n_p x_p } \right).
• La médiane est le nombre qui sépare la série en deux groupes de même effectif.
• Au-dessous du premier quartile on trouve le quart de l'effectif, au-dessous du troisième quartile on trouve les trois-quarts de l'effectif.
Cochez la bonne réponse.
Archibald, le fermier, pour mieux planifier son élevage de gallinacés, étudie le nombre X d'années d'ancienneté de ses meilleures pondeuses. Il obtient pour ses 60 poules les données brutes suivantes :
1,2
2,3
2,5
3,1
4,2
5,5
6,2
6,2
1,5
4,1
4,5
1,5
4,5
3,5
2,1
1,4
6,2
7,5
8,5
4,7
1,8
2,5
2,7
7,3
5,4
4,1
3,9
1,5
4,2
8,4
6,2
6,3
1,2
4,2
3,5
3
1,9
2,5
2,4
4,8
1,7
5,4
4,4
6,5
7,2
2,5
3
6,3
5,6
3
7
2,1
2
1,4
1,9
7,7
8,8
8
1,5
2,3

Il décide de traiter X comme une variable aléatoire continue et de regrouper les valeurs par classes d'amplitude 1,5.
L'effectif de la classe [1,5 ; 3[ est :
Cochez la bonne réponse.
20
19
26
Il faut compter le nombre de fois où X prend une valeur supérieure ou égale à 1,5 et inférieure à 3.
3 + 2 + 4 + 3 + 2 + 5 = 19 (en comptant ligne par ligne).
Voici un tableau indiquant la répartition des 1 600 salariés d'une entreprise en fonction de leur temps de transport.
Nombre d'heures xi
De 0 à 0,5
De 0,5 à 1
De 1 à 1,5
De 1,5 à 2
Effectifs ni
200
310
480
610
Effectifs cumulés croissants
200
510
990
1 600
Utilisez le polygone des effectifs cumulés croissants pour déterminer l'affirmation fausse.
Moyenne, médiane, classe modale et dispersion d'une série statistique - illustration 4
Cochez la bonne réponse.
Le quart des salariés vient en moins de 50 min.
La moitié des salariés vient en moins de 1 h 20 min.
Les trois-quarts des salariés viennent en moins de 1 h 30 min.
• Le troisième quartile correspond aux trois-quarts de l'effectif.
1\,600\,\times\,\frac{3}{4}\,=\,1\,200.
Le point du polygone des effectifs cumulés croissants d'ordonnée 1 200 a pour abscisse environ 1,67.
1,67 × 60 = 100,2, soit environ 1 h 40 min.
C'est donc au-dessous de 1 h 40 min qu'on trouve les trois quarts de l'effectif.
Comme la durée de 1 h 30 min est inférieure, l'affirmation est fausse.
• Le calcul par interpolation linéaire permet d'obtenir plus précisément :
1,5\,+\,\frac{1\,200\,-\,990}{610}\,\times\,0,5\,\approx\,1,672. 0,672\,\times\,60\,=\,40,32.
0,32\,\times\,60\,\approx\,19.
Soit 1 h 40 min 19 s.
Moyenne, médiane, classe modale et dispersion d'une série statistique - illustration 5
Cochez la bonne réponse.
X est le nombre de retards pour le premier trimestre sur une population de 2000 lycéens :
X
0
1
2
3
4
 
Effectif
240
620
520
360
260
2 000

On représente cette série par un diagramme en bâtons. L'échelle sur l'axe des ordonnées est 1,5 cm pour 100 lycéens. Le bâton correspondant à la valeur 1 mesure :
Cochez la bonne réponse.
4,13 cm
6,2 cm
9,3 cm
On a le tableau de proportionnalité suivant :
1,5
100
x
620

D'où : x = \frac{{620 \times 1,5}}{{100}} = 9,3 soit 9,3 cm.
Voici le diagramme en bâtons qu'on obtient :
Moyenne, médiane, classe modale et dispersion d'une série statistique - illustration 2
Cochez la bonne réponse.
Archibald, le fermier, décide ce dimanche matin d'étudier le poids X de ses œufs. Pour les 100 œufs de sa récolte dominicale, il obtient :
X : poids en g
[0 ; 40[
[40 ; 60[
[60 ; 70[
[70 ; 80[
[80 ; 100[
Effectif
10
15
20
35
20

Pour tracer l'histogramme des effectifs, il choisit pour échelle sur l'axe des abscisses : 1 cm pour 10 g.
Le rectangle de la classe [60 ; 70[ a pour hauteur 4 cm ; celui de la classe [40 ; 60[ a pour hauteur :
Cochez la bonne réponse.
1,5 cm
3 cm
6 cm
Attention, les classes n'ont pas la même amplitude.
Avec la même échelle sur l'axe des ordonnées que pour la classe [60 ; 70[ (2 cm pour 10 œufs), le rectangle de la classe [40 ; 60[ devrait avoir pour hauteur 3 cm.
Mais comme la classe [40 ; 60[ est d'amplitude deux fois plus grande (et est donc représentée par un rectangle de 2 cm de large), on compense par une hauteur deux fois plus petite, d'où une hauteur de 1,5 cm.
Voici l'histogramme qu'on obtient :
Moyenne, médiane, classe modale et dispersion d'une série statistique - illustration 3
Cochez la bonne réponse.
Dans une classe de 40 élèves, on effectue une enquête, après 7 devoirs de mathématiques, en demandant à chacun le nombre de fois où il a copié son devoir sur un camarade. On obtient les résultats suivants :
Nombre de devoirs copiés
0
1
2
3
5
6
7
Effectif
11
8
5
6
2
4
4

La moyenne de cette série statistique est :
Cochez la bonne réponse.
4
2,725
2,45
On calcule la moyenne :
\overline X = \frac{1}{{40}}\left( {0 \times 11 + 1 \times 8 + 2 \times 5 + 3 \times 6 + 5 \times 2 + 6 \times 4 + 7 \times 4} \right) = \frac{{98}}{{40}} = 2,45.
Cochez la bonne réponse.
Excédées par les études statistiques d'Archibald le fermier, ses poules décident de rédiger une pétition. Pour étayer leurs revendications, elles mesurent, en cm2, la place réservée à chacune d'elles. Elles obtiennent :
Surface en cm2
[0 ; 100[
[100 ; 200[
[200 ; 300[
[300 ; 400[
[400 ; 450[
Effectif
10
26
38
21
5

La moyenne de cette série statistique est :
Cochez la bonne réponse.
185
282,5
233,75
Attention à bien utiliser le centre de la classe pour calculer cette moyenne.
\overline X = \frac{1}{{100}}\left( {50 \times 10 + 150 \times 26 + 250 \times 38 + 350 \times 21 + 425 \times 5} \right) = \frac{{23~375}}{{100}} = 233,75.
Cochez la bonne réponse.
345 005
345 002
345 008
345 006
345 009
345 000
Sans calculatrice, la moyenne de ces nombres est :
Cochez la bonne réponse.
impossible à calculer
345 005
345 004
• Tous les nombres sont de la forme « 345 000 + un entier ».
On a donc : 345~000 + 5\,;\; 345~000 + 2\,;\; 345~000 + 8\,;\; 345~000 + 6\,;\; 345~000 + 9\,;\; 345~000 + 0.
La moyenne des nombres 5 ; 2 ; 8 ; 6 ; 9 et 0 est : \frac{{5 + 2 + 8 + 6 + 9 + 0}}{6} = 5.
• Or, si \overline X est la moyenne des nombres x_1,\: x_2,\: \ldots,\: x_n, alors la moyenne des nombres k + x_1,\: k + x_2,\: \ldots,\: k + x_n est k + \overline X.
Donc la moyenne des nombres de départ est : 345~000 + 5 = 345~005.
Cochez la bonne réponse.
Dans une classe de 40 élèves, on effectue une enquête, après 7 devoirs de mathématiques, en demandant à chacun le nombre de fois où il a copié son devoir sur un camarade. On obtient les résultats suivants :
Nombre de devoirs copiés
0
1
2
3
5
6
7
Effectif
11
8
5
6
2
4
4

La médiane de cette série statistique est :
Cochez la bonne réponse.
1
2
1,5
• On écrit la liste des 40 valeurs de la série par ordre croissant, chacune d'elles répétée autant de fois que son effectif. On obtient :
0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 5 5 6 6 6 6 7 7 7 7.
• Le 20e terme est un « 2 », le 21e est aussi un « 2 », la médiane est donc 2.
Remarque : si le 20e terme avait été un « 1 » et le 21e un « 2 », la médiane aurait été \frac{{1 + 2}}{2} = 1,5.
Cochez la bonne réponse.
Dans une classe de 40 élèves, on effectue une enquête, après 7 devoirs de mathématiques, en demandant à chacun le nombre de fois où il a copié son devoir sur un camarade. On obtient les résultats suivants :
Nombre de devoirs copiés
0
1
2
3
5
6
7
Effectif
11
8
5
6
2
4
4

L'étendue et le mode de cette série sont :
Cochez la bonne réponse.
étendue : 7 ; mode : 0
étendue : 7 ; mode : 11
étendue : 11 ; mode : 11
• La plus grande valeur prise par la série est 7 (et 4 élèves ont copié 7 fois leur devoir ; ceci sur 7 devoirs, ils font très forts…).
• La plus petite valeur prise par la série est 0 (et 11 élèves n'ont jamais copié leur devoir, ou alors ils mentent…).
• L'étendue de la série est donc : 7 − 0 = 7.
Le mode est la valeur de la série qui a le plus grand effectif ; ici c'est 0.
Soit une série de notes obtenues à un contrôle.
Notes
8
10
11
12
14
15
Effectifs
2
4
6
5
3
7
Effectifs cumulés croissants
2
6
12
17
20
27
L'intervalle interquartile est égal à :
Cochez la bonne réponse.
4
5
6
• L'intervalle interquartile est égal à 4.
27\,\times\,\frac{1}{4}\,=\,6,75.
Le premier quartile se situe au 7e rang. En utilisant les effectifs cumulés croissants, on obtient 11.
27\,\times\,\frac{3}{4}\,=\,\frac{27\,\times\,3}{4}\,=\,20,25. Le troisième quartile se situe au 21e rang. En utilisant les effectifs cumulés croissants on obtient 15.
L'intervalle interquartile est : 15 − 11 = 4.
• La plus petite valeur prise par la série est 0 (et 11 élèves n'ont jamais copié leur devoir, ou alors ils mentent…).
• L'étendue de la série est donc : 7 − 0 = 7.
Le mode est la valeur de la série qui a le plus grand effectif ; ici c'est 0.