eduroam-prg-sg-1-46-190.net.univ-paris-diderot.fr 2026-1-26:16:42:14

This commit is contained in:
oskar
2026-01-26 16:42:15 +01:00
parent 1ca8363ab9
commit 43d6631670

View File

@@ -20,8 +20,20 @@ Lorsque l'on travaille sur des données tabulaires.
# II - Lexique / vocabulaire
- échantillon (sample)
- souvent obtenu à partir d'une *population*
- mesures/variables sur chaque individu
- ! bien distinguer un sondage (qui vient d'un tirage sur un recensement de la population) d'une enquête d'opinion (qui admet des refus, ce qui ne permet pas de connaître la distribution de l'échantillon)
- mesures/variables sur chaque individu, de 2 types :
- variables numériques (à valeurs dans les nombres)
- variables catégorielles/qualitatives (à valeurs dans un ensemble fini)
- I échelle de Likert : réponse (sur 5 ou 7 items), pour évaluer des perceptions/attitudes/opinions
- = "que pensez vous de la politique de Macron ?" : très bonne, plutôt bonne, neutre, plutôt mauvaise, très mauvaise
# III - échantillons quantitatifs / numériques
étant donnés $n$ individus, et soient $x_1, \dots, x_{n}$ les $n$ mesures sur chacun de ces individus.
cet échantillon donne une **loi empirique** $P_{n}$ :
- loi sur $\mathbb{R}$ (muni de la tribu...)
- $\displaystyle P_{n}(A) = \sum\limits_{i=1}^{n} \frac{1}{n} \mathbb{1}_{\{ x_{i} \in A \}}$ donne un poids $\frac{1}{n}$ à chaque point $x_{i}$
# IV - résumés numériques
# V - graphiques
# VI - échantillons catégoriels