diff --git a/statistiques univariées.md b/statistiques univariées.md index 41a71ddf..cadbefc9 100644 --- a/statistiques univariées.md +++ b/statistiques univariées.md @@ -33,6 +33,18 @@ Lorsque l'on travaille sur des données tabulaires. cet échantillon donne une **loi empirique** $P_{n}$ : - loi sur $\mathbb{R}$ (muni de la tribu...) - $\displaystyle P_{n}(A) = \sum\limits_{i=1}^{n} \frac{1}{n} \mathbb{1}_{\{ x_{i} \in A \}}$ donne un poids $\frac{1}{n}$ à chaque point $x_{i}$ +**Fonction de répartition empirique** (ecrf) : +$\begin{align} F_{n} : \mathbb{R} & \to (0, 1)\\ x &\mapsto P_{n}(]-\infty, x[) = \sum\limits_{i = 1}^{n} \frac{1}{n}\mathbb{1}_{x_{i}\leq x} \end{align}$ + +> [!info] caractérisations équivalentes +> Entre l'échantillon et la fonction de répartition empirique, il y à **perte d'information** +> Si les $(x_{i})$ sont distincts, toutes les $n!$ permutations de l'échantillon donnent la même fonction de répartition. +> La fonction de répartition donne autant d'information que l'échantillon **trié**. +> +> soient $x_{1:n} \leq x_{2:n} \leq \cdots \leq x_{n:n}$ les "statistiques d'ordre" (les $(x_{i})$ ordonnés) +> $x \in [x_{i:n}; x_{n:n}[ \iff F_{n}(x) = \frac{i}{n}$ +> +> Les statistiques d'ordre, la loi empirique et la fonction de répartition empirique, donnent la même information sur les mesures. # IV - résumés numériques # V - graphiques