cours/statistiques cheat sheet.md
Oscar Plaisant 602a41e7f8 update
2024-12-25 22:30:24 +01:00

32 lines
3.1 KiB
Markdown
Raw Permalink Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

up:: [[statistiques]], [[cheat sheet]]
#s/maths/statistiques
- loi binomiale $\mathcal{B}(n, p)$ : $E(X) = n\cdot p$, $\sigma(X) = \sqrt{ n\cdot p\cdot (1-p) }$
- loi de poisson $\mathcal{P}(\lambda)$ : $P(X=k) = \dfrac{\lambda^{k}e^{k}}{k!}$, $E(X) = V(X) = \lambda$, $\sigma(X) = \sqrt{ \lambda }$
- Loi normale $\mathcal{N}(\mu, \sigma)$ : $\mathcal{N}(\mu_1, \sigma_1)+\mathcal{N}(\mu_2, \sigma_2) = \mathcal{N}\left(\mu_1+\mu_2, \sqrt{ \sigma_1^{2}+\sigma_2^{2} }\right)$ et $\Pi \leadsto \mathcal{N}(0, 1)$
- Variance : $V(X) = \frac{1}{n} \sum\limits_{i}\left( \underbracket{n_{i}}_{\text{effectif}} \left( \underbracket{x_{i}}_{\text{valeur}} - \underbracket{\overline{X}}_{\text{moyenne}} \right) \right) = \overline{(X - \overline{X})^{2}}$
- covariance : $cov(X, Y) = \overline{X\cdot Y} - \overline{X}\cdot \overline{Y} = \sum\limits_{i}\left( \frac{(X-\overline{X})\cdot(Y-\overline{Y})}{n} \right)$
- coefficient correllation linéaire : $\rho(X, Y) = \frac{cov(X, Y)}{\sigma(X)\cdot\sigma(Y)}$
**Régression par les moindres carrés** : $\hat{y} = a(x - \overline{X}) + \overline{Y}$ où $a = \frac{cov(X, Y)}{V(X)}$ valide si $0.7 \leq |\rho(X, Y)| \leq 1$
**Théorème centrale limite :**
- soient $X_{i}$ des variables aléatoires obéissant à **la même loi de probabilité**, la somme $\sum\limits_{k=0}^{n} X_{k}$ tend vers $\mathcal{N}(n\mu, \sigma\sqrt{ n })$
- **APPROXIMATIONS DE LA LOI BINOMIALE**
- **par la loi normale**
- Soit $X \leadsto \mathcal{B}(n, p)$, pour $n$ grand on à : $X$ suit environ $\mathcal{N}(E(X), \sigma(X)) = \mathcal{N}(n\cdot p, \sqrt{ n\cdot p\cdot(1-p) })$
- satisfaisant si $n\cdot p \geq5$ et $n*(1-p) \geq 5$
- **par la loi de poisson**
- quand $n\cdot p < 5$, l'approximation par loi normale échoue. on peut alors utiliser une loi de poisson
- soient $X \leadsto \mathcal{B}(n, p)$ et $\lambda = n\cdot p$ alors $P(X = k)$ tend vers $\frac{\lambda^{k}e^{-\lambda}}{k!}$ quand $n \to +\infty$, $k$ prenant toutes les valeurs possibles : $k = 1, 2, 3 \ldots$
- quand $n \to +\infty$, on sait que $\mathcal{B}(n, p) \to \mathcal{P}(\lambda=n\cdot p)$
- valable si $n \geq 30$, $p \leq 0.1$ et $\lambda=n\cdot p \leq 10$
- les deux lois sont discrètes, dont pas de correction de continuité
- **approximation de la loi de poisson par la loi normale**
- $X \leadsto \mathcal{P}(\lambda)$ (loi de poisson) avec $\lambda \geq 10$, on a $\mathcal{P}(\lambda ) \approx \mathcal{N}(\lambda)$ pour des variables réduites
- avec *correction de continuité* : $P\left( a \leq \frac{X-\lambda }{\sqrt{ \lambda }} \leq b\right) = \Pi(b+0.5) - \Pi(a - 0.5)$
- exemple : si $X \leadsto \mathcal{P}(\lambda=10)$, alors $P(X \leq 6) \approx \Pi \left( \frac{6.5 - 10}{\sqrt{ 10 }} \right)$
**Approximation par loi de poisson** :
- approximation de la loi $\mathcal{B}(n, p)$ (valable si $n \geq 30$, $p \leq 0.1$ et $\lambda=n\cdot p \leq 10$)
- quand $n \to +\infty$, on sait que $\mathcal{B}(n, p) \to \mathcal{P}(\lambda=n\cdot p)$
- les deux lois sont discrètes, dont pas de correction de continuité