up:: [[stage de L3]] #fac #informatique - semaine 1 : - sujet par M.Labroche et M.Marcel - prédiction du résultat de requêtes SQL (ordre de valeurs d'un attribut) - inégalités de concentration - production de code - création de la base de données depuis des CSV - connexion python $\longleftrightarrow$ base de données - récupération et traitement des données en python - filtrage et gestion des tables - gestion des ordres et des permutations - extraire plusieurs ordres d'une table - aggréger des permutations - distance $\tau$ de kendall (normalisé : $\frac{2 \tau}{n(n+1)}$) - aggrégation de kemeny-young (barycentre pour ) - semaine 2 et 3: - réorientation du sujet - chercher à vérifier une hypothèse sur les données en faisant des requêtes sur des sous-ensembles des données - hypothèse sous forme d'un ordre sur des valeurs - utiliser des inégalités de concentration - semaine 4 : - implémentation de la loss modale - la loss est 1 si l'ordre est égal à l'hypothèse, et 0 sinon - on calcule la loss moyenne ainsi que la loss - début de rédaction