This commit is contained in:
Oscar Plaisant
2024-07-07 04:15:38 +02:00
parent ba4a8f79e1
commit 44cc38e148
268 changed files with 45693 additions and 8468 deletions

View File

@@ -0,0 +1,12 @@
up:: [[documents]]
source:: [[MADICS 2024]]
#informatique
- les [[documents textuels]] sont souvent utilisée (plus simples à générer, traiter, indexer)
- problème : perte de
# OCR
- problèmes de bruit (images, background...)
- ne prends souvent pas en compte le contexte (langue, type de document...)
- noms propres (personnes, lieux)
- homonymes et orthographes multiples