cours/numérisation de documents.md
Oscar Plaisant 44cc38e148 update
2024-07-07 04:15:38 +02:00

13 lines
386 B
Markdown

up:: [[documents]]
source:: [[MADICS 2024]]
#informatique
- les [[documents textuels]] sont souvent utilisée (plus simples à générer, traiter, indexer)
- problème : perte de
# OCR
- problèmes de bruit (images, background...)
- ne prends souvent pas en compte le contexte (langue, type de document...)
- noms propres (personnes, lieux)
- homonymes et orthographes multiples