cours/numérisation de documents.md
Oscar Plaisant 602a41e7f8 update
2024-12-25 22:30:24 +01:00

15 lines
405 B
Markdown

---
up: "[[documents]]"
source: "[[MADICS 2024]]"
tags: "#s/informatique"
---
- les [[documents textuels]] sont souvent utilisée (plus simples à générer, traiter, indexer)
- problème : perte de
# OCR
- problèmes de bruit (images, background...)
- ne prends souvent pas en compte le contexte (langue, type de document...)
- noms propres (personnes, lieux)
- homonymes et orthographes multiples