cours/numérisation de documents.md
Oscar Plaisant 602a41e7f8 update
2024-12-25 22:30:24 +01:00

405 B

up, source, tags
up source tags
documents MADICS 2024 #s/informatique
  • les documents textuels sont souvent utilisée (plus simples à générer, traiter, indexer)
    • problème : perte de

OCR

  • problèmes de bruit (images, background...)
  • ne prends souvent pas en compte le contexte (langue, type de document...)
  • noms propres (personnes, lieux)
  • homonymes et orthographes multiples