405 B
		
	
	
	
	
	
	
	
			
		
		
	
	
			405 B
		
	
	
	
	
	
	
	
up, source, tags
| up | source | tags | 
|---|---|---|
| documents | MADICS 2024 | #s/informatique | 
- les documents textuels sont souvent utilisée (plus simples à générer, traiter, indexer)
- problème : perte de
 
 
OCR
- problèmes de bruit (images, background...)
 - ne prends souvent pas en compte le contexte (langue, type de document...)
 - noms propres (personnes, lieux)
 - homonymes et orthographes multiples