
Optical Character Recognition on Handwritten Documents
Cet article explore les défis de l'OCR sur des documents manuscrits, en se concentrant sur des recensements de population. Il passe en revue des bibliothèques open-source comme Tesseract et OpenCV, ainsi que des services cloud tels qu'AWS Textract, Azure AI Document Intelligence et Google Cloud Document AI. Malgré des tentatives variées, aucune solution ne répond adéquatement aux besoins, ce qui pousse les auteurs à se tourner vers la littérature scientifique pour trouver une solution. Ils mentionnent un projet de recherche de l'Université de Rouen sur l'OCR pour des recensements similaires dans les années 1920 et 1930.
