• Reconnaissance optique de caractères (ROC)

    Reconnaissance optique de caractères (ROC)

    Selon wikipédia, La reconnaissance optique (ROC, en anglais optical character recognition : OCR), ou encore appelé vidéocodage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps.

    La reconnaissance optique de caractères pourra permettre aux élèves peu ou pas lecteurs d'utiliser une voix de synthèse pour "entendre" le contenu des textes en voix de synthèse. L'OCR est une technique assez complexe et encore perfectible, c'est pourquoi la voix de synthèse ne lira pas toujours un texte compréhensible. En effet, si l'on effectue un "copier" d'un document pdf dont la reconnaissance optique de caractères a été faite au préalable, et qu'on le colle dans un traitement de texte lambda, on peut observer que le texte collé ne correspond pas parfaitement à l'original chose qui va générer des incompréhensions puisque la voix de synthèse lira des caractères parfois reconnus de manière erronée. 

    Solutions d'OCR

    Sous MAC OS X, le logiciel payant PDFpenPro est capable d'effectuer de la reconnaissance optique de caractères. Il a également l'avantage d'offrir la possibilité d'annoter des documents pdf (aperçu, natif sous MAC OS X, est capable d'annoter les pdf, voir à ce sujet l'article de la fondation defitech).

    Sous windows, il existe une alternative gratuite à PDFpenPro nommée PDF-Change Viewer, capable d'effectuer tant l'OCR qu'annoter les documents pdf. Il existe des solutions gratuites en ligne, je citerai Google Docs qui à l'importation propose l'OCR, le service free OCR et le logiciel Capture2text. Enfin, il existe une multitude de logiciels commerciaux assez onéreux mais qui offrent probablement une meilleure reconnaissance optique de caractères. 


    Tags Tags : , , , , , ,
  • Commentaires

    Aucun commentaire pour le moment

    Suivre le flux RSS des commentaires


    Ajouter un commentaire

    Nom / Pseudo :

    E-mail (facultatif) :

    Site Web (facultatif) :

    Commentaire :