AMIR

mercredi 16 avril 2014

Comment puis-je choisir le meilleur logiciel OCR?

La reconnaissance Optique de Caractères (OCR), est un logiciel conçu pour traduire des images de texte en texte réel qu'un ordinateur peut lire. Généralement, il est utilisé après qu'une image a été numérisée dans un ordinateur, bien que d'autres formes d'entrée puissent également être utilisées. Logiciel OCR fonctionne le mieux sur le texte qui a déjà été tapé, dans les cas où une impression originale a été perdue, ou en feuilles de numérisation tapés sur une machine à écrire. Un bon logiciel peut également être capable de traduire un texte manuscrit, cependant, bien que le taux d'erreur sur ce genre de conversion a tendance à être beaucoup plus élevé.

Le logiciel OCR réelle terme est un peu trompeur, car la plupart des versions modernes font pas en fait utiliser la reconnaissance optique de caractères, mais utilisent en fait la reconnaissance de caractères numériques. C'est parce que il y a quelques années, les champs effectivement fusionné, et les deux champs ont adopté la reconnaissance optique de caractères terme plus attrayant. Logiciel OCR a beaucoup progressé au cours des dernières années, des programmes modernes sensiblement mieux que leurs prédécesseurs à identifier texte.

En fait, le logiciel OCR tôt la formation requise le programme sur une police spécifique avant de pouvoir être entrée avec précision. De même, lors de la saisie manuscrite, le programme devrait être formé, un processus qui pourrait être incroyablement temps. Méthodes se sont améliorées, cependant, et systèmes plus intelligents sont maintenant la norme. Les méthodes utilisées sont maintenant relativement stable, avec seulement un peu de recherches peu entrer dans le développement de méthodes entièrement nouvelles, et la plupart des recherches en cours dans les procédures existantes de raffinage afin de les rendre de plus en plus précis. Les premières versions de logiciels ont été utilisés dans un large éventail d'applications, avec des grandes entreprises les utilisent pour lire la carte de crédit empreintes dans les années 1950, et le Service postal des États-Unis de les utiliser pour trier le courrier depuis le milieu des années 1960.

Il y a dix ans, en choisissant un morceau de logiciel OCR a été difficile, car de nombreux programmes ont été très mauvais à certaines tâches, et assez bon à d'autres. Ces jours-ci, cependant, le domaine a été largement stabilisé. Les taux d'exactitude dans tout bon logiciel pour la traduction en caractères latins qui ont été tapés dessus de 99%. Quand il s'agit de l'écriture manuscrite, cependant, ou des polices de caractères plus complexes, le logiciel OCR a encore relativement haut de gamme.

Le coût des logiciels OCR varie également beaucoup, souvent en rapport avec les taux de précision, il se vante. Une bonne quantité de logiciels libres peut être trouvée, qui est adapté pour entrer imprimés, et certains peuvent être trouvés qui est relativement bien à détecter l'écriture, en particulier avec une certaine formation. Les suites logicielles les plus chers, comme la suite OmniPage, qui coûte environ 100 $ dollars américains (USD) pour la version d'origine et environ 450 euros pour la version professionnelle, se vanter des tableaux de caractéristiques impressionnantes, et les taux de réussite sont généralement plus élevés.

Malheureusement, il n'y a toujours pas de telle chose comme un logiciel OCR parfait, afin de choisir un programme de rachat peut encore largement être un processus frustrant. Même les meilleurs programmes auront probablement un moment difficile avec l'écriture, et les erreurs seront inévitablement glisser à travers, même à de faibles niveaux. Généralement, le choix d'un programme de rachat se résume à des fonctionnalités supplémentaires: support multilingue, analyse d'une seule touche et l'intégration de la conversion, la conversion de PDF automatique, et la reconnaissance de mots entiers dans toutes les disciplines spécialisées comme les domaines juridiques et médicaux.