La reconnaissance
Optique de Caractères (OCR), est un logiciel conçu pour traduire des images de
texte en texte réel qu'un ordinateur peut lire. Généralement, il est utilisé
après qu'une image a été numérisée dans un ordinateur, bien que d'autres formes
d'entrée puissent également être utilisées. Logiciel OCR fonctionne le mieux
sur le texte qui a déjà été tapé, dans les cas où une impression originale a
été perdue, ou en feuilles de numérisation tapés sur une machine à écrire. Un
bon logiciel peut également être capable de traduire un texte manuscrit,
cependant, bien que le taux d'erreur sur ce genre de conversion a tendance à
être beaucoup plus élevé.
Le logiciel OCR
réelle terme est un peu trompeur, car la plupart des versions modernes font pas
en fait utiliser la reconnaissance optique de caractères, mais utilisent en
fait la reconnaissance de caractères numériques. C'est parce que il y a
quelques années, les champs effectivement fusionné, et les deux champs ont
adopté la reconnaissance optique de caractères terme plus attrayant. Logiciel
OCR a beaucoup progressé au cours des dernières années, des programmes modernes
sensiblement mieux que leurs prédécesseurs à identifier texte.
En fait, le
logiciel OCR tôt la formation requise le programme sur une police spécifique
avant de pouvoir être entrée avec précision. De même, lors de la saisie manuscrite,
le programme devrait être formé, un processus qui pourrait être incroyablement
temps. Méthodes se sont améliorées, cependant, et systèmes plus intelligents
sont maintenant la norme. Les méthodes utilisées sont maintenant relativement
stable, avec seulement un peu de recherches peu entrer dans le développement de
méthodes entièrement nouvelles, et la plupart des recherches en cours dans les
procédures existantes de raffinage afin de les rendre de plus en plus précis.
Les premières versions de logiciels ont été utilisés dans un large éventail
d'applications, avec des grandes entreprises les utilisent pour lire la carte
de crédit empreintes dans les années 1950, et le Service postal des États-Unis
de les utiliser pour trier le courrier depuis le milieu des années 1960.
Il y a dix ans,
en choisissant un morceau de logiciel OCR a été difficile, car de nombreux
programmes ont été très mauvais à certaines tâches, et assez bon à d'autres.
Ces jours-ci, cependant, le domaine a été largement stabilisé. Les taux
d'exactitude dans tout bon logiciel pour la traduction en caractères latins qui
ont été tapés dessus de 99%. Quand il s'agit de l'écriture manuscrite,
cependant, ou des polices de caractères plus complexes, le logiciel OCR a
encore relativement haut de gamme.
Le coût des
logiciels OCR varie également beaucoup, souvent en rapport avec les taux de
précision, il se vante. Une bonne quantité de logiciels libres peut être
trouvée, qui est adapté pour entrer imprimés, et certains peuvent être trouvés
qui est relativement bien à détecter l'écriture, en particulier avec une
certaine formation. Les suites logicielles les plus chers, comme la suite
OmniPage, qui coûte environ 100 $ dollars américains (USD) pour la version
d'origine et environ 450 euros pour la version professionnelle, se vanter des
tableaux de caractéristiques impressionnantes, et les taux de réussite sont
généralement plus élevés.
Malheureusement,
il n'y a toujours pas de telle chose comme un logiciel OCR parfait, afin de
choisir un programme de rachat peut encore largement être un processus frustrant.
Même les meilleurs programmes auront probablement un moment difficile avec
l'écriture, et les erreurs seront inévitablement glisser à travers, même à de
faibles niveaux. Généralement, le choix d'un programme de rachat se résume à
des fonctionnalités supplémentaires: support multilingue, analyse d'une seule
touche et l'intégration de la conversion, la conversion de PDF automatique, et
la reconnaissance de mots entiers dans toutes les disciplines spécialisées
comme les domaines juridiques et médicaux.