OCR Test - Works offline 0.6.0

Licence: Gratuit ‎Taille du fichier: 10.49 MB
‎Note des utilisateurs: 2.8/5 - ‎6 ‎Votes

Application expérimentale pour la reconnaissance optique des caractères (OCR) Cette application est une application expérimentale que j’ai développé il ya plusieurs années qui démontre l’utilisation du moteur OCR Tesseract pour reconnaître le texte dans les images capturées par la caméra de l’appareil. Cette application fonctionne OCR sur votre appareil – sans télécharger vos images sur un serveur – et est adapté pour reconnaître les mots individuels ou de courtes phrases de texte, mais cette application est destinée aux amateurs et aux développeurs de logiciels intéressés par OCR et non pas pour le grand public. Contrairement à l’API Mobile Vision de Google, cette application est capable de reconnaître le texte imprimé dans des polices non basées sur le latin lorsqu’il est hors ligne. Pour ce faire, cette application intègre une quantité exceptionnellement importante de données de formation pour plusieurs langues. Ces données de formation sont stockées sur votre téléphone, et cette application prend beaucoup plus de place que les applications ordinaires. Aucun pré-traitement d’image n’est effectué par cette application avant de remettre des images capturées à Tesseract, de sorte que l’application n’est pas réglée pour un cas d’utilisation spécifique et, par conséquent, sa précision de reconnaissance et sa vitesse dépend fortement de facteurs situationnels tels que la perspective, l’éclairage et le type de police. Le code source de cette application est disponible sur GitHub (avec des modifications mineures pour tenir compte des restrictions de taille de fichier GitHub). Le code de cette application est une combinaison de code open source lié à la caméra du projet de scanner de code à barres ZXing et de code optique open source de reconnaissance de caractères du projet Tesseract OCR. CAPTURE DE TEXTE La capture par prise unique par défaut exécute OCR sur une image instantanée capturée lorsque vous cliquez sur le bouton d’obturateur, comme une photo régulière. Lorsque la case à cocher « aperçu continu » est vérifiée, l’application affiche un affichage dynamique en temps réel de ce que l’appareil reconnaît juste à côté du viseur de la caméra. Le mode de prévisualisation continue fonctionne mieux sur un appareil rapide. UTILISATION DE CETTE APPLICATION • Pointez l’appareil vers une petite région de texte et az-vous appuyer sur le bouton d’obturation à l’écran pour démarrer ocr. • Pour reconnaître les caractères chinois/japonais/coréens individuels, définissez le mode de segmentation des pages en « caractère unique ». PRÉCISION DE RECONNAISSANCE • Divers facteurs peuvent provoquer l’échec de l’OCR : éclairage inégal, texte stylisé ou texte sans contraste suffisant par rapport à l’arrière-plan. Essayez d’avoir un bon éclairage. • Maintenez l’appareil stable, et assurez-vous que l’image est au point. • Si vous avez besoin de scanner un grand bloc de texte ou un document entier, essayez une application de numérisation de documents comme Text Fairy à la place. Traduction • Cette application prend en charge plusieurs langues/scripts non reconnus par Google Translate. • Langues soutenues pour OCR: Afrikaans Albanais Amharique Arabe Assamese Azerbaïdjanais Azerbaïdjanais (cyrillique) Basque Biélorusse Bengali Bosniaque Bulgare Birman Catalan Cebuano Cherokee Chinois (Simplifié) Chinois (traditionnel) Croate Tchèque Danois Néerlandais Dzongkha Anglais Anglais, Moyen (1100-1500) Espéranto Estonien Finnois Franc Français Français, Moyen (vers 1400-1600) Galicien Géorgien Géorgien - Vieux Allemand Grec, Ancien (-1453) Grec, Moderne (1453-) Gujarâtî Haïtien Hébreu Hindi Hongrois Islandais Indonésien Inuktitut Irlandais Italien Italien - Vieux Japonais Javanais Canara Kazakh Khmer Coréen Kurde Kirghiz Lao Latine Letton Lituanien Macédonien Malaisien Malayalam Maltais Marathi Népalais Norvégien Oriya Pachtou Perse Polonais Portugais Punjabi Roumain Russe Sanskrit Serbe Serbe (Latin) Cinghalais Slovaque Slovène Espagnol Espagnol - Vieux Swahili Suédois Syriaque Tagalog ( Tagalog ) Tadjik Tamil Telugu Thaï Tibétain Tigrinya Turc Ukrainien Urdu Uyghur Ouzbek Ouzbek (cyrillique) Vietnamien Gallois Yiddish NOTES D’APPAREIL SAMSUNG • Sur les appareils Samsung Galaxy, vous devrez peut-être appuyer longtemps sur le bouton menu pour définir les préférences.

historique de la version

  • Version 0.5.14 posté sur 2014-05-11
  • Version 0.4.3 posté sur 2011-05-13
    Plusieurs correctifs et mises à jour

Détails du programme