Page 1 of 1

Tesseract 4 - Programa OCR (Optical Character Recognition)

Posted: Tue 30 Jan 2018, 03:56
by tenochslb
Este programa identifica texto en archivos .jpeg y lo transcribe a formato .txt

su uso basico es el siguiente:

Code: Select all

tesseract archivo.jpeg nombre -l spa+spa_old

Donde:
  • archivo.jpeg = el archivo que se quiere transcribir a formato texto
    nombre = el nombre que se le desee dar al archivo texto que sera creado
    -l = lenguage
    spa = diccionario español
    spa_old = diccionario español old
    + = para agregar mas de un diccionario
La descarga consiste en tres paquetes: Image