lunes, 4 de agosto de 2014

YAGF: software para el reconocimiento de texto

YAGF es un programa para el reconocimiento de texto en Linux, que nos provee de una interfaz gráfica Qt, para dos conocidas herramientas de software OCR como son Tesseract y Cuneiform.

Con YAGF podemos escanear imágenes a través de Xsane, importar páginas de los documentos PDF, imágenes con texto que tengamos en nuestros archivos, digitalizar documentos…. convirtiéndolo todo en texto editable, con la capacidad de mantener la estructura del documento original.

El programa soporta una gran cantidad de lenguajes, entre ellos es español.

Para que funcione correctamente es necesario tener instalados los paquetes correspondientes de tesseract y aspell del idioma, que vamos a usar.

YAGF incluye en su interfaz herramientas que permiten girar las imágenes o seleccionar de forma automática, (además de manual) los bloques de texto a reconocer.

El texto resultante se muestra en un panel lateral.

Para instalar YAGF: sudo apt-get install yagf

Para instalar Tesseract: sudo apt-get install tesseract-ocr tesseract-ocr-spa

No hay comentarios: