Skip to main content

Las herramientas para escanear documentos y extraer texto no son nada nuevo como Docsumo. La tecnología de reconocimiento óptico de caracteres (OCR) se puede encontrar en software para casi cualquier plataforma, incluidas las plataformas web.

Lo interesante de esto es cuando las opciones que renuevan la propuesta explotan con algo nuevo y asequible en el medio. Este es el caso de Docsumo.

 

Herramienta de escaneo de nivel empresarial, disponible de forma gratuita

Docsumo es una startup de Bombay, India, que lleva dos años ofreciendo soluciones comerciales para digitalizar tareas administrativas, implementar sistemas automatizados de procesamiento de documentos, para facilitar su gestión y análisis.

Como las cosas suelen funcionar con este modelo, las funciones de Docsumo se ofrecieron inicialmente como servicios de pago. Si bien eso permanece, la última vez se lanzaron algunas herramientas para uso gratuito.

Hay uno de ellos Extraer tablas, que le permite capturar tablas e identificar binomios de valores clave a partir de imágenes escaneadas o archivos PDF. Para obtener resultados más precisos, puede entrenar el algoritmo, proporcionando algunos ejemplos para guiarlo. Del mismo modo, después de escanear y antes de exportar, puede verificar manualmente los datos y corregirlos si es necesario.

Si necesita exportar los datos en formato JSON, puede configurar reglas para que el documento exportado sea válido para trabajar con una API en particular. Además, puede exportar la tabla escaneada en formato XLSX, para editarla en un procesador de hojas de cálculo. Hay otras dos opciones en formato de texto sin formato (TXT) y una copia de la imagen original.

Si bien el acceso es gratuito, esta herramienta limita su oferta a 20 documentos por día.

Esta utilidad, recientemente lanzada de forma gratuita, llega como complemento a otras herramientas de categoría similar que también se ofrecen de forma gratuita, como Herramienta de OCR banda de alta precisión y Convertidor de PDF a Excel, con menos parafernalia que la función antes mencionada.

 

Las tablas en las aplicaciones de reconocimiento de caracteres suelen ser más débiles. Los más simples de esta categoría se limitan a simplemente reconocer el texto de una imagen y convertirlo en texto comestible, que suele ser desordenado. Si bien otras aplicaciones realizan la misma tarea, incluida la versión móvil de Microsoft Excel, el valor agregado es la posibilidad de exportar datos de forma automatizada a través de su API, como se describe en la documentación de este servicio.