Entradas

Mostrando entradas de noviembre, 2015

Digitalización 2.0

Imagen
El pasado jueves 26 de Noviembre tuve el agrado de presentar la solución de digitalización de IBM bajo este titulo: Digitalización 2.0 (Capture 2.0) en un evento organizado por Tacco Calpini La presentación refleja una tendencia que se viene observando hace algunos años. Las organizaciones necesitan encarar una estrategia de ECM (y digitalización) para poder lograr un desafío importante: reducir el uso de papel. Aunque los procesos de digitalización tradicional presentan muchos beneficios y un ROI palpable, como ser: minimizar la perdida de documentos, securizar el acceso a la información y reducir los costos de búsqueda y logística de documentación física, lo que esta presentación llama Digitalización 2.0 abre el panorama a una solución que permite lograr niveles de optimización aun mayores. ¿De que hablamos con Digitalización 2.0? Principalmente una solución de digitalización enterprise alineada con una estrategia de gestión documental de nuestra organización, que permita

Digitalización: Tutoriales en video

Imagen
A partir de la próxima semana iniciaremos una serie de tutoriales en vídeo sobre digitalización, gestión documental e integración de datos. Comenzaremos con un tema central: "Como elegir una solución de digitalización". Esperamos sus comentarios con propuestas de temas a tratar.

Exprimiendo el OCR de texto completo

Imagen
Dentro de las practicas conocidas a la hora de digitalizar, es la de obtener o reconocer todo el texto o contenido de un documento mediante OCR. Con muchas aplicaciones (incluso aquellas que vienen con un scanner de documentos) podemos generar PDF buscable, o sea el formato de PDF que incluye el contenido en texto como metadato asociado a la imagen escaneada. ¿Cuanta utilidad le damos a estos datos reconocidos? ¿Podemos hacer algo más que simplemente ejecutar búsquedas por coincidencia exacta en nuestro ECM o administrador de documentos? La respuesta es que si, y creo que este tema dá para largo. Pensemos en tan solo algunas aplicaciones: Categorización de tipos documentales: mediante el análisis de contenido podemos identificar el tipo documental que tiene asociada la existencia de determinadas palabras claves (y la no existencia de otras). Y si aplicamos algo mas de lógica a nuestro algoritmo también podremos asociar estas palabras claves a posiciones o zonas del documento

Expresiones regulares: 2 sitios recomendados

Imagen
En digitalización las expresiones regulares nos serán de mucha utilidad, sea para aplicar métodos de separación por códigos de barra y filtrar los resultados, aplicar localizadores de campos por formato o para hacer análisis de texto completo como comentaremos en un próximo post esta semana. Listo sitios que hasta ahora me han sido muy útiles: RegExr http://www.regexr.com/ Rubular http://rubular.com/ Rubular esta pensado para las expresiones regulares soportadas al desarrollar en Ruby que permiten mayor potencia a la hora de trabajar en análisis de texto. Totalmente recomendado para aquellos que desean codificar sus propios localizadores de campos.

Manipulación de archivos PDF con PDFtk

Imagen
No podemos pasar por alto esta excelente herramienta a la hora de manipular archivos PDF. La versión Free viene con interfaz gráfica y permite combinar archivos (merge) y dividir documentos en páginas individuales (split). La versión Server es la que más nos gusta, no solo porque es una aplicación por linea de comando con muchas mas funciones, sino también porque podemos usarla desde Windows, Mac o Linux. Entre sus opciones están: Agregar fondos, marcas de agua o sellos. Rotar páginas Encriptar y desencriptar (se requiere de la contraseña) Agregar marcadores y metadatos Adjuntar archivos a un PDF Desempaquetar adjuntos Reparar archivos dañados En caso de incluir PDFtk server en nuestra aplicación comercial deberemos adquirir previamente su licencia. Algunos comandos de ejemplo: Combinar archivos PDF pdftk archivo1.pdf archivo2.pdf cat output archivo_final.pdf Agregar fondo a archivos PDF pdftk archivo.pdf background fondo.pdf output archivo_con_fondo.pdf

IBM lleva a la nube su suite de ECM de la mano de Box

Imagen
El pasado 30 de septiembre IBM anunció la conformación de una alianza estratégica con Box para ofrecer soluciones de ECM mas potentes habilitando la colaboración basada en la nube. IBM y Box anunciaron cuatro soluciones que permiten posibilidades ampliadas de colaboración, clasificación de datos, búsqueda y análisis de contenido y administración de procesos de negocio. Las soluciones son: IBM Content Navigator with Box  permitirá a los usuarios realizar búsquedas, acceder y compartir contenido entre los ambientes on-premise y en la nube con una única interfaz integrada. IBM StoredIQ with Box  ayuda a las empresas a la toma de decisiones permitiendo evaluar  profundamente  la información desestructurada contenida en los ambientes on-premise y en la nube. IBM Case Manager with Box  con esta herramienta el usuario podrá compartir de forma sencilla contenido en la plataforma de Box con participantes externos en el flujo de procesos de negocio. Esta diseñada para optimizar