Últimamente no he escrito mucho acá debido, entre otras razones, a que he tenido una carga académica mayor a lo habitual. También me he visto enfrentado a algunos problemillas con el manejo de archivos a los que he podido hacer frente y salir airoso, como era de esperar, con software libre. En el caso de hoy, explicaré como crear un pdf desde fotografías de las páginas de un documento.

Lo primero que ocurre es lo siguiente: me llega un mail o mensajes por Telegram con fotografías de un documento que necesitamos leer (bueno, también está la posibilidad de que nosotros mismos las hayamos sacado) y nos encontramos con la siguiente situación:

1

El texto se ve irregular, la hoja no está derecha y, en el caso del cuarto archivo inclusive está de costado. Horror ¿Cómo hacemos para leer este preciado documento y no enloquecer en el proceso? nos valdremos de dos herramientas poderosas para salir de nuestra tribulación: Gimp y Abiword. Básicamente, un editor de imágenes y un editor de texto.

Vayamos a picar. Abriremos la primera página con Gimp:

2

Vamos a seleccionar el area del texto, definiendo las esquinas en los puntos más cercanos a los bordes de la página.

4

Usaremos la herramienta llamada Perspectiva.

3

Y manipularemos las esquinas superiores para que el texto quede del siguiente modo:

5Ahora, volvemos a hacer una selección dentro de la imagen, en la que encerraremos el texto ya reordenado.

6Acudiremos ahora a las opciones de Brillo y Contraste, que se encuentran en el menú Colores. Ahí regulamos cuanto brillo y contraste necesita la imagen para que el fondo se vea blanco y las letras suficientemente claras.

7Para reducir el tamaño del futuro archivo, cambiaremos el modo de colores de la imagen. Para hacer esto, vamos al menú Imagen/Modo y seleccionamos Indexado y le pondremos que el número máximo de colores sea 8.8Es importante mencionar que, mientras mayor sea el máximo de colores, mayor será la cantidad de colores de la imagen lo que significará mayor legibilidad del documento. A continuación vemos el resultado:

9Ahora, teniendo lista nuestra página mejorada, la copiamos (click derecho y “copiar” o el clásico Control+V) y pegamos la imagen en un documento nuevo de Abiword.

10Con el resto de las fotografías de páginas tenemos que repetir el proceso (parece largo, pero no es tanto. Además, vale la pena) las veces que sea necesario.

11En el ejemplo, se nota que usé la misma imagen… pero me entienden la idea, ¿Cierto? Ahora bastará que guardemos el archivo como pdf y lo enviemos por mail o lo guardemos en nuestra carpeta de documentos… pero ¡Pausa! hay algo más que podemos hacer, veamos.

12El archivo resultante tiene un tamaño bastante austero y podríamos quedarnos satisfechos, pero somos gente extrema, leñadores de alaska, camioneros en siberia, salvajes indomables. ¡Reduciremos el tamaño del archivo!

Accederemos por terminal a la carpeta en que tengamos el archivo pdf que estamos trabajando y lo someteremos al siguiente comando:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=testok.pdf test.pdf

Ojo al final, testok.pdf es el nombre del archivo que queremos por resultado y test.pdf el archivo que tenemos actualmente. Luego de ejecutar este comando, nos encontraremos con esta realidad:

13¡¡El archivo resultante es más de tres veces más pequeño que el original!! En este ejemplo, la diferencia es relativamente nimia pero en archivos más grandes puede ser trascendental  edición: no sé qué me llevó a pensar que una reducción en un tercio del tamaño es algo menor, ¡Es mucho! Este último tip lo encontré en un artículo de la página La mirada del replicante, ahí se explican con más detalles los parámetros del comando, ojo con eso.

Espero que este pequeño manual te sirva!! Buen día 🙂