José Manuel Mira Ros. Instrumentos para docencia
Manipular PDF

Generalmente los ficheros PDF son el resultado de la exportación a ese formato de algún fichero "fuente" de naturaleza diversa. En muchas ocasiones tenemos necesidad de realizar ciertas manipulaciones en ficheros PDF para los que no disponemos del fuente.

Extraer páginas de un PDF. Unir varios documentos PDF, o grupos de páginas de varios documentos PDF.

pdftk es la herramienta más poderosa que conozco. Pero es una herramienta de consola que realiza sus tareas mediante comandos, con una sintaxis que es fácil olvidar a menos que se use habitualmente. Bien es verdad que, desde la consola, usando man pdftk se tiene acceso a un manual en línea con todas sus posibilidades y variados ejemplos.

pdfchain es una interfaz gráfica que utiliza como motor pdftk y que resulta más ergonómica que aquel, aunque tiene menos posibilidades. Pero para unir/concatenar ficheros completos o una selección de páginas es una buena opción. También lo es para girar páginas.

Algunos ejemplos del uso de pdftk:

pdftk Completo.pdf cat 10-30 output Parte.pdf 
pdftk Completo.pdf cat 1-endE output Rotado.pdf 
pdftk Completo.pdf cat 1-endW output Rotado.pdf
pdftk Completo.pdf cat 1-enddown output Rotado180.pdf
pdftk *.pdf cat output Unidos.pdf
pdftk Fichero1.pdf Fichero2.pdf cat output Unidos.pdf
El código de la primera línea extrae las páginas 10 a 30 del fichero Completo.pdf y crea con ellas el fichero Parte.pdf.
El código de la segunda línea rota (hacia el Este) las páginas de la 1 al final del fichero Completo.pdf y genera el fichero Rotado.pdf.
El código de la tercera línea rota (hacia el Oeste) las páginas de la 1 al final del fichero Completo.pdf y genera el fichero Rotado.pdf.
El código de la cuarta línea sirve para unir (en orden alfabético) todos los archivos pdf existentes en una carpeta y genera el fichero Unidos.pdf.
La quinta línea es análoga a la cuarta pero se limita a unir los ficheros que se nombran explícitamente.

ManipularPDF.pdftk.Unir.ogv
ManipularPDF.pdftk.Unir.mp4
UnirPDF_pdfchain.mp4

pdfsam es un producto similar a pdfchain, pero a diferencia de aquel no hace uso de pdftk y tiene la ventaja de que genera ficheros de menos peso; en torno a un 20% menos.

UnirPDF_pdfsam.mp4

Todas las herramientas anteriores están en los repositorios Debian y si los pdf son de naturaleza vectorial, (eso se comprueba marcando y copiando un texto en un editor) el resultado sigue siendo de naturaleza vectorial, lo cual es muy importante y aligera el peso del fichero.

pdfshuffler es otra herramienta con objetivos parecidos a las anteriores. Incluso tiene una interfaz más intuitiva y la gestión para reordenar y mover páginas es mucho más visual. Por contra, y ese es su mayor inconveniente, genera un documento de mapa de bits (fotocopiado) aunque los documentos utilizados sean vectoriales. También está disponible en los repositorios Debian.

Unir varias páginas en una sola.

Otra herramienta que también resulta de utilidad es pdfnup, que forma parte del paquete pdfjam (en Debian). Esta herramienta permite poner varias páginas del fichero pdf original en una misma página en el fichero de salida, cuyo nombre, salvo que se indique algo más específico, se construye de forma automática. En ejemplo que sigue, se selecciona desde la página 2 a la 56 en el fichero de entrada y se ponen 4 páginas en una sola en el fichero de salida.

pdfnup --nup 2x2 --pages 2-59  FicheroEntrada.pdf 
pdfnup --nup 2x2 --nup 2x2 --suffix 'Papel' --batch *.pdf 

Para más detalles, consúltese la información del programa mediante man pdfnup.

Editar, limitadamente, PDF y aligerar peso reduciendo la calidad de las imágenes.

LibreOffice puede ser de utilidad para el objetivo que se marca en el título de este apartado. Es necesario para ello instalar la librería que le permite a Write de LibreOffice leer y editar, cieramente de forma muy primitiva, ficheros PDF para los que no se dispone del fichero fichero "fuente" utilizado para generarlos. Pero otra prestación muy útil de esta herramienta es la posibilidad de aligerar de pero a las imágenes de mapa de bits, y por ende, al fichero PDF. El vídeo que sigue, sin palabras, es suficientemente autoexplicativo.

UnirPDF_ReducirCalidadImagenes.mp4

 

Departamento de Matemáticas. Universidad de Murcia