Domanda Estrazione di immagini incorporate da un PDF


Prima di iniziare ad usare Ubuntu ho usato il lettore Nitro PDF per estrarre automaticamente le immagini dai file PDF. C'è un lettore PDF per Linux che fa questo?

Mi piacerebbe essere in grado di estrarre le immagini più velocemente / più facilmente rispetto a quando si scatta un'istantanea.


138
2018-06-12 22:36


origine


Riesci a ricordare quanto bene NitroPDF può fare con le immagini vettoriali? Può pdfimages fallo meglio / peggiore di NitroPDF? - Léo Léopold Hertz 준영
Possibile duplicato di strumento da riga di comando per estrarre le immagini in blocco da un pdf? - funky-future
@ funky-future Chiaramente le due domande sono doppie, ma il tuo obiettivo duplicato ha solo due risposte e una di queste due risposte è una risposta spam, quindi la direzione della duplicazione deve essere invertita per evitare che questa domanda venga martellata dal martello. - karel


risposte:


Uso pdfimages

pdfimages è uno strumento di estrazione di immagini PDF che salva le immagini in un file PDF in formato di file PPM, PBM, JPEG o JPEG 2000.

Fa parte del poppler-utils pacchetto, che dovrai installare.

Uso:  pdfimages [options] <PDF-file> <image-root>

Esempio: Quanto segue estrae tutte le immagini da un file PDF, salvandole in formato JPEG.

pdfimages -j in.pdf /tmp/out

Salverà le immagini dal file PDF in.pdf nei file /tmp/out-000.jpg (o /tmp/out-000.pbm; vedi sotto), /tmp/out-001.jpg, eccetera.


Le immagini PDF pagina man spiega:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

169
2018-06-12 23:06



Sarebbe bello avere una soluzione che estrae le immagini nel suo formato nativo. La ricodifica dei file JPEG non è davvero l'ideale. - Christian
@Christian dalla pagina man -all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt. - wil93
Si prega di notare che il -all switch è supportato solo nelle recenti revisioni di poppler-utils. Ad esempio, se si è ancora in data 12.04, non sarà possibile accedere a questa opzione - Glutanimate
Se non puoi usare -all andare per i formati PNM. Sono senza perdita di dati e puoi postprocedere le immagini, ad es. in PNG. - Tomasz Gandor
@Christian, usa $ pdfimages -list <PDF-file> per verificare il formato originale nella colonna "enc", in modo da non dover ricodificare l'immagine in un altro formato. - Jose Barakat


Io uso spesso Inkscape per questo. Carica la pagina ed elimina tutte le altre cose. Il vantaggio è che puoi ottenere immagini vettoriali in SVG e modificarle come preferisci.


18
2017-09-11 13:12



Alcuni PDF possono essere importati correttamente solo con l'importazione interna di Inkscape (l'importazione di poppler / cairo o pdfimage non può analizzarla correttamente). Una volta importato, copia e incolla l'immagine in un nuovo file e ridimensiona la pagina alla selezione graphicdesign.stackexchange.com/a/21638/95041 - sdaffa23fdsf


Puoi anche provare pdfmod. È una GUI (interfaccia grafica) che può estrarre immagini e fare altre manipolazioni di base in pdf.


4
2018-06-13 17:18



Hmm, mi sembra un po 'buggy. Inserito un PDF con principalmente immagini viola e ottenuto immagini verdastre. - DBX12


Ho un file PDF a doppia colonna con immagini incorporate create con LaTeX in cui le immagini originali sono state fornite come EPS. Ho provato la soluzione proposta basata su pdfimages, ma sfortunatamente, non ha restituito alcuna immagine. Ho provato a utilizzare Inkscape, ma le immagini SVG generate erano distorte e non ho avuto la fortuna di esportarle come EPS.

Il software che ha funzionato per noi era il MasterPdfEditor.

Ecco la procedura

  • Apri il tuo file usando Master PDF Editor
  • Usa il strumento di modifica (Alt + 1) per selezionare l'immagine che è necessario estrarre
  • Copia la figura (Ctrl + C)
  • Fare clic sulla cornice tratteggiata circostante intorno all'immagine e controllare la barra laterale destra (Object Inspector) e fare clic su "Geomerty". Lì puoi vedere la dimensione della tua selezione
  • Crea un nuovo file (Ctrl + N). Ti verrà richiesto di fornire le dimensioni della pagina. Fornisci le dimensioni esatte della tua immagine e crea il nuovo file
  • Ora è un po 'complicato: incollare l'immagine (Ctrl + V). L'immagine potrebbe non apparire nel nuovo file. Usa le frecce per spostarlo finché non sei in grado di rintracciarlo.
  • Usa le frecce per centrare l'immagine nella nuova pagina
  • Salva come PDF

Il risultato è di altissima qualità, ma il software non è gratuito. C'è una versione demo che "ti permette di provare tutte le funzionalità", ma viene fornito con "l'aggiunta di una filigrana sul file di output". Ad essere sinceri, non ho notato alcuna filigrana nel PDF prodotto.


4
2018-04-12 16:50



Questo è Ask Ubuntu ... Ci piace l'open source qui e la tua soluzione è una soluzione commerciale a codice chiuso ... Come vanno meglio le risposte già aggiornate? (-1 nel frattempo) - Fabby
@Fabby Grazie per il feedback. Non lo sapevo. C'è una tale regola su askubuntu.com? Tuttavia, non appena si apre Centro software Ubuntu, ottieni suggerimenti per applicazioni non libere. - Pantelis Sopasakis
No, non c'è una "regola" ed è per questo che non ho votato per cancellare questa risposta, ma ci sono strumenti migliori che sono gratuiti (come nella birra gratis e la libertà di parola) quindi è solo un'opinione. - Fabby
+1. Ho usato la riga di comando di ImageMagick, ma questa è una soluzione interessante per chi cerca una GUI. - rpmcruz
Funziona per alcune persone, è abbastanza buono. Non essere un nazista ... Non so chi sia "noi". Puoi parlare solo per te stesso. +1 per la risposta - sdaffa23fdsf


Uso pdfimages che è uno strumento da riga di comando e funziona perfettamente per me. È molto facile da usare ed è possibile utilizzare l'opzione --help per saperne di più sul suo utilizzo. Io uso Ubuntu e viene preinstallato. Se i tuoi file PDF sono crittografati o protetti da password ci sono opzioni per questo, quindi questo strumento funziona alla grande. Puoi leggere Di Più su pdfimages Qui 


2
2017-07-24 01:39



Per favore leggi altre risposte prima di postare le tue. Si noti che c'è altro che copre questo. - edwin
Ok, scusa :) Ho pensato di postare il mio perché ha alcune informazioni sui file pdf protetti da password e spiego che questo strumento ha queste opzioni, inoltre ho postato un link che è un tutorial su questo strumento. - jetbird13
Se ottieni una reputazione sufficiente, puoi commentare le risposte di altri o svalutarli. - edwin


Se ciò di cui hai bisogno è un'immagine ritagliata in formato pdf / eps, quindi estrai una pagina usando l'immagine pdfmod(come suggerito da To Do).

Quindi usando pdfcrop puoi ritagliarlo correttamente impostando i margini per tentativi ed errori:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

2
2018-06-12 14:17





Con pdfimages l'immagine estratta può essere in due o più parti. Un modo semplice per rimetterli insieme senza preoccupazioni sui formati estratti è quello di importare le parti in LibreOffice Draw, ritagliare il dialogo di ritaglio delle immagini, posizionare le parti, regolare le dimensioni della pagina ed esportarle nel formato che preferisci.


1
2018-01-06 23:54





Se vuoi ritagliare un'immagine da un pdf con un pdfviewer, puoi provare okular. Può ritagliare qualsiasi cosa (testi o immagini) in formato png o jpeg. Se vuoi estrarre immagini in formato png da un pdf, puoi farlo con un comando minimo con pdftohtml. Converte le immagini da pdf a html più. Qui puoi trovare un esempio - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Se vuoi estrarre molte immagini da un pdf, ti suggerisco di provarlo.


1
2017-07-06 15:09