Vraag Ingebouwde afbeeldingen uit een PDF extraheren


Voordat ik Ubuntu ging gebruiken, gebruikte ik Nitro PDF-reader om automatisch afbeeldingen uit PDF-bestanden te extraheren. Is er een PDF-lezer voor Linux die dit doet?

Ik zou graag afbeeldingen sneller / gemakkelijker kunnen uitpakken dan wanneer ik een foto maak.


138
2018-06-12 22:36


oorsprong


Kun je je herinneren hoe goed NitroPDF kan omgaan met vectorafbeeldingen? Kan pdfimages doe het beter / worser dan NitroPDF? - Léo Léopold Hertz 준영
Mogelijk duplicaat van command line tool om bulk afbeeldingen uit een pdf te extraheren? - funky-future
@ funky-toekomst Het is duidelijk dat de twee vragen duplicaten zijn, maar je dubbele doel heeft slechts twee antwoorden en een van deze twee antwoorden is een spamantwoord, dus de richting van de duplicatie moet worden omgekeerd om te voorkomen dat deze vraag wordt gehamerd door de dupe hamer. - karel


antwoorden:


Gebruik pdfimages

pdfimages is een PDF-afbeeldingshulptool waarmee de afbeeldingen in een PDF-bestand kunnen worden opgeslagen in PPM-, PBM-, JPEG- of JPEG 2000-indeling (en).

Het is een deel van de poppler-utils pakket, dat je moet installeren.

Gebruik:  pdfimages [options] <PDF-file> <image-root>

Voorbeeld: Het volgende extraheert alle afbeeldingen uit een PDF-bestand en slaat ze op in JPEG-indeling.

pdfimages -j in.pdf /tmp/out

Zal afbeeldingen uit PDF-bestand opslaan in.pdf in bestanden /tmp/out-000.jpg (of /tmp/out-000.pbm; zie hieronder), /tmp/out-001.jpg, enz.


De pdfimages man pagina legt uit:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

169
2018-06-12 23:06



Zou fijn zijn om een ​​oplossing te hebben die afbeeldingen in zijn oorspronkelijke formaat uitpakt. Het opnieuw coderen van JPEG's is niet echt ideaal. - Christian
@Christian from man-pagina -all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt. - wil93
Houd er rekening mee dat de -all switch wordt alleen ondersteund in recente poppler-utils revisies. Als u bijvoorbeeld nog op 12.04 bent, kunt u deze optie niet gebruiken - Glutanimate
Als je niet kunt gebruiken -all ga voor de PNM-indelingen. Ze zijn verliesvrij en u kunt de afbeeldingen nabewerken, bijvoorbeeld naar PNG. - Tomasz Gandor
@Christian, gebruik $ pdfimages -list <PDF-file> om het originele formaat in de kolom "enc" te controleren, zodat u de afbeelding niet opnieuw naar een andere indeling hoeft te coderen. - Jose Barakat


Ik gebruik hiervoor vaak Inkscape. Laad de pagina en verwijder alle andere dingen. Het voordeel is dat u vectorafbeeldingen in SVG kunt ophalen en deze naar wens kunt wijzigen.


18
2017-09-11 13:12



Sommige PDF's kunnen alleen correct worden geïmporteerd met Inkscape interne import (poppler / cairo-import of pdfimage kan het niet goed parseren). Importeer, kopieer en plak de afbeelding naar een nieuw bestand en wijzig het formaat van de pagina naar de selectie graphicdesign.stackexchange.com/a/21638/95041 - sdaffa23fdsf


Je kunt ook pdfmod proberen. Het is een GUI (grafische interface) die afbeeldingen kan extraheren en andere eenvoudige pdf-manipulatie kan uitvoeren.


4
2018-06-13 17:18



Hmm, lijkt een beetje buggy voor mij. Een PDF ingevoegd met voornamelijk violette afbeeldingen en groenige afbeeldingen. - DBX12


Ik heb een PDF-bestand met dubbele kolom met ingesloten afbeeldingen gemaakt met LaTeX waar de originele afbeeldingen als EPS werden geleverd. Ik probeerde de voorgestelde oplossing op basis van pdfimages, maar helaas zijn er geen afbeeldingen geretourneerd. Ik heb toen geprobeerd om Inkscape te gebruiken, maar de SVG-afbeeldingen die werden gegenereerd waren vervormd en ik had ook geen geluk om ze als EPS te exporteren.

De software die werkte, was de MasterPdfEditor.

Hier is de procedure

  • Open uw bestand met behulp van Master PDF Editor
  • Gebruik de bewerkingsgereedschap (Alt + 1) om de afbeelding te selecteren die u wilt extraheren
  • Kopieer het cijfer (Ctrl + C)
  • Klik op het omliggende gestippelde kader rond de afbeelding en bekijk de rechterzijbalk (Object Inspector) en klik op "Geomerty". Daar zie je de grootte van je selectie
  • Maak een nieuw bestand (Ctrl + N). U wordt gevraagd om het paginaformaat op te geven. Geef de exacte grootte van uw afbeelding op en maak het nieuwe bestand aan
  • Nu is het een beetje lastig: plak de afbeelding (Ctrl + V). De afbeelding wordt mogelijk niet weergegeven in het nieuwe bestand. Gebruik de pijlen om het te verplaatsen totdat je het kunt traceren.
  • Gebruik de pijlen om de afbeelding op de nieuwe pagina te centreren
  • Opslaan als PDF

Het resultaat is van zeer hoge kwaliteit, maar de software is niet gratis. Er is een demoversie waarmee je alle functies kunt uitproberen, maar die wordt geleverd met de toevoeging van een watermerk in het uitvoerbestand. Om eerlijk te zijn merkte ik geen enkel watermerk op in de geproduceerde PDF.


4
2018-04-12 16:50



Dit is de vraag Ubuntu ... We houden van open source hier en uw oplossing is een commerciële closed-source oplossing ... Hoe is dit beter dan de al upvoted antwoorden? (-1 in de tussentijd) - Fabby
@Fabby Bedankt voor de feedback. Ik wist het niet. Bestaat er een dergelijke regel op askubuntu.com? Echter, zodra u opent Ubuntu-softwarecentrum, krijg je suggesties voor niet-gratis applicaties. - Pantelis Sopasakis
Nee, er is geen "regel" en daarom heb ik niet gestemd om dit antwoord te verwijderen, maar er zijn betere tools die gratis zijn (zoals in gratis bier en vrijheid van meningsuiting), dus dat is slechts een mening. - Fabby
1. Ik heb de ImageMagick-opdrachtregel gebruikt, maar dit is een interessante oplossing voor iemand die op zoek is naar een GUI. - rpmcruz
Het werkt voor sommige mensen, dat is goed genoeg. Wees geen nazi ... ik weet niet wie "wij" zijn. Je kunt alleen voor jezelf spreken. +1 voor het antwoord - sdaffa23fdsf


Ik gebruik pdfimages wat een commandoregel-tool is en het werkt geweldig voor mij. Het is heel gemakkelijk te gebruiken en je kunt de --help-optie gebruiken om meer te leren over het gebruik ervan. Ik gebruik Ubuntu en het is vooraf geïnstalleerd. Als uw pdf-bestanden gecodeerd of beveiligd met een wachtwoord zijn, zijn er daarvoor opties, dus deze tool werkt prima. Jij kunt lezen meer over pdfimages hier 


2
2017-07-24 01:39



Lees andere antwoorden voordat je de jouwe plaatst. Merk op dat er andere zijn die dit dekken. - edwin
Ok, sorry :) Ik dacht om de mijne te plaatsen omdat het wat info heeft over met wachtwoord beveiligde pdf-bestanden en ik leg uit dat deze tool deze optie heeft, plus ik heb een link geplaatst die een tutorial over deze tool is. - jetbird13
Als je genoeg reputatie opdoet, kun je commentaar geven op de antwoorden van anderen of ze verbeteren. - edwin


Als u een bijgesneden afbeelding in pdf / eps-indeling nodig heeft, extraheer dan een pagina met de afbeelding met pdfmod(zoals voorgesteld door To Do).

Dan gebruiken pdfcrop u kunt het bijsnijden door de marges met vallen en opstaan ​​in te stellen:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

2
2018-06-12 14:17





Met pdfimages kan de geëxtraheerde afbeelding in twee of meer delen zijn. Een eenvoudige manier om ze opnieuw samen te stellen zonder zorgen over de geëxtraheerde formaten is om de onderdelen in LibreOffice Draw te importeren, bij te snijden met het beelduitsnedialoogvenster, de onderdelen te positioneren, het paginaformaat aan te passen en te exporteren in elk gewenst formaat.


1
2018-01-06 23:54





Als u een afbeelding uit pdf wilt bijsnijden met een pdfviewer, kunt u okular proberen. Het kan alles (teksten of afbeeldingen) bijsnijden in png- of jpeg-indeling. Als u afbeeldingen in png-formaat uit een pdf wilt extraheren, kunt u dit doen met een minimale opdracht met pdftohtml. Het converteert pdf naar html plus afbeeldingen. Hier kunt u een voorbeeld vinden - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Als u veel afbeeldingen uit een pdf wilt extraheren, raad ik u aan dit te proberen.


1
2017-07-06 15:09