PDF to TXT, JPG, PNG – prosta konwersja pliku

Uwaga: Ten wpis został utworzony ponad rok temu. Informacje w nim zawarte mogą być nieaktualne!

Plik PDF jest plikiem, który jest bardzo ciężko edytować, ale można spróbować zapisać go w innym formacie np. TXT, JPG, PNG. Pokaże co trzeba zrobić, aby zapisać taki plik.

Najpierw musimy zainstalować odpowiedni program. Idziemy do System → Administracja → Synaptic Package Manager i instalujemy poppler-utils.

Jeśli chcemy przerobić cały plik PDF na TXT musimy skopiować go do katalogu domowego (lub podać odpowiednią ścieżkę w konstrukcji polecenia). Oto kilka opcji konwersji:

  • Konwersja całego pliku na text:
  • pdftotxt nazwa_pliku.pdf nazwa_pliku.txt
  • Konwertowanie dwóch pierwszych stron pliku:
  • pdftotxt -f 2 nazwa_pliku.pdf nazwa_pliku.txt
  • Konwersja dwóch ostatnich stron pliku:
  • pdftotxt -l 2 nazwa_pliku.pdf nazwa_pliku.txt
  • Konwersja pliku, który jest chroniony hasłem:
  • pdftotxt -upw 'hasło' nazwa_pliku.pdf nazwa_pliku.txt

Zapis pliku PDF w na format JPG lub PNG można wykonać za pomocą programu GIMP. Wystarczy otworzyć plik i zapisać go formacie, który nam odpowiada.

Wszystkie programy, które przedstawiłem tutaj można zainstalować poprzez Centrum Oprogramowania Ubuntu.

Jeżeli powyższy artykuł nie rozwiązał lub rozwiązał częściowo Twój problem, dodaj swój komentarz opisujący, w którym miejscu napotkałeś trudności.
Mile widziane komentarze z uwagami lub informacjami o rozwiązaniu problemu.
  • Sebastian

    Czy nie lepszym rozwiązaniem będzie użycie wtyczki pdfimport w open office?

  • Adam

    A jeszcze lepszym rozwiązaniem będzie TO

    • Sebastian

      Nie, nie masz pojęcia co robi ta wtyczka. Proponuję sprawdzić, bo wprowadzasz ludzi w błąd. Twoje rozwiązanie konwertuje pdf-a do jpg, png, a podane przeze mnie umożliwia po konwersji lepszą edycję, bo wykrywa tekst, tabele itp, czyli konwertuje do dokumentu tekstowego. Jest to co innego, na przyszłość radzę zainteresować się chociaż trochę zanim coś napiszesz.

  • kryfian

    Witam.
    U mnie ta metoda nie dała rezultatu.Mam zainstalowanu poppler-utils,
    wpisałem w terminal odpowiednią komende i dostałem „pdftotxt comand not fund”
    Proszę o radę.

    • Sebastian

      Usuń(możesz nawet użyć purge) i zainstaluj ponownie poppler-utils. Potem wpisz pdf i naciśnij dwa razy tab. Terminal wyrzuci ci wszystkie programy zaczynające się fraza „pdf” – zobacz czy wśród nich nie ma pdftotext. Jeśli jest to wpisuj kolejne znaki posiłkując się tabem – dopełni Ci polecenie do końca, a tym samym, będziesz pewien, że taki program posiadasz w systemie. Mi działa bez zarzutu – używam Ubuntu 10.04.

  • kormar

    w 10.4 to chyba nie pdftotxt a pdftotext

    • Sebastian

      Przecież tak napisałem, czytaj uważnie!

  • kormar

    Niestety program ten nie konwertuje całego dokumentu a jedynie nieistotne dane (np strona 1), tabelka z istotnymi danymi pozostaje niewidoczna.

    • Sebastian

      Użyj więc wtyczki, którą podałem w 1 poście.