1. Termékek
  2.   PDF
  3.   Python
  4.   Pikepdf
 
  

Nyílt forráskódú Python Library PDF-fájlok feldolgozásához

Az ingyenes Python API lehetővé teszi a PDF-ek linearizálását és a titkosított PDF-ek elérését. Támogatja a PDF-készítést a semmiből, az oldalak másolását egyik PDF-ből a másikba, a PDF-ek felosztását vagy egyesítését és még sok mást.

A PikePDF egy nagyon egyszerű Python PDF könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy PDF fájlokkal dolgozzanak Python alkalmazásokon belül. A QPDF-en, egy hatékony PDF-manipulációs és -javító könyvtáron alapul. A PikePDF egy PDF-tartalom-átalakítási könyvtár, amely alacsony szintű hozzáférést biztosít a PDF-fájlokhoz. Ez azt jelenti, hogy a felhasználóknak ismerniük kell a PDF belső tulajdonságait és ismerniük kell a PDF specifikációit. A könyvtár nyílt forráskódú, és az MIT licenc alatt áll rendelkezésre nyilvános használatra. A könyvtár nyílt forráskódú, és az MPL-2.0 licenc alatt érhető el.

A PikePDF támogatja a PDF-ek linearizálását és a titkosított PDF-ekhez való hozzáférést. A PDF-kezeléshez kapcsolódó nagyon hatékony funkciókészlettel rendelkezik, mint például a PDF-készítés a semmiből, az oldalak másolása egyik PDF-ből a másikba, a PDF-ek felosztása vagy egyesítése, kép vagy szöveg kinyerése PDF-ből, tartalom cseréje PDF-ben, PDF javítási támogatás, oldal. beállítások támogatása, PDF metaadatok kezelése, jelszóval védett munka, PDF XMP metaadatok szerkesztése, meglévő PDF-ek átalakítása és még sok más.

.

Previous Next

A PikePDF használatának első lépései

A PikePDF-hez Python 3.6 vagy újabb verzió szükséges. A PikePDF-et a pip segítségével telepítheti. Kérjük, használja a következő parancsot a telepítéshez.

Telepítse a PikePDF-et pip-n keresztül

 pip install pikepdf

Oldalak másolása egyik PDF-ből a másikba Python segítségével

A nyílt forráskódú PikePDF könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy néhány sor Python kóddal átmásolják az oldalakat egyik PDF-fájlból a másikba. Az oldalak PDF-objektumok közötti másolása a forrásoldal sekély másolatát hozza létre a cél PDF-fájlban, ezért az oldalak módosítása nem lesz hatással az eredeti PDF-dokumentumokra. Lehetőség van bizonyos oldalak egyedi tartalommal történő helyettesítésére is. Lehetőség van oldalak másolására is egy adott PDF-ben.

Nyissa meg és kezelje a PDF dokumentumokat Python segítségével

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

PDF felosztása és egyesítése Python segítségével

A PDF PikePDF könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy hozzáférjenek a meglévő PDF-fájlokhoz, és könnyedén feloszthassák azokat több PDF-fájlra. A PDF felosztása során mindössze annyit kérünk, hogy az új PDF-eknek tartalmazniuk kell a céloldalakat. A könyvtár gondoskodik az egyes oldalakhoz tartozó adatok átviteléről is, hogy minden oldal önállóan álljon. A könyvtár támogatja a több PDF-dokumentum egyesítését vagy összefűzését is. Lehetőség van a PDF-oldalak sorrendjének megfordítására is, mindössze néhány sornyi kóddal.

PDF-dokumentumok felosztása és egyesítése Python segítségével

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

A PDF-dokumentumban lévő képek kezelése Python segítségével

A PDF PikePDF könyvtár megkönnyíti a szoftverfejlesztők számára, hogy Python-parancsokkal kezeljék a PDF-fájlban lévő képeket. A könyvtár számos, a képkezeléssel kapcsolatos fontos funkciót tartalmaz, mint például képek másolása PDF oldalon, PDF megnyitása és megtekintése, képek átméretezése, PDF-ben lévő képek manipulálása, képek PDF-ből való kinyerése, képek cseréje, kép törlése PDF-ből és még sok más. .

Kivonja a képet és cserélje ki PDF-ben a Python segítségével

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

PDF metaadatok kezelése Python segítségével

A PDF metaadatok nagyon hasznos információkat tartalmaznak a PDF-dokumentumról, például a szerző nevét, a létrehozás és módosítás dátumát, kulcsszavakat, szerzői jogi információkat stb. A PDF PikePDF könyvtár teljes funkcionalitást tartalmaz a metaadatok eléréséhez és olvasásához, a metaadatok kinyeréséhez, valamint a metaadat bejegyzések törléséhez a PDF dokumentumokból. A következő kódpélda bemutatja, hogyan lehet metaadatokat kinyerni PDF dokumentumokból.

PDF-metaadatok kinyerése Python segítségével

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 Magyar