Nyílt forráskódú Python Library PDF-fájlok feldolgozásához
Az ingyenes Python API lehetővé teszi a PDF-ek linearizálását és a titkosított PDF-ek elérését. Támogatja a PDF-készítést a semmiből, az oldalak másolását egyik PDF-ből a másikba, a PDF-ek felosztását vagy egyesítését és még sok mást.
A PikePDF egy nagyon egyszerű Python PDF könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy PDF fájlokkal dolgozzanak Python alkalmazásokon belül. A QPDF-en, egy hatékony PDF-manipulációs és -javító könyvtáron alapul. A PikePDF egy PDF-tartalom-átalakítási könyvtár, amely alacsony szintű hozzáférést biztosít a PDF-fájlokhoz. Ez azt jelenti, hogy a felhasználóknak ismerniük kell a PDF belső tulajdonságait és ismerniük kell a PDF specifikációit. A könyvtár nyílt forráskódú, és az MIT licenc alatt áll rendelkezésre nyilvános használatra. A könyvtár nyílt forráskódú, és az MPL-2.0 licenc alatt érhető el.
A PikePDF támogatja a PDF-ek linearizálását és a titkosított PDF-ekhez való hozzáférést. A PDF-kezeléshez kapcsolódó nagyon hatékony funkciókészlettel rendelkezik, mint például a PDF-készítés a semmiből, az oldalak másolása egyik PDF-ből a másikba, a PDF-ek felosztása vagy egyesítése, kép vagy szöveg kinyerése PDF-ből, tartalom cseréje PDF-ben, PDF javítási támogatás, oldal. beállítások támogatása, PDF metaadatok kezelése, jelszóval védett munka, PDF XMP metaadatok szerkesztése, meglévő PDF-ek átalakítása és még sok más.
.
A PikePDF használatának első lépései
A PikePDF-hez Python 3.6 vagy újabb verzió szükséges. A PikePDF-et a pip segítségével telepítheti. Kérjük, használja a következő parancsot a telepítéshez.
Telepítse a PikePDF-et pip-n keresztül
pip install pikepdf
Oldalak másolása egyik PDF-ből a másikba Python segítségével
A nyílt forráskódú PikePDF könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy néhány sor Python kóddal átmásolják az oldalakat egyik PDF-fájlból a másikba. Az oldalak PDF-objektumok közötti másolása a forrásoldal sekély másolatát hozza létre a cél PDF-fájlban, ezért az oldalak módosítása nem lesz hatással az eredeti PDF-dokumentumokra. Lehetőség van bizonyos oldalak egyedi tartalommal történő helyettesítésére is. Lehetőség van oldalak másolására is egy adott PDF-ben.
Nyissa meg és kezelje a PDF dokumentumokat Python segítségével
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
PDF felosztása és egyesítése Python segítségével
A PDF PikePDF könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy hozzáférjenek a meglévő PDF-fájlokhoz, és könnyedén feloszthassák azokat több PDF-fájlra. A PDF felosztása során mindössze annyit kérünk, hogy az új PDF-eknek tartalmazniuk kell a céloldalakat. A könyvtár gondoskodik az egyes oldalakhoz tartozó adatok átviteléről is, hogy minden oldal önállóan álljon. A könyvtár támogatja a több PDF-dokumentum egyesítését vagy összefűzését is. Lehetőség van a PDF-oldalak sorrendjének megfordítására is, mindössze néhány sornyi kóddal.
PDF-dokumentumok felosztása és egyesítése Python segítségével
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
A PDF-dokumentumban lévő képek kezelése Python segítségével
A PDF PikePDF könyvtár megkönnyíti a szoftverfejlesztők számára, hogy Python-parancsokkal kezeljék a PDF-fájlban lévő képeket. A könyvtár számos, a képkezeléssel kapcsolatos fontos funkciót tartalmaz, mint például képek másolása PDF oldalon, PDF megnyitása és megtekintése, képek átméretezése, PDF-ben lévő képek manipulálása, képek PDF-ből való kinyerése, képek cseréje, kép törlése PDF-ből és még sok más. .
Kivonja a képet és cserélje ki PDF-ben a Python segítségével
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
PDF metaadatok kezelése Python segítségével
A PDF metaadatok nagyon hasznos információkat tartalmaznak a PDF-dokumentumról, például a szerző nevét, a létrehozás és módosítás dátumát, kulcsszavakat, szerzői jogi információkat stb. A PDF PikePDF könyvtár teljes funkcionalitást tartalmaz a metaadatok eléréséhez és olvasásához, a metaadatok kinyeréséhez, valamint a metaadat bejegyzések törléséhez a PDF dokumentumokból. A következő kódpélda bemutatja, hogyan lehet metaadatokat kinyerni PDF dokumentumokból.
PDF-metaadatok kinyerése Python segítségével
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)