PDF Dosyalarını İşlemek için Açık Kaynak Python Kitaplığı
Ücretsiz Python API, PDF'leri doğrusallaştırmaya ve şifreli PDF'lere erişmeye izin verir. Sıfırdan PDF oluşturmayı, sayfaları bir PDF'den diğerine kopyalamayı, PDF'leri bölmeyi veya birleştirmeyi ve çok daha fazlasını destekler.
PikePDF, yazılım geliştiricilerin Python uygulamaları içinde PDF dosyalarıyla çalışmasına izin veren çok basit bir Python PDF kitaplığıdır. Güçlü bir PDF işleme ve onarım kitaplığı olan QPDF'ye dayanmaktadır. PikePDF bir PDF içerik dönüştürme kitaplığıdır ve PDF dosyalarına düşük düzeyde erişim sağlar. Bu, kullanıcıların PDF dahili bilgilerine ve PDF özelliklerine aşina olmaları gerektiği anlamına gelir. Kütüphane açık kaynak kodludur ve MIT lisansı altında genel kullanıma açıktır. Kütüphane açık kaynak kodludur ve MPL-2.0 Lisansı altında mevcuttur.
PikePDF, PDF'leri doğrusallaştırma ve şifreli PDF'lere erişim için destek sağlar. Sıfırdan PDF oluşturma, sayfaları bir PDF'den diğerine kopyalama, PDF'leri bölme veya birleştirme, PDF'den görüntü veya metin çıkarma, PDF'deki içeriği değiştirme, PDF onarım desteği, sayfa gibi PDF yönetimiyle ilgili çok güçlü bir dizi özellik içeriyor. ayarlar desteği, PDF meta verilerini yönetme, parola korumalı çalışma, PDF XMP meta veri düzenleme, mevcut PDF'lerin dönüştürülmesi ve daha fazlası.
.
PikePDF'ye Başlarken
PikePDF, Python 3.6 ve üstünü gerektirir. PikePDF'yi pip kullanarak yükleyebilirsiniz. Lütfen yüklemek için aşağıdaki komutu kullanın.
PikePDF'yi pip ile kurun
pip install pikepdf
Python ile Sayfaları Bir PDF'den Diğerine Kopyalayın
Açık kaynaklı PikePDF kitaplığı, yazılım geliştiricilerin yalnızca birkaç satır Python koduyla bir PDF'den diğerine sayfa kopyalamasını sağlayan yetenek sağlar. Sayfaları PDF nesneleri arasında kopyalamak, hedef PDF dosyası içinde kaynak sayfanın sığ bir kopyasını oluşturacaktır ve bu nedenle sayfaları değiştirmek orijinal PDF belgelerini etkilemeyecektir. Belirli sayfaları özel içerikle değiştirmek de mümkündür. Belirli bir PDF içindeki sayfaları kopyalamak da mümkündür.
Python ile PDF Belgelerini Açın ve İşleyin
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
Python ile PDF Bölme ve Birleştirme
PDF PikePDF kitaplığı, yazılım geliştiricilerine mevcut PDF dosyalarına erişme ve bunları kolaylıkla birden çok PDF dosyasına bölme gücü verir. PDF'yi bölerken tek ihtiyacımız olan, yeni PDF'lerin hedef sayfaları içermesi gerektiğidir. Kütüphane ayrıca her sayfayla ilişkili verilerin aktarılmasını sağlar, böylece her sayfa kendi başına durur. Kitaplık ayrıca birden fazla PDF belgesini tek bir belgede birleştirme veya birleştirme desteği de içeriyordu. Sadece birkaç satır kod ile PDF sayfalarının sırasını tersine çevirmek de mümkündür.
Python ile PDF Belgelerini Böl ve Birleştir
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
Python ile PDF Belgesi içindeki Görüntüleri Yönetin
PDF PikePDF kitaplığı, yazılım geliştiricilerin Python komutlarını kullanarak bir PDF dosyası içindeki görüntüleri işlemesini kolaylaştırır. Kitaplık, PDF sayfasındaki görüntüleri kopyalama, PDF'yi açma ve görüntüleme, görüntüleri yeniden boyutlandırma, PDF'deki görüntüleri değiştirme, PDF'den görüntü çıkarma, görüntüleri değiştirme, PDF'den görüntü silme ve daha pek çok görüntü işleme ile ilgili birçok önemli işlevi içerir. .
Görüntüyü Çıkarın ve Python ile PDF'de Değiştirin
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
Python ile PDF Meta Veri İşleme
PDF meta verileri, bir PDF belgesi hakkında yazarın adı, oluşturulma ve değiştirilme tarihi, anahtar sözcükler, telif hakkı bilgileri vb. gibi çok yararlı bilgiler içerir. PDF PikePDF kitaplığı, meta verilere erişmek ve okumak, meta verileri çıkarmak, PDF belgelerinden meta veri girişlerini silmek için eksiksiz işlevsellik içerir. Aşağıdaki kod örneği, PDF belgelerinden meta verilerin nasıl çıkarılacağını gösterir.
Python ile PDF Meta Verileri Nasıl Çıkarılır
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)