1. Ürün:% s
  2.   PDF
  3.   Python
  4.   Pikepdf
 
  

PDF Dosyalarını İşlemek için Açık Kaynak Python Kitaplığı

Ücretsiz Python API, PDF'leri doğrusallaştırmaya ve şifreli PDF'lere erişmeye izin verir. Sıfırdan PDF oluşturmayı, sayfaları bir PDF'den diğerine kopyalamayı, PDF'leri bölmeyi veya birleştirmeyi ve çok daha fazlasını destekler.

PikePDF, yazılım geliştiricilerin Python uygulamaları içinde PDF dosyalarıyla çalışmasına izin veren çok basit bir Python PDF kitaplığıdır. Güçlü bir PDF işleme ve onarım kitaplığı olan QPDF'ye dayanmaktadır. PikePDF bir PDF içerik dönüştürme kitaplığıdır ve PDF dosyalarına düşük düzeyde erişim sağlar. Bu, kullanıcıların PDF dahili bilgilerine ve PDF özelliklerine aşina olmaları gerektiği anlamına gelir. Kütüphane açık kaynak kodludur ve MIT lisansı altında genel kullanıma açıktır. Kütüphane açık kaynak kodludur ve MPL-2.0 Lisansı altında mevcuttur.

PikePDF, PDF'leri doğrusallaştırma ve şifreli PDF'lere erişim için destek sağlar. Sıfırdan PDF oluşturma, sayfaları bir PDF'den diğerine kopyalama, PDF'leri bölme veya birleştirme, PDF'den görüntü veya metin çıkarma, PDF'deki içeriği değiştirme, PDF onarım desteği, sayfa gibi PDF yönetimiyle ilgili çok güçlü bir dizi özellik içeriyor. ayarlar desteği, PDF meta verilerini yönetme, parola korumalı çalışma, PDF XMP meta veri düzenleme, mevcut PDF'lerin dönüştürülmesi ve daha fazlası.

.

Previous Next

PikePDF'ye Başlarken

PikePDF, Python 3.6 ve üstünü gerektirir. PikePDF'yi pip kullanarak yükleyebilirsiniz. Lütfen yüklemek için aşağıdaki komutu kullanın.

PikePDF'yi pip ile kurun

 pip install pikepdf

Python ile Sayfaları Bir PDF'den Diğerine Kopyalayın

Açık kaynaklı PikePDF kitaplığı, yazılım geliştiricilerin yalnızca birkaç satır Python koduyla bir PDF'den diğerine sayfa kopyalamasını sağlayan yetenek sağlar. Sayfaları PDF nesneleri arasında kopyalamak, hedef PDF dosyası içinde kaynak sayfanın sığ bir kopyasını oluşturacaktır ve bu nedenle sayfaları değiştirmek orijinal PDF belgelerini etkilemeyecektir. Belirli sayfaları özel içerikle değiştirmek de mümkündür. Belirli bir PDF içindeki sayfaları kopyalamak da mümkündür.

Python ile PDF Belgelerini Açın ve İşleyin

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

Python ile PDF Bölme ve Birleştirme

PDF PikePDF kitaplığı, yazılım geliştiricilerine mevcut PDF dosyalarına erişme ve bunları kolaylıkla birden çok PDF dosyasına bölme gücü verir. PDF'yi bölerken tek ihtiyacımız olan, yeni PDF'lerin hedef sayfaları içermesi gerektiğidir. Kütüphane ayrıca her sayfayla ilişkili verilerin aktarılmasını sağlar, böylece her sayfa kendi başına durur. Kitaplık ayrıca birden fazla PDF belgesini tek bir belgede birleştirme veya birleştirme desteği de içeriyordu. Sadece birkaç satır kod ile PDF sayfalarının sırasını tersine çevirmek de mümkündür.

Python ile PDF Belgelerini Böl ve Birleştir

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

Python ile PDF Belgesi içindeki Görüntüleri Yönetin

PDF PikePDF kitaplığı, yazılım geliştiricilerin Python komutlarını kullanarak bir PDF dosyası içindeki görüntüleri işlemesini kolaylaştırır. Kitaplık, PDF sayfasındaki görüntüleri kopyalama, PDF'yi açma ve görüntüleme, görüntüleri yeniden boyutlandırma, PDF'deki görüntüleri değiştirme, PDF'den görüntü çıkarma, görüntüleri değiştirme, PDF'den görüntü silme ve daha pek çok görüntü işleme ile ilgili birçok önemli işlevi içerir. .

Görüntüyü Çıkarın ve Python ile PDF'de Değiştirin

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

Python ile PDF Meta Veri İşleme

PDF meta verileri, bir PDF belgesi hakkında yazarın adı, oluşturulma ve değiştirilme tarihi, anahtar sözcükler, telif hakkı bilgileri vb. gibi çok yararlı bilgiler içerir. PDF PikePDF kitaplığı, meta verilere erişmek ve okumak, meta verileri çıkarmak, PDF belgelerinden meta veri girişlerini silmek için eksiksiz işlevsellik içerir. Aşağıdaki kod örneği, PDF belgelerinden meta verilerin nasıl çıkarılacağını gösterir.

Python ile PDF Meta Verileri Nasıl Çıkarılır

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 Türkçe