PDF fayllarını çevirmək üçün açıq mənbəli Python kitabxanası

Pulsuz Python API Tərtibatçılara PDF fayllarını ixrac etməyə, döndərməyə, birləşdirməyə və birləşdirməyə, PDF-lərdən məlumat və elementləri çıxarmağa imkan verir.

pdfrw proqram tərtibatçılarına heç bir xarici xüsusi proqram quraşdırmadan PDF fayllarını oxumaq və yazmaq imkanı verən açıq mənbəli təmiz Python kitabxanasıdır. pdfrw proqramlaşdırma kitabxanasından istifadə etmək çox sadədir və mənbə kodu yaxşı sənədləşdirilmiş, çox sadə və başa düşüləndir. Kitabxanaya PDF-lərdə mətn sətirləri üçün düzgün Unicode dəstəyi, eləcə də ən sürətli təmiz Python PDF analizatoru daxildir.

pdfrw kitabxanasına PDF-lərin birləşdirilməsi, metadatanın dəyişdirilməsi, çoxsaylı PDF-lərin birləşdirilməsi, şəkillərin çıxarılması, PDF çapı, PDF səhifələrinin fırlanması, yeni PDF yaradılması, su nişanının PDF şəklinin əlavə edilməsi və sair kimi bir neçə mühüm PDF əməliyyatı üçün dəstək daxildir.

Bir baxışda

pdfrw xüsusiyyətlərinə ümumi baxış.

Xüsusiyyətlərə Baxış

PDF yaradın
PDF redaktə edin
PDF-lərin bölünməsi
PDF-lərin birləşdirilməsi
Fırlanan PDF sənədləri
PDF-lərin birləşdirilməsi
Hiperlinklərin yerləşdirilməsi
Dairələri daxil edin
Kompleks formalar əlavə edin
Unicode dəstəyi
Məlumatların çıxarılması
Mətn kerning
Şriftin yerləşdirilməsi
PDF şifrələyin
PDF forması
Şəkillərin yerləşdirilməsi

pdfrw

pdfrw PDF fayl formatını və ixrac üçün sənaye standart formatlarını dəstəkləyir.

Oxucu

yazıçı

TXT, HTML

pdfrw

Platformanın Müstəqilliyi

pdfrw Python 2.6, 2.7, 3.3, 3.4, 3.5 və 3.6 ilə sınaqdan keçirilir.

Python 2.6 və daha yüksək

pdfrw

Pdfrw ilə işə başlamaq

pdfrw üçün Python 2.6, 2.7, 3.3, 3.4, 3.5 və 3.6 tələb olunur. Siz pip istifadə edərək pdfrw quraşdıra bilərsiniz. Quraşdırmaq üçün aşağıdakı əmrdən istifadə edin.

pip vasitəsilə pdfrw quraşdırın

 python -m pip install pdfrw

Python Kitabxanası vasitəsilə PDF sənədləri yaradın

pdfrw kitabxanası proqram tərtibatçılarına yalnız bir neçə sətir kodla öz Python proqramlarında PDF Sənədləri Yaratmaq imkanı verir. Kitabxana həmçinin mövcud PDF fayllarına daxil olmaq və onları dəyişdirmək üçün dəstək verir. Mövcud PDF-ə asanlıqla yeni səhifələr, eləcə də qrafik komponentlər və ya mətn elementləri daxil edə bilərsiniz. pdfrw kitabxanası oxuduğunuz PDF fayllarında səhifələri tapmaq və bir sıra səhifələri yeni PDF faylına yazmaq üçün dəstək verir.

Python vasitəsilə PDF sənədlərini yaradın və dəyişdirin

 // PDF Documents Creation 
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write()

Python vasitəsilə PDF faylları oxumaq

pdfrw kitabxanası proqram tərtibatçılarına Python proqramları daxilində PDF sənədlərinin müxtəlif hissələrinə asanlıqla daxil olmaq və oxumaq imkanı verir. Bütün PDF sənədinə asan giriş imkanı verir. Kitabxana fayl məlumatının, ölçüsünün və s. alınmasını dəstəkləyir. O, istifadəçilərə PDF sənədinin bütün səhifələrini sadalamağa imkan verən səhifələr adlı xüsusi atribut yaradır. Bu, müəllif, başlıq və s. kimi məlumatları çıxarmaq üçün istifadə edə biləcəyiniz sənəd məlumat obyektini çıxarmağa imkan verir.

Python vasitəsilə PDF fayllarına daxil olun və oxuyun

 // Reading PDF Files
  from pdfrw import pdfreader
  def get_pdf_info(path):
    pdf = pdfreader(path)
    print(pdf.keys())
    print(pdf.info)
    print(pdf.root.keys())
    print('pdf has {} pages'.format(len(pdf.pages)))
  if __name__ == '__main__':
    get_pdf_info('w9.pdf')

Metadata əlavə etmək və ya dəyişdirmək

pdfrw proqram tərtibatçılarına öz Python proqramlarında PDF fayllarının metadatasını əlavə etmək və ya dəyişdirmək imkanı verir. Siz PDF-də tək metaməlumat elementini dəyişdirə, nəticəni yeni PDF-ə yaza, həmçinin bir neçə faylı daxil edə və çıxış PDF faylına bəzi mənasız metadata əlavə etdikdən sonra onları birləşdirə bilərsiniz.

Python vasitəsilə PDF metadatasını dəyişdirin

 // Modifying PDF Metadata
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write()

PDF sənədlərinin bölünməsi

pdfrw proqram tərtibatçılarına proqramlar daxilində PDF sənədlərini proqramlı şəkildə bölməyə imkan verir. İstifadəçi PDF kitabının müəyyən hissəsini çıxarmağı və ya onları bir faylda saxlamaq əvəzinə bir neçə PDF-ə bölməyi tələb edə bilər. Bu pdfrw kitabxanası ilə çox asandır, sadəcə olaraq daxil olan PDF fayl yolunu, çıxarmaq istədiyiniz səhifələrin sayını və çıxış yolunu təmin etməlisiniz.

Python vasitəsilə PDF faylını birdən çox PDF-ə bölün

 // Splitting PDF file into multiple pdfs
  from pdfrw import pdfreader, pdfwriter
  def split(path, number_of_pages, output):
    pdf_obj = pdfreader(path)
    total_pages = len(pdf_obj.pages)
    writer = pdfwriter()
    for page in range(number_of_pages):
      if page <= total_pages:
        writer.addpage(pdf_obj.pages[page])
    writer.write(output)
  if __name__ == '__main__':
    split('reportlab-sample.pdf', 10, 'subset.pdf')