PDF fayllarını çevirmək üçün açıq mənbəli Python kitabxanası
Pulsuz Python API Tərtibatçılara PDF fayllarını ixrac etməyə, döndərməyə, birləşdirməyə və birləşdirməyə, PDF-lərdən məlumat və elementləri çıxarmağa imkan verir.
pdfrw proqram tərtibatçılarına heç bir xarici xüsusi proqram quraşdırmadan PDF fayllarını oxumaq və yazmaq imkanı verən açıq mənbəli təmiz Python kitabxanasıdır. pdfrw proqramlaşdırma kitabxanasından istifadə etmək çox sadədir və mənbə kodu yaxşı sənədləşdirilmiş, çox sadə və başa düşüləndir. Kitabxanaya PDF-lərdə mətn sətirləri üçün düzgün Unicode dəstəyi, eləcə də ən sürətli təmiz Python PDF analizatoru daxildir.
pdfrw kitabxanasına PDF-lərin birləşdirilməsi, metadatanın dəyişdirilməsi, çoxsaylı PDF-lərin birləşdirilməsi, şəkillərin çıxarılması, PDF çapı, PDF səhifələrinin fırlanması, yeni PDF yaradılması, su nişanının PDF şəklinin əlavə edilməsi və sair kimi bir neçə mühüm PDF əməliyyatı üçün dəstək daxildir.
.
Pdfrw ilə işə başlamaq
pdfrw üçün Python 2.6, 2.7, 3.3, 3.4, 3.5 və 3.6 tələb olunur. Siz pip istifadə edərək pdfrw quraşdıra bilərsiniz. Quraşdırmaq üçün aşağıdakı əmrdən istifadə edin.
pip vasitəsilə pdfrw quraşdırın
python -m pip install pdfrw
Python Kitabxanası vasitəsilə PDF sənədləri yaradın
pdfrw kitabxanası proqram tərtibatçılarına yalnız bir neçə sətir kodla öz Python proqramlarında PDF Sənədləri Yaratmaq imkanı verir. Kitabxana həmçinin mövcud PDF fayllarına daxil olmaq və onları dəyişdirmək üçün dəstək verir. Mövcud PDF-ə asanlıqla yeni səhifələr, eləcə də qrafik komponentlər və ya mətn elementləri daxil edə bilərsiniz. pdfrw kitabxanası oxuduğunuz PDF fayllarında səhifələri tapmaq və bir sıra səhifələri yeni PDF faylına yazmaq üçün dəstək verir.
Python vasitəsilə PDF sənədlərini yaradın və dəyişdirin
// PDF Documents Creation
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
Python vasitəsilə PDF faylları oxumaq
pdfrw kitabxanası proqram tərtibatçılarına Python proqramları daxilində PDF sənədlərinin müxtəlif hissələrinə asanlıqla daxil olmaq və oxumaq imkanı verir. Bütün PDF sənədinə asan giriş imkanı verir. Kitabxana fayl məlumatının, ölçüsünün və s. alınmasını dəstəkləyir. O, istifadəçilərə PDF sənədinin bütün səhifələrini sadalamağa imkan verən səhifələr adlı xüsusi atribut yaradır. Bu, müəllif, başlıq və s. kimi məlumatları çıxarmaq üçün istifadə edə biləcəyiniz sənəd məlumat obyektini çıxarmağa imkan verir.
Python vasitəsilə PDF fayllarına daxil olun və oxuyun
// Reading PDF Files
from pdfrw import pdfreader
def get_pdf_info(path):
pdf = pdfreader(path)
print(pdf.keys())
print(pdf.info)
print(pdf.root.keys())
print('pdf has {} pages'.format(len(pdf.pages)))
if __name__ == '__main__':
get_pdf_info('w9.pdf')
Metadata əlavə etmək və ya dəyişdirmək
pdfrw proqram tərtibatçılarına öz Python proqramlarında PDF fayllarının metadatasını əlavə etmək və ya dəyişdirmək imkanı verir. Siz PDF-də tək metaməlumat elementini dəyişdirə, nəticəni yeni PDF-ə yaza, həmçinin bir neçə faylı daxil edə və çıxış PDF faylına bəzi mənasız metadata əlavə etdikdən sonra onları birləşdirə bilərsiniz.
Python vasitəsilə PDF metadatasını dəyişdirin
// Modifying PDF Metadata
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
PDF sənədlərinin bölünməsi
pdfrw proqram tərtibatçılarına proqramlar daxilində PDF sənədlərini proqramlı şəkildə bölməyə imkan verir. İstifadəçi PDF kitabının müəyyən hissəsini çıxarmağı və ya onları bir faylda saxlamaq əvəzinə bir neçə PDF-ə bölməyi tələb edə bilər. Bu pdfrw kitabxanası ilə çox asandır, sadəcə olaraq daxil olan PDF fayl yolunu, çıxarmaq istədiyiniz səhifələrin sayını və çıxış yolunu təmin etməlisiniz.
Python vasitəsilə PDF faylını birdən çox PDF-ə bölün
// Splitting PDF file into multiple pdfs
from pdfrw import pdfreader, pdfwriter
def split(path, number_of_pages, output):
pdf_obj = pdfreader(path)
total_pages = len(pdf_obj.pages)
writer = pdfwriter()
for page in range(number_of_pages):
if page <= total_pages:
writer.addpage(pdf_obj.pages[page])
writer.write(output)
if __name__ == '__main__':
split('reportlab-sample.pdf', 10, 'subset.pdf')