1. Məhsullar
  2.   PDF
  3.   Python
  4.   pdf2docx
 
  

Açıq Mənbə Python Kitabxanası vasitəsilə PDF yaradın və Docx-a çevirin

PDF sənədlərini DOCX-ə yarada və çevirə bilən pulsuz Python API, Python Kitabxanası vasitəsilə səhifə tərtibatını təhlil edib yenidən yarada və ya paraqrafı yenidən yarada bilər.

PDF sənədlərinin yaradılması və işlənməsi üçün çoxlu Python kitabxanaları var. AS Python, PDF emalı üçün ən yaxşı dil hesab olunur, çünki o, inkişafı çox asan və sürətli edir. pdf2docx, kompüter proqramçılarına PDF sənədlərini asanlıqla Word DOCX fayl formatına yaratmağa və çevirməyə imkan verən belə güclü açıq mənbəli Python kitabxanasıdır. Kitabxananın idarə edilməsi çox sadədir və istifadəçilərə kitabxananın müxtəlif funksiyalarına asanlıqla daxil olmaq və istifadə etmək imkanı verən sadə GUI-yə malikdir.

Pdf2docx kitabxanasına PDF sənədlərinə daxil olmaq, PDF-i digər fayl formatlarına çevirmək, səhifənin tərtibatını təhlil etmək və yenidən yaratmaq, səhifə kənarına dəstək, meta-məlumat çıxarmaq, PDF fayllarından mətn çıxarmaq, təhlil etmək və yenidən yaratmaq kimi PDF əməliyyatlarını idarə etmək üçün müxtəlif funksiyalar daxildir. -paraqraf yaratmaq, PDF-ə mətn daxil etmək, üslubların siyahısını dəstəkləmək, Şəkli təhlil etmək və yenidən yaratmaq, şəffaf təsvir etmək, Cədvəlləri təhlil etmək və yenidən yaratmaq, birləşdirilən xanalar, qismən gizli haşiyələri olan cədvəl, iç-içə cədvəllər dəstəyi, çoxlu sayda səhifələri təhlil etmək emal və daha çox.

Previous Next

Pdf2docx ilə işə başlamaq

pdf2docx quraşdırmaq çox asandır, bunun üçün üstünlük verilən yol pipdən istifadə etməkdir, hər hansı asan quraşdırma üçün aşağıdakı əmrdən istifadə edin.

Pip vasitəsilə pdf2docx quraşdırın

 pip install pdf2docx 

Onu əl ilə quraşdırmaq da mümkündür; ən son buraxılış fayllarını birbaşa GitHub deposundan endirin.

Python API vasitəsilə PDF faylını Docx-a çevirin

Açıq mənbəli pdf2docx kitabxanası PDF faylının yalnız bir neçə sətir Python kodu ilə Docx fayl formatına çevrilməsini tam dəstəkləyir. Kitabxana PDF-ə çevrilmə ilə məşğul olmaq üçün bir neçə üsul təqdim etmişdir. Siz sənədin bütün səhifələrini çevirə və ya bəzi xüsusi səhifələri seçib Docx faylına çevirə bilərsiniz. Kitabxana həmçinin Python proqramları daxilində parolla qorunan PDF sənədlərinə daxil olmağı və onları çevirməyi dəstəkləyir. Kitabxana həmçinin yalnız başlanğıc və son ilə müəyyən edilmiş davamlı PDF səhifələri üçün işləyən çoxlu emalı dəstəkləyir.

Python API vasitəsilə PDF-in bütün səhifələrini çevirin

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Python vasitəsilə müəyyən edilmiş PDF səhifələrini Docx-a çevirin

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Python API vasitəsilə PDF-dən Cədvəl çıxarın

Bəzən bir PDF faylından bəzi xüsusi məlumatları çıxarmaq lazımdır. Pulsuz pdf2docx kitabxanası istifadəçilərə heç bir xarici asılılıq olmadan PDF fayllarından cədvəl çıxarmağa imkan verir. Bu tapşırığı yerinə yetirmək üçün siz extract_tables() funksiyasından istifadə etməlisiniz. Aşağıdakı nümunələr PDF faylından bütün cədvəlləri çıxarmaq üçün istifadə edilə bilər.

Python API vasitəsilə PDF cədvəlini çıxarın

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
cv = Converter(pdf_file)
tables = cv.extract_tables(start=0, end=1)
cv.close()
for table in tables:
    print(table)

Python API vasitəsilə bütün cədvəlləri PDF-dən çıxarın

extrated_tables_list = extract_tables(pdf_with_path, start={int page id}, end={int page id})
for obj in extrated_tables_list :
    print(obj)
 Azəri