1. Produse
  2.   PDF
  3.   Python
  4.   pdf2docx
 
  

Creează și convertește PDF la Docx prin Open Source Python Library

Python API gratuit, capabil să creeze și să transforme PDF de documente la DOCX, Parke și să recreeze aspectul paginii sau să recreeze paragraful prin Biblioteca Python.

Există multe biblioteci Python pentru crearea și procesarea a PDF de documente. Un Python este considerat cel mai bun limbaj pentru manipularea procesării PDF deoarece face dezvoltarea atât de ușoară și rapidă. Pdf2doc este o bibliotecă Python cu sursă deschisă, care permite programatorilor să creeze și să convertească PDF de documente în format fișier Word DOCX cu ușurință. Biblioteca este foarte simplă și are un UI simplu care permite utilizatorilor să acceseze și să utilizeze cu ușurință diverse caracteristici ale bibliotecii.

Biblioteca pdf2doc a inclus diverse caracteristici pentru manipularea a PDF de operațiuni, cum ar fi accesarea a PDF de documente, extragerea a PDF de caractere, parcarea și re-crearea tabelelor.

Previous Next

Începeți cu pdf2doc

Pdf2doc este foarte ușor de instalat, Modul preferat de a face acest lucru este de a utiliza pip, vă rugăm să utilizați următoarea comandă pentru orice instalare ușoară.

Instalați pdf2doc prin pip

 pip install pdf2docx 

Se poate instala si manual; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Convertire PDF File la Docx Python API

Biblioteca open source pdf2doc sprijină pe deplin PDF de conversii în format fișier Docx cu doar câteva linii de cod Python. Biblioteca a oferit mai multe metode de manipulare a PDF de conversii. Puteți converti toate paginile unui document sau selectați anumite pagini și le puteți converti într-un fișier de Docx . Biblioteca sprijină, de asemenea, accesarea și transformarea a PDF documente protejate prin parolă în aplicațiile Python. Biblioteca sprijină, de asemenea, multi-procesarea, care funcționează doar pentru PDF pagini continue, specificate doar la început și sfârșit.

Toate paginile unui PDF via Python API

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Convertiți PDF pagini la Docx prin Python

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Tabelul PDF via Python API

Uneori este necesar să extragem anumite date dintr-un fișier PDF. Biblioteca gratuită pdf2doc permite utilizatorilor să extragă tabele din PDF de fișiere fără dependențe externe. Pentru a realiza acest lucru, trebuie să utilizați funcția de extra-tables(). Următoarele exemple pot fi utilizate pentru a extrage toate tabelele dintr-un fișier PDF .

PDF Table via Python API

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
cv = Converter(pdf_file)
tables = cv.extract_tables(start=0, end=1)
cv.close()
for table in tables:
    print(table)

Extras din PDF via Python API

extrated_tables_list = extract_tables(pdf_with_path, start={int page id}, end={int page id})
for obj in extrated_tables_list :
    print(obj)
 Română