1. Προϊόντα
  2.   PDF
  3.   Python
  4.   pdf2docx
 
  

Δημιουργία και μετατροπή PDF σε Docx μέσω της Open Source Python Library

Δωρεάν Python API ικανή να δημιουργήσει και να μετατρέψει PDF έγγραφα σε DOCX, Parke και να δημιουργήσει εκ νέου τη διάταξη σελίδας ή να δημιουργήσει ξανά την παράγραφο μέσω της Βιβλιοθήκης Python.

Υπάρχουν πολλές βιβλιοθήκες Python για PDF δημιουργία και επεξεργασία εγγράφων. Η Python θεωρείται η καλύτερη γλώσσα για τον χειρισμό PDF επεξεργασίας, επειδή κάνει την ανάπτυξη τόσο εύκολη και γρήγορη. pdf2doc είναι μια τέτοια ισχυρή βιβλιοθήκη ανοικτού κώδικα Python που επιτρέπει στους προγραμματιστές υπολογιστών να δημιουργούν και να μετατρέπουν PDF έγγραφα σε μορφή αρχείου Word DOCX με ευκολία. Η βιβλιοθήκη είναι πολύ απλή στη διαχείριση και διαθέτει ένα απλό UI που επιτρέπει στους χρήστες να έχουν εύκολη πρόσβαση και να χρησιμοποιούν διάφορα χαρακτηριστικά της βιβλιοθήκης.

Η βιβλιοθήκη pdf2doc έχει συμπεριλάβει διάφορα χαρακτηριστικά για τη διαχείριση PDF λειτουργιών, όπως πρόσβαση σε PDF έγγραφα, μετατροπή PDF σε άλλες μορφές αρχείων, σάρωση και επαναδημιουργία σελίδας, υποστήριξη σελίδων

Previous Next

Ξεκίνησε με pdf2doc

pdf2doc είναι πολύ εύκολο να εγκατασταθεί, ο προτιμώμενος τρόπος για να το κάνετε είναι να χρησιμοποιήσετε pip, παρακαλώ χρησιμοποιήστε την ακόλουθη εντολή για οποιαδήποτε εύκολη εγκατάσταση.

Εγκατάσταση pdf2doc μέσω pip

 pip install pdf2docx 

Είναι επίσης δυνατό να το εγκαταστήσετε χειροκίνητα. κατεβάστε τα αρχεία τελευταίας έκδοσης απευθείας από το αποθετήριο GitHub.

Μετατροπή PDF αρχείων σε Docx μέσω Python API

Η βιβλιοθήκη pdf2doc ανοικτού κώδικα υποστηρίζει πλήρως τη μετατροπή PDF αρχείων σε Docx μορφή αρχείου με λίγες γραμμές κώδικα Python. Η βιβλιοθήκη παρέχει διάφορες μεθόδους για τον χειρισμό PDF μετατροπών. Μπορείτε να μετατρέψετε όλες τις σελίδες ενός εγγράφου ή να επιλέξετε ορισμένες συγκεκριμένες σελίδες και να τις μετατρέψετε σε ένα αρχείο Docx . Η βιβλιοθήκη υποστηρίζει επίσης την πρόσβαση και τη μετατροπή των κωδικών που προστατεύονται από PDF έγγραφα μέσα σε εφαρμογές της Python. Η βιβλιοθήκη υποστηρίζει επίσης πολυεπεξεργασία η οποία λειτουργεί μόνο για συνεχείς PDF σελίδες, οι οποίες καθορίζονται μόνο από την αρχή και το τέλος.

Μετατροπή όλων των σελίδων ενός PDF μέσω Python API

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Μετατροπή PDF σελίδων σε Docx μέσω Python

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file)      # all pages by default
cv.close()

Πίνακας από PDF μέσω Python API

Μερικές φορές πρέπει να εξάγουμε κάποια συγκεκριμένα δεδομένα από ένα αρχείο PDF . Η δωρεάν βιβλιοθήκη pdf2doc επιτρέπει στους χρήστες να εξάγουν πίνακες από PDF αρχεία χωρίς εξωτερικές εξαρτήσεις. Για να επιτευχθεί αυτή η εργασία θα πρέπει να χρησιμοποιήσετε τη λειτουργία απόσπασμα (). Τα παρακάτω παραδείγματα μπορούν να χρησιμοποιηθούν για την εξαγωγή όλων των πινάκων από ένα αρχείο PDF .

Εκχύλισμα PDF Πίνακας μέσω Python API

from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
cv = Converter(pdf_file)
tables = cv.extract_tables(start=0, end=1)
cv.close()
for table in tables:
    print(table)

Απλώστε όλα τα καλώδια από PDF μέσω Python API

extrated_tables_list = extract_tables(pdf_with_path, start={int page id}, end={int page id})
for obj in extrated_tables_list :
    print(obj)
 Ελληνικά