Create & Convert PDF to Docx via Open Source Python Library
Ücretsiz Python API, PDF belgeyi DOCX. Parke'ye oluşturma ve yeniden yaratmalı sayfa düzeni veya Python Library aracılığıyla yeniden yaratılabilir.
PDF belge oluşturma ve işleme için birçok Python kütüphanesi var. Bir Python PDF işlemeyi işlemek için en iyi dil olarak kabul edilir, çünkü gelişim çok kolay ve hızlı hale getirir. pdf2doc, bilgisayar programcıları oluşturmak ve PDF belgeyi Word DOCX dosya formatına kolaylıkla dönüştürmek için bu kadar güçlü açık kaynak Python kütüphanesidir. Kütüphane idare etmek ve kullanıcıların kütüphanenin çeşitli özelliklerini kolayca erişmelerini sağlayan basit bir UI'ye sahip olmak çok basittir.
pdf2doc kütüphanesi PDF belgeye erişmek gibi PDF işlemi işlemek için çeşitli özellikler içeriyordu, PDF'i diğer dosya formatlarına dönüştürmek, görüntüyü yeniden yaratmak ve yeniden yaratmak, sayfa desteği, meta-bilgileri çıkarmak, PDF dosyadan alıntı yapmak, not etmek ve yeniden yaratmak, metin eklemek için PDF'e tıklayın, liste stilleri desteği, Parke ve yeniden yaratmak.
pdf2doc ile başlayın
pdf2doc yüklemek çok kolaydır, Bunu yapmak için tercih edilen yol, lütfen herhangi bir kolay yükleme için aşağıdaki komutu kullanın.
pdf2doc Boru yoluyla
pip install pdf2docx
Manuel olarak kurmak da mümkündür; en son sürüm dosyalarını doğrudan GitHub deposundan indirin.
PDF Dosyayı Python API ile Docx
Açık kaynak pdf2doc kütüphanesi, Python kodunun birkaç satırı ile PDF dosya dönüştürmesini tamamen destekler. Kütüphane PDF dönüşümü işlemek için birkaç yöntem sağlamıştır. Bir belgenin tüm sayfalarını dönüştürebilir veya bazı özel sayfaları seçebilir ve Docx dosyaya dönüştürebilirsiniz. Kütüphane ayrıca Python uygulamaları içindeki PDF belgeyi erişim ve dönüştürmeyi de destekler. Kütüphane aynı zamanda sadece sürekli PDF sayfa için çalışan çok fazla işlemeyi de destekler, sadece başlayın ve sonlayın.
Tüm Pages of a PDF via Python API
from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file) # all pages by default
cv.close()
PDF Pages'i Python ile Docx'e Dönüştürdü
from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
docx_file = 'path/to/sample.docx'
# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file) # all pages by default
cv.close()
Tablo, PDF ile Python API
Bazen PDF dosyadan bazı özel verileri çıkarmamız gerekiyor. Ücretsiz pdf2doc kütüphanesi kullanıcıların dış bağımlılık olmadan PDF dosyadan tablo çıkarmalarına izin verir. Bu görevi elde etmek için ekstra_tables() fonksiyonunu kullanmanız gerekir. Aşağıdaki örnekler PDF dosyadan tüm tabloları çıkarmak için kullanılabilir.
Python ile PDF Tablo API
from pdf2docx import Converter
pdf_file = '/path/to/sample.pdf'
cv = Converter(pdf_file)
tables = cv.extract_tables(start=0, end=1)
cv.close()
for table in tables:
print(table)
Tüm Masalar Python API aracılığıyla
extrated_tables_list = extract_tables(pdf_with_path, start={int page id}, end={int page id})
for obj in extrated_tables_list :
print(obj)