Erstellen, Bearbeiten & Konvertieren PDF zu Images über Python API
Free Python API for creating, edit and conversion PDF to images and vice versa. Fusion/split & convert PDF to text, Drehen /Trim/Crop PDFs.
PDFsuite ist eine sehr nützliche Python-Bibliothek, die vollständige Funktionalität für die Erstellung und Verwaltung von PDF Dokumenten bietet. Die Bibliothek ist sehr stabil und kann leicht unter MacOS (Of X) ausgeführt werden. PDFsuite ist sehr einfach zu benutzen und gibt den Benutzern die Möglichkeit, ihre PDF Dateien zu verwalten, und alles, was sie möglicherweise tun wollen, um PDF ist nur ein Klick entfernt.
Die Bibliothek ist sehr funktionsreich und enthält mehrere wichtige Funktionen im Zusammenhang mit der Handhabung von PDF-Dokumenten, wie z PDFs, Grafiken in PDFs zeichnen, Quarzfilter auf PDFs anwenden, auf Metadaten zugreifen und diese lesen, PDF-Seiten als Bilder exportieren, Seiten in PDFs zählen und vieles mehr. Die PDFsuite-Skripte sind Open Source, können in jeder Art von Projekt völlig kostenlos verwendet und beliebig angepasst werden.
Starten Sie mit PDFsuite
Um PDFsuite zunächst zu installieren, müssen Sie python 3 und die pyobjc Bibliothek installieren. Danach tippen Sie im Terminal den folgenden Befehl ein und drücken die Return.
Install pyobjc via pip
pip3 install pyobjc
Es ist auch möglich, die Bibliothek manuell zu installieren; Laden Sie die neuesten Release-Dateien direkt aus dem GitHub-Repository herunter.
Konvertierung PDF in Image & Other Formats
Die PDFsuite hat vollständige Funktionalität zur Konvertierung von PDF Dokumenten in verschiedene Bilddateiformate integriert. Es stellt NG, JPEG, Diff und andere beliebte Bilddateiformate zur Verfügung. Es ist auch möglich, ein Batman-Bild von jeder Seite der bereitgestellten PDF Dokumente mit Leichtigkeit zu erstellen. Sobald der Prozess abgeschlossen ist, müssen Sie jeder Datei einen eigenen Namen zuweisen und auf der Festplatte speichern. Es unterstützt auch die Änderung von Auflösung, Transparenz und anderen Parametern. Es ist auch möglich, PDF Dateien in Text und andere Dateiformate zu konvertieren.
Kombinieren Sie mehrere PDF Dateien mithilfe von Python Scripts
Haben Sie jemals eine Situation gehabt, in der verschiedene PDF Dokumente kombiniert werden müssen, um eine neue PDF Datei zu erstellen? Organisationen benötigen häufig das Zusammenführen mehrerer PDF Dateien in ein einziges Dokument. Die PDFsuite-Bibliothek macht es seinen Benutzern leicht, mehrere PDF Dokumente in eine einzige mit nur wenigen Zeilen Python-Code zu kombinieren. Es fügt auch eine Inhaltstabelle für jede Komponentendatei hinzu. Die Bibliothek unterstützt auch vollständig die Aufteilung großer PDF Dokumente in kleinere Dokumente in Python-Apps.
Verschmelzung mehrerer PDF Dateien über Python API
def merge(filename):
writeContext = None
shortName = os.path.splitext(filename)[0]
outFilename = shortName + "+wm.pdf"
metaDict = getDocInfo(filename)
writeContext = createOutputContextWithPath(outFilename, metaDict)
readPDF = createPDFDocumentWithPath(filename)
mergePDF = createPDFDocumentWithPath(watermark)
if writeContext != None and readPDF != None:
numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
for pageNum in range(1, numPages + 1):
page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
if page:
mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
if Quartz.CGRectIsEmpty(mediaBox):
mediaBox = None
Quartz.CGContextBeginPage(writeContext, mediaBox)
Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
Quartz.CGContextDrawPDFPage(writeContext, page)
Quartz.CGContextDrawPDFPage(writeContext, mergepage)
Quartz.CGContextEndPage(writeContext)
Quartz.CGPDFContextClose(writeContext)
del writeContext
else:
print ("A valid input file and output file must be supplied.")
sys.exit(1)
if __name__ == "__main__":
for filename in sys.argv[1:]:
merge(filename)
Konvertiert PDF Dateien in Textdatei über Python
Die Open Source PDFsuite Bibliothek hat einige wichtige Funktionen für die Konvertierung von PDF Dokumenten in zahlreiche unterstützen Dateiformate enthalten. Eine wichtige Funktion ist es, den Text einer PDF Datei in eine externe Textdatei zu konvertieren und an den gewünschten Ort zu speichern. Es ist auch möglich, jede Seite der PDF Dokumente als separate Datei zu speichern und sie mit einem anderen Namen zu speichern.
Konvertiert PDF Dokumente in Textdatei über Python API
import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
for filename in sys.argv[1:]:
shortName = os.path.splitext(filename)[0]
outputfile = shortName+" text.txt"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc :
pdfString = NSString.stringWithString_(pdfDoc.string())
pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
main()
Rotate, Trim, Crop PDFs oder Pages in Python Apps
Die PDFsuite-Bibliothek hat einige wichtige Funktionen für die einfache Handhabung von PDF Dateien enthalten. Es erlaubt Programmierern, PDF Dokumente innerhalb ihrer eigenen Python-Anwendung zu rotieren, zu schneiden, zu schneiden, zu schneiden, zu kleben, zu färben, Wasserzeichen, zu skalieren und zu erheben. Es hat zwei Möglichkeiten zur Verfügung gestellt, eine PDF-Seite oder komplette Datei zu rotieren. Der erste besteht darin, einen neuen PDF Kontext zu erstellen, jede Seite des Originals grafisch zu transformieren und die Datei zu speichern. Zweitens müssen Sie nur den 'Rotation'-Parameter auf jeder Seite anpassen, und das ist es.
How to Trim PDF Files via Python API
import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
hasBeenChanged = False
# filename = filename.decode('utf-8')
shortName = os.path.splitext(filename)[0]
outFilename = shortName + " TPS.pdf"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc:
pages = pdfDoc.pageCount()
for p in range(0, pages):
page = pdfDoc.pageAtIndex_(p)
mediaBoxSize = page.boundsForBox_(mediabox)
trimBoxSize = page.boundsForBox_(trimbox)
if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
page.setBounds_forBox_(trimBoxSize, mediabox)
hasBeenChanged = True
if hasBeenChanged:
pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
for filename in sys.argv[1:]:
trimPDF(filename)