Criar, Editar e converter PDF para imagens via Python API
Python API livre para, editar e converter PDF para imagens e vice-versa. Merge/split & converter PDF para texto, Rotate /Trim/Crop PDFs.
PDFsuite é uma biblioteca Python muito que uma completa à criação e à gestão de PDF documentos. A biblioteca é muito e pode ser facilmente executada em MacOS (Of X). PDFsuite é muito fácil de usar e dá aos usuários a de gerenciar seus PDF arquivos e tudo o que eles fazer a um PDF é apenas um clique de.
A biblioteca é muito rica em recursos e inclui vários recursos importantes relacionados ao manuseio de documentos PDF, como conversão de documentos PDF em PDF, mesclagem ou divisão de documentos PDF, conversão de imagens em PDF, rotação de PDF, adição de números de página a PDF, inserção de marcas d'água em PDFs, desenhe gráficos em PDFs, aplique filtros de quartzo a PDFs, acesse e leia metadados, exporte páginas PDF como imagens, conte páginas em PDF e muito mais. Os scripts PDFsuite são de código aberto e totalmente gratuitos para uso em qualquer tipo de projeto e podem ser adaptados de qualquer forma.
Começando com PDFsuite
Para PDFsuite primeiro você precisa instalar python 3 e a biblioteca pyobjc, e depois disso no Terminal por favor digite o seguinte comando e pressione Return.
Instalar pyobjc via pip
pip3 install pyobjc
Também é possível instalar a biblioteca manualmente; baixe os arquivos de lançamento mais recentes diretamente do repositório GitHub.
Converter PDF para imagem e outros
O PDFsuite completa para converter PDF documentos para vários de arquivos de imagem. Ele NG, JPEG, Diff e outros de arquivos de imagem populares. é possível uma imagem de batman de cada página dos PDF documentos com. Uma vez que o processo é completo, você precisa atribuir um nome a cada arquivo e -lo no disco. Ela também envolve alterar os, e outros. é possível converter PDF arquivos para texto e outros de arquivo.
Combine vários PDF arquivos usando Python Scripts
Você já em uma onde é necessário diferentes PDF documentos para um novo PDF ? As muitas vezes requerem a de múltiplos PDF arquivos em um único documento. A biblioteca PDFsuite torna mais fácil para seus usuários vários PDF documentos em um único com apenas algumas de código Python. Ele também adiciona uma de entrada de conteúdo para cada arquivo de componentes. A biblioteca também totalmente dividir PDF documentos grandes em aplicativos Python menores.
Mesclar vários arquivos PDF via Python API
def merge(filename):
writeContext = None
shortName = os.path.splitext(filename)[0]
outFilename = shortName + "+wm.pdf"
metaDict = getDocInfo(filename)
writeContext = createOutputContextWithPath(outFilename, metaDict)
readPDF = createPDFDocumentWithPath(filename)
mergePDF = createPDFDocumentWithPath(watermark)
if writeContext != None and readPDF != None:
numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
for pageNum in range(1, numPages + 1):
page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
if page:
mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
if Quartz.CGRectIsEmpty(mediaBox):
mediaBox = None
Quartz.CGContextBeginPage(writeContext, mediaBox)
Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
Quartz.CGContextDrawPDFPage(writeContext, page)
Quartz.CGContextDrawPDFPage(writeContext, mergepage)
Quartz.CGContextEndPage(writeContext)
Quartz.CGPDFContextClose(writeContext)
del writeContext
else:
print ("A valid input file and output file must be supplied.")
sys.exit(1)
if __name__ == "__main__":
for filename in sys.argv[1:]:
merge(filename)
Converter PDF arquivos em Text File via Python
A biblioteca open source PDFsuite vários recursos importantes para PDF conversão de documentos para de arquivos de suporte. Uma importante é converter o conteúdo de texto de um arquivo PDF em um arquivo de texto externo e guardá-lo para o lugar de sua. é possível salvar cada página dos PDF documentos como um arquivo e -lo com um nome diferente.
Converter PDF documentos para arquivo de texto via Python API
import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
for filename in sys.argv[1:]:
shortName = os.path.splitext(filename)[0]
outputfile = shortName+" text.txt"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc :
pdfString = NSString.stringWithString_(pdfDoc.string())
pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
main()
Rotate, Trim, Recorte PDFs ou Páginas em Apps Python
A biblioteca PDFsuite incluiu várias funcionalidades importantes para manusear facilmente PDF arquivos. Ele permite que os programadores girar, cortar, cortar, tintar, marca d'água, escala e subir PDF documentos dentro de sua Python. Ele forneceu duas de girar uma PDF página ou arquivo completo. O primeiro é um novo PDF contexto, transformar graficamente cada página do original e salvar o arquivo. Em segundo lugar, você só precisa o 'rotação' em cada página e é isso.
Como PDF arquivos via Python API
import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
hasBeenChanged = False
# filename = filename.decode('utf-8')
shortName = os.path.splitext(filename)[0]
outFilename = shortName + " TPS.pdf"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc:
pages = pdfDoc.pageCount()
for p in range(0, pages):
page = pdfDoc.pageAtIndex_(p)
mediaBoxSize = page.boundsForBox_(mediabox)
trimBoxSize = page.boundsForBox_(trimbox)
if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
page.setBounds_forBox_(trimBoxSize, mediabox)
hasBeenChanged = True
if hasBeenChanged:
pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
for filename in sys.argv[1:]:
trimPDF(filename)