Create, Edit & Convert PDF to Images via Python API
PDF oluşturmak, düzenlemek ve resimlere dönüştürmek ve bunun tersi için ücretsiz Python API'si. PDF'yi birleştirin/bölün ve metne dönüştürün, PDF'leri Döndürün/Kırpın/Kırpın.
PDFsuite, PDF belgesi oluşturma ve yönetme ile ilgili eksiksiz işlevsellik sağlayan çok kullanışlı bir Python kitaplığıdır. Kitaplık çok kararlıdır ve MacOS'ta (OS X) kolayca çalıştırılabilir. PDFsuite'in kullanımı çok kolaydır ve kullanıcılara PDF dosyalarını yönetme yeteneği verir ve bir PDF'de yapmak isteyebilecekleri her şey sadece bir tık ötededir.
Kütüphane çok özellik zengindir ve PDF'lere ait birkaç önemli özellik içeriyor, PDF'e dönüşüm, görüntüler, PDF'e dönüşüm, PDF'e dönüşüm, PDF'e kadar görüntüyü PDF'e eklemek, Sumark'ı PDF'e eklemek, PDF'e kadar çizerek, kurtz filtreleri PDF'lere, erişime ve okumak gibi, PDF sayfayı görüntüler, PDF'e transfer etmek, PDF sayfayı PDF'e ekleyin. PDFsuite senaryolar açık kaynak, herhangi bir projede kullanım için tamamen ücretsizdir ve herhangi bir şekilde adapte edilebilir.
PDFsuite ile başlayın
PDFsuite'i çalıştırmak için önce python 3 ve pyobjc kütüphanesi yüklemek zorundasınız ve Terminal'de bundan sonra lütfen aşağıdaki komut ve basın geri dön.
pip üzerinden pyobjc yükleyin
pip3 install pyobjc
Kitaplığı manuel olarak kurmak da mümkündür; en son sürüm dosyalarını doğrudan GitHub deposundan indirin.
PDF'ü Resim ve Diğer Biçimlere Dönüştürün
PDFsuite, PDF belgeyi çeşitli görüntü dosyası formatlarına dönüştürmek için tam işlevsellik ekledi. NG, JPEG, Diff ve diğer popüler görüntü dosya formatları sağlar. Ayrıca, sağlanan PDF belgenin her sayfasından bir batman görüntü oluşturabilir. Süreç tamamlandığında, her dosyaya ayrı bir isim atamanız ve disk üzerinde tasarruf etmeniz gerekir. Ayrıca çözümü, şeffaflığı ve diğer parametreleri değiştirmeyi da destekler. Ayrıca PDF dosyayı metin ve diğer dosya formatlarına dönüştürmek mümkündür.
Python scripts kullanarak birden fazla PDF Files
Yeni PDF dosya oluşturmak için farklı PDF belgeyi birleştirmek için gerekli olan bir durumda mıydınız? Organizasyonlar genellikle birden fazla PDF dosyayı tek bir belgeye dönüştürmek gerektirir. PDFsuite kütüphanesi, kullanıcılarından birkaç PDF belgeyi sadece birkaç Python kodu ile bir araya getirmelerini kolaylaştırır. Ayrıca her bileşen dosyası için bir içerik girişi tablosu ekliyor. Kütüphane ayrıca Python uygulamaları içinde büyük PDF belgeyi daha küçük olanlara ayırmaktadır.
Merge Multi PDF Files via Python API
def merge(filename):
writeContext = None
shortName = os.path.splitext(filename)[0]
outFilename = shortName + "+wm.pdf"
metaDict = getDocInfo(filename)
writeContext = createOutputContextWithPath(outFilename, metaDict)
readPDF = createPDFDocumentWithPath(filename)
mergePDF = createPDFDocumentWithPath(watermark)
if writeContext != None and readPDF != None:
numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
for pageNum in range(1, numPages + 1):
page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
if page:
mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
if Quartz.CGRectIsEmpty(mediaBox):
mediaBox = None
Quartz.CGContextBeginPage(writeContext, mediaBox)
Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
Quartz.CGContextDrawPDFPage(writeContext, page)
Quartz.CGContextDrawPDFPage(writeContext, mergepage)
Quartz.CGContextEndPage(writeContext)
Quartz.CGPDFContextClose(writeContext)
del writeContext
else:
print ("A valid input file and output file must be supplied.")
sys.exit(1)
if __name__ == "__main__":
for filename in sys.argv[1:]:
merge(filename)
Python ile Text File'a PDF Dosya Dönüştürün
Açık kaynak PDFsuite kütüphanesi, PDF belge dönüştürmesi için birçok destek dosyası formatına dahil edilmiştir. Önemli bir özellik, PDF dosyanın metin içeriğini dış bir metin dosyasına dönüştürmek ve seçiminizin yerine getirmektir. Aynı zamanda PDF belgenin her sayfasını ayrı bir dosya olarak kurtarmak ve farklı bir isim ile tasarruf etmek de mümkündür.
Python API ile Text File için PDF Belgeyi Dönüştürün API
import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
for filename in sys.argv[1:]:
shortName = os.path.splitext(filename)[0]
outputfile = shortName+" text.txt"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc :
pdfString = NSString.stringWithString_(pdfDoc.string())
pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
main()
Rotate, Trim, Ek PDFs veya Python Uygulamaları
PDFsuite kütüphanesi, PDF dosyayı kolayca işlemek için birkaç önemli işlevleri içeriyordu. Programcıların döndürmesine izin verir, ekin, tint, sumark, ölçek ve kendi Python uygulamasında PDF belgeyi arttırır. PDF sayfa veya tam bir dosya döndürmek için iki yol sağlamıştır. İlki yeni PDF bağlam oluşturmak, grafik olarak her sayfayı orijinalin her sayfasını dönüştürmek ve dosyayı kurtarmaktır. İkincisi, her sayfadaki ‘uçlama’ parametresini ayarlamanız gerekiyor ve bu.
Python API ile PDF Dosya Nasıl Çekilir
import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
hasBeenChanged = False
# filename = filename.decode('utf-8')
shortName = os.path.splitext(filename)[0]
outFilename = shortName + " TPS.pdf"
pdfURL = NSURL.fileURLWithPath_(filename)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc:
pages = pdfDoc.pageCount()
for p in range(0, pages):
page = pdfDoc.pageAtIndex_(p)
mediaBoxSize = page.boundsForBox_(mediabox)
trimBoxSize = page.boundsForBox_(trimbox)
if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
page.setBounds_forBox_(trimBoxSize, mediabox)
hasBeenChanged = True
if hasBeenChanged:
pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
for filename in sys.argv[1:]:
trimPDF(filename)