Paket: ocrmypdf (8.0.1+dfsg-1)

Links für ocrmypdf

Debian-Ressourcen:

Quellcode-Paket ocrmypdf herunterladen:

Betreuer:

Sean Whitton (QS-Seite)

Externe Ressourcen:

Homepage [github.com]

Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien

OCRmyPDF erzeugt eine durchsuchbare PDF/A-Datei aus einer normalen PDF-Datei, die nur Bilder enthält, sodass diese durchsucht werden kann.

Das Programm verwendet die OCR-Engine Tesseract und unterstützt somit alle Sprachen, die Tesseract unterstützt.

Einige weitere Hauptmerkmale:

  * Platziert OCR-Text genau unter dem Bild, um das Kopieren/Einfügen
    zu erleichtern.
  * Behält die genaue Auflösung der original eingebetteten Bilder bei.
  * Fügt nach Möglichkeit OCR-Informationen als verlustfreien Vorgang ein,
    ohne Vektorinformationen zu rendern.
  * Hält die Dateigröße ungefähr gleich.
  * Bei Bedarf wird das Bild entzerrt und/oder bereinigt, bevor OCR .
    ausgeführt wird
  * Validiert Eingabe- und Ausgabedateien.
  * Bietet einen Debug-Modus, um eine einfache Überprüfung der
    OCR-Ergebnisse zu ermöglichen.
  * Verarbeitet Seiten parallel, wenn mehr als ein CPU-Kern verfügbar ist.
  * kampferprobt mit Tausenden von PDFs, einer Testsuite und
    kontinuierlicher Integration

Andere Pakete mit Bezug zu ocrmypdf

hängt ab von

empfiehlt

schlägt vor

erweitert

dep: ghostscript (>= 9.18~dfsg~)

PostScript/PDF-Interpreter
dep: icc-profiles-free

ICC-Farbprofile für Software die mit Farbprofilen umgehen kann
dep: liblept5

Bildbearbeitungsbibliothek
dep: python3

Interaktive objektorientierte Hochsprache (Python3-Standardversion)
dep: python3-cffi-backend-api-max (>= 9729)

Paket nicht verfügbar
dep: python3-cffi-backend-api-min (<= 9729)

Paket nicht verfügbar
dep: python3-chardet

Universelles Erkennungsprogramm für Zeichensatz-Codierungen für Python3
dep: python3-img2pdf (>= 0.3.0)

Verlustfreie Konvertierung von Rasterbildern in PDF (Bibliothek)
dep: python3-pdfminer (>= 20181108+dfsg-3)

PDF-Parser und -Analysator (Python3)
dep: python3-pikepdf

Python-Bibliothek zum Lesen und Schreiben von PDFs mit QPDF
dep: python3-pil

Python3-Bildbearbeitungsbibliothek
dep: python3-pkg-resources

Paketermittlung und Ressourcenzugriff mittels pkg_resources
dep: python3-reportlab

Python3-Bibliothek zur Erzeugung von PDF-Dokumenten
dep: python3-ruffus (>= 2.8)

Python3 computation pipeline library widely used in bioinformatics
dep: qpdf (>= 8.0.2)

Werkzeuge für die Umwandlung und Untersuchung von PDF-Dateien
dep: tesseract-ocr (>= 4.0.0)

Kommandozeilenwerkzeug für (optische) Zeichenerkennung (OCR)
dep: zlib1g

Kompressions-Bibliothek - Laufzeit

rec: pngquant

Werkzeug zur Optimierung von PNG-Bildern (Portable Network Graphics)
rec: unpaper

Werkzeug zum Nachbearbeiten von eingescannten Seiten

sug: img2pdf

Verlustfreie Konvertierung von Rasterbildern in PDF
sug: ocrmypdf-doc

Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien - Dokumentation
sug: python-watchdog

Python API and shell utilities to monitor file system events - Python 2.x

ocrmypdf herunterladen

Download für alle verfügbaren Architekturen
Architektur	Paketgröße	Größe (installiert)	Dateien
all	109,5 kB	431,0 kB	[Liste der Dateien]