Alle Optionen
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Quellcode: ocrmypdf  ]

Paket: ocrmypdf (8.0.1+dfsg-1)

Links für ocrmypdf

Screenshot

Debian-Ressourcen:

Quellcode-Paket ocrmypdf herunterladen:

Betreuer:

Externe Ressourcen:

Ähnliche Pakete:

Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien

OCRmyPDF erzeugt eine durchsuchbare PDF/A-Datei aus einer normalen PDF-Datei, die nur Bilder enthält, sodass diese durchsucht werden kann.

Das Programm verwendet die OCR-Engine Tesseract und unterstützt somit alle Sprachen, die Tesseract unterstützt.

Einige weitere Hauptmerkmale:

  * Platziert OCR-Text genau unter dem Bild, um das Kopieren/Einfügen
    zu erleichtern.
  * Behält die genaue Auflösung der original eingebetteten Bilder bei.
  * Fügt nach Möglichkeit OCR-Informationen als verlustfreien Vorgang ein,
    ohne Vektorinformationen zu rendern.
  * Hält die Dateigröße ungefähr gleich.
  * Bei Bedarf wird das Bild entzerrt und/oder bereinigt, bevor OCR .
    ausgeführt wird
  * Validiert Eingabe- und Ausgabedateien.
  * Bietet einen Debug-Modus, um eine einfache Überprüfung der
    OCR-Ergebnisse zu ermöglichen.
  * Verarbeitet Seiten parallel, wenn mehr als ein CPU-Kern verfügbar ist.
  * kampferprobt mit Tausenden von PDFs, einer Testsuite und
    kontinuierlicher Integration

Andere Pakete mit Bezug zu ocrmypdf

  • hängt ab von
  • empfiehlt
  • schlägt vor
  • erweitert

ocrmypdf herunterladen

Download für alle verfügbaren Architekturen
Architektur Paketgröße Größe (installiert) Dateien
all 109,5 kB431,0 kB [Liste der Dateien]