Paket: ocrmypdf (8.0.1+dfsg-1)
Links für ocrmypdf
Debian-Ressourcen:
Quellcode-Paket ocrmypdf herunterladen:
Betreuer:
Externe Ressourcen:
- Homepage [github.com]
Ähnliche Pakete:
Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien
OCRmyPDF erzeugt eine durchsuchbare PDF/A-Datei aus einer normalen PDF-Datei, die nur Bilder enthält, sodass diese durchsucht werden kann.
Das Programm verwendet die OCR-Engine Tesseract und unterstützt somit alle Sprachen, die Tesseract unterstützt.
Einige weitere Hauptmerkmale:
* Platziert OCR-Text genau unter dem Bild, um das Kopieren/Einfügen zu erleichtern. * Behält die genaue Auflösung der original eingebetteten Bilder bei. * Fügt nach Möglichkeit OCR-Informationen als verlustfreien Vorgang ein, ohne Vektorinformationen zu rendern. * Hält die Dateigröße ungefähr gleich. * Bei Bedarf wird das Bild entzerrt und/oder bereinigt, bevor OCR . ausgeführt wird * Validiert Eingabe- und Ausgabedateien. * Bietet einen Debug-Modus, um eine einfache Überprüfung der OCR-Ergebnisse zu ermöglichen. * Verarbeitet Seiten parallel, wenn mehr als ein CPU-Kern verfügbar ist. * kampferprobt mit Tausenden von PDFs, einer Testsuite und kontinuierlicher Integration
Andere Pakete mit Bezug zu ocrmypdf
|
|
|
|
-
- dep: ghostscript (>= 9.18~dfsg~)
- PostScript/PDF-Interpreter
-
- dep: icc-profiles-free
- ICC-Farbprofile für Software die mit Farbprofilen umgehen kann
-
- dep: liblept5
- Bildbearbeitungsbibliothek
-
- dep: python3
- Interaktive objektorientierte Hochsprache (Python3-Standardversion)
-
- dep: python3-cffi-backend-api-max (>= 9729)
- Paket nicht verfügbar
-
- dep: python3-cffi-backend-api-min (<= 9729)
- Paket nicht verfügbar
-
- dep: python3-chardet
- Universelles Erkennungsprogramm für Zeichensatz-Codierungen für Python3
-
- dep: python3-img2pdf (>= 0.3.0)
- Verlustfreie Konvertierung von Rasterbildern in PDF (Bibliothek)
-
- dep: python3-pdfminer (>= 20181108+dfsg-3)
- PDF-Parser und -Analysator (Python3)
-
- dep: python3-pikepdf
- Python-Bibliothek zum Lesen und Schreiben von PDFs mit QPDF
-
- dep: python3-pil
- Python3-Bildbearbeitungsbibliothek
-
- dep: python3-pkg-resources
- Paketermittlung und Ressourcenzugriff mittels pkg_resources
-
- dep: python3-reportlab
- Python3-Bibliothek zur Erzeugung von PDF-Dokumenten
-
- dep: python3-ruffus (>= 2.8)
- Python3 computation pipeline library widely used in bioinformatics
-
- dep: qpdf (>= 8.0.2)
- Werkzeuge für die Umwandlung und Untersuchung von PDF-Dateien
-
- dep: tesseract-ocr (>= 4.0.0)
- Kommandozeilenwerkzeug für (optische) Zeichenerkennung (OCR)
-
- dep: zlib1g
- Kompressions-Bibliothek - Laufzeit
-
- rec: pngquant
- Werkzeug zur Optimierung von PNG-Bildern (Portable Network Graphics)
-
- rec: unpaper
- Werkzeug zum Nachbearbeiten von eingescannten Seiten
-
- sug: img2pdf
- Verlustfreie Konvertierung von Rasterbildern in PDF
-
- sug: ocrmypdf-doc
- Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien - Dokumentation
-
- sug: python-watchdog
- Python API and shell utilities to monitor file system events - Python 2.x
ocrmypdf herunterladen
Architektur | Paketgröße | Größe (installiert) | Dateien |
---|---|---|---|
all | 109,5 kB | 431,0 kB | [Liste der Dateien] |