[ Quellcode: ocrmypdf ]
Paket: ocrmypdf (16.7.0+dfsg1-1)
Links für ocrmypdf
Debian-Ressourcen:
Quellcode-Paket ocrmypdf herunterladen:
- [ocrmypdf_16.7.0+dfsg1-1.dsc]
- [ocrmypdf_16.7.0+dfsg1.orig.tar.xz]
- [ocrmypdf_16.7.0+dfsg1-1.debian.tar.xz]
Betreuer:
Externe Ressourcen:
- Homepage [github.com]
Ähnliche Pakete:
Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien
OCRmyPDF erzeugt eine durchsuchbare PDF/A-Datei aus einer normalen PDF-Datei, die nur Bilder enthält, sodass diese durchsucht werden kann.
Das Programm verwendet die OCR-Engine Tesseract und unterstützt somit alle Sprachen, die Tesseract unterstützt.
Einige weitere Hauptmerkmale:
* Platziert OCR-Text genau unter dem Bild, um das Kopieren/Einfügen zu erleichtern. * Behält die genaue Auflösung der original eingebetteten Bilder bei. * Fügt nach Möglichkeit OCR-Informationen als verlustfreien Vorgang ein, ohne Vektorinformationen zu rendern. * Hält die Dateigröße ungefähr gleich. * Bei Bedarf wird das Bild entzerrt und/oder bereinigt, bevor OCR . ausgeführt wird * Validiert Eingabe- und Ausgabedateien. * Bietet einen Debug-Modus, um eine einfache Überprüfung der OCR-Ergebnisse zu ermöglichen. * Verarbeitet Seiten parallel, wenn mehr als ein CPU-Kern verfügbar ist. * kampferprobt mit Tausenden von PDFs, einer Testsuite und kontinuierlicher Integration
Andere Pakete mit Bezug zu ocrmypdf
|
|
|
|
-
- dep: ghostscript (>= 9.18~dfsg~)
- interpreter for the PostScript language and for PDF
-
- dep: icc-profiles-free
- ICC-Farbprofile für Software die mit Farbprofilen umgehen kann
-
- dep: python3
- interactive high-level object-oriented language (default python3 version)
-
- dep: python3-coloredlogs
- colored terminal output for Python 3's logging module
-
- dep: python3-deprecation
- Library to handle automated deprecations
-
- dep: python3-hypothesis
- advanced Quickcheck style testing library for Python 3
-
- dep: python3-img2pdf (>= 0.3.0)
- Verlustfreie Konvertierung von Rasterbildern in PDF (Bibliothek)
-
- dep: python3-packaging
- Kern-Dienstprogramme für Python3-Pakete
-
- dep: python3-pdfminer (>= 20181108+dfsg-3)
- PDF-Parser und -Analysator (Python3)
-
- dep: python3-pikepdf (>= 8.14.0)
- Python-Bibliothek zum Lesen und Schreiben von PDFs mit QPDF
-
- dep: python3-pil
- Python3-Bildbearbeitungsbibliothek
-
- dep: python3-pluggy
- plugin and hook calling mechanisms for Python 3
-
- dep: python3-reportlab
- Python3-Bibliothek zur Erzeugung von PDF-Dokumenten
-
- dep: python3-rich
- render rich text, tables, progress bars, syntax highlighting, markdown and more
-
- dep: tesseract-ocr (>= 4.0.0)
- Kommandozeilenwerkzeug für (optische) Zeichenerkennung (OCR)
-
- dep: zlib1g
- Kompressions-Bibliothek - Laufzeit
-
- rec: jbig2
- encoder for JBIG2 - command-line tool
-
- rec: pngquant
- Werkzeug zur Optimierung von PNG-Bildern (Portable Network Graphics)
-
- rec: unpaper
- Werkzeug zum Nachbearbeiten von eingescannten Seiten
-
- sug: img2pdf
- Verlustfreie Konvertierung von Rasterbildern in PDF
-
- sug: ocrmypdf-doc
- Hinzufügen einer Zeichenerkennungs-Textebene zu PDF-Dateien - Dokumentation
-
- sug: python-watchdog
- Paket nicht verfügbar
ocrmypdf herunterladen
Architektur | Paketgröße | Größe (installiert) | Dateien |
---|---|---|---|
all | 176,0 kB | 693,0 kB | [Liste der Dateien] |