toutes les options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Paquet source : pdfsandwich  ]

Paquet : pdfsandwich (0.1.7-2 et autres)

Liens pour pdfsandwich

Screenshot

Ressources Debian :

Télécharger le paquet source pdfsandwich :

Responsable :

Ressources externes :

Paquets similaires :

outil pour créer des fichiers PDF « sandwich » pour la ROC (OCR)

pdfsandwich génère des fichiers PDF « sandwich » ROC (en anglais, OCR), c’est-à-dire des fichiers PDF qui ne contiennent que des images (pas de texte) qui seront traités par une reconnaissance optique de caractères, et le texte sera ajouté à chaque page de manière invisible « derrière » les images. pdfsandwich est un outil en ligne de commande qui est supposé être utile pour la reconnaissance optique de caractères de livres ou journaux numérisés.

Il est capable de reconnaitre la disposition de la page même pour du texte sur plusieurs colonnes.

Essentiellement, pdfsandwich est un script enveloppe qui appelle les exécutables suivants : convert, unpaper, gs (seulement pour le redimensionnement de psd), hocr2pdf (pour tesseract < 3.03) et tesseract.

Autres paquets associés à pdfsandwich

  • dépendances
  • recommandations
  • suggestions
  • enhances

Télécharger pdfsandwich

Télécharger pour toutes les architectures proposées
Architecture Version Taille du paquet Espace occupé une fois installé Fichiers
amd64 0.1.7-2 330,3 ko1 299,0 ko [liste des fichiers]
arm64 0.1.7-2 373,1 ko1 542,0 ko [liste des fichiers]
armhf 0.1.7-2 305,3 ko869,0 ko [liste des fichiers]
i386 0.1.7-2 316,3 ko1 113,0 ko [liste des fichiers]
ppc64 (portage non officiel) 0.1.7-2 360,6 ko1 743,0 ko [liste des fichiers]
ppc64el 0.1.7-2 360,6 ko1 551,0 ko [liste des fichiers]
riscv64 0.1.7-2+b1 391,1 ko1 443,0 ko [liste des fichiers]
s390x 0.1.7-2 333,7 ko1 476,0 ko [liste des fichiers]