все параметры
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Источник: ocrmypdf  ]

Пакет: ocrmypdf (10.3.1+dfsg-1)

Ссылки для ocrmypdf

Screenshot

Ресурсы Debian:

Исходный код ocrmypdf:

Сопровождающий:

Внешние ресурсы:

Подобные пакеты:

добавление текстового слоя OCR в файлы PDF

OCRmyPDF создаёт файл PDF/A с возможностью поиска из обычного файла PDF, содержащего только изображения.

Программа использует систему оптического распознавания символов (OCR) Tesseract, поэтому возможно использовать для распознавания все языки поддерживаемые этой системой.

Основные особенности:

  * Аккуратное размещение текста за изображением для копирования текста в
    буфер обмена
  * Сохранение точного разрешения оригинальных встроенных изображений
  * При возможности, добавление OCR-информации операцией не допускающей
    потерь, без перевода векторной графики в растровую
  * Размер файла практически не изменяется
  * Возможность компенсации наклона и/или очистки изображения перед
    распознаванием текста
  * Проверка входного и выходного файлов
  * Режим отладки для упрощения проверки результата распознавания текста
  * Параллельная обработка страниц при наличии более одного ядра процессора
  * Проверено боем на тысячах файлов PDF, комплекте тестов и непрерывной
    интеграцией

Другие пакеты, относящиеся к ocrmypdf

  • зависимости
  • рекомендации
  • предложения
  • enhances

Загрузка ocrmypdf

Загрузить для всех доступных архитектур
Архитектура Размер пакета В установленном виде Файлы
all 141,5 Кб558,0 Кб [список файлов]