Исходный код catdoc:
Данная программа извлекает текст из файлов MS-Word, пытаясь при этом сохранить как можно больше печатных символов. catdoc поддерживает все версии форматов до Word-97 включительно. Также поддерживаются документы MS Write и файлы RTF.
Программа даже не пытается сохранить оригинальное форматирование документа Word, так как пользователи Word обычно не заботятся о структуре документа, а это самое важное для пользователей LaTeX.
В пакет также входит xls2csv, которая извлекает данные из электронных таблиц Excel и выводит данные в формате csv. Также есть catppt, которая извлекает данные из презентаций PowerPoint.
Этот пакет предлагает установку tk, так как включает утилиту wordview, необязательный графический Tk-интерфейс для catdoc. Пакет выполняет настройку MIME, чтобы при запуске из X для просмотра документа вызывался wordview, или только catdoc в противном случае.
Сайт: http://freshmeat.net/projects/catdoc
|
|
|
| Архитектура | Размер пакета | В установленном виде | Файлы |
|---|---|---|---|
| amd64 | 630,0 Кб | 2664 Кб | [список файлов] |
| armel | 620,6 Кб | 2648 Кб | [список файлов] |
| hppa | 595,6 Кб | 2664 Кб | [список файлов] |
| i386 | 580,6 Кб | 2648 Кб | [список файлов] |
| ia64 | 621,9 Кб | 2764 Кб | [список файлов] |
| mips | 600,1 Кб | 2688 Кб | [список файлов] |
| mipsel | 600,0 Кб | 2688 Кб | [список файлов] |
| powerpc | 587,5 Кб | 2648 Кб | [список файлов] |
| s390 | 591,3 Кб | 2656 Кб | [список файлов] |
| sparc | 580,5 Кб | 2648 Кб | [список файлов] |